Twitter puede ser un arma de doble filo. Como toda red social, si bien tiene la capacidad de difundir rápidamente información desde cualquier lugar donde se encuentren sus usuarios, también puede convertirse en un canal para distribuir datos falsos. Ya sea por error o por el sólo ánimo de hacer daño, no es raro toparse con anuncios de muertes que no han ocurrido, o con reportes contradictorios en situaciones de emergencia.

Usualmente, la verificación de los datos permite percatarse de un mensaje engañoso, ¿pero cómo descubrirlo en una marea de cientos de miles de mensajes por minuto?

Basados en un estudio sobre la información que circuló en Twitter tras el terremoto de 2010 en Chile, un grupo de investigadores de la rama nacional de Yahoo Research desarrolló un algoritmo -es decir, un sistema de cálculo- a través del cual logran diferenciar automáticamente un tuiteo falso de uno verdadero, con una tasa de aciertos del 86%.

Se trata del trabajo de Carlos Castillo, Marcelo Mendoza y Barbara Poblete, quienes publicarán sus resultados el próximo mes en el Internet Research. El trabajo se basa en el análisis de tuiteos emitidos tras el sismo de 8.8 grados, separando mensajes reales como el cierre del aeropuerto de Santiago, el saqueo de supermercados en Concepción o la desolación dejada por el tsunami en Iloca; de los mensajes falsos, como la muerte de Ricardo Arjona tras el terremoto, o que el maremoto había golpeado a Valparaíso.

Según explicó al portal Slate, Patrick Meier, del Qatar Foundation’s Computing Research Institute, y quien tuvo acceso al trabajo de los investigadores chilenos, el algoritmo se basa en 16 funciones que se consideran para evaluar los mensajes.

Entre ellas, hay 5 principios básicos que hacen a un tuiteo más creíble:

- Los tuiteos reales tienden a ser más largos y contienen links a sitios web
- Los usuarios que entregan información real tienen mayor número de seguidores
- Los tuiteos reales se escriben en un tono más negativo que positivo
- Los tuiteos reales no suelen incorporar signos de exclamación ni interrogación
- Los tuiteos reales no usan pronombres en primera o tercera persona

A esto se deben sumar los hallazgos previos de un equipo de investigación en la India, quienes se percataron de que los tuiteos creíbles tienden a contener muy pocas groserías, así como usar más emoticones negativos que caritas sonrientes.

Bajo estos conceptos, los investigadores chilenos lograron que el algoritmo tenga una tasa de éxito de 0.86 AUC (área bajo la curva), en una escala donde 1 AUC es perfecto y 0.5 AUC es lo mismo que hacer una selección al azar.