Los Bots en Redes Sociales - 2015

14/07/2015 - 14:00:00 por Fabio Baccaglioni - 11988 - 11 - En Artículos

Como hoy estaré dando una charla durante el Social Media Day sobre bots quería dejar aquí la parte más "técnica" de lo que fue mi investigación.

No quería dar una charla con material viejo, del 2014, el cual tuvo bastante repercusión en su momento, en cambio decidí buscar redes falsificadoras de este mismo año y la búsqueda ni tuve que hacerla, llegaron por cuenta propia

Además aproveché para actualizar el código fuente de mi software "BotKillah" para dar con esta linda red, ahora paso los datos crudos a ustedes, esto no será parte de la charla porque es demasiado detalle de lo técnico y un caso en particular, mi charla va por el lado del negocio publicitario y por qué considero que esto afecta negativamente el ecosistema...

Update: Agregué video que armé luego de la charla para que tengan la misma data de lo que dí, cuando consiga el video oficial lo sumo

nota en Clarín del 2014 sobre mi primer investigación

El objetivo

El objetivo primario de esta acción fue desprestigiar a un candidato a presidente, en este caso Macri, con un sitio dedicado a explicar "100 razones para no votar a Macri".

El sitio, un wordpress bajo un servidor externo y dominio reservado con datos ocultos, recibió bastante tráfico por esta campaña pero, como se evidencia en el único sistema de comentarios que tiene (Facebook), la respuesta fue más bien negativa.

Los bots apuntaron a este sitio no sólo con menciones sino con tuits sueltos tratando de forzar el hashtag #cienrazonesparaNOvotaraMACRI , la acción comenzó aproximadamente el 27 de Mayo y duró un mes.

No sólo bots

Hubo un cambio radical entre los bots del 2014 y estos: originalmente no eran bots.

Esto es muy interesante, la red desarticulada el año pasado contaba con usuarios creados entre un rango de fechas muy definido, claramente falsos, al comenzar la investigación de esta otra red noté que no había un patrón en las fechas. Algunos eran de 2012, otros de 2010, había de cualquier año. Raro.

Luego noté que algunos tenían una cantidad de envíos previos a Twitter que no coincidían con otros bots, en vez de ser sólo tuits de la campaña habían fotos propias que coincidían con el avatar. Es raro encontrar bots con "pasado" armado artificialmente, es más fácil robar uno existente. Sin embargo esto era realmente propio y en un día en particular se cortaba su participación.

De golpe, en Enero/Febrero, comenzaban los típicos posteos de bot, falsas frases que no hacen referencia a nada o que son tomadas del streaming principal de Twitter y replicadas aquí.

Evidentemente de alguna forma habían "tomado" estas cuentas, los métodos más comunes son el phishing o una App. La App es vulnerable y el Phishing se soluciona cambiando el password, pero para que esto se solucione la víctima debería saber que ha perdido la cuenta, cosa que no sucedió.

Si se realizó por Phishing ni siquiera hace falta que lo note, teniendo el usuario-password de la víctima sólo hay que chequear primero que no esté muy activa que digamos, por ejemplo, seis meses de inactividad, luego utilizar esas credenciales para postear.

Encontré al menos un par de casos donde el dueño real de la cuenta notó esto y creyó que estaba hackeada, no pude contactarme con la víctima pero si capturar su queja.

A borrar que se nota

Otra característica fenomenal de esta red es que su autor comenzó a borrar con el codo lo tuiteado con la mano

así es, a partir del mes pasado comenzó la limpieza, de esta forma ninguno de los usuarios "infectados" notaría que su cuenta había sido utilizada por una red.

Así mismo Twitter tampoco podría detectarlo, mi scanner de bots no tendría cómo trabajar, etc. Una buena idea pero tardía, pude detectar al menos 4000 usuarios potencialmente bots/secuestrados.

Otro dato interesante fue encontrarme con MUCHAS cuentas con "candado" sin utilizar, estimo que podrán ser activadas a voluntad en caso de necesitarse. Se las "cierra" y un script de detección mucho más no puede hacer.

Hoy por hoy la mayoría de las cuentas sigue existiendo, algunas contienen todavía los tuits incriminadores, otras fueron borradas/anuladas por Twitter, otras no tengo idea, mi base inicial eran seis cuentas, hoy tres estan activas, tres inactivas o borradas:

@kecoluraschi, @lauman20, @MatiasCrestale, @FernaMenendez, @agustinoks, @tatigre

Código y Dump

Hay un problema que se lo dejo a Twitter, los dueño de las cuentas no son bots, pero tampoco son usuarios asiduos de la plataforma, entonces ¿vale la pena borrarle la cuenta? No tengo idea pero si ellos no se preocupan por sus propias identidades en redes sociales ¿Por qué cuidarles el usuario? Que se creen otro o reclamen, la mayoría no tuvo actividad en los últimos seis meses, algunas dos años.

Muchos casos pueden ser falsos positivos, otros reactivarse y volver a ser cuentas independientes, supongo que analizándolo desde Twitter es mucho más fácil notar cuales son los casos que fueron administrados desde un mismo puesto de control, sea un rango de IPs como una app en particular.

Primero aclaraciones del script BotKillah, le hice varios cambios importantes, el primero de ellos es analizar el timeline de las cuentas asociadas, cada vez que tomo un bot me fijo cuales son sus followers y followings, puedo configurar keywords que se van contabilizando y un umbral, a partir de X cuenta lo considera automáticamente bot y no necesito chequear manualmente.

Esta mejora aceleró muchísimo el proceso y me permitió alcanzar la cifra rápidamente, descarta a "ocasionales" que justo comenten tal o cual acción, salen a la vista los "obvios", requiere un poco de trabajo previo pero funciona.

Me falta agregarle un sistema para crear la "semilla", es decir, el primer usuario a investigar, actualmente lo tengo que ingresar a mano en la base de datos (no es código para usuarios casuales), todo está hecho en PHP y requiere datos de acceso a la API de Twitter para la consulta de followers-following, no para la de los timelines porque la hice con un scrapeo, esto para no usar la API y que no se agote tan rápido.

El código fuente lo pueden descargar desde GitHub, no es gran cosa y seguramente en otro lenguaje funcionaría mejor, pero, oiga, lo hice en unos pocos ratos libres que tenía a mano y recibió ayuda de un par de colaboradores vía Git.

Link a Pastebin con id_str, name, screen_name, location, description, followers_count, friends_count, statuses_count. El resto de las relaciones y tuits analizados los tengo también, si alguien de Twitter los quiere analizar, claro.

Si te gustó esta nota podés...

Categoría: Artículos Etiquetas: bots bots en redes sociales fake investigación investigación bots redes sociales social media social media day spam twitter

Escrito por Fabio Baccaglioni

Otros posts que podrían llegar a gustarte...

Spammers de usuarios, a ver si se les ocurre una idea de dónde salen

Atrapado por las redes 4: todo por un review de Etsy

Trolls Electorales Cambiemitas - La otra parte de la historia

Trolls Electorales K - Un pequeño estudio sobre militancia digital

Buscar en MySQL con REGEX y detectar cuentas... ¿falsas?

De trolls, bots, fakes y notas en los diarios

Comentarios

1

Gustavo V 14/07/2015 - 17:55:32

genial, suerte en tu disertación, llegaste a 10 de carisma con las practicas???

2

joaquin 14/07/2015 - 23:31:58

Exitos!!! despues subite un videito y contanos como te fue

3

ezeq 15/07/2015 - 01:18:08

Si!! los que estamos lejos de esos lugares disertores, queremos video!

4

PAbloF 15/07/2015 - 11:18:20

que capo

5

Marco 15/07/2015 - 13:15:27

PAbloF dijo:

que capo

Posta!

6

Francisco 15/07/2015 - 13:17:47

Hace 15 dias mi mujer me comento algo de que le llegaban mails de twitter que ya no usaba hace bocha... Leyendo la nota me acorde, cuando me fui a fijar el twitter, tenia unos twits "falsos" de "100 razones para no votar a macri..."...

7

Fabio Baccaglioni 15/07/2015 - 13:20:38

Francisco dijo:

Hace 15 dias mi mujer me comento algo de que le llegaban mails de twitter que ya no usaba hace bocha... Leyendo la nota me acorde, cuando me fui a fijar el twitter, tenia unos twits "falsos" de "100 razones para no votar a macri..."...

Francisco, podrían chusmear si le dieron permisos a una aplicación que no conocen? para saber quien y cómo envía los mensajes, estaría bueno alertar, de hecho, es básicamente un hackeo de cuenta...

8

Cattel 15/07/2015 - 14:45:35

Espectacular.
Y me alegra que los rusos estos aprendan de sus errores, lo de pishear cuentas orgánicas y después limpiar todo me pareció genial. Lo que también pienso es que deben haber subido los costos, no? No es lo mismo meter usuarios automáticos que tener que estar "criando" usuarios orgánicos.

9

Francisco 15/07/2015 - 15:38:05

Fabio Baccaglioni dijo:

Francisco dijo:

Hace 15 dias mi mujer me comento algo de que le llegaban mails de twitter que ya no usaba hace bocha... Leyendo la nota me acorde, cuando me fui a fijar el twitter, tenia unos twits &quot;falsos&quot; de &quot;100 razones para no votar a macri...&quot;...

Francisco, podrían chusmear si le dieron permisos a una aplicación que no conocen? para saber quien y cómo envía los mensajes, estaría bueno alertar, de hecho, es básicamente un hackeo de cuenta...

Uf... si hay varias y tienen pinta de turbias...

10

Gustavo V 15/07/2015 - 17:29:37

Francisco dijo:

Uf... si hay varias y tienen pinta de turbias...

Y por ahi pasale los datos de la cuenta a Fabio para que lo sume a su analisis... despues le cambias la clave y listo...

11

Yago 22/07/2015 - 18:39:14

Osea que la onda ahora no es tener bots, sino usar cuentas zombies?

Deje su comentario:

Nombre

Email Tranquilo, su email nunca será revelado.

URL La gente de bien tiene URL, no se olvide del http/https

Comentario Comentarios ofensivos o que no hagan al enriquecimiento del post serán borrados/editados por el administrador. Los comentarios son filtrados por Cloudflare Turnstile.