Los Bots en Redes Sociales - 2015



Como hoy estaré dando una charla durante el Social Media Day sobre bots quería dejar aquí la parte más "técnica" de lo que fue mi investigación.

No quería dar una charla con material viejo, del 2014, el cual tuvo bastante repercusión en su momento, en cambio decidí buscar redes falsificadoras de este mismo año y la búsqueda ni tuve que hacerla, llegaron por cuenta propia :P

Además aproveché para actualizar el código fuente de mi software "BotKillah" para dar con esta linda red, ahora paso los datos crudos a ustedes, esto no será parte de la charla porque es demasiado detalle de lo técnico y un caso en particular, mi charla va por el lado del negocio publicitario y por qué considero que esto afecta negativamente el ecosistema...

Update: Agregué video que armé luego de la charla para que tengan la misma data de lo que dí, cuando consiga el video oficial lo sumo Guiño




nota en Clarín del 2014 sobre mi primer investigación


El objetivo



El objetivo primario de esta acción fue desprestigiar a un candidato a presidente, en este caso Macri, con un sitio dedicado a explicar "100 razones para no votar a Macri".

El sitio, un wordpress bajo un servidor externo y dominio reservado con datos ocultos, recibió bastante tráfico por esta campaña pero, como se evidencia en el único sistema de comentarios que tiene (Facebook), la respuesta fue más bien negativa.

Los bots apuntaron a este sitio no sólo con menciones sino con tuits sueltos tratando de forzar el hashtag #cienrazonesparaNOvotaraMACRI , la acción comenzó aproximadamente el 27 de Mayo y duró un mes.



No sólo bots



Hubo un cambio radical entre los bots del 2014 y estos: originalmente no eran bots.

Esto es muy interesante, la red desarticulada el año pasado contaba con usuarios creados entre un rango de fechas muy definido, claramente falsos, al comenzar la investigación de esta otra red noté que no había un patrón en las fechas. Algunos eran de 2012, otros de 2010, había de cualquier año. Raro.

Luego noté que algunos tenían una cantidad de envíos previos a Twitter que no coincidían con otros bots, en vez de ser sólo tuits de la campaña habían fotos propias que coincidían con el avatar. Es raro encontrar bots con "pasado" armado artificialmente, es más fácil robar uno existente. Sin embargo esto era realmente propio y en un día en particular se cortaba su participación.

De golpe, en Enero/Febrero, comenzaban los típicos posteos de bot, falsas frases que no hacen referencia a nada o que son tomadas del streaming principal de Twitter y replicadas aquí.

Evidentemente de alguna forma habían "tomado" estas cuentas, los métodos más comunes son el phishing o una App. La App es vulnerable y el Phishing se soluciona cambiando el password, pero para que esto se solucione la víctima debería saber que ha perdido la cuenta, cosa que no sucedió.

Si se realizó por Phishing ni siquiera hace falta que lo note, teniendo el usuario-password de la víctima sólo hay que chequear primero que no esté muy activa que digamos, por ejemplo, seis meses de inactividad, luego utilizar esas credenciales para postear.

Encontré al menos un par de casos donde el dueño real de la cuenta notó esto y creyó que estaba hackeada, no pude contactarme con la víctima pero si capturar su queja.



A borrar que se nota



Otra característica fenomenal de esta red es que su autor comenzó a borrar con el codo lo tuiteado con la mano :D así es, a partir del mes pasado comenzó la limpieza, de esta forma ninguno de los usuarios "infectados" notaría que su cuenta había sido utilizada por una red.

Así mismo Twitter tampoco podría detectarlo, mi scanner de bots no tendría cómo trabajar, etc. Una buena idea pero tardía, pude detectar al menos 4000 usuarios potencialmente bots/secuestrados.

Otro dato interesante fue encontrarme con MUCHAS cuentas con "candado" sin utilizar, estimo que podrán ser activadas a voluntad en caso de necesitarse. Se las "cierra" y un script de detección mucho más no puede hacer.

Hoy por hoy la mayoría de las cuentas sigue existiendo, algunas contienen todavía los tuits incriminadores, otras fueron borradas/anuladas por Twitter, otras no tengo idea, mi base inicial eran seis cuentas, hoy tres estan activas, tres inactivas o borradas:

@kecoluraschi, @lauman20, @MatiasCrestale, @FernaMenendez, @agustinoks, @tatigre

Código y Dump



Hay un problema que se lo dejo a Twitter, los dueño de las cuentas no son bots, pero tampoco son usuarios asiduos de la plataforma, entonces ¿vale la pena borrarle la cuenta? No tengo idea pero si ellos no se preocupan por sus propias identidades en redes sociales ¿Por qué cuidarles el usuario? Que se creen otro o reclamen, la mayoría no tuvo actividad en los últimos seis meses, algunas dos años.

Muchos casos pueden ser falsos positivos, otros reactivarse y volver a ser cuentas independientes, supongo que analizándolo desde Twitter es mucho más fácil notar cuales son los casos que fueron administrados desde un mismo puesto de control, sea un rango de IPs como una app en particular.



Primero aclaraciones del script BotKillah, le hice varios cambios importantes, el primero de ellos es analizar el timeline de las cuentas asociadas, cada vez que tomo un bot me fijo cuales son sus followers y followings, puedo configurar keywords que se van contabilizando y un umbral, a partir de X cuenta lo considera automáticamente bot y no necesito chequear manualmente.

Esta mejora aceleró muchísimo el proceso y me permitió alcanzar la cifra rápidamente, descarta a "ocasionales" que justo comenten tal o cual acción, salen a la vista los "obvios", requiere un poco de trabajo previo pero funciona.

Me falta agregarle un sistema para crear la "semilla", es decir, el primer usuario a investigar, actualmente lo tengo que ingresar a mano en la base de datos (no es código para usuarios casuales), todo está hecho en PHP y requiere datos de acceso a la API de Twitter para la consulta de followers-following, no para la de los timelines porque la hice con un scrapeo, esto para no usar la API y que no se agote tan rápido.

El código fuente lo pueden descargar desde GitHub, no es gran cosa y seguramente en otro lenguaje funcionaría mejor, pero, oiga, lo hice en unos pocos ratos libres que tenía a mano y recibió ayuda de un par de colaboradores vía Git.



Link a Pastebin con id_str, name, screen_name, location, description, followers_count, friends_count, statuses_count. El resto de las relaciones y tuits analizados los tengo también, si alguien de Twitter los quiere analizar, claro.

Otros posts que podrían llegar a gustarte...

Comentarios

  • Gustavo V    

    genial, suerte en tu disertación, llegaste a 10 de carisma con las practicas???

    • Responder
    • Citar
    • Comentado:
  • joaquin    

    Exitos!!! despues subite un videito y contanos como te fue

    • Responder
    • Citar
    • Comentado:
  • ezeq    

    Si!! los que estamos lejos de esos lugares disertores, queremos video!

    • Responder
    • Citar
    • Comentado:
  • PAbloF    

    que capo

    • Responder
    • Citar
    • Comentado:
  • Marco    

    PAbloF dijo:

    que capo


    Posta!

    • Responder
    • Citar
    • Comentado:
  • Francisco    

    Hace 15 dias mi mujer me comento algo de que le llegaban mails de twitter que ya no usaba hace bocha... Leyendo la nota me acorde, cuando me fui a fijar el twitter, tenia unos twits "falsos" de "100 razones para no votar a macri..."...

    • Responder
    • Citar
    • Comentado:
  • Francisco dijo:

    Hace 15 dias mi mujer me comento algo de que le llegaban mails de twitter que ya no usaba hace bocha... Leyendo la nota me acorde, cuando me fui a fijar el twitter, tenia unos twits "falsos" de "100 razones para no votar a macri..."...


    Francisco, podrían chusmear si le dieron permisos a una aplicación que no conocen? para saber quien y cómo envía los mensajes, estaría bueno alertar, de hecho, es básicamente un hackeo de cuenta...

    • Responder
    • Citar
    • Comentado:
  • Cattel    

    Espectacular.
    Y me alegra que los rusos estos aprendan de sus errores, lo de pishear cuentas orgánicas y después limpiar todo me pareció genial. Lo que también pienso es que deben haber subido los costos, no? No es lo mismo meter usuarios automáticos que tener que estar "criando" usuarios orgánicos.

    • Responder
    • Citar
    • Comentado:
  • Francisco    

    Fabio Baccaglioni dijo:

    Francisco dijo:
    Hace 15 dias mi mujer me comento algo de que le llegaban mails de twitter que ya no usaba hace bocha... Leyendo la nota me acorde, cuando me fui a fijar el twitter, tenia unos twits "falsos" de "100 razones para no votar a macri..."...


    Francisco, podrían chusmear si le dieron permisos a una aplicación que no conocen? para saber quien y cómo envía los mensajes, estaría bueno alertar, de hecho, es básicamente un hackeo de cuenta...

    Uf... si hay varias y tienen pinta de turbias...

    • Responder
    • Citar
    • Comentado:
  • Gustavo V    

    Francisco dijo:


    Uf... si hay varias y tienen pinta de turbias...


    Y por ahi pasale los datos de la cuenta a Fabio para que lo sume a su analisis... despues le cambias la clave y listo...

    • Responder
    • Citar
    • Comentado:
  • Yago    

    Osea que la onda ahora no es tener bots, sino usar cuentas zombies?

    • Responder
    • Citar
    • Comentado:

Deje su comentario:

Tranquilo, su email nunca será revelado.
La gente de bien tiene URL, no se olvide del http/https
Para evitar bots, si se tardó mucho en leer la nota seguramente no sirva y tenga que intentar dos veces

Negrita Cursiva Imagen Enlace


comentarios ofensivos o que no hagan al enriquecimiento del post serán borrados/editados por el administrador