De trolls, bots, fakes y notas en los diarios

02/05/2018 - 13:12:10 por Fabio Baccaglioni - 11276 - 19 - En Actualidad

Hoy se publicó una nota en La Nación en la cual aparezco como fuente, una más, no es la primera vez que soy consultado para estos temas que vengo investigando hace años así que para mi es lo más normal del mundo. Un par de meses atrás salió otra en Clarín sobre el mismo tema y donde también fui parte. Mi foco, en este caso, es solamente en Twitter ya que su API me permite juntar información y yo me baso en datos, no en deseos.

Lo curioso de estas notas es la reacción que generan, en particular esta última tiene algún que otro problema: soy el único que aparece con nombre y apellido. Así es, el único que, como fuente, se hace cargo de su propia existencia. Esto es, obviamente, un probleama en todo artículo a la hora de considerar la veracidad del mismo y, por mi parte, sólo puedo dar autenticidad de lo que digo, ni siquiera de lo que interpreta el periodista.

La reacción que noto es de negación en muchos casos, no voy a juzgar cómo está escrita la nota, pero negar la existencia de agencias trabajando para forzar temáticas, hashtags, comentarios y demás es tan ridículo como la paranoia de que esto sea realmente efectivo al largo plazo.

Todas las figuras políticas trabajan en la actualidad con campañas de imagen y agencias que difunden información "tocada" para mejorar su imagen o derivar la atención a un tema que no los toque. TODOS LOS POLÍTICOS LO HACEN. Si, hasta ese inocente y poco votado que apreciás por ser "de abajo" suele tener un grupo de partidarios haciendo el trabajo desde su mini bunker de barrio. Es exactamente lo mismo que hace un gran político lleno de dinero y con respaldo, sólo cambia el volumen, la proporción.

Esto no debe sorprendernos, no volvernos paranoicos, es lo natural porque hasta las marcas lo hacen cuando impulsan un producto, contratan influencers, actores, hablan de su nueva gaseosa, el auto con todas las prestaciones, sonríen, te muestran qué linda es la vida en un acting de absoluta falsedad que aceptamos naturalmente bajo el nombre de "pubicidad".

La política tomó esto hace un tiempo aunque tal vez con más verborragia. Hacerlo en las redes sociales es una pata más de una enorme maquinaria propagandística. ¿Y qué?

El uso de cuentas apócrifas tiene varios matices, por un lado está el uso activo para atacar a rivales y/u opositores, pero no es la única forma, también se usan para fijar la vista en otro tema y poder sacarla de una que complica. Así pues no es extraño que cuentas políticas de pronto esten hablando de fútbol o del programa de Mirtha Legrand. Si podemos desviar el foco es tan útil como sembrar una mentira o difundir un dato, a veces es hasta más efectivo. Es parte del juego.

El año pasado reconstruí mi software para capturar data, pasé de hacerlo orientado a bots a orientado a política/temática y ahí en tal caso identificar cada perfil. Me propuse un trabajo manual arduo pero interesante, marca "a mano" qué tendencia política tenía cada uno estudiando sus perfiles, primero buscando a partir de las figuras más relevantes para luego ir identificando a sus operadores políticos. Otra casta que no es la misma que la de un troll o un fake. Eso me sirvió para identificar con una gran probabilidad de acierto de qué orientación política es cada uno.

En mi base de datos actual, luego de casi un año, tengo identificados 33.5k kirchneristas, 18k del PRO, unos 1800 Massistas y 546 de otros partidos, sí, hay muchos más, pero esa es la muestra con la que trabajo y me está sirviendo mucho. De todo este set de datos unos 5100 son cuentas confirmadas como falsas, sin nombre real o con nombre ficticio, avatares robados, biografías simuladas y timelines dudosos, los "Fakes". Como probables bots (contabilizados como fakes también, se superponen) tengo unos 3800 usuarios, ni siquiera son buenos bots, algunos sólo hacen RTs.

Troll, lo que se dice troll, es decir que trabaje para ello, no supera los 260 usuarios, y esto ya les daría un parámetro de qué pequeño es este ruidoso mundo, los operadores son una cifra similar y a muchos los conocemos, trabajan promoviendo cosas de un partido o un gobierno y suelen hasta dar nombre y apellido (no todos), tampoco ellos son, para mí, un problema. Todo político tiene voceros.

Sí puedo asegurarles que muchas de las notas que en medios hablan sobre "cómo repercutió en las redes" son víctimas del trabajo de las cuentas apócrifas o hasta de cuentas verdaderas pero no representativas. Esta es la verdadera enfermedad, el verdadero problema. No puedo identificar más de 100.000 usuarios activos hablando de política en una semana, 100k es NADA, pero es suficiente para torcer qué dicen los diarios y la televisión.

Es ahí donde debería estar el foco en vez de preocuparnos por las cuentas apócrifas que si bien son una medida y un termómetro no son por sí mismas un problema, son una consecuencia.

Desarrollé mi software para poder VER esto en tiempo casi real y lo genial es que me lo permite, sí, algunos me piden que lo libere, mi idea es más bien comercializarlo (acepto propuestas indecentes

) pero lo cierto es que es medible, es mensurable, los datos estan, los puede analizar cualquiera si se toma el mismo trabajo que me tomé yo y son datos libres que la API de Twitter deja ver a quien quiera.

Todo el arco político está conformado por trolls? Falso, un partidario político es eso, defiende en lo que cree, reacciona a lo que le molesta, su reacción puede ser virulenta, puede interpretarse como mal intencionada, pero la realidad es que son muy pocos los que trabajan de esto.

Ahora bien, existen los trolls pagos? Sí, existen, se paga por ello, negarlos es tan ridículo como asumir que todo usuario lo es, son dos realidades de una misma red social, el abanico de posibilidades es enorme y la simplificación es a veces el problema cuando se lo analiza. Debería escribir todo un paper con lo que descubrí hasta ahora, no se bien por dónde empezar pero datos me sobran.

Desde ya que, repito, yo no soy quien escribe las notas pero sí tengo mis fuentes (gente que trabaja haciendo esto y vive de ello) y mis datos (los de la API de Twitter) más mi experiencia a la hora de analizar y tratar grandes volumenes de datos, crear el software, adaptarlo, modificarlo constantemente, hacerlo funcionar y automatizarlo. Qué se hace con esos datos, bueno, eso ya es otra historia

Si te gustó esta nota podés...

Categoría: Actualidad Etiquetas: análisis bot botkillah bots fake fakes periodismo redes redes sociales troll twitter

Escrito por Fabio Baccaglioni

Otros posts que podrían llegar a gustarte...

El Doxeo masivo en Twitter y cómo te engañan todos los días con tal de sacarte de tus casillas

Spammers de usuarios, a ver si se les ocurre una idea de dónde salen

La era de las redes sociales pagas

Todos quieren reemplazar a Internet

Atrapado por las redes 5: Revelando secretos de estado para ganar una discusión online

Atrapado por las redes 4: todo por un review de Etsy

Comentarios

1

pablo 02/05/2018 - 15:06:35

...el que no ha trolleado alguna vez que tire la primera piedra!

2

Lelale 02/05/2018 - 16:36:33

pablo dijo:

...el que no ha trolleado alguna vez que tire la primera piedra!

O la primera moneda en este caso

3

Camila 02/05/2018 - 17:19:31

Please que alguien me pase en limpio.
la cuestión sería que: los trolls existen pero no son tantos como un cree, ni tan pocos como para no darles importancia?

4

Cattel 02/05/2018 - 17:53:09

Camila dijo:

Please que alguien me pase en limpio.
la cuestión sería que: los trolls existen pero no son tantos como un cree, ni tan pocos como para no darles importancia?

Son los medios tradicionales los que deberían poner en perspectiva lo que dicen 260 pibes del call center en vez de publicar titulares incendiarios de lo que "arde en las redes".

Se podría usar tu base para "marcar" en la TL de cada uno a los bots y los trolls, sobre todo los trolls? Que me aparezcan con el iconito de troll pago. O deberías desarrollar una app para twitter con eso retocado?

En FB no vale la pena porque uno sabe que los trolls son un tío K o una suegra Pro!

5

pablo 02/05/2018 - 19:53:24

Fabio! Buen laburo che. La herramienta parece muy interesante! Porque no pones una versión gratis que tenga lo más básico y después cobras algo por ver el resto de la data? O sea, un frontpage con datos agregados a nivel macro y si quieren ver más, que paguen.
Digo, te convertirias en el referente de los "cazadores de bots" y quizas alguien esté interesado en comprarte la idea o comprar el resto de los datos (suscripción?).
Espero que te sirva!
Saludos,
Pablo

PD: entré porque esos graficos huelen a matplotlib

6

Fabio Baccaglioni 02/05/2018 - 22:23:04

pablo dijo:

Fabio! Buen laburo che. La herramienta parece muy interesante! Porque no pones una versión gratis que tenga lo más básico y después cobras algo por ver el resto de la data? O sea, un frontpage con datos agregados a nivel macro y si quieren ver más, que paguen.
Digo, te convertirias en el referente de los "cazadores de bots" y quizas alguien esté interesado en comprarte la idea o comprar el resto de los datos (suscripción?).
Espero que te sirva!
Saludos,
Pablo

PD: entré porque esos graficos huelen a matplotlib

es exactamente lo que voy a hacer (estoy refinando código, claro), la idea es que exista una demo púbica con algunos informes prearmados y stats más o menos en tiempo real y luego una versión paga más completa.

Cattel dijo:

Camila dijo:

Please que alguien me pase en limpio.
la cuestión sería que: los trolls existen pero no son tantos como un cree, ni tan pocos como para no darles importancia?

Son los medios tradicionales los que deberían poner en perspectiva lo que dicen 260 pibes del call center en vez de publicar titulares incendiarios de lo que "arde en las redes".

Se podría usar tu base para "marcar" en la TL de cada uno a los bots y los trolls, sobre todo los trolls? Que me aparezcan con el iconito de troll pago. O deberías desarrollar una app para twitter con eso retocado?

En FB no vale la pena porque uno sabe que los trolls son un tío K o una suegra Pro!

exactamente, así funciona, el problema mayor que se está dando es que donde hay opinión pública siempre habrá tergiversadores queriendo aprovecharse. Quienes deben estar atentos son los comunicadores.

Una herramienta como la que armé sirve para, justamente, detectar operetas y por ende evitar caer en la trampa. Pero es muy tentador caer en la trampa cuando no tenés noticias relevantes para dar o sólo buscás tráfico.

7

MarceloC 03/05/2018 - 02:17:14

En cuanto a la nota de La Nación -que muestra una realidad, o una parte- no parece haber tenido
demasiado peso, mas si mirás los comentarios de los usuarios del diario. Están en la pelotudez,
mezclan temas, hay gente que se la da de "yo tengo la posta", mas los idas y vueltas de k contra pro y las
peleas dentro del micromundo de usuarios de ese diario.

Una pena.

Fabio, creo que tenés algo muy bueno entre manos y a lo que le tenés que exprimirle todo el jugo.
Seguro en algún momento te va a sonar el celu y va a aparecer gente interesada en tu laburo y
en la data.

Éxitos !

8

Lelale 03/05/2018 - 06:41:51

pablo dijo:

Fabio! Buen laburo che. La herramienta parece muy interesante! Porque no pones una versión gratis que tenga lo más básico y después cobras algo por ver el resto de la data? O sea, un frontpage con datos agregados a nivel macro y si quieren ver más, que paguen.
Digo, te convertirias en el referente de los "cazadores de bots" y quizas alguien esté interesado en comprarte la idea o comprar el resto de los datos (suscripción?).
Espero que te sirva!
Saludos,
Pablo

PD: entré porque esos graficos huelen a matplotlib

Matplotlib... este tipo me agrada.

9

Facundo 03/05/2018 - 10:28:21

Che a Russia today no le gusta tu proyecto , fuera de chiste ¿se puede aplicar para ver las campañas de esta máquina de fake news?

10

timoss 03/05/2018 - 10:56:38

Che tus críticas al sistema de trolling va a generar que mejoren su trolleo.

11

Gustavo V 03/05/2018 - 12:00:59

Fabito, dame acceso a ese github, ya sabes mi mail

Gracias, esta muy buena la radio

12

Nahux 04/05/2018 - 10:05:41

Como bien decís, todos los proyectos políticos tienen exposición online; algunos serán rentados aunque una gran mayoría deben ser militantes.
Lo que es preocupante son aquellos a los que se les paga con dinero público. Supongo que se puede inferir pero no probar a esta altura.

13

Camila 04/05/2018 - 11:29:51

Gracias Cattel y Fabio
a mirar las noticias con un poco más de atención

14

MarioCletus 06/05/2018 - 03:22:16

Seguí investigándonos y vas a aparecer flotando en el Riachuelo. Zurdito!

15

Sergio Achenbach 09/05/2018 - 01:47:28 Revisado: 09/05/2018 - 01:49:43

Creo que lo de Facebook es más siniestro que 200 supuestos trolls "pagados". Por ejemplo, mí viejo es un jubilado que se la pasa posteando en Fb cosas anti K, pro PRO y de la iglesia católica. Todavía no conoce Twitter, pero creo que caería en un troll pago. Y como viejo debe haber miles, no 200. Ojo, sin desmerecer tu laburo

16

timoss 09/05/2018 - 13:46:12

Te amenazaron !
Aunque media rara, yo que vos hago la denuncia.

17

aqui_c 16/05/2018 - 03:31:39

Entiendo tu idea de querer hacer guita con esto. Pero sinceramente, si nadie puede auditar tu código y tus datos, los resultados son tan buenos como los de un troll.
Puede haber errores honestos, por supuesto, pero tiendo a no creer en tales cosas. Acaso no sos partidario? Acaso no te convendría agachar la cabeza si tu empleador no te presiona para generar un sesgo? Acaso no te corromperías por algo de dinero de uno u otro lado?

18

Fabio Baccaglioni 16/05/2018 - 10:33:10

aqui_c dijo:

Entiendo tu idea de querer hacer guita con esto. Pero sinceramente, si nadie puede auditar tu código y tus datos, los resultados son tan buenos como los de un troll.
Puede haber errores honestos, por supuesto, pero tiendo a no creer en tales cosas. Acaso no sos partidario? Acaso no te convendría agachar la cabeza si tu empleador no te presiona para generar un sesgo? Acaso no te corromperías por algo de dinero de uno u otro lado?

Quien audita al auditor? Esto no se trata de un problema de código cerrado / código abierto sino de datos, el código es irrelevante porque es tan sólo un capturador de información y un agrupador al hacer estadísticas, el punto son los datos (que son libres y estan ahí para ser capturados por cualquier software) y la única parte discrecional es que un usuario (el cliente o quien lo use) defina qué quiere medir y qué calificar y cómo.
Empleador? El soft es 100% mío, así que no hay un tercero ejerciendo influencia. Dinero de un lado u otro? Creo que no entendés la naturaleza del software que es totalmente agnóstico. Si quien contrata el software es del partido A, utilizará los datos a su favor, la interpretación será propia, el mismo set de datos puede ser tomado por el partido B y ver una cosa totalmente distinta. Yo no me meto en eso, el soft sólo provee una forma de clasificar y ordenar información, qué hace un tercero con ella es indistinto.

El sesgo es del análisis, no del software, ese es el punto. Y si creés que me vas a presionar para liberarlo no che, que no soy tan fácil, hacé un mejor esfuerzo, jejeje. Nah, es bien simple como software, aun cuando pretendo meterle ML para clasificación todo depende de quien interprete los acumulados de datos.

19

aqui_c 17/05/2018 - 16:44:27

Fabio Baccaglioni dijo:

aqui_c dijo:

Entiendo tu idea de querer hacer guita con esto. Pero sinceramente, si nadie puede auditar tu código y tus datos, los resultados son tan buenos como los de un troll.
Puede haber errores honestos, por supuesto, pero tiendo a no creer en tales cosas. Acaso no sos partidario? Acaso no te convendría agachar la cabeza si tu empleador no te presiona para generar un sesgo? Acaso no te corromperías por algo de dinero de uno u otro lado?

Quien audita al auditor? Esto no se trata de un problema de código cerrado / código abierto sino de datos, el código es irrelevante porque es tan sólo un capturador de información y un agrupador al hacer estadísticas, el punto son los datos (que son libres y estan ahí para ser capturados por cualquier software) y la única parte discrecional es que un usuario (el cliente o quien lo use) defina qué quiere medir y qué calificar y cómo.
Empleador? El soft es 100% mío, así que no hay un tercero ejerciendo influencia. Dinero de un lado u otro? Creo que no entendés la naturaleza del software que es totalmente agnóstico. Si quien contrata el software es del partido A, utilizará los datos a su favor, la interpretación será propia, el mismo set de datos puede ser tomado por el partido B y ver una cosa totalmente distinta. Yo no me meto en eso, el soft sólo provee una forma de clasificar y ordenar información, qué hace un tercero con ella es indistinto.

El sesgo es del análisis, no del software, ese es el punto. Y si creés que me vas a presionar para liberarlo no che, que no soy tan fácil, hacé un mejor esfuerzo, jejeje. Nah, es bien simple como software, aun cuando pretendo meterle ML para clasificación todo depende de quien interprete los acumulados de datos.

Si el código es libre, yo soy el auditor, juan es el auditor. Vos decís que los datos están ahí y son públicos, pero no es cierto. Quiénes son los que definís como bots, trolls, etc. No es público.

Con tu empleador no se refería a quién te pagó para hacer este programa, sino que, si no me equivoco, tu empleador es el eatado. Resistirías la presión de tu propio empleador, por ejemplo?

Vos decís que el software es agnóstico. Pero no se de qué software estás hablando. El que te permite hacer el plot? O el que te permite coleccionar datos? Si te referís al segundo, tu clasificación manual de usuarios le quita todo el agnosticismo. Quizás tenés otro post en el que explicás tus métodos, pero mientras no sean públicos, no hay forma de verificar.

Al final, qué es lo que querés? Un mango fácil? O generar una herramienta que permita cambiar algo?

Deje su comentario:

Nombre

Email Tranquilo, su email nunca será revelado.

URL La gente de bien tiene URL, no se olvide del http/https

Comentario Comentarios ofensivos o que no hagan al enriquecimiento del post serán borrados/editados por el administrador. Los comentarios son filtrados por Cloudflare Turnstile.