Trolls Electorales K - Un pequeño estudio sobre militancia digital

Hace ya varios años que vengo coleccionando información sobre la actividad política en Twitter, principalmente porque es la única red social que me permite hacerlo sin tener que pagar fortunas. Lo bueno de esto es que ha sido un excelente ejercicio de investigación, programación y análisis de datos.

Lo malo es que me he tenido que encontrar con cada cosa que no le recomendaría a nadie. Aprenderme las tendencias y formas de los más verborrágicos en Argentina, estamos hablando de mucho odio concentrado. Pero gracias a todo eso creo que puedo mostrarles el siguiente análisis de cómo funciona la militancia digital en Twitter, en este caso desde el kirchnerismo, y no es casual que sea de esta facción en particular: es la más numerosa y activa.

A continuación los detalles y, aviso, hay mucha definición, hashtags, números y odio político :D 

Definiciones

Antes de comenzar a mostrar números y tendencias sería ideal explicar un poco el criterio utilizado.

Desde hace tres años vengo coleccionando información sobre cuentas de redes sociales de trolls, bots, operadores, gente común y hasta muchos que nada tienen que ver con la política. El foco, sin embargo, estuvo en esto último que menciono, la política, tratando de dar, filtrar y segmentar la participación activa de usuarios de Twitter en la política.
Esto implica que todo se mezclará y uno deberá hacer el ejercicio de selección, discriminación y curación de la información para poder obtener algo relevante. Eso hice.

En mi sistema diferencio entre "Sin datos", como la gran mayoría, la masa de la cual uno no puede definir una tendencia política firme, Pro, Kirchnerismo, Massismo (inexistente para 2019) y "Otros" que incluye a la izquierda en mayor medida y otras fuerzas mínimas que realmente no pueden promover ninguna tendencia en Twitter.

Luego, para que tenga sentido todo esto, diferencio entre cuentas que podrían ser Troll, Fake, Bot, Operador, Medio, Famoso, Fan, o simplemente ninguna de estas cosas si no es posible identificarlo fielmente.

¿Qué es cada una? En versión simplificada el troll es el que ataca directamente, el más verborrágico e insoportable, el flag Fake sólo identifica si es una cuenta "falsa", puede ser un bot, troll o un personaje, el tema es que no sea un individuo identificable sino una cuenta de muchas, cuentas secundarias, cuentas usadas para atacar, usualmente las que no dan la cara. 

Bot es una cuenta operada tanto sea por una central que envía spam como por un operador político que cuenta con múltiples cuentas y algunas las utiliza para "potenciar" a una cuenta objetivo.

Operador es el que promueve y dispara temas, en política se usa mucho, la "tropa" se encolumna detrás de la "propuesta" del operador. Suelen contar con información supuestamente "privilegiada" y "tiran postas", hay muchos pero son una minoría comparado con la tropa.

El flag medio discrimina cuentas de medios de comunicación y algunos periodistas que las utilizan en ese sentido, pero puede estar asociado a los otros flags sin problemas (Ej: periodista, famoso, operador y massista, tendrá esos flags marcados). Fan es un flag que armé para diferenciar usuarios que tan sólo son fans de algo y poder separarlo de la política. Famoso es para marcar cuentas con una gran cantidad de seguidores, los políticos más importantes suelen tener marcado esto en mi sistema.

Lo útil es que son flags, banderas, indicadores que pueden sumarse, integrarse y estar todos a la vez o sencillamente no tener ninguno. Inclusive los de filiación política pueden estar combinados como la izquierda+kirchnerismo o massismo+kirchnerismo puede darse el caso... porque se da.

Toda esta información la colecciono con mi propio software y traigo todo desde la API pública de Twitter así que sólo mido información accesible libremente por todo el mundo.

Estadísticas Generales y criterio

En particular este análisis lo hago sobre el kirchnerismo y hay varios motivos para hacerlo.

Contrariamente a la creencia popular instaurada por una parte de la militancia digital no son los "Trolls de Marquitos Peña" el segmento más grande, es apenas un tercio si lo comparamos con el kirchnerismo en todas sus vertientes. El resto de las fuerzas políticas podrá ser ruidoso en ocasiones pero no llega ni a los talones.

Durante la semana es fácil encontrar más actividad kirchnerista que del Pro porque son más obvios y directos, esto me permite encontrarlos fácilmente. El Pro suele manejar otros criterios a la hora de "trollear", ya sea acción directa entre usuarios y usualmente menos hashtags.

El kirchnerismo, por su parte, se podría decir que utiliza métodos "tradicionales" (como si esto fuese algo antiguo) y abusa de hashtags con bastante creatividad a la hora de crearlos con cierta diversidad. En Twitter los hashtags son hundidos automáticamente si se repiten durante mucho tiempo, así pues es mejor crear uno o dos cada día que utilizar el del día anterior.

He visto en medios tradicionales a supuestos "expertos" decir que por esta razón el kirchnerismo había "ganado" la batalla en redes, algo que no tiene ningún sentido porque los hashtags no miden, para nada, lo que la gente lee o dice, simplemente es lo que la militancia promueve y es tan sólo UNO de los métodos para hacerlo. Se puede lograr el mismo efecto o mayor sin siquiera tocar un hashtag.

En mi base de datos tengo identificados unos 60.000 kirchneristas y 25.000 del Pro, suficiente masa crítica para verificar cada acción política en Twitter porque la realidaad es que no participa mucha más gente yestimo que la mitad, al menos, podría ser una cuenta apócrifa, así que los números reales deberían ser menores.

Una semana de muestra

Tomé tan sólo diez hashtags utilizados por el kirchnerismo durante una semana, del 9 al 13 de Julio, semana con feriado en el medio pero que no implicó cambios en la estrategia.

De estos diez hashtags podemos identificar tres positivos hacia los propios candidatos y siete en contra de los rivales. Es una estrategia muy común en esta fuerza política que prioriza el ataque y el tratar constantemente de instaurar ideas o temas que empañar a sus rivales, se nota fácilmente con los nombres de los mismos, hasta algunos (lo digo a título personal) son fantásticos por la creatividad.

Contabilicé 53582 publicaciones que incluyen twitts y retwitts, de los cuales apenas el 30% es contenido original, el resto es republicar lo que ya existe.

Esto es interesante porque no es tanta la gente participando, son apenas 17.000 usuarios entre los cuales hay varios con cientos de publicaciones y retuits, una supera los 800, UNA SOLA CUENTA, una decena está por arriba de 300 publicaciones, como se imaginarán no es una participación muy comunitaria, es una clara acción coordinada.

De esos 17.000 usuarios apenas 4600 crearon contenido original para los hashtags. Pero hay más cosas interesantes.

Primero que nada la distribución diaria, el 8/7 era "LasMentirasDeVidal", el 9 "MacriAngustiado", el 10 dos de las que más me gustaron "DevastacionMacrista" y "NegacionismoM", el 11 "SinOdioNoHayMacrismo" y la primera positiva con "KicillofConTodos" promoviendo al candidato a gobernador Kicillof, el 12 "AltaSuciedadPro" y "AlbertoPresidente" y el 13 "AxelGobernador" y un clásico de Twitter: "MacriEsPobreza".

Como notarán hay un claro intento de sembrar una idea alrededor de los rivales pero en el caso de los propios es una campaña más "clásica".

De todas estas la que más participación tuvo fue "LasMentirasDeVidal" y Kicillof tuvo dos hashtags contra uno de Alberto Fernández, lo que deja en claro dónde está puesto el foco de la campaña, la Provincia de Buenos Aires.

Vamos con los hashtags uno por uno, puede resultar aburrido pero son los datos crudos así no se quejan de que falta información, todo esto está en mi base de datos que ya comprende unos 25GB de tuits desde 2017.

De Trolls y Fakes

Como habrán notado en la parte inferior de cada gráfico hay una tablita con los "top" de cada hashtag, las cifras son totalmente antinaturales, 200, 300 tuits sobre un mismo tema, algunos de estos usuarios casi no tienen tuits propios, es todo RT, ametralladoras de compartir mensajes.

Hay miles de usuarios que ni seguidores tienen, son fáciles de filtrar, pero otros han construido perfiles falsos muy buenos con muchos seguidores y bastante actividad. Ser Fake o Troll no implica dejar de aprovechar la oportunidad de que tontos y crédulos supongan que es una cuenta real, así muchas cuentas falsas se transforman en operadores con nombre y apellido.

Ahora bien, aquí intenté marcar con colores la repetición de usuarios entre temas, es genial:

Como notarán hay repeticiones entre todas las acciones, como les dije, son apenas 17k usuarios participando de las diez acciones, hubo más acciones, desde ya, estas son las que más envíos tuvieron.

La estrategia es simple, atacar con lo que se pueda al rival, muchas veces tan sólo son tuits con el hashtag sin contenido alguno, forzar temáticas en la lista de hashtags del día y con eso dar por cumplida la jornada. Estimo que se paga por haber alcanzado dicho objetivo.

El objetivo secundario es que algún periodista sin ideas tome alguna de esas keywords y las utilice para escribir algo o, como mencioné antes, creer que uno u otro "ganó" una batalla ficticia en la que no hubo combate alguno, sólo un ejército en un campo vacío tirando al aire. Porque de eso se trata esta contienda digital.

Con menos de 5000 usuarios se puede sostener una acción semanal que se basa en el ruido y no en el contenido, el engaño por saturación, el "copar" un espacio a los gritos porque el contenido de la acción es irrelevante, lo que importa es que nadie más sea escuchado.

Esta estrategia le ha funcionado a muchos políticos a nivel global, no se si tiene resultado más allá de saturar el canal, pero se usa y a los que más les rinde es a quienes cobran por hacerlas.

El Kirchnerismo en particular adoptó esta metodología hace unos años, primero fraguando participación en blogs como éste mismo (se acuerdan de los blogueros K? esos que me querían forzar a hablar de tal o cual tema y no lo lograban? me amenazaron mucho :D) y luego a Facebook y Twitter donde siguen muy activos.

Por todo esto se paga, no es gratis, tampoco demasiado caro, pero se paga porque hay que estar todo el día publicando, hay cuentas que hacen su trabajo en marcado horario de oficina así que podemos hablar de un trabajo de tiempo completo.

Hay cuentas que, en cambio, postean TODO el día sin interrupción, con una desproporción increíble entre contenido generado y republicado de terceros, pero lo interesante de estas cuentas es que no son 100% automatizadas y varias estan, en cambio, utilizadas por varios operadores a la vez.

Resulta que hace un buen tiempo confirmaron que era mucho más exitosa una cuenta que ocasionalmente tuiteaba cosas reales que una 100% falsa. Es más, el truco ideal es que respondan preguntas de vez en cuando. Crear un perfil que se pueda atender dos o tres veces al día mientras el resto se automatiza.

Esta estrategia de semi-bot evita también que los sistemas automáticos bloqueen o den de baja la cuenta, como no se puede decir que no estan activas y sólo dan RT tienen algo de "vida" aunque sea tan sólo de forma aparente.

El kirchnerismo tiene 3 veces las cuentas que Cambiemos pero además de esto hay una especie de orgullo y pertenencia, no es raro encontrar miles de cuentas que se hagan llamar a sí mismas parte de la "Tropa K", literal. No tienen problema en asumirse como parte de un ejército cuyo único fin es "ganar" en este escenario como si fuese un campo de batalla.

Para que los K no se ofendan, tranquilos, justamente es Cambiemos/Pro quien más utiliza las cuentas sin una sola publicación real, 100% bot falsos, de poquísima calidad y prácticamente nula relevancia más allá del numerito final.

La militancia digital requiere de un poco de trabajo artesanal, el campo de batalla está seco, vacío, pero aun así lo que vale son las apariencias, no el resultado real. Nadie será votado por lo que se diga en Twitter pero sirve, y muy bien, para sembrar mentiras sobre tu oponente. Ahí está la clave, ah, eso y ganar dinero publicando cosas masivamente para candidatos que no entienden las redes sociales, ahí es un negocio seguro.

Queda mucho margen para seguir analizando, estrategias, estilos, otros partidos políticos, esto es tan sólo la punta del iceberg y, para colmo, sólo es una muestra de un lapso corto de tiempo, con más captura de datos los números crecen.

Otros posts que podrían llegar a gustarte...

Comentarios

  • Damian    

    me sorprenden bastante los datos, hace unos años el Pro había dominado las redes con cuentas de éste tipo; evidentemente estuvieron laburando todos ahora. en política todo vale, se juega por plata.

    • Responder
    • Citar
    • Comentado:
    • el pro no creció en este sentido, se diversificó en otras plataformas, hacen un mejor laburo en crear contenido por ejemplo, en vez de ir tanto al ataque o a la repetición van al laburo más curado con lo que no se identifica tan fácilmente. Se puede, pero ahí sí que no podés automatizar la detección porque utilizan contenido generado y distinto entre sí, no copy-pasta

      • Responder
      • Citar
      • Comentado:
      • Damian    

        por cierto buen trabajo, te contrataría si fuera político jajaja

        • Citar
        • Comentado:
  • Danbat    

    Por la poca relevancia real de Twitter en el mundo digital (en los rankings está muy lejos de Facebook y Youtube) yo veo que estas cosas son más un refuerzo emocional para los propios y una clara estafa a los que pagan por esto creyendo que sirve de algo.

    "Tropa K", "militar", "soldados de ", etc.
    No deja de llamarme la atención esa inclinación militar del fanático de la izquierda. Lo ven todo como si fuera una guerra mientras se la pasan denostando a las fuerzas de seguridad.

    • Responder
    • Citar
    • Comentado:
    • Manuel    

      Y su todopoderoso líder es "El General".

      Son verticalistas y tanto o más fachos que lo que suelen criticar...

      • Responder
      • Citar
      • Comentado:
    • aqui_c    

      Twitter es la red social más accesible a ser estudiada, y también la más fácil de abusar. Cada tema puede ser intervenido, todo es muy transversal, inclusive para alguien sin seguidores. Esto hace que la inversión sea relativamente baja.

      Facebook, por ejemplo, no funciona si no tenés seguidores. Cómo haces para entrar en los círculos de la gente real? Con el modelo de Cambridge Analytica, por ejemplo, tenías que desembolsar dinero y la posibilidad de escrache. Tenés que generar contenido también fuera de redes.

      Y YouTube, que creo tiene un valor inmenso, también necesita de una inversión espectacular.

      Creo que al final del día, Twitter sigue siendo relevante por el ratio audiencia/precio, además de las altas chances de que medios tradicionales amplifiquen el mensaje cuando levantan trending topics.

      • Responder
      • Citar
      • Comentado:
  • Fernando    

    No entiendo como los políticos creen que esto sirve de algo.
    Quién vota a un político por lo que dicen en twitter?
    Es una pelotudez..

    • Responder
    • Citar
    • Comentado:
  • Cattel    

    Danbat dijo:

    Por la poca relevancia real de Twitter en el mundo digital (en los rankings está muy lejos de Facebook y Youtube) yo veo que estas cosas son más un refuerzo emocional para los propios y una clara estafa a los que pagan por esto creyendo que sirve de algo.


    Es el equivalente a los trabajadores de la era dorada del Y2K arreglando cosas en COBOL. Un microclima. Sí le tengo más miedo a las campañas por whatsapp a lo Bolsonaro, que te vengan con teorías psicopatoconspiraniocas en tu propio teléfono me parece una pesadilla.

    Cuántos empleados tienen estos call centers, porque hablas de 5000 usuarios es una empresa grosa, o cobrarán en bitcoins desde el sillón de su casa?

    • Responder
    • Citar
    • Comentado:
  • Cattel    

    PD: se ve re pulenta la herramienta de análisis que te mandaste!

    • Responder
    • Citar
    • Comentado:
  • Hugo    

    Coincido con Danbat, esto no mueve la aguja de la elección. Y con Fernando, nadie cambia de voto en general.

    Los esfuerzos deberían estar apuntados al 20/30% de indecisos, que no tienen idea hoy a quién votarían, porque las dos alternativas que les presentan como "las únicas" son un desastre.

    El día que se den cuenta que gobernar bien es todo lo que se precisa para que un país salga a defender una gestión, no los saca nadie.

    • Responder
    • Citar
    • Comentado:
  • Horacio    

    Danbat dijo:
    .... yo veo que estas cosas son más un refuerzo emocional para los propios y una clara estafa a los que pagan por esto creyendo que sirve de algo.

    Totalmente de acuerdo!
    Cattel dijo:
    Es el equivalente a los trabajadores de la era dorada del Y2K arreglando cosas en COBOL. Un microclima.

    Ahi no estoy de acuerdo. Trabaje en un banco extranjero que estaba radicado en el pais en ese momento. No solo hubo que parchear las aplicaciones (rpg/cobol /PL1) sino también aplicar cientos de parches al sistema operativo de mainframes y midranges. Si fue un microclima y nadie se entero fue gracias a la tonelada de dinero que se gasto.

    • Responder
    • Citar
    • Comentado:
  • aqui_c    

    Cómo hacés para definir bot/troll? Tenés alguna DB anotada para contrastar?

    Vos decís que hay más K que P, no puede ser que tengas un bias en tu proceso de identificación?

    Por lo que entiendo, monitoreas el stream de Twitter filtrando por trending hashtags, es correcto? Cómo hacés para tener datos de tweets de antes de que el hash sea trending?

    Las cuentas que identificas como troll/bot tienen patrones en común? Fecha de registro, números en el nombre, frecuencia de posteo (sin tener en cuenta el contenido), entropia con los seguidores?

    Sería muy útil medir velocidad de propagación en la red. Porque tenés los canales rápidos (gente paga para transmitir un mensaje) y lentos gente normal que retwittea mensajes pagos. Imagino que viendo este parámetros se puede estimar la influencia que puede llegar a tener una campaña de estas características.

    Veo que no filtras respuesta a tweets. En mi experiencia, MUCHOS trolls, especialmente P se la pasan respondiendo temas. Es mucho más eficiente, ya que hasta con 0 seguidores, es fácil tener engagement con gente real y su propia red.

    • Responder
    • Citar
    • Comentado:
    • aqui_c dijo:

      Cómo hacés para definir bot/troll? Tenés alguna DB anotada para contrastar?

      La base la fui armando yo a mano, ya expliqué qué es bot o troll, su propio nombre los diferencia, lo que no se diferencia en la clasificación habitual es que cualquier operador puede tomar control de un bot y hasta responder, es una táctica muy usada.

      Vos decís que hay más K que P, no puede ser que tengas un bias en tu proceso de identificación?

      El criterio es sencillo: volumen, tanto de participantes como participaciones, en sí no dice nada como número, pero siempre me hizo reír que dijeran que eran muchos más del Pro cuando son claramente muchos más (y más activos) los K, aun así el resultado al que concluyo me es claro: importa poco


      Por lo que entiendo, monitoreas el stream de Twitter filtrando por trending hashtags, es correcto? Cómo hacés para tener datos de tweets de antes de que el hash sea trending?


      No me importa demasiado lo que no es trending si no llega a serlo, es decir, lo que no vas a ver (y no es objeto de estudio aquí) son las conversaciones personales de poco volumen. Si tomás las que tienen volumen (Twitter hace el trabajo por uno) y la cruzás con usuarios que ya tenés catalogado (100k en mi caso) tomás sólo esas conversaciones. Si una resulta muy tentadora uso la API al extremo y traigo todo de esa (en los ejemplos que dí hice eso). Sin pagar por la API premium no puedo traer más data así que tengo que acotar cuántos HT utilizo.


      Las cuentas que identificas como troll/bot tienen patrones en común? Fecha de registro, números en el nombre, frecuencia de posteo (sin tener en cuenta el contenido), entropia con los seguidores?


      No, eso aprendieron a no hacerlo hace 3-4 años cuando caían sus cuentas por esas obviedades. Cambiaron la estrategia hace tiempo y varía mucho el tema de fecha de registro, idioma, origen, etc. Si estan bien hechas las cuentas son todas "naturales", es decir, creadas en Argentina, validadas con número de teléfono, etc. Esas son las más caras usualmente.
      La frecuencia de posteo SI tiene que tener en cuenta el contenido, una cuenta que hace 100 RTs por día no es orgánica, no en mi criterio, una que ni siquiera postea contenido propio ni te cuento.
      Los seguidores/Seguidos ya no son relevantes para identificarlos, eso también dejaron de usarlo hace 4 años. Mi primer script se basaba en eso y quedó inútil.


      Sería muy útil medir velocidad de propagación en la red. Porque tenés los canales rápidos (gente paga para transmitir un mensaje) y lentos gente normal que retwittea mensajes pagos. Imagino que viendo este parámetros se puede estimar la influencia que puede llegar a tener una campaña de estas características.

      Pero no puedo hacerlo con mis recursos! en ese sentido estoy bastante limitado, tené en cuenta que trabajo todos los días en otra cosa, que no soy estadístico, que no soy un genio de querys a una base de datos y que tengo un sólo servidor de USD 20 por mes para bancar esta base de datos enorme :D


      Veo que no filtras respuesta a tweets. En mi experiencia, MUCHOS trolls, especialmente P se la pasan respondiendo temas. Es mucho más eficiente, ya que hasta con 0 seguidores, es fácil tener engagement con gente real y su propia red.


      Sería ideal pero Twitter no lo permite. Así de choto es, no podés consultar respuestas a un TW, sólo podés enterarste si un Twitt es respuesta de otro porque te llega el ID pero no existe consulta de las respuestas en sí, sólo el número, cantidad.

      Por ende si un troll está atacando puntualmente a ciertas personas tenés que traer el timeline del troll para conectarlo. Al ya tenerlos indentificados como trolls (laburo manual) podés llegar a crear un script que intente hacer eso haciendo un seguimiento troll por troll diario.
      No tengo tantos recursos de API como para implementarlo y que brinde algún resultado así que ni me molesto, si alguien quiere pagar USD 300 por mes para el acceso grande a la API y me lo regala, buenísimo :D

      • Responder
      • Citar
      • Comentado:
  • aqui_c    

    PD1: algo de todo esto está regulado en Argentina?

    PD2: alguien sabe qué precios se manejan en Argentina para estas farms?

    PD3: sólo una impresión, los tweets de trolls tienen menos faltas de ortografía que el promedio.

    • Responder
    • Citar
    • Comentado:
    • PD1: no
      PD2: depende, USD 50 por cuenta bien hecha, 50 por mes por cuenta para mantenerlas activas. Igual hay que tener en cuenta que muchas veces es laburo que hacen los mismos partidos desde adentro sin pagarle a operadores externos.
      PD3: es posible, no me puse en grammar nazi con ellos :D

      • Responder
      • Citar
      • Comentado:
  • cesar    

    Iba a decir de que te armes un patreon para pagarte la API premium pero 300 dólares es mucho.

    • Responder
    • Citar
    • Comentado:
    • si, es mucho, mejor que lo pague algún partido político interesado :P

      • Responder
      • Citar
      • Comentado:
  • Mariano    

    Decís que lo hiciste con tu propio software.... Podrías dar mas detalles sobre ese software? Por ej en que lo programaste.... Salute

    • Responder
    • Citar
    • Comentado:
  • Pablerque    

    Muy interesante. Me va a llevar más de una sentada en el baño analizar esta info. Excelente análisis.

    • Responder
    • Citar
    • Comentado:

Deje su comentario:

Tranquilo, su email nunca será revelado.
La gente de bien tiene URL, no se olvide del http/https
Para evitar bots, si se tardó mucho en leer la nota seguramente no sirva y tenga que intentar dos veces

Negrita Cursiva Imagen Enlace


comentarios ofensivos o que no hagan al enriquecimiento del post serán borrados/editados por el administrador