Skip links

Bots a la Twittersphere

El paper dels anomenats “robots” de les xarxes socials, comptes automatitzats capaços de publicar continguts o interactuar amb altres usuaris sense cap implicació directa humana, han estat objecte de molt escrutini i atenció en els últims anys. Aquests comptes poden tenir una part valuosa en l’ecosistema de les xarxes socials responent preguntes sobre diversos temes en temps real o proporcionant actualitzacions automàtiques sobre notícies o esdeveniments. Al mateix temps, també es poden utilitzar per intentar alterar les percepcions del discurs polític en les xarxes socials, difondre la informació errònia o manipular sistemes d’avaluació i revisió en línia. Com que les xarxes socials han aconseguit una posició cada vegada més destacada en l’entorn general de notícies i informació, els bots s’han vist arrossegats en un debat més ampli sobre els canvis en els hàbits de notícies dels nord-americans, el tenor del discurs en línia i la prevalença de “notícies falses” en línia.

En el context d’aquests arguments en curs sobre el paper i la naturalesa dels robots, Pew Research Center va comprendre millor quants dels enllaços es compartien a Twitter, la majoria dels quals es refereixen a un lloc fora de la pròpia plataforma, estan sent promoguts per robots en lloc d’éssers humans. Per fer-ho, el Centre va utilitzar una llista de 2.315 dels llocs web més populars i va examinar els aproximadament 1.2 milions de tweets (enviats pels usuaris de l’idioma anglès) que incloïen enllaços a aquests llocs durant un període aproximat de sis setmanes a l’estiu de 2017. Els resultats il·lustren el paper dominant que tenen els comptes automàtics en la difusió d’enllaços a una àmplia gamma de llocs web destacats a Twitter.

 

 

Com defineix aquest estudi un bot de Twitter?

En termes generals, els robots de Twitter són comptes que poden publicar contingut o interactuar amb altres usuaris d’una manera automatitzada i sense l’entrada humana directa.

Els bots s’utilitzen per a molts propòsits. Aquest estudi se centra en un tipus particular de comportament bot: bots que tweet o retweet vincula al contingut de la web. En altres paraules, aquests són robots que publiquen o promocionen llocs web específics o altres continguts en línia.

Molts robots no s’identifiquen a si mateixos com a robots, per la qual cosa aquest estudi utilitza una eina anomenada Botómetre per estimar la proporció d’enllaços de Twitter a llocs populars de tota la web publicats per comptes automatitzats o parcialment automatitzats. Un estudi suggereix que el botómetre és aproximadament del 86% precís, i Pew Resesarch Center ha dut a terme les seves pròpies proves de validació independents del sistema del botòmetre. Per reconèixer la possibilitat de classificació equivocada, utilitzem el terme “bots sospitosos” al llarg d’aquest informe. Per obtenir informació sobre com funciona el botómetro, consulteu la metodologia.

Entre les troballes clau d’aquesta investigació:

  • De tots els enllaços tweetats als llocs web populars, el 66% són compartits per comptes amb característiques comunes entre “robots” automàtics, més que usuaris humans.
  • Entre les notícies populars i els llocs web d’esdeveniments actuals, el 66% dels enllaços tweetats són realitzats per sospitosos robots: idèntics a la mitjana global. La part dels enllaços tweeted creats per bot és encara més alta entre certs tipus de llocs de notícies. Per exemple, s’estima que un 89% dels enllaços tweetats als llocs d’agregació populars que compilen històries de tot el web són publicats per robots.
  • Un nombre relativament petit de robots altament actius són els responsables d’una part important dels enllaços a destacats llocs de notícies i mitjans de comunicació. Aquesta anàlisi troba que els 500 sospitosos bots actius més actius són responsables del 22% dels enllaços tweetats a notícies populars i llocs d’esdeveniments actuals durant el període en què es va dur a terme aquest estudi. En comparació, els 500 usuaris humans més actius són responsables d’una participació molt menor (aproximadament un 6%) d’enllaços tweetats a aquests punts de venda.
  • L’estudi no troba evidència que els comptes automatitzats actualment tenen un “pols polític” liberal o conservador en el seu comportament general d’intercanvi d’enllaços. Això sorgeix d’una anàlisi del subconjunt de llocs de notícies que contenen material orientat políticament. Les sospites de bots comparteixen aproximadament el 41% dels enllaços als llocs polítics compartits principalment pels liberals i el 44% dels enllaços als llocs polítics compartits principalment pels conservadors: una diferència que no és estadísticament significativa. Per contra, els bots sospitosos comparteixen el 57% al 66% dels enllaços de notícies i llocs d’esdeveniments actuals compartits principalment per un públic humà ideològicament mixt o centriste.

 

Aquestes troballes es basen en una anàlisi d’una mostra aleatòria d’aproximadament 1,2 milions de tweets d’usuaris de l’idioma anglès que contenen enllaços a llocs web populars durant el període de temps del 27 de juliol al 11 de setembre de 2017. Per construir la llista de llocs populars usats en aquest a l’anàlisi, el centre va identificar prop de 3.000 dels llocs web més compartits durant els primers 18 dies del període d’estudi i els va codificar a partir d’una varietat de característiques. 5  Després d’eliminar enllaços que estaven morts, duplicats o dirigits a llocs sense informació suficient per classificar el seu contingut, els investigadors van arribar a una llista de 2.315 llocs web.

En primer lloc, aquests llocs es classifiquen en sis grups temàtics diferents segons la seva àrea d’atenció primària. Les agrupacions tòpiques inclouen continguts per a adults, esports, celebritats, productes o serveis comercials, organitzacions o grups, i notícies i esdeveniments actuals. Per comparar-los amb aquestes categories principals, els investigadors han publicat enllaços que es redirigeixen al contingut de Twitter en una categoria diferent.

En segon lloc, els llocs classificats com un ampli enfocament en les notícies i els esdeveniments actuals (en total, 925 llocs que compleixen aquests criteris) es van codificar posteriorment en funció de tres criteris addicionals:

  • Si la majoria del contingut del lloc consistia en material agregat o publicat per altres llocs o publicacions.
  • Ja sigui que el lloc inclogués una secció de política i/o destacava històries polítiques en els seus principals titulars; i
  • si el lloc tenia una pàgina de contacte (un tret que pot servir com a proxy per saber si un lloc ofereix als lectors la possibilitat d’enviar comentaris i comentaris).

 

En tercer lloc, el centre va identificar un subconjunt addicional de notícies i llocs d’esdeveniments actuals que incloïen històries polítiques o una secció de política i que servien principalment a un públic dels EUA. Cadascuna d’aquestes notícies orientades políticament i llocs d’esdeveniments actuals es categoritzava com a principalment un públic liberal, un públic conservador o un públic mixt.

El següent pas consistia a examinar cada enllaç tweetitzat a aquests llocs i intentar determinar si el vincle es va publicar des d’un compte automatitzat. Per identificar els robots, el Centre va utilitzar una eina anomenada “Botòmetre”, desenvolupada per investigadors de la Universitat del Sud de Califòrnia i la Universitat d’Indiana. Ara, en la seva segona encarnació, Botometer estima la probabilitat que un compte determinat estigui automatitzat o no estigui basat en diversos criteris, incloent l’edat del compte, la freqüència amb què es publiqui i les característiques de la seva xarxa de seguidors, entre altres factors. Els comptes que es van estimar tenint una probabilitat relativament alta de ser automatitzats en funció de les proves del Pew Research Center del sistema Botómetre es van classificar com a robots a efectes d’aquesta anàlisi.

De forma col·lectiva, la recopilació de dades, la codificació de llocs i l’anàlisi de detecció de bots descrits anteriorment proporcionen una resposta a la següent pregunta de recerca clau: Quina proporció dels enllaços tweetats als llocs web populars es publiquen mitjançant comptes automatitzats, en lloc d’usuaris humans?

Aquesta investigació forma part d’una sèrie d’informes del Centre de Recerca Pew que examinen l’entorn d’informació sobre els mitjans socials i la forma en què els usuaris participen en aquests espais digitals. Estudis previs han documentat la naturalesa i les fonts dels tweets sobre les notícies d’immigració, la forma en què les notícies es comparteixen a través de les xarxes socials en un congrés polaritzat, el grau en què es comparteix i confia informació científica sobre els mitjans socials, el paper de les xarxes socials a la regió un context més ampli d’assetjament en línia, com es desenvolupen les qüestions socials clau com les relacions racials en aquestes plataformes, i els patrons de com es disposen els diferents grups a Twitter.

És important tenir en compte que els comptes bot no sempre es defineixen clarament com a tals en els seus perfils, i qualsevol sistema de classificació de bot té, inevitablement, risc d’error. El sistema del botómetre ha estat documentat i validat en una varietat de publicacions acadèmiques i investigadors del centre han dut a terme diverses mesures de validació independents dels seus resultats. No obstant això, alguns comptes humans poden classificar-se erròniament com a automatitzats, mentre que alguns comptes automatitzats poden classificar-se erròniament com a autèntics. Per tant, hi ha cert grau d’incertesa en aquestes estimacions de la part del trànsit per sospites de comptes bot.

A més, l’anàlisi que es descriu en aquest informe es basa en un subconjunt de tweets recollits durant un període de temps determinat. No és una anàlisi de tots els llocs web o de totes les propietats dels mitjans, sinó una anàlisi de llocs web i mitjans de comunicació populars, mesurats pel nombre d’enllaços publicats a Twitter al seu contingut. Aquesta anàlisi no pretén avaluar si aquests bots estaven compartint bots “bons” o “dolents”, o si aquests bots es controlen des de dins o fora dels EUA. A més, no va intentar avaluar l’abast dels tweets en qüestió o per determinar quants usuaris humans van veure, fer clic o contractar continguts generats per bot.

Podeu trobar més detalls sobre el nostre esforç de classificació bot per la metodologia d’aquest informe.

 

L’activitat automàtica del compte és destacada a través de l’ecosistema de Twitter

Els comptes automatitzats tenen un paper destacat a l’hora de twittejar enllaços a continguts a través de l’ecosistema de Twitter. L’anàlisi del Centre considera que es calcula que el 66% de tots els enllaços tweetats als llocs web més populars probablement publiquin per comptes automàtics, en comptes d’usuaris humans.

Alguns tipus de llocs, sobretot els centrats en contingut per a adults i esports, reben una part especialment gran dels enllaços de Twitter dels comptes automatitzats. Els comptes automatitzats van ser responsables d’un estimat del 90% de tots els enllaços tweetats a llocs web populars centrats en contingut per a adults durant el període d’estudi. Per a llocs web populars centrats en el contingut esportiu, es va estimar que aquest percentatge era del 76%.

Els comptes automatitzats constitueixen una proporció lleugerament més petita, encara que, en cada cas, la majoria d’enllaços comparteixen altres tipus de llocs populars. Més notablement, l’anàlisi del Centre troba que el 66% dels enllaços tweetats a les notícies més populars i als llocs d’esdeveniments actuals a Twitter probablement han estat compartits pels comptes bot. Aquesta xifra és idèntica a la mitjana dels llocs més populars en general. Els sospitosos comptes automàtics constitueixen una proporció més gran dels enllaços publicats als llocs populars centrats en productes o serveis comercials (73%) i una menor part dels llocs centrats en les notícies i la cultura de celebritats (62%). La proporció d’accions d’enllaç mitjançant comptes automàtiques és la més baixa per als enllaços associats a Twitter.com, és a dir, els enllaços que s’aturen a Twitter i que no es dirigeixen a cap lloc extern, en comparació amb les sis categories tòpiques d’aquest estudi.

 

En enfocament: les notícies populars i els llocs web d’esdeveniments actuals estan vinculats als tweets per robots

Els comptes automatitzats publiquen una part important dels enllaços a una àmplia gamma de punts de venda en línia a Twitter. Com es va assenyalar anteriorment, l’anàlisi del Centre calcula que el 66% dels enllaços tweetats a notícies populars i llocs web d’esdeveniments actuals són publicats per robots. L’anàlisi també troba que una quantitat relativament petita de comptes automatitzats és responsable d’una part important dels enllaços als mitjans de comunicació populars a Twitter. Els 500 sospitosos bot més actius sols eren responsables del 22% de tots els enllaços a aquestes notícies i llocs d’esdeveniments actuals durant el període en què es va dur a terme aquest estudi. Per contra, els 500 comptes humans més actius eren responsables de només el 6% de tots els enllaços a aquests llocs.

L’anàlisi del Centre també indica que certs tipus de notícies i llocs d’esdeveniments actuals són especialment susceptibles de ser tweetats per comptes automatitzats. Entre els més destacats es troben els llocs d’agregació o llocs que compilen principalment continguts d’altres llocs de la web. S’estima que el 89% dels enllaços a aquests llocs d’agregació durant el període d’estudi van ser publicats pels comptes bot.

 

Els comptes automatitzats també proporcionen una proporció una mica superior a la mitjana d’enllaços a llocs que no tenen una pàgina de contacte pública o adreça de correu electrònic per contactar amb l’editor o amb un altre personal. Aquest tipus d’informació de contacte es pot utilitzar per enviar comentaris dels lectors que poden servir com a base de correccions o informes addicionals. La gran majoria (el 90%) de les notícies populars i els llocs actuals d’esdeveniments examinats en aquest estudi tenien una pàgina de contacte pública que no era de Twitter. La petita minoria de llocs que no tenien aquest tipus de pàgina de contacte van ser compartits per sospitosos robots a majors taxes que aquells amb pàgines de contacte. Un 75% dels enllaços a aquests llocs van ser compartits per sospites de comptes bot durant el període que s’està estudiant, en comparació amb el 60% dels llocs amb una pàgina de contacte.

D’altra banda, certs tipus de notícies i llocs d’esdeveniments actuals reben una part inferior a la mitjana dels enllaços de Twitter dels comptes automatitzats. A més, aquesta anàlisi indica que les notícies populars i els llocs d’esdeveniments actuals que contenen contingut polític tenen el menor nivell de trànsit d’enllaços dels comptes bot entre els tipus de notícies i els esdeveniments actuals que el Centre analitza, mantenint constants altres factors. De tots els enllaços a fonts de mitjans populars que presenten una visió destacada de la política o el contingut polític durant el període de temps de l’estudi, es calcula que el 57% s’ha originat en comptes bot.

 

Els robots de Twitter publiquen una major proporció de contingut dels públics centristes de Twitter

La qüestió de si els mitjans de comunicació compartits pels liberals o conservadors veuen més el trànsit automàtic del compte ha estat un tema de debat durant l’últim any. Alguns han expressat la seva preocupació perquè els presumptes comptes de bot siguin prolífics en compartir notícies polítiques hiperpartistes, ja sigui a l’esquerra o a la dreta de l’espectre ideològic.

Tanmateix, l’anàlisi del centre troba que els comptes automàtics de Twitter comparteixen una major proporció d’enllaços de llocs que tenen públics ideològicament mixtos o centristes, almenys dins del camp de notícies populars i llocs d’esdeveniments actuals orientats cap a notícies i problemes polítics. Per extensió, aquests comptes automatitzats tenen menys probabilitats de compartir enllaços de llocs amb públics ideològicament conservadors o liberals. A més, les diferències de dreta a la proporció del trànsit de bot no són substancials.

Aquesta anàlisi es basa en un subgrup de notícies populars i esdeveniments actuals que contenen històries polítiques en els seus titulars o que tenen una secció de política i que serveixen principalment a un públic nord-americà. Un total de 358 llocs web de la nostra mostra completa de 2.315 llocs populars van complir aquests criteris. Els investigadors van aïllar els sospitosos comptes no automatitzats que compartien enllaços a aquests llocs a Twitter durant el període de temps de l’estudi i van utilitzar una tècnica estadística coneguda com a anàlisi de correspondència per estimar la ideologia de l’audiència de Twitter de cada lloc.

L’anàlisi de la correcció correspon, primer, a la mesura que els usuaris comparteixen, de manera coherent, els llocs individuals i no els altres. Després els agrupa i quantifica el grau de diferència. A partir d’aquesta anàlisi, una puntuació de més de zero suggereix que l’audiència d’un lloc sigui més consistentment conservadora, mentre que una puntuació inferior a zero suggereix que l’audiència d’un lloc sigui més consistentment liberal. Es tracta d’una tècnica basada en la investigació acadèmica que estima les preferències ideològiques que es revelen per la conducta. Els investigadors poden utilitzar aquest mètode per veure quins llocs són compartits principalment per un públic liberal, conservador o moderat, i quantes vegades els robots comparteixen cada tipus de lloc. És important tenir en compte que l’anàlisi de la correspondència produeix estimacions de la ideologia de l’audiència sense cap anàlisi del contingut del lloc web, només els patrons d’ús compartit dels usuaris humans. Per obtenir més informació, consulteu la secció de metodologia AQUÍ.

L’anàlisi del Centre considera que els sospitosos comptes autònoms publiquen una major proporció d’enllaços a llocs que són principalment compartits per usuaris humans que apunten al centre de l’espectre ideològic, en comptes d’aquells més sovint compartits per un públic més liberal o més conservador. Els comptes automatitzats comparteixen aproximadament el 57% al 66% dels enllaços als llocs polítics compartits per un públic humà ideològicament mixt o centrista, segons l’anàlisi. Per contra, es calcula que els comptes automatitzats comparteixen aproximadament el 41% dels enllaços a llocs polítics amb públic format principalment per liberals i el 44% dels que comprenen principalment conservadors. Les taxes d’intercanvi entre llocs amb públic liberal no són significativament diferents de les que tenen un públic conservador. Malgrat això, és important tenir en compte certes advertències a l’hora d’interpretar les conclusions d’aquesta anàlisi. En primer lloc, aquest estudi només examina els principals mitjans de comunicació, mesurats pel nombre d’accions que reben a Twitter. En segon lloc, no examina la veracitat (o la manca d’això) del contingut compartit pels humans i el contingut compartit pels robots. Finalment, es centra en les taxes de repartiment global i no té en compte les accions posteriors o el compromís dels usuaris humans.

 

Per. Pew Research Center
Font Imatge: pewresearch.org,