Desde ya mismo, Prensa Ibérica (incluyendo a La Nueva España que pertenece a este grupo editorial) cuenta con una herramienta diseñada por CTIC Centro Técnológico para analizar las opiniones en Twitter de los políticos y sus partidos. ELECC-IA, que así se llama, está disponible en la web del periódico para poder consultarla y cada día habrá un resumen en la edición en papel.
ELECC-IA es una herramienta única en España y ha sido diseñada por investigadores de CTIC. Combina inteligencia artificial y análisis matemático con el objetivo de evaluar el panorama político gracias a los datos que arroja la red del pajarito.
ELECC-IA
A lo largo de los últimos años, las redes sociales han tomado un papel determinante en el desarrollo de las campañas electorales. La principal razón radica en el tipo de perfil que se puede identificar en dichas redes sociales: personas jóvenes que expresan su opinión acerca de la temática (y por tanto, muestran interés hacia la campaña), las cuales, en un gran porcentaje, no tienen aún decidido su voto. De este modo, la monitorización de las redes sociales en las semanas previas a una convocatoria electoral puede proporcionar información de especial interés que permita analizar la situación de cada uno de los partidos a nivel diario, pudiendo observar la influencia en la opinión del público de diferentes hechos ocurridos durante este periodo.
En las próximas semanas, la actividad política en España se verá drásticamente acentuada con las convocatorias a elecciones generales del 28 de abril, y a elecciones europeas, autonómicas y municipales del 26 de mayo. Por esta razón, desde la línea de especialización de Inteligencia Artificial y Big Data de CTIC Centro Tecnológico se ha desarrollado una herramienta que permite rastrear diariamente la información asociada a los partidos a nivel nacional, con mayor proyección electoral, de cara a las elecciones generales de este mes: PSOE, PP, Unidas Podemos, Ciudadanos y VOX. Dicha herramienta, ha sido bautizada como ELECC-IA.
La información ha sido extraída de la red social de microblogging Twitter. Esta elección se basa en diferentes razones: es una red social centrada en gran medida en la expresión de opiniones acerca de diversos temas públicos (a diferencia de otras como Instagram, con un enfoque más personal), permite un acceso abierto a sus datos a través de su API oficial con restricciones manejables, y consiste en mensajes de extensión corta (280 caracteres), por lo que la opinión ha de expresarse de forma concisa.
Así, se ha desarrollado un procedimiento diario automático de descarga de todas las menciones a las cuentas oficiales de los cinco partidos anteriormente mencionados, así como de sus líderes y candidatos a la presidencia del gobierno (es decir, todos los mensajes o tweets que contienen el nombre de las cuentas en cuestión).
Tabla 1. Listado de cuentas analizadas y número de seguidores a 8 de abril de 2019
El número de mensajes descargados diariamente es de aproximadamente 50.000 tweets, si bien puede verse ampliamente incrementado en días con algún hito concreto (entrevistas, declaraciones, debates, etc.).
A partir de los mensajes descargados diariamente, se procede al análisis de éstos, de modo que sea posible extraer información de interés acerca del panorama político global en Twitter, así como a nivel individual para cada partido y líder. Para ello, se ha desarrollado una herramienta complementaria que permite estimar la polaridad de cada mensaje a partir de su contenido, es decir, si se trata de contenido con connotaciones positivas, neutras o negativas. Dicho modelo de polaridad se ha generado mediante la aplicación de técnicas de Inteligencia Artificial, combinadas con herramientas de Procesamiento del Lenguaje Natural, las cuales permiten el tratamiento de textos como los tweets analizados.
Figura 1. Ejemplo de tweet etiquetado como positivo
Figura 2. Ejemplo de tweet etiquetado como negativo
ELECC-IA está estructurado en dos partes claramente diferenciadas: un análisis general de la situación política nacional en Twitter, y un análisis individualizado de cada uno de los partidos analizados.
En el análisis general, se muestran diferentes representaciones gráficas para la comprensión de los datos recogidos. Entre ellos, una nube de palabras, a partir de la cual es posible visualizar qué términos son los más habituales entre todas las menciones del día hacia las cuentas analizadas. Con respecto al volumen de menciones, se proporcionan dos gráficos que permiten su visualización para cada uno de los partidos o líderes políticos analizados a lo largo del tiempo, pudiendo localizarse así hitos que hayan llevado a un repunte en las menciones, ya sea de todos los partidos o de uno en particular. En cuanto al análisis de polaridad, se han generado gráficas basadas en la polaridad general obtenida para cada partido o líder político. Éstas se han obtenido teniendo en cuenta tanto la polaridad de cada uno de los mensajes que mencionan a dicha cuenta, así como la influencia de éstos en Twitter (basada en el número de veces que ha sido compartido o retweeteado y marcado como favorito).
Figura 3. Evolución de las menciones a los diferentes líderes políticos
De forma adicional dentro del propio análisis general, se ha estudiado la diferencia de opinión con respecto al sexo del usuario. Inicialmente, a partir del nombre del usuario en Twitter, se ha desarrollado un sistema que permita identificar el género asociado a la cuenta, así como si se trata de un caso sin género identificable. Tras esto, se generan resultados de los últimos siete días, proporcionando información sobre el porcentaje de hombres y mujeres identificados que participan en el debate, así como la existencia de tendencias de opinión más positivas o negativas de cada sexo con respecto a algún líder o partido político.
Figura 4. Información asociada al género
Por otro lado, el análisis individualizado se presenta en tarjetas para cada uno de los partidos. En cada una de ellas, se proporciona el número de menciones positivas y negativas registradas el último día, tanto para la cuenta del partido político como para la del líder. A modo ilustrativo, también se presenta el mensaje del día con mayor repercusión que mencione a cada uno de ellos.
Figura 5. Resumen de menciones de Ciudadanos para el día en análisis
En un segundo apartado de cada tarjeta de análisis individualizado, se confrontan las series temporales de la polaridad de partido y líder, siendo así posible analizar si existe un comportamiento similar entre ambos, o si hay diferencias significativas entre ellos. Además, se proporciona un agregado de la polaridad semanal para partido y líder, a modo de resumen con un mayor rango temporal. Finalmente, se genera una nube de palabras individual para el partido en cuestión, con los términos más utilizados entre sus menciones diarias, siendo así posible analizar el contenido del debate que las rodea.
Figura 6. Información de polaridad y nube de palabras asociadas a Ciudadanos para el día en análisis
A través de toda la información mostrada con ELECC-IA, es posible crear una fotografía del panorama político nacional en Twitter diariamente, pudiendo consultar información particular de cada uno de los partidos en estudio, y analizar las tendencias que presentan a lo largo del tiempo con respecto a la polaridad y al volumen de las menciones generadas