EN

|

ES

Análisis de sentimientos en redes sociales

(Foto: Adobe Stock)

Por Édgar León

Pero ¿Cómo es que funciona esto? y, ¿Para qué lo pudiéramos utilizar? Para contestar estas preguntas, primero necesitamos algunas definiciones, comenzando con su importancia.

Análisis de sentimientos

El análisis de sentimientos recientemente ha visto un enorme incremento en popularidad, esto sucede principalmente por dos razones importantes:

  1. La adopción de aprendizaje automático profundo. Estas son un tipo de redes neuronales, y aunque no profundizaremos en ellas, es suficiente decir que estas son muy buenas para esta tarea y que solo recientemente se ha hecho posible utilizar estas tecnologías gracias a la gran cantidad de datos disponibles, y al incremento en capacidad computacional.
  2. El desarrollo de mejores representaciones vectoriales de texto. Investigadores en Google descubrieron una manera de representar texto como vectores que mantiene información semántica (Mikolov et al., 2013), lo que es muy útil para el clasificador al momento de tomar decisiones, pues nos proporciona una mejor representación del texto.

Estos dos puntos han acelerado enormemente la adopción de estos análisis en prácticamente todos los sectores, y son muy populares para monitorear la moral comunitaria, clasificación y diagnóstico en las reseñas de productos y atención a clientes, por nombrar solo algunas. Hablaremos más de ello más adelante, por ahora volvamos a definir en qué consiste esto del análisis de sentimientos.

El análisis de sentimientos es un sistema al cual alimentamos con texto natural de cualquier longitud, es decir, lo podemos alimentar con una oración, un párrafo, o todo un libro, y este nos devuelve la intensidad de los sentimientos que muestra dicho texto. El conjunto de sentimientos que podemos detectar de esta manera es llamado taxonomía de sentimientos, y cómo hacer esta clasificación es difícil, verdaderamente solo podemos detectar emociones básicas, es decir, el conjunto de emociones a partir de las cuales podemos formular todas las demás. Los lingüistas aún están en discusión sobre la definición de cuáles sentimientos pueden ser considerados básicos, por lo que existen diversos modelos. Ekman, quien es considerado como la mayor autoridad en el área, define las siguientes emociones básicas: alegría, tristeza, miedo, enojo, disgusto, desprecio y sorpresa (Tracy y Randles, 2011). Pero, en su mayor parte es suficiente tener una sola dimensión que describa qué tan positivo, negativo, o neutral es el texto. A continuación, se muestra una tabla con un resumen de estos modelos.

Emociones básicas de acuerdo con cada modelo:

IZARD PANKSEPP y WATT LEVENSON EKMAN y CORDARO
Felicidad Juego Diversión Felicidad
Tristeza Pánico/Luto Tristeza Tristeza
Miedo Miedo Miedo Miedo
Ira Ira Ira Ira
Disgusto Disgusto Disgusto
Interés Buscando Interés (?)
Desprecio (?) Desprecio
Lujuria Amor (?)
Atención Alivio (?) Sorpresa

Fuente: (Tracy y Randles, 2011)

Seguramente ahora te estás preguntando cómo es que una computadora puede entender lo suficiente bien el texto como para poder determinar la intensidad de los sentimientos expresados. La respuesta corta, aunque esto aún es un área abierta de investigación, es que no puede. Como hacer eso requiere procesos cognitivos de alto orden, mejor hacemos trampa y nos apoyamos de la estadística para determinar los sentimientos. Y este proceso es tan simple como realizar una comparación; la máquina recibe texto, y determina algo como «esto se parece a este otro que está calificado como feliz, entonces esta muestra nueva debe de ser feliz.» Y de esta manera, con algunos trucos por ahí, y una cantidad enorme de muestras, aproximan lo suficientemente bien la respuesta correcta. Es claro que esto no es ideal, y que conlleva muchos problemas y limitaciones, pero siendo nuestro lenguaje tan rico y expresivo esto es lo mejor que podemos hacer. Y sí, aunque tenemos varias técnicas para mitigar algunos de estos problemas, aún no podemos eliminarlos completamente.

Hemos mencionado que se utilizan clasificadores estadísticos para realizar la calificación de sentimientos. Generalmente se utiliza el aprendizaje automático profundo para producir estos modelos estadísticos, conocidos como modelos de lenguaje. Usamos estas técnicas porque nos permiten tener modelos enormes, de entradas variables, y que no son lineales. Todo ello es muy importante cuando tratamos con texto natural.

Entonces, para resumir el proceso, tomamos texto, lo convertimos a vectores numéricos que alimentamos a una red neuronal profunda, y que en la salida nos entrega una calificación de sentimientos. Ahora pasemos a la utilidad de hacer esto.

Aplicaciones de análisis de sentimientos en redes sociales

Las aplicaciones más frecuentes del análisis de sentimientos incluyen el monitoreo de la moral comunitaria, hacer clasificación y diagnóstico en reseñas de productos y atención a clientes. Nosotros nos enfocamos en el monitoreo de la moral, pero también mencionaremos otras aplicaciones que se han realizado enfocadas en las redes sociales.

¿Por qué es buena idea enfocarnos en las redes sociales? La respuesta corta es que ya tenemos los datos disponibles, y en su mayor parte son públicos. Hacer una encuesta a gran escala es muy costoso, tanto en tiempo, como esfuerzo, y dinero, y solamente tendríamos una muestra mucho más chica de la que podemos obtener directamente de redes sociales en un único instante de tiempo. También debemos tener en cuenta que no todas las redes son iguales, pues la inclusión de multimedia, hilos de conversación jerárquicos, y otras funciones nos hacen la tarea aún más difícil. Por todo ello la plataforma más amigable para el análisis de sentimientos es Twitter, pues los usuarios escriben texto corto y conciso, y solo una porción pequeña incluye multimedia.

Con ello en mente hay muchas razones para utilizar análisis de sentimientos en Twitter, por ejemplo, detección de acoso digital, detección de riesgo alto de depresión (Birjali et al., 2017), monitoreo moral de la comunidad (Eshleman y Yang, 2015), predicción de resultados en votaciones para funcionarios públicos (Praciano et al., 2018), e incluso predicción de alzas o bajas en varios símbolos financieros (Kordonis et al., 2016). Aquí podemos ver el poder de realizar estos análisis a larga escala, aunque también es utilizado en chats públicos, por ejemplo, en juegos de video, para detectar agresión y abuso y simplemente impedir ese tipo de mensajes.

Para concluir, el análisis de sentimientos es una herramienta tecnológica poderosa, que tiene muchos canales de aplicación diferentes, con impacto directo en la sociedad, y cuya aplicación sólo recientemente ha sido factible. Además de ello, vimos a grandes rasgos cómo funcionan estos sistemas, y si tienen interés en probarlo por ustedes mismos, estos análisis ya están disponibles para consumo directo en cualquier plataforma de análisis de datos, o bien, se pueden consumir directamente desde cualquier proveedor de servicios en la nube.

Los autores

Edgar León Sandoval es estudiante del programa de Doctorado en Ciencias Computacionales de la Escuela de Ciencias e Ingenierías del Tecnológico de Monterrey. [email protected]

Referencias

  • Mikolov, T., Chen, K., Corrado, G.S., & Dean, J. (2013). Efficient Estimation of Word Representations in Vector Space. ICLR.
  • Tracy, J. L., & Randles, D. (2011). Four models of basic emotions: A review of Ekman and Cordaro, Izard, Levenson, and Panksepp and Watt. Emotion Review, 3(4), 397–405. https://doi.org/10.1177/1754073911410747
  • Birjali, M., Beni-Hssane, A., & Erritali, M. (2017). Machine learning and semantic sentiment analysis-based algorithms for suicide sentiment prediction in social networks. Procedia Computer Science, 113, 65-72. https://doi.org/10.1016/j.procs.2017.08.290.
  • Eshleman, R. M., & Yang, H. (2015). “Hey #311, come clean my street!”: A spatio-temporal sentiment analysis of twitter data and 311 civil complaints. Proceedings – 4th IEEE International Conference on Big Data and Cloud Computing, BDCloud 2014 with the 7th IEEE International Conference on Social Computing and Networking, SocialCom 2014 and the 4th International Conference on Sustainable Computing and C, 477–484. https://doi.org/10.1109/BDCloud.2014.106
  • Praciano, B. J. G., da Costa, J. P. C. L., Maranhão, J. P. A., de Mendonça, F. L. L., de Sousa Júnior, R. T., & Prettz, J. B. (2018). Spatio-Temporal Trend Analysis of the Brazilian Elections Based on Twitter Data. 1355–1360.
  • Kordonis, J., Symeonidis, S., & Arampatzis, A. (2016). Stock price forecasting via sentiment analysis on Twitter. ACM International Conference Proceeding Series. https://doi.org/10.1145/3003733.3003787

¿Te gustó este contenido? ¡Compártelo!