Índice:
Introducción
Comprenda cómo la inteligencia artificial analiza las publicaciones recopiladas en su investigación
Dentro del contexto del análisis de sentimiento, el motor de inteligencia artificial de STILINGUE utiliza tres clasificaciones: Positivo, Negativo o Neutro. Esta clasificación se realiza de manera semántica y considera el significado actual de las palabras. Esto se debe a que el lenguaje está en constante evolución y experimenta cambios diarios.
Este proceso también incluye la clasificación de los emojis según su forma de uso habitual en las redes sociales. STILINGUE tiene actualmente un banco de datos de 1100 emojis registrados actualizados mensualmente y tiene en cuenta aquellos más utilizados en las redes sociales por los usuarios.
¿Cuál es la precisión de nuestra clasificación de sentimiento?
La precisión indica el rendimiento general del modelo de IA responsable de la clasificación y permite determinar cuánto ha clasificado correctamente este modelo del total de publicaciones. Actualmente, la precisión para la clasificación de sentimiento en publicaciones en portugués (PT-BR) oscila entre el 75% y el 82%.
STILINGUE entiende que la precisión no se determina por el volumen de aciertos, sino por la diversidad. Esto significa que lo más importante es buscar una buena variedad de ejemplos para medir la calidad de la inteligencia artificial responsable de la clasificación de sentimiento, ya que la precisión es una métrica dinámica; su resultado difiere según la muestra analizada.
Al analizar diferentes muestras, es posible establecer un rango de precisión más común en la clasificación de sentimiento del motor de IA. El valor de este intervalo puede ser mayor o menor, ya que, además de depender de la muestra utilizada, es necesario considerar que el portugués de Brasil (BR) es una lengua viva y las palabras se resignifican a diario.
Un término específico, antes considerado positivo, puede adquirir una connotación negativa. Además, campañas, fechas festivas y crisis pueden dar un nuevo significado a una expresión, todo como resultado del contexto en el que se utiliza. Cada vez que una palabra o expresión adquiere un nuevo significado, o cuando se crea un nuevo término, el motor de inteligencia artificial de STILINGUE debe ser enseñado y, por esta razón, se somete a mejoras continuas.
Otro punto importante a considerar es la clasificación de sentimiento, que puede variar debido a diversos factores, como los términos utilizados en su Configuración de Investigación y el contexto actual. A continuación, se presentan otros elementos considerados por la IA al clasificar el sentimiento de las publicaciones recopiladas:
1. Emojis y sus clasificaciones
Como se explicó anteriormente, la biblioteca de STILINGUE contiene miles de emojis, resultado de un mapeo realizado a partir de las publicaciones de los usuarios en las redes sociales. Con base en esta muestra, la IA clasifica cada uno de los emojis según su polaridad, ya sea Negativa, Positiva o Neutra.
La polaridad del emoji se define por la frecuencia de uso en las redes sociales. Si un emoji no se usa con frecuencia, se considera Neutro. Si esto cambia con el tiempo y el emoji se utiliza de manera más crítica, la polaridad se vuelve Negativa.
Si la publicación no presenta texto, solo emojis, la clasificación de sentimiento se realizará mediante la polarización de los emojis para definir la polaridad de la publicación.
2. Risas y sus clasificaciones
n el caso de publicaciones que contienen solo lenguaje indicando risas, como: kkkkk, hehehehe, hahahaha, hehehe, entre otros, el contenido pasa por un proceso denominado normalización para que todas las variaciones de risa se comprendan de la misma manera. Este proceso es similar a la normalización de términos abreviados; para obtener más información, consulte la sección de FAQ.
Aunque la normalización facilita la identificación de un texto con risas, es importante destacar que esta categoría de interacción no se considera en el motor de inteligencia artificial de STILINGUE al realizar el análisis de sentimiento. Es decir, un mensaje con risas no se clasificará automáticamente como positivo, neutro o negativo.
Esto se debe a que una risa no siempre se puede considerar como un sentimiento positivo, ya que a menudo se utilizan como ironía o en contextos neutros y negativos. Por lo tanto, la IA no podrá determinar la polaridad de una publicación con risas si no hay otro elemento de texto que informe sobre el contexto de esta publicación.
3. Abreviaciones y sus clasificaciones
Cuando se recopila un término escrito como una abreviatura de una palabra o una sigla en las redes sociales, se adopta la normalización para devolver esa abreviatura a su forma original. Después de esta etapa, se realiza la clasificación de sentimiento según el contexto presentado en la publicación. Esta normalización es la misma utilizada en la clasificación de risas, siendo una de las etapas internas de procesamiento del texto que no es visible dentro de STILINGUE. Vea el ejemplo a continuación:
Texto recopilado:“amg, me encantó eso, sqn”
Texto procesado: “amiga, me encantó eso, solo que no.”
Texto que aparece en la plataforma:“amg, me encantó eso, sqn”
Este proceso de normalización lo realiza el equipo de Machine Teaching (responsable del perfeccionamiento del Motor de Inteligencia Artificial de STILINGUE), basándose en un extenso diccionario de términos y constantemente actualizado. La plataforma no se modifica por esta acción: el cambio de la abreviatura a la versión completa se realiza automáticamente, al igual que la clasificación de sentimiento.
En el caso de la abreviatura "sqn", al ser una ironía, se clasifica inicialmente como Negativa en la plataforma, según el contexto de la publicación.
4. Ambigüedad y sus clasificaciones
Cuando una publicación recopilada contiene algún término que puede ser ambiguo, la inteligencia artificial comprende ese término con una polaridad que tenga más sentido en la mayoría de las ocasiones. Observe el ejemplo a continuación:
Si una marca de ropa tiene una sección infantil y se recopila alguna interacción que contiene la palabra Infantil, se procesará como una palabra con polaridad negativa, aunque en este contexto no esté hablando de la niñez.
En estos casos, con palabras ambiguas cuyo significado tenga polaridad diferente a la que el sistema suele clasificar, se recomienda que los usuarios añadan esos términos en la polaridad deseada para ser clasificados por la Biblioteca de Términos.
Para obtener más información, acceda a la discusión sobre el tema en nuestra comunidad o los vídeos en nuestro canal. 😃