El odio en redes sociales ya es detectable a través de un sistema

por Redacción | Jun 7, 2022

Tras los varios casos de acoso y bullying por medio de redes sociales, un grupo de investigadores de la Universidad de Jaén y TECNOMOD de la Universidad de Murcia, en España. diseñaron un sistema automático de detección del discurso de odio en español para las distintas plataformas. El propósito es clasificar los mensajes dirigidos a dañar a otras personas por motivos de raza, género, orientación sexual, nacionalidad o religión. Por ello, en el método empleado combina el análisis de las características lingüísticas con redes neuronales basadas en mecanismos de atención, llamadas «transformers», mejorando la precisión de los sistemas actuales.

De esta manera, se podrá agilizar los mecanismos de alerta sobre esas publicaciones de odio y detenerlas ante de su difusión masiva.

Estas redes neuronales permiten saber cuáles son los significados que más influyen sobre una palabra en concreto, útil en casos de polisemia o anáfora. De esta forma, el sistema alcanza unos resultados cercanos al 90 por ciento de precisión. El desafío de esta herramienta de procesamiento del lenguaje natural es agilizar la detección del lenguaje ofensivo para evitar su propagación masiva.

Para reducir el número de comentarios que deben ser revisados por expertos o incluso para el desarrollo de sistemas autónomos de detección, los investigadores proponen un modelo de identificación automática de discursos de odio destinado a frenar su dispersión. Sin embargo, estudios anteriores apuntan que la presencia de estos mensajes dirigidos a dañar por motivos ya mencionados se correlaciona con los delitos de odio en la vida real.

“No es factible depender de la supervisión manual para detener estas palabras ofensivas. Por ello, queremos contribuir a la detección del discurso de odio en español con un modelo automático y preciso que sea más rápido”, explica la investigadora de la Universidad de Jaén Salud María Jiménez Zafra, una de las autoras del estudio.

En concreto, los investigadores proponen la combinación de un sistema de extracción de características lingüísticas diseñado para el español y modelos computacionales. En este sentido, se utiliza la plataforma denominada UMUTextStats, desarrollada por el grupo TECNOMOD de la Universidad de Murcia, que obtiene de los textos características morfológicas, pragmáticas, semánticas, sintácticas, y de corrección y estilo, que reflejan qué quiere decir un texto dado y cómo lo dice.

Para complementar se suma el modelo basado en transformers, el cual, se trata de un sistema pre entrenado que ha aprendido cómo se relacionan las palabras, expresiones y otras características del lenguaje a partir de un gran conjunto de datos.

¿Cómo funciona?

Primero: el texto se traduce a modelos estadísticos que capturan diversas dimensiones del lenguaje y así, los investigadores incluyen 365 rasgos de interés extraídos de la herramienta UMUTextStats organizados en distintas categorías como fonéticas, morfosintácticas, semánticas, pragmáticas, estilo métricas o jerga de los medios sociales. Se contabilizan verbos, pronombres, adverbios, frases hechas o marcadores del discurso.

Después: Junto a estos métodos que atienden a la propia palabra, se entrenan redes neuronales, que son algoritmos, los cuales funcionan como lo hace el cerebro humano y cuenta con áreas especializadas en ciertas tareas, por lo que van aprendiendo con la incorporación de nuevos datos.

Finalmente: El resultado de esta combinación es un sistema para el idioma español más preciso, generalizable e interpretable. Además supera la precisión de estudios anteriores que alcanza un 90.4 por ciento.

“Los estudios existentes hasta la fecha trabajan con uno o dos de los conjuntos de datos más conocidos en español como HaterNet y HatEval. Sin embargo, existen más que la comunidad científica debería conocer y que podrían ayudar a avanzar en el estudio de este fenómeno”, precisa el catedrático de la Universidad de Murcia Rafael Valencia García.

Y ahora ¿Qué sigue?

La siguiente fase de la investigación será mejorar en la interpretación del sistema para que estos modelos sean comprensibles por cualquier persona no experta. Asimismo, el equipo de investigación apunta que este modelo se plasmará en aplicaciones que indiquen de forma rápida si un mensaje contiene elementos de odio o no y se agilizará el mecanismo de alerta en las plataformas de medios sociales para avisar sobre la presencia de elementos odiosos en los contenidos o el seguimiento de usuarios que viertan continuamente mensajes de odio.

Te puede interesar: ¿Agua de mar a potable? Es posible con tan solo un botón