Detección automática de discurso de odio en redes sociales
No Thumbnail Available
Date
2021-04-30
Journal Title
Journal ISSN
Volume Title
Publisher
Centro Universitario de la Defensa de Marín
Abstract
Se presenta un enfoque para la creación de un sistema de detección del discurso de odio en las redes
sociales, mediante la aplicación de técnicas de procesamiento del lenguaje natural que servirán para
entrenar diversos sistemas supervisados. Con este fin, se realiza así la extracción de numerosas
características superficiales, incluyendo estas la polaridad de los emojis y conteo de menciones y
hashtags; léxicas, con la aportación de TF-IDF y CounterVectorizer; y, además, la implementación de
análisis de sentimiento y de sarcasmo. Se experimenta con combinaciones de características para la
búsqueda de aquellas que aporten mayor cantidad de información al sistema con la consiguiente
mejora en los resultados. Se realiza así en este TFG pruebas muy variadas teniendo en cuenta el
abanico de características consideradas y los varios modelos de aprendizaje existentes. Todas estas
pruebas se llevaron a cabo sobre un conjunto de tweets de temática yihadista en un entorno
multilingüe, centrándose el trabajo en aquellos escritos en inglés y árabe. Finalmente, se realizó una
evaluación exhaustiva utilizando características de un modo individual, pero también grupal, sobre los
distintos modelos, concluyendo cuáles de ellos son los que proporcionan un mayor rendimiento en este
caso de estudio.
Description
Keywords
Machine Learning, TF-IDF, SVM, MLP, Discurso de odio