Detección automática de discurso de odio en redes sociales

No Thumbnail Available
Date
2021-04-30
Journal Title
Journal ISSN
Volume Title
Publisher
Centro Universitario de la Defensa de Marín
Abstract
Se presenta un enfoque para la creación de un sistema de detección del discurso de odio en las redes sociales, mediante la aplicación de técnicas de procesamiento del lenguaje natural que servirán para entrenar diversos sistemas supervisados. Con este fin, se realiza así la extracción de numerosas características superficiales, incluyendo estas la polaridad de los emojis y conteo de menciones y hashtags; léxicas, con la aportación de TF-IDF y CounterVectorizer; y, además, la implementación de análisis de sentimiento y de sarcasmo. Se experimenta con combinaciones de características para la búsqueda de aquellas que aporten mayor cantidad de información al sistema con la consiguiente mejora en los resultados. Se realiza así en este TFG pruebas muy variadas teniendo en cuenta el abanico de características consideradas y los varios modelos de aprendizaje existentes. Todas estas pruebas se llevaron a cabo sobre un conjunto de tweets de temática yihadista en un entorno multilingüe, centrándose el trabajo en aquellos escritos en inglés y árabe. Finalmente, se realizó una evaluación exhaustiva utilizando características de un modo individual, pero también grupal, sobre los distintos modelos, concluyendo cuáles de ellos son los que proporcionan un mayor rendimiento en este caso de estudio.
Description
Keywords
Machine Learning, TF-IDF, SVM, MLP, Discurso de odio
Citation
Collections