Detección automática de discurso de odio en redes sociales

Pachón de la Torre, Sheila María; Fernández Gavilanes (advisor), Milagros

Detección automática de discurso de odio en redes sociales

Files

Pachón de la Torre, Sheila María - Memoria.pdf(2.41 MB)

Date

2021-04-30

Authors

Pachón de la Torre, Sheila María

Fernández Gavilanes (advisor), Milagros

Publisher

Centro Universitario de la Defensa de Marín

Abstract

Se presenta un enfoque para la creación de un sistema de detección del discurso de odio en las redes sociales, mediante la aplicación de técnicas de procesamiento del lenguaje natural que servirán para entrenar diversos sistemas supervisados. Con este fin, se realiza así la extracción de numerosas características superficiales, incluyendo estas la polaridad de los emojis y conteo de menciones y hashtags; léxicas, con la aportación de TF-IDF y CounterVectorizer; y, además, la implementación de análisis de sentimiento y de sarcasmo. Se experimenta con combinaciones de características para la búsqueda de aquellas que aporten mayor cantidad de información al sistema con la consiguiente mejora en los resultados. Se realiza así en este TFG pruebas muy variadas teniendo en cuenta el abanico de características consideradas y los varios modelos de aprendizaje existentes. Todas estas pruebas se llevaron a cabo sobre un conjunto de tweets de temática yihadista en un entorno multilingüe, centrándose el trabajo en aquellos escritos en inglés y árabe. Finalmente, se realizó una evaluación exhaustiva utilizando características de un modo individual, pero también grupal, sobre los distintos modelos, concluyendo cuáles de ellos son los que proporcionan un mayor rendimiento en este caso de estudio.

Keywords

Machine Learning, TF-IDF, SVM, MLP, Discurso de odio

URI

http://calderon.cud.uvigo.es/handle/123456789/598

Collections

2020-21

Full item page