Desarrollo de un sistema de detección de fake news en español y aplicación en noticias

No Thumbnail Available
Date
2020-04-30
Journal Title
Journal ISSN
Volume Title
Publisher
Centro Universitario de la Defensa de Marín
Abstract
El controvertido ascenso de Donald Trump hacia la Casa Blanca ha despertado un mal que permanecía oculto para toda la sociedad, las fake news. Este fenómeno ha sido capaz de poner en jaque la credibilidad del periodismo en general y ha propiciado la búsqueda de diferentes mecanismos para detectar e identificar este tipo de noticias. El método tradicional y más empleado pasa por el procesado manual de las noticias mediante la comprobación del autor, la fuente o el contenido (fact-checking). En este TFG se busca un sistema más sofisticado basado en la utilización de técnicas de procesamiento del lenguaje natural mediante machine learning para el desarrollo en lenguaje Python de un sistema, en el cual el usuario sea un mero observador y el programa pueda dirimir la veracidad de la noticia. En función de un conjunto de datos textuales proporcionados, en el cual encontramos las noticias clasificadas como verdaderas y falsas, se crea un modelo a partir de diferentes algoritmos de aprendizaje como Long Short-Term Memory (LSTM) para discernir si la noticia es verdadera o falsa. Antes de poder hacer que el texto sea comprendido por el modelo creado precisa pasar por diferentes procesos como es el embedding, en otras palabras, la transformación del corpus tal y como lo conocemos a un lenguaje numérico y que permite un óptimo funcionamiento de los diferentes algoritmos empleados.
Description
Keywords
Fake news, python, Dataset, procesamiento del lenguaje natural, machine learning, embedding
Citation
Collections