Herramientas para la detección de menciones a palabras clave en flujos de audio
Fecha
2021-04-30Autor
Barroso Marín, Kevin
Fernández García (advisor), Norberto
González Coma (advisor), José P.
Metadatos
Mostrar el registro completo del ítemResumen
El audio mining es una técnica que está actualmente en alza, ya que desempeña una serie de
funciones muy diversas. Dentro de estas funciones, este trabajo se centra en la detección de menciones
a palabras. Esta función tiene multitud de aplicaciones, desde asistentes virtuales o marketing hasta la
que más interesa en el objetivo y el contexto de este trabajo, la inteligencia militar.
Para realizar esta operación de búsqueda de menciones a palabras, existen tres alternativas
diferentes: search by sound, búsqueda de patrones en la señal sonora; keyword spotting, detección de
menciones a términos usando características extraídas del audio y/o lingüísticas o speech recognition,
donde el audio se transcribe a texto y ahí se busca la mención. Para encontrar la mejor herramienta que
realice la función deseada, se lleva a cabo un estudio de una selección de herramientas que
desempeñan la función. Se elige la aplicación Vosk, se procede a su instalación y se describe su
funcionamiento. A continuación, con el propósito de averiguar qué factores son los que influyen en la
calidad de la transcripción y de la búsqueda de menciones a palabras, se realizan diversas pruebas en
diferentes escenarios (incluyendo comunicaciones navales) y se analizan los resultados, para al final
concluir si influyen o no y en qué medida los factores estudiados.