Técnicas de mejora de la representación en los sistemas de reconocimiento automático de voz

TORRE VEGA, ANGEL DE LA

Técnicas de mejora de la representación en los sistemas de reconocimiento automático de voz

TORRE VEGA, ANGEL DE LA

unter der Leitung von:

Antonio M. Peinado Herreros Doktorvater/Doktormutter
Antonio José Rubio Ayuso Co-Doktorvater

Universität der Verteidigung: Universidad de Granada

Fecha de defensa: 28 von April von 1999

Gericht:

Francisco Casacuberta Nolla Präsident/in
José Carlos Segura Luna Sekretär
Eduardo López Gonzalo Vocal
Enric Monte Moreno Vocal
José Luis Alba Castro Vocal

Fachbereiche:

ELECTRÓNICA Y TECNOLOGÍA DE COMPUTADORES

Art: Dissertation

Teseo: 70259 DIALNET

Zusammenfassung

La presente tesis aborda el problema de la representación en los sistemas de reconocimiento de voz. En este trabajo se presentan y discuten diversas técnicas orientadas a mejorar la representación de la voz para el reconocimiento. Las técnicas propuestas se pueden situar en dos grupos: * Las primeras tratan de mejorar la capacidad discriminativa de la representación mediante la aplicación de transformaciones. Aunque estas técnicas no están diseñadas explícitamente para mejorar el rendimiento de los reconocedores en ruido, al incrementarse la capacidad discriminativa de la representación tienden a mejorar el rendimiento tanto en condiciones limpias como ruidosas. * Las técnicas del segundo grupo están diseñadas para adaptar la voz ruidosa a un entorno limpio de referencia. Dentro de este grupo se han desarrollado tanto técnicas que realizan una adaptación ciega (sin hacer consideraciones relativas al ruido) como técnicas que realizan la adaptación en base a un modelo del ruido. La tesis se ha organizado en tres grandes bloques. El primero de ellos presenta el problema del reconocimiento automático de voz y la representación de la voz. También incluye información general acerca de los experimentos realizados en esta tesis: bases de datos, sistemas de reconocimiento, tareas, etc. El siguiente bloque está dedicado a los métodos propuestos para mejorar la representación de la voz desarrollados en base a criterios discriminativos. El tercer bloque aborda el problema del reconocimiento de voz en ruido. Se analiza el problema del reconocimiento de voz contaminada: se propone y estudia un método ciego (sin consideraciones previas relativas al ruido) para compensar el ruido; también se propone un modelo para describir el ruido y se presenta un método para estimarlo; para concluir el bloque, se proponen y estudian varios métodos para compensar el ruido, haciendo uso del modlo. Finalmente, la tesis se cierra con un ca