Técnicas de mejora de la representación en los sistemas de reconocimiento automático de voz

TORRE VEGA, ANGEL DE LA

Técnicas de mejora de la representación en los sistemas de reconocimiento automático de voz

TORRE VEGA, ANGEL DE LA

Dirigée par:

Antonio M. Peinado Herreros Directeur/trice
Antonio José Rubio Ayuso Co-directeur

Université de défendre: Universidad de Granada

Fecha de defensa: 28 avril 1999

Jury:

Francisco Casacuberta Nolla President
José Carlos Segura Luna Secrétaire
Eduardo López Gonzalo Rapporteur
Enric Monte Moreno Rapporteur
José Luis Alba Castro Rapporteur

Département:

ELECTRÓNICA Y TECNOLOGÍA DE COMPUTADORES

Type: Thèses

Teseo: 70259 DIALNET

Résumé

La presente tesis aborda el problema de la representación en los sistemas de reconocimiento de voz. En este trabajo se presentan y discuten diversas técnicas orientadas a mejorar la representación de la voz para el reconocimiento. Las técnicas propuestas se pueden situar en dos grupos: * Las primeras tratan de mejorar la capacidad discriminativa de la representación mediante la aplicación de transformaciones. Aunque estas técnicas no están diseñadas explícitamente para mejorar el rendimiento de los reconocedores en ruido, al incrementarse la capacidad discriminativa de la representación tienden a mejorar el rendimiento tanto en condiciones limpias como ruidosas. * Las técnicas del segundo grupo están diseñadas para adaptar la voz ruidosa a un entorno limpio de referencia. Dentro de este grupo se han desarrollado tanto técnicas que realizan una adaptación ciega (sin hacer consideraciones relativas al ruido) como técnicas que realizan la adaptación en base a un modelo del ruido. La tesis se ha organizado en tres grandes bloques. El primero de ellos presenta el problema del reconocimiento automático de voz y la representación de la voz. También incluye información general acerca de los experimentos realizados en esta tesis: bases de datos, sistemas de reconocimiento, tareas, etc. El siguiente bloque está dedicado a los métodos propuestos para mejorar la representación de la voz desarrollados en base a criterios discriminativos. El tercer bloque aborda el problema del reconocimiento de voz en ruido. Se analiza el problema del reconocimiento de voz contaminada: se propone y estudia un método ciego (sin consideraciones previas relativas al ruido) para compensar el ruido; también se propone un modelo para describir el ruido y se presenta un método para estimarlo; para concluir el bloque, se proponen y estudian varios métodos para compensar el ruido, haciendo uso del modlo. Finalmente, la tesis se cierra con un ca