Técnicas de mejora de la representación en los sistemas de reconocimiento automático de voz

TORRE VEGA, ANGEL DE LA

Técnicas de mejora de la representación en los sistemas de reconocimiento automático de voz

TORRE VEGA, ANGEL DE LA

Dirigida por:

Antonio M. Peinado Herreros Director/a
Antonio José Rubio Ayuso Codirector

Universidad de defensa: Universidad de Granada

Fecha de defensa: 28 de abril de 1999

Tribunal:

Francisco Casacuberta Nolla Presidente/a
José Carlos Segura Luna Secretario
Eduardo López Gonzalo Vocal
Enric Monte Moreno Vocal
José Luis Alba Castro Vocal

Departamento:

ELECTRÓNICA Y TECNOLOGÍA DE COMPUTADORES

Tipo: Tesis

Teseo: 70259 DIALNET

Resumen

La presente tesis aborda el problema de la representación en los sistemas de reconocimiento de voz. En este trabajo se presentan y discuten diversas técnicas orientadas a mejorar la representación de la voz para el reconocimiento. Las técnicas propuestas se pueden situar en dos grupos: * Las primeras tratan de mejorar la capacidad discriminativa de la representación mediante la aplicación de transformaciones. Aunque estas técnicas no están diseñadas explícitamente para mejorar el rendimiento de los reconocedores en ruido, al incrementarse la capacidad discriminativa de la representación tienden a mejorar el rendimiento tanto en condiciones limpias como ruidosas. * Las técnicas del segundo grupo están diseñadas para adaptar la voz ruidosa a un entorno limpio de referencia. Dentro de este grupo se han desarrollado tanto técnicas que realizan una adaptación ciega (sin hacer consideraciones relativas al ruido) como técnicas que realizan la adaptación en base a un modelo del ruido. La tesis se ha organizado en tres grandes bloques. El primero de ellos presenta el problema del reconocimiento automático de voz y la representación de la voz. También incluye información general acerca de los experimentos realizados en esta tesis: bases de datos, sistemas de reconocimiento, tareas, etc. El siguiente bloque está dedicado a los métodos propuestos para mejorar la representación de la voz desarrollados en base a criterios discriminativos. El tercer bloque aborda el problema del reconocimiento de voz en ruido. Se analiza el problema del reconocimiento de voz contaminada: se propone y estudia un método ciego (sin consideraciones previas relativas al ruido) para compensar el ruido; también se propone un modelo para describir el ruido y se presenta un método para estimarlo; para concluir el bloque, se proponen y estudian varios métodos para compensar el ruido, haciendo uso del modlo. Finalmente, la tesis se cierra con un ca