Modelos K-explorables en sentido estricto integrados en un sistema de reconocimiento automático del habla

Varona Fernández, Amparo

Modelos K-explorables en sentido estricto integrados en un sistema de reconocimiento automático del habla

Varona Fernández, Amparo

Dirixida por:

María Inés Torres Barañano Director

Universidade de defensa: Universidad del País Vasco - Euskal Herriko Unibertsitatea

Fecha de defensa: 12 de abril de 2000

Tribunal:

Francisco Casacuberta Nolla Presidente/a
Germán Bordel García Secretario/a
Enrique Vidal Ruiz Vogal
José Bernardo Mariño Acebal Vogal
Antonio José Rubio Ayuso Vogal

Tipo: Tese

Teseo: 78102 DIALNET

Resumo

Una de las etapas fundamentales en un sistema de RAH es la incorporación de conocimiento sintáctico y/o semántico mediante un Modelo de Lenguaje (ML), Uno de los principales objetivos de este trabajo ha sido aplicar una aproximación grmatical al modelado de lenguaje, basada en la utilización de una subclase de las gramáticas regualares, conocidas como gramáticas k-Eplorables en Sentido Estricto (k-EE). Además, la construcción y evaluación de los ML se ha realizado en base a resultados de reconocimiento. Con la integración directa de las probabilidades acústicas y de ML no se logran los resultados de decodificación óptimos. En este trabajo se ha estudiado y evaluado los heurísticos que se utilizan tradicionalmente (ponderación lineal y exponencial sobre las probabilidades del acústicas y de ML) para mejorar el comportamiento del sistema, junto con nuevas propuestas (aplicación de una funciónescalón, combinación de hurísticos, etc.). El uso de las gramáticas k-EE permite integrar en un sólo modelo K autómatas k-EE deterministas (k=1.K) y la técnica de suavizado por back-off. La fomralización de este modelo ha sido también objetivo del trabajo. Además el suaviado de los ML es fundamental para evitar las probabilidades igual a cero de las combinaciones de palabras que no aparecen en las muestras de entrenamiento. En este trabajo se han evaluado, dentro del sistema de RAH, varios descuentos usando la técnica de back-off sintáctico: propuestas clásicas (Witten-Bell, Absoluto y Lineal) y nuevas propuestas (Sencillo y Acotado). Para reducir el tamaño de los modelos se ha evaluado también el efecto que tiene en decodificación la poda de los modelos k-EE suavizados con los distintos descuentos evaluados previamente. Se compara el diferente comportamiento de los modelos podados frente a los no podados.