Estudio y aplicacion de medidas de confianza para la mejora de sistemas de dialogo
- PEREZ-PIÑAR LOPEZ, DAVID
- Carmen García Mateo Director
Defence university: Universidade de Vigo
Fecha de defensa: 16 April 2007
- José Bernardo Mariño Acebal Chair
- Antonio Cardenal López Secretary
- Ruben Sansegundo Hernandez Committee member
- Luis Alfonso Hernández Gómez Committee member
- Ramón López-Cózar Delgado Committee member
Type: Thesis
Abstract
Uno de los aspectos más complicados en el diseño e implementación de sistemas de diálogo reales se encuentra en la gestión de los errores que surgen en la interacción hablada con el usuario. Las soluciones tradicionales, que tratan de resolver los errores interactuando con el usuario o robusteciendo el módulo de reconocimiento para conseguir tasas de error menores, tienen grandes limitaciones. Los diálogos de corrección complican enormemente la gestión del diálogo, son habitualmente difíciles y tediosos para el usuario y provocan un enorme rechazo en éste. La mejora del reconocedor, por su parte, reduce el problema sólo en cierta medida, porque no cubre todas las fuentes de error y requiere una íntima coordinación con otros módulos para ser eficaz. Esta Tesis trata de mostrar que es posible mejorar la calidad de los sistemas prácticos de diálogo en este sentido sin reducir su modularidad y sin aumentar excesivamente su complejidad. Para ello se parte de la hipótesis de que la reducción de los errores de entendimiento entre el usuario y el sistema requiere el uso de fuentes de conocimiento de alto nivel que proporcionen la información necesaria. Este punto de partida se emplea para proponer una arquitectura modificada para mejora notablemente las tasas de reconocimiento y cumple, al mismo tiempo, las condiciones de modularidad y facilita de implementación tan importantes en sistemas reales. Para ello el trabajo se inicia con un estudio previo, necesariamente resumido, del estado del arte en el campo de los sistemas de diálogo, al que se añade como ejemplo el sistema TelCorreo, de desarrollo propio, que ha permitido centrar el problema y definir los aspectos más problemáticos desde el punto de vista del usuario. La arquitectura modificada del sistema, que constituye la base de las aportaciones de esta Tesis, permite introducir las fuentes de conocimiento de alto nivel mediante el uso de medidas de confianza de bajo nivel y mediante la aplicación del Análisis Semántico Latente. Esta arquitectura usa la identificación del tema al que corresponde la locución del usuario para mejorar el reconocimiento. El reconocedor tradicional se sustituye por un módulo de reconocedores adaptados a cada tema que trabajan en paralelo, y que combinan sus salidas para identificar el tema de la frase. De este modo, la información de alto nivel requerida para reducir los errores se introduce en la arquitectura misma del sistema, y al mismo tiempo se permite el uso de reconocedores desarrollados por terceros y se obtiene un sistema completamente dirigido por datos, y por ello, muy fácil de implementar y ajustar a cada aplicación.