Una aproximación estocástica para la comprensión del lenguaje

  1. GARCÍA GRANADA, FERNANDO
Dirigida por:
  1. Emilio Sanchís Arnal Director/a
  2. Encarna Segarra Soriano Codirector/a

Universidad de defensa: Universitat Politècnica de València

Fecha de defensa: 10 de diciembre de 2003

Tribunal:
  1. Antonio José Rubio Ayuso Presidente
  2. Isabel Galiano Ronda Secretario/a
  3. María José Castro Bleda Vocal
  4. Amparo Varona Fernández Vocal
  5. Antonio Bonafonte Cávez Vocal

Tipo: Tesis

Teseo: 105648 DIALNET

Resumen

En este trabajo se ha desarrollado una aproximación para abordar la tarea de comprensión de un sistema de diálogo hablado para un entorno semántico restringido. El sistema de comprensión representa diferentes niveles de conocimiento del lenguaje a través de modelos de estados finitos, que se aprenden de forma automática a partir de corpora anotados con información semántica. Para la construcción del sistema de comprensión se han empleado métodos estocásticos, aprendizaje automático a partir de datos y técnicas de inferencia gramatical. Estos modelos emplean una representación de dos niveles en la que se considera la información de las secuencias de unidades semánticas presentes en el corpus, así como la información de las palabras asociadas a cada una de estas unidades semánticas, permitiendo una segmentación y un etiquetado secuencial de la frase completa de entrada. Un sistema de reglas convierte esta segmentación en un frame semántico, que es la representación elegida por esta tarea. La aproximación propuesta ha sido aplicada para desarrollar el módulo de comprensión de un sistema de diálogo hablado que atiende a preguntas en lenguaje natural a través de la línea telefónica, sobre horarios y preciso de trenes de largo recorrido. Los resultados obtenidos, evaluados sobre la representación semántica que da como salida el sistema de comprensión, han sido satisfactorios. Podemos considerar que el uso de este tipo de métodos es adecuado para resovler el tipo de tarea abordada.