Sistemas de reconocimiento de habla continua y aisladaComparación y optimizacion de los sistemas de modelado y parametrizacion

  1. CORDOBA HERRALDE RICARDO DE
Dirigida por:
  1. José Manuel Pardo Muñoz Director/a

Universidad de defensa: Universidad Politécnica de Madrid

Año de defensa: 1996

Tribunal:
  1. Andres Santos Lleo Presidente/a
  2. Antonio José Rubio Ayuso Secretario
  3. Jorge Alvarez Cercadillo Vocal
  4. Climent Nadeu Camprubí Vocal
  5. Manuel Antonio Leandro Reguillo Vocal

Tipo: Tesis

Teseo: 56311 DIALNET

Resumen

El objetivo de la presente tesis es tratar de dominar toda una serie de técnicas con las que mejorar el modelado y parametrizacion de dos sistemas de reconocimiento de habla, uno de habla continua y otro de habla aislada, independiente del locutor y sobre linea telefónica. Los puntos básicos que se han tratado son: parametrizacion: se ha trabajado en la manera de caracterizar el espectro de la señal de voz. Se han introducido distintas maneras de realizar un filtrado de dichos valores para conseguir que sean robustos frente al ruido telefónico. Tipo de modelado: se ha trabajado con tres tipos de modelado: discreto, continuo y semicontinuo. En este ultimo se ha introducido una técnica de preseleccion con la que reducir el tiempo de calculo sin perder tasa de reconocimiento. Unidad de modelado: se han estudiado distintas posibilidades en nuestros dos sistemas: palabra, fonema, trifonema generalizado y agrupamiento a nivel de estado. Detección de principio y fin: se ha introducido una técnica basada en una red neuronal con la que se discrimina señal y ruido. Asimismo, utilizando modelos de ruido inicial y final comunes a todos los modelos se ha conseguido absorber las tramas de ruido.