Sistemas de reconocimiento de habla continua y aisladaComparación y optimizacion de los sistemas de modelado y parametrizacion

  1. CORDOBA HERRALDE RICARDO DE
Dirigida per:
  1. José Manuel Pardo Muñoz Director/a

Universitat de defensa: Universidad Politécnica de Madrid

Any de defensa: 1996

Tribunal:
  1. Andres Santos Lleo President/a
  2. Antonio José Rubio Ayuso Secretari
  3. Jorge Alvarez Cercadillo Vocal
  4. Climent Nadeu Camprubí Vocal
  5. Manuel Antonio Leandro Reguillo Vocal

Tipus: Tesi

Teseo: 56311 DIALNET

Resum

El objetivo de la presente tesis es tratar de dominar toda una serie de técnicas con las que mejorar el modelado y parametrizacion de dos sistemas de reconocimiento de habla, uno de habla continua y otro de habla aislada, independiente del locutor y sobre linea telefónica. Los puntos básicos que se han tratado son: parametrizacion: se ha trabajado en la manera de caracterizar el espectro de la señal de voz. Se han introducido distintas maneras de realizar un filtrado de dichos valores para conseguir que sean robustos frente al ruido telefónico. Tipo de modelado: se ha trabajado con tres tipos de modelado: discreto, continuo y semicontinuo. En este ultimo se ha introducido una técnica de preseleccion con la que reducir el tiempo de calculo sin perder tasa de reconocimiento. Unidad de modelado: se han estudiado distintas posibilidades en nuestros dos sistemas: palabra, fonema, trifonema generalizado y agrupamiento a nivel de estado. Detección de principio y fin: se ha introducido una técnica basada en una red neuronal con la que se discrimina señal y ruido. Asimismo, utilizando modelos de ruido inicial y final comunes a todos los modelos se ha conseguido absorber las tramas de ruido.