Nuevos avances en detección de actividad de voz mediante Hos y estrategias de optimización

  1. GÓRRIZ SÁEZ, JUAN MANUEL
Dirigida per:
  1. Carlos García Puntonet Director
  2. Javier Ramírez Pérez de Inestrosa Codirector

Universitat de defensa: Universidad de Granada

Fecha de defensa: 13 de de juliol de 2006

Tribunal:
  1. Antonio José Rubio Ayuso President
  2. Manuel Rodríguez Álvarez Secretari/ària
  3. José Carlos Segura Luna Vocal
  4. Elmar Wolfgang Lang Vocal
  5. Rubén Martín Clemente Vocal

Tipus: Tesi

Resum

n este trabajo se presentan nuevos avances en el campo de la detección de actividad de voz (VAD, del inglés "Voice Activity Detection") para su aplicación a Reconocimiento robusto del Habla en entornos ruidosos. Los nuevos detectores de actividad de voz (VADs) se basan en distintas metodologías: i) Tests estadísticos basados en promedios biespectrales sobre la rejilla en el dominio bi-frecuencia; ii) Tests estadísticos basados en el cociente de probabilidad (LRT) de magnitudes biespectrales integradas; iii) Análisis cluster para modelado del espacio de ruido y formulación de una regla de decisión basada en divergencia cluster; y iv) Máquinas de vectores soporte (SVMs) aplicadas a las clases de SNRs en subbandas de energía. El rendimiento de los VADs propuestos es superior en tasa de acierto de detección para una falsa alarma dada, cuando los comparamos con los VADs estándar, como los de ITU-T G.729, ETSI GSM AMR y ETSI AFE, y con los recientemente publicados, usando las bases de datos más representativas de ETSI como son AURORA2&3, y al formar parte de un sistema automático de reconocimiento (ASR), mejoran sensiblemente la tasa de reconocimiento de palabra en entornos ruidosos