Nuevos avances en detección de actividad de voz mediante Hos y estrategias de optimización

  1. GÓRRIZ SÁEZ, JUAN MANUEL
Dirigida por:
  1. Carlos García Puntonet Director
  2. Javier Ramírez Pérez de Inestrosa Codirector

Universidad de defensa: Universidad de Granada

Fecha de defensa: 13 de julio de 2006

Tribunal:
  1. Antonio José Rubio Ayuso Presidente
  2. Manuel Rodríguez Álvarez Secretario/a
  3. José Carlos Segura Luna Vocal
  4. Elmar Wolfgang Lang Vocal
  5. Rubén Martín Clemente Vocal

Tipo: Tesis

Resumen

n este trabajo se presentan nuevos avances en el campo de la detección de actividad de voz (VAD, del inglés "Voice Activity Detection") para su aplicación a Reconocimiento robusto del Habla en entornos ruidosos. Los nuevos detectores de actividad de voz (VADs) se basan en distintas metodologías: i) Tests estadísticos basados en promedios biespectrales sobre la rejilla en el dominio bi-frecuencia; ii) Tests estadísticos basados en el cociente de probabilidad (LRT) de magnitudes biespectrales integradas; iii) Análisis cluster para modelado del espacio de ruido y formulación de una regla de decisión basada en divergencia cluster; y iv) Máquinas de vectores soporte (SVMs) aplicadas a las clases de SNRs en subbandas de energía. El rendimiento de los VADs propuestos es superior en tasa de acierto de detección para una falsa alarma dada, cuando los comparamos con los VADs estándar, como los de ITU-T G.729, ETSI GSM AMR y ETSI AFE, y con los recientemente publicados, usando las bases de datos más representativas de ETSI como son AURORA2&3, y al formar parte de un sistema automático de reconocimiento (ASR), mejoran sensiblemente la tasa de reconocimiento de palabra en entornos ruidosos