Nuevos avances en detección de actividad de voz mediante Hos y estrategias de optimización

  1. GÓRRIZ SÁEZ, JUAN MANUEL
unter der Leitung von:
  1. Carlos García Puntonet Doktorvater
  2. Javier Ramírez Pérez de Inestrosa Co-Doktorvater

Universität der Verteidigung: Universidad de Granada

Fecha de defensa: 13 von Juli von 2006

Gericht:
  1. Antonio José Rubio Ayuso Präsident
  2. Manuel Rodríguez Álvarez Sekretär/in
  3. José Carlos Segura Luna Vocal
  4. Elmar Wolfgang Lang Vocal
  5. Rubén Martín Clemente Vocal

Art: Dissertation

Zusammenfassung

n este trabajo se presentan nuevos avances en el campo de la detección de actividad de voz (VAD, del inglés "Voice Activity Detection") para su aplicación a Reconocimiento robusto del Habla en entornos ruidosos. Los nuevos detectores de actividad de voz (VADs) se basan en distintas metodologías: i) Tests estadísticos basados en promedios biespectrales sobre la rejilla en el dominio bi-frecuencia; ii) Tests estadísticos basados en el cociente de probabilidad (LRT) de magnitudes biespectrales integradas; iii) Análisis cluster para modelado del espacio de ruido y formulación de una regla de decisión basada en divergencia cluster; y iv) Máquinas de vectores soporte (SVMs) aplicadas a las clases de SNRs en subbandas de energía. El rendimiento de los VADs propuestos es superior en tasa de acierto de detección para una falsa alarma dada, cuando los comparamos con los VADs estándar, como los de ITU-T G.729, ETSI GSM AMR y ETSI AFE, y con los recientemente publicados, usando las bases de datos más representativas de ETSI como son AURORA2&3, y al formar parte de un sistema automático de reconocimiento (ASR), mejoran sensiblemente la tasa de reconocimiento de palabra en entornos ruidosos