Análisis de expresiones faciales mediante visión por computador

  1. Buenaposada Biencinto, José Miguel
Dirigée par:
  1. Luis Baumela Molina Directeur/trice

Université de défendre: Universidad Politécnica de Madrid

Année de défendre: 2004

Jury:
  1. José Crespo del Arco President
  2. Luis M. Bergasa Pascual Secrétaire
  3. Nicolás Pérez de la Blanca Capilla Rapporteur
  4. Lourdes Agapito Vicente Rapporteur
  5. Luis Miguel Álvarez León Rapporteur

Type: Thèses

Résumé

Las expresiones del rostro son una componente esencial de los procesos de comunicación entre los seres humanos. No es sorprendente, por tanto, que la cuantificación de las expresiones faciales constituya un tema de interés en el campo de la visión por computador por su utilidad en la construcción de interfaces avanzadas de comunicación con el ordenador. También es un tema de interés en el campo de la animación, área en la que confluyen las técnicas gráficas y la visión. La cara es un objeto difícil de analizar mediante técnicas de Visión por Computador pues presenta amplias zonas con poca textura y sus regiones más expresivas (ojos, cejas y boca) sufren deformaciones no rígidas. Si a esto le añadimos la dificultad de modelizar y predecir el movimiento de la cabeza junto a la existencia de oclusiones o de condiciones cambiantes de iluminación, entenderemos por qué el análisis del rostro mediante Visión por Computador es un problema difícil que hoy en día continúa abierto. En la presente tesis desarrollamos un sistema de análisis facial que nos permitirá encontrar y seguir el rostro humano así como cuantificar sus expresiones faciales. Para el seguimiento utilizaremos una arquitectura basada en el ""Enfoque Gradual de la Atención"". Esta arquitectura está formada por un conjunto de seguidores con distintos niveles de precisión y de carga computacional. El seguidor menos preciso consiste en buscar la cara aleatoriamente en la imagen, prestando atención a regiones con un color parecido al de la piel. Una vez tenemos una región candidata, se emplea la textura de la cara de la persona a seguir para localizar de forma más precisa su cabeza. Un seguidor basado en la apariencia, entrenado con la cara del usuario, nos permitirá tratar el movimiento no rígido del rostro y, al mismo tiempo, estimar el movimiento rígido del conjunto. El sistema resultante controla el coste computacional y la precisión en el seguimiento, empleando un seguidor menos preciso y de menor coste cuando las condiciones del entorno se degradan, y aumentando la precisión cuando mejoran. Finalmente, como aplicación práctica, emplearemos los parámetros de movimiento estimados para animar un modelo gráfico 3D. Para afrontar el problema de los cambios de iluminación, se ha propuesto un procedimiento de normalización de color basado en un conocido algoritmo de constancia de color para escenas estáticas, el algoritmo Grey World, pero extendido al caso de secuencias de imágenes. Con el nuevo desarrollo se pueden seguir objetos a partir de su color, con un buen grado de robustez a los cambios de iluminación. Además, se ha desarrollado un seguidor eficiente basado en diferencias en los niveles de gris (SSD) que puede estimar la posición y orientación en 3D de un plano mediante el empleo de un modelo de movimiento proyectivo. Está basado en la extensión al caso proyectivo de la idea de la factorización del Jacobiano de Hager y Belhumeur. También se ha desarrollado un procedimiento de elección del conjunto de píxeles más informativo de la plantilla de seguimiento para incrementar aún más el rendimiento del seguidor. Finalmente, se ha desarrollado una técnica de factorización del Jacobiano para resolver el problema de seguimiento de objetos deformables. Usando nuestro algoritmo es posible seguir el movimiento no rígido de las zonas de la cara en tiempo real. El algoritmo resultante es interesante no sólo por su eficiencia computacional, sino también porque es más fácil de entrenar que los bien conocidos Modelos Activos de Apariencia (AAM)