Cómputo evolutivo como enfoque en la descripción del contenido de la imagen aplicado al reconocimiento de objetos

  1. Pérez Castro, Cynthia
Dirigida por:
  1. Francisco Fernández de Vega Director/a
  2. Gustavo Olague Director/a

Universidad de defensa: Universidad de Extremadura

Fecha de defensa: 06 de junio de 2014

Tribunal:
  1. Óscar Cordón García Presidente
  2. Francisco Chávez de la O Secretario/a
  3. Jose Ignacio Hidalgo Perez Vocal
  4. Juan Lanchares Dávila Vocal
  5. Sergio Damas Arroyo Vocal

Tipo: Tesis

Teseo: 364917 DIALNET

Resumen

La habilidad para analizar y describir la información contenida en las imágenes provenientes de escenarios reales o diseñados por el hombre es una tarea que resulta retadora y atractiva para diferentes áreas de la ciencia. Este trabajo presenta tres algoritmos evolutivos los cuales analizan el contenido de la imagen para tres aplicaciones de la Visión por Computadora, como lo es: la segmentación, el reconocimiento de objetos y la creación de mosaico de imágenes. Por un lado se realiza un análisis del contenido de imágenes con textura utilizando descriptores estadísticos por medio de la matriz de co-ocurrencia para llevar a cabo la segmentación. Por otro lado, se proponen nuevos descriptores locales que describen el contenido de la imagen para reconocer objetos en escenarios al interior y al exterior así como para crear mosaico de imágenes a partir de fotografías. En ambos casos, el análisis del contenido de la imagen es requerido para llevar a cabo la tarea lo más eficientemente posible. En el primer trabajo presentamos nuestro algoritmo de segmentación EvoSeg el cual utiliza conocimiento derivado del análisis de textura para identificar el número de regiones homogéneas existentes en la escena sin contar con ninguna información a priori. EvoSeg utiliza descriptores estadísticos en una matriz de co-ocurrencias en escala de grises y optimiza una medida de aptitud basada en el criterio de varianza mínima usando un algoritmo genético canónico. Posteriormente, se incorpora interacción dentro del proceso de optimización del algoritmo EvoSeg en donde una persona experta interactúa con el sistema ayudando a mejorar los resultados. La interacción permite al algoritmo adaptarse usando esta nueva información externa basada en el criterio del experto. Por otro lado, se describe una metodología basada en la programación genética que sintetiza expresiones matemáticas que son usadas para mejorar el conocido descriptor del estado del arte, SIFT (Scale Invariant Feature Transform). El mecanismo de reconocimiento de este trabajo está inspirado en la idea de cómo se hace el reconocimiento en la corteza cerebral de los primates al hacer uso de características de una complejidad intermedia que son invariantes a cambios de escala, localización e iluminación de manera natural. Estas características locales han sido diseñadas por personas expertas en el área que hacen uso de las representaciones tradicionales a través de definiciones matemáticas bien fundamentadas. Sin embargo, no es muy claro que estas mismas representaciones sean implementadas por el sistema natural de la misma manera. Es por ello, que la posibilidad para diseñar novedosos operadores a través de la programación genética representa una linea de investigación abierta donde la búsqueda combinatoria de los algoritmos evolutivos pueden exceder a la habilidad de los expertos. En ese sentido, este trabajo provee evidencia que la programación genética tanto canónica como multiobjetivo es capaz de diseñar nuevas características que mejoran el rendimiento general de los mejores descriptores locales disponibles en la actualidad. Para ello, los resultados experimentales confirman la validez de nuestro enfoque usando un protocolo de evaluación ampliamente aceptado, así como también el uso de nuestro mejor descriptor RDGP2 en el reconocimiento de objetos y el MORDGP en el caso de creación de mosaico de imágenes.