Arquitectura eficiente de condensación de información visual dirigida por procesos atencionales (efficient architecture to condénsate visual information driven by attention processes)

  1. Granados Cabeza, María Sara
Zuzendaria:
  1. Javier Díaz Alonso Zuzendaria
  2. Alberto Prieto Espinosa Zuzendarikidea
  3. Mª Sonia Mota Fernández Zuzendarikidea

Defentsa unibertsitatea: Universidad de Granada

Fecha de defensa: 2012(e)ko abendua-(a)k 11

Epaimahaia:
  1. Manuel Rodríguez Álvarez Presidentea
  2. Eva Martínez Ortigosa Idazkaria
  3. Pilar Martínez Ortigosa Kidea
  4. José Manuel Palomares Muñoz Kidea
  5. Nicolas Pugeault Kidea

Mota: Tesia

Laburpena

Esta tesis doctoral presenta un innovador mapa de representación disperso que condensa características visuales hasta conseguir una representación más dispersa, reduciendo los requisitos de memoria, ancho de banda y recursos computacionales. Este mapa semidenso, al contrario que otros existentes, incluye eficientemente tanto información de zonas salientes como no salientes, lo cual incrementa la versatilidad y permite su utilización en múltiples aplicaciones. Esta tesis doctoral está divida en tres partes. En la primera parte revisamos el estado del arte, poniendo especial atención a las características visuales densas y dispersas. A continuación, nos centramos en nuestra novedosa representación. Primero estudiamos cómo las características dispersas extraen la información relevante de una imagen y cuál sería la mejor opción como indicador de saliencia en nuestro mapa de representación. Después nos centramos en la parte no saliente de la imagen, estudiando los distintos filtros disponibles como herramientas de regularización y decidiendo qué cantidad de puntos no salientes deberíamos incluir. Y por último integramos eficientemente estos dos tipos de puntos en una única representación. En la segunda parte de esta tesis doctoral estudiamos el comportamiento de nuestro mapa de representación semidenso en distintos escenarios. Primero lo utilizamos en un sistema atencional en el que recibimos e integramos señales tanto bottom-up como top-down, estas últimas no son normalmente incluidas por otros sistemas. Esta integración muestra nuestra representación como un marco muy adecuado para la incorporación de información dirigida por objetivos en un sistema de visión. A continuación, hemos utilizado nuestro mapa semidenso como entrada a una aplicación real basada en un escenario de conducción de vehículos, reduciendo el tiempo de ejecución a la vez que obtenemos resultados similares a los conseguidos con el mapa denso original. La tercera parte corresponde al diseño e implementación de nuestro algoritmo en una FPGA, incorporándolo a un sistema de baja visión con limitaciones de memoria, ancho de banda y recursos computacionales. Nuestro mapa semidenso soluciona estas limitaciones y permite la integración, en tiempo real, de señales realimentadas procedentes de algoritmos de medio y alto nivel. Todo esto sin introducir ninguna penalización en el sistema. Como conclusión, los resultados muestran que nuestro mapa de representación semidenso es versátil (es decir, condensa cualquier característica visual densa), soporta condiciones de tiempo real, regulariza inherentemente las características de entrada e integra retroalimentación procedente de otras etapas de procesamiento. Todas estas características hacen que nuestra solución sea una representación muy útil para cualquier sistema empotrado de tiempo real que procese imágenes.