Genetic graph-based in clustering applied to static and streaming data analysis

  1. Menéndez Benito, Hector de
Dirigida por:
  1. David Camacho Fernández Director/a
  2. David Fernández Barrero Director/a

Universidad de defensa: Universidad Autónoma de Madrid

Fecha de defensa: 18 de diciembre de 2014

Tribunal:
  1. Óscar Cordón García Presidente
  2. Pablo Castells Azpilicueta Secretario/a
  3. Juan Manuel Estévez Tapiador Vocal
  4. Fernando Esteban Barril Otero Vocal
  5. Sanaz Mostaghim Vocal

Tipo: Tesis

Resumen

Dentro del aprendizaje automático y concretamente en el área de las técnicas no supervisadas, el Clustering es tal vez una de las áreas de mayor interés e impacto por parte de la comunidad científica. La posibilidad de descubrir patrones en grandes conjuntos de datos no "etiquetados", junto con la actual tendencia que el Big Data han originado en dominios industriales y científicos hacen que las aportaciones en esta área sean consideradas de gran interés por toda la comunidad. De las diferentes aproximaciones que se han abordado en las últimas décadas para tratar el problema de la agrupación por similitud de datos, esta tesis aborda una de las más recientes, la basada en continuidad de datos. En esta aproximación los datos son agrupados mediante la forma que estos están definidos por alguna propiedad espacial. Por lo tanto las medidas de similitud y representación de la estructura interna de los datos deben tener en cuenta este hecho. El denominado Spectral Clustering, basado en la utilización de grafos para la detección de la continuidad de los datos, es tal vez la que mayor impacto ha tenido en el área. El trabajo de tesis aquí presentado tiene como principales objetivos; en primer lugar realizar un análisis del estado del arte en esta área; y en segundo lugar desarrollar nuevos algoritmos basados en estrategias evolutivas que puedan ser aplicados a problemas de Clustering basados en continuidad.