Aprendizaje automático en conjuntos de clasificadores heterogéneos y modelado de agentes
- Ledezma Espino, Agapito Ismael
- Ricardo Aler Mur Director/a
- María Araceli Sanchís de Miguel Director/a
Universidad de defensa: Universidad Carlos III de Madrid
Fecha de defensa: 17 de diciembre de 2004
- Daniel Borrajo Millán Presidente/a
- José Manuel Molina López Secretario/a
- José María Armingol Moreno Vocal
- Jesús González Boticario Vocal
- Antonio González Muñoz Vocal
Tipo: Tesis
Resumen
Una de las áreas que mas auge ha tenido en los últimos años dentro del aprendizaje automático es aquella en donde se combinan las decisiones de clasificadores individuales con la finalidad de que la decisión final de a que clase pertenece un ejemplo sea realizada por un conjunto de clasificadores. Existen diversas técnicas para generar conjuntos de clasificadores, desde la manipulación de los datos de entrada a la utilización de meta-aprendizaje. Una de las maneras en las que se clasifican estas técnicas es por el numero de algoritmos de aprendizaje diferentes que utilizan con el fin de generar los miembros del conjunto. Aquellas técnicas que utilizan un único algoritmo para generar todos los miembros del conjunto se dice que generan un conjunto homogéneo. Por otra parte, aquellas técnicas que utilizan mas de un algoritmo para generar los clasificadores se considera que generan un conjunto de clasificadores heterogéneo. Entre los algoritmos de generación de conjuntos heterogéneos se encuentra Stacking, el cual, además de generar los clasificadores del conjunto a partir de distintos algoritmos de aprendizaje, utiliza dos niveles de aprendizaje. El primer nivel de aprendizaje o nivel-0 utiliza los datos del dominio de manera directa, mientras que el meta-nivel o nivel-1 utiliza datos generados a partir de los clasificadores del nivel-0. Un problema inherente a Stacking es determinar la configuración de los parámetros de aprendizaje del algoritmo, entre ellos, qué y cuántos algoritmos deben ser utilizados en la generación de los clasificadores del conjunto. Trabajo previos han determinado que no hay un numero exacto de algoritmos a utilizar que sea el optimo para todos los dominios. Tampoco está perfectamente definido qué algoritmos se deberían utilizar, aunque existen trabajos que utilizan algoritmos representativos de cada tipo. Uno de los objetivos de esta tesis doctoral es la utilización de algoritmos genéticos como técnica de optimización para determinar los algoritmos que deben ser utilizados para generar el conjunto de clasificadores, al igual que la configuración de los parámetros de aprendizaje de estos. De esta manera el método que se propone es independiente del dominio, mientras que la configuración de los parámetros de Stacking encontrada, dependería del dominio. El crecimiento del comercio electrónico y las aplicaciones en la World-Wide- Web ha motivado el incremento de los entornos en donde intervienen agentes. Estos entornos incluyen situaciones competitivas y/o colaborativas en donde el conocimiento que se posea sobre los individuos involucrados en el entorno, proporciona II III una clara ventaja a la hora de tomar una decisión sobre qué acción llevar a cabo. Existen diversas formas de adquirir este conocimiento. Una de ellas es a través del modelado del comportamiento de los agentes. A su vez, existen diversas formas de construir el modelo de un agente. Algunas técnicas utilizan modelos previamente construidos y su objetivo es intentar emparejar el comportamiento observado con un modelo existente. Otras técnicas asumen un comportamiento optimo del agente a modelar con el fin de crear un modelo de su comportamiento. Un segundo objetivo de esta tesis doctoral es la creación de un marco general para el modelado de agentes basándose en la observación del comportamiento del agente a modelar. Para ello se propone la utilización de técnicas de aprendizaje automático con el propósito de llevar a cabo la tarea de modelado basándose en la relación existente entre la entrada y la salida del agente.