Sistema de coordinación multiagente basado en comportamientos aprendidos

Peula Palacios, José Manuel

Sistema de coordinación multiagente basado en comportamientos aprendidos

Peula Palacios, José Manuel

Dirixida por:

Cristina Urdiales García Director

Universidade de defensa: Universidad de Málaga

Fecha de defensa: 17 de decembro de 2015

Tribunal:

Vicente Matellán Olivera Presidente/a
Juan Pedro Bandera Rubio Secretario/a
José Manuel Pérez Lorenzo Vogal
Pedro Manuel Martinez Jimenez Vogal
Carmen de Trazegnies Otero Vogal

Tipo: Tese

Teseo: 397744 DIALNET RIUMA editor

Resumo

La robótica ha cambiado enormemente desde sus orígenes hasta la actualidad, pasando de simples autómatas que realizaban una simple tarea repetitiva de forma automática a robots autónomos con una gran versatilidad y capacidades de interacción con su entorno. En el caso de un robot, las posibles interacciones que puede tener, aparte de con los elementos estáticos del entorno, son la interacción robot-robot y la interacción robot-humano. Ambos tipos de interacción son hoy en día áreas de trabajo muy activas, pues suponen retos interesantes, complejos y con distintos puntos de vista y soluciones, muchas de ellas válidas dependiendo de la situación y problema concreto. La presente tesis se centra en la interacción y coordinación entre robots. Concretamente, en este trabajo se presenta un sistema de coordinación implícita multi-agente basado en el aprendizaje de comportamientos mediante aprendizaje por demostración. La coordinación implícita se basa en que la coordinación surge a partir de la interacción entre los distintos agentes del sistema, los cuales actúan de forma autónoma e independiente entre ellos. Este enfoque ha sido utilizado frente a la coordinación explícita porque encaja más fácilmente en una arquitectura basada en comportamientos, cuyo principio de funcionamiento, de abajo hacia arriba, consiste en el desarrollo de comportamientos simples para que la combinación de éstos de lugar a un comportamiento emergente, de alto nivel, más complejo que los comportamientos simples desarrollados. Se ha seleccionado aprendizaje frente al uso de algoritmos analíticos porque el aprendizaje permite una mayor libertad a la hora de crear los comportamientos y no requiere de un modelado tan estricto como, en general, los algoritmos analíticos. De entre las distintas técnicas de aprendizaje, el aprendizaje por demostración es una técnica que asocia una acción a un estado y permite entrenar un comportamiento específico a partir de ejemplos provistos por un usuario supervisor. Esta técnica resulta interesante en el entrenamiento de robots, pues permite absorber, implícitamente, distintos factores difíciles de modelar, como imperfecciones en los robots, errores en los sensores, etc., ya que son tenidos en cuenta durante el entrenamiento. Así pues, esta técnica solventa uno de los problemas que supone trabajar con robots: su modelado. Por último, el aprendizaje por demostración se realiza mediante razonamiento basado en casos (CBR) porque es muy intuitivo, está estrechamente relacionado con el modo en que piensan las personas y encaja a la perfección con el concepto de comportamiento reactivo, cuya principio de funcionamiento consiste en acoplar las entradas de los sensores a los actuadores o, visto de otra forma, asociar una situación a una solución, que es lo que hace el CBR. El sistema ha sido probado con robots AIBO ERS-7 de Sony, usando localización visual mediante marcas artificiales de colores en un entorno similar al de la competición robótica de fútbol Robocup. Para ello se entrenan comportamientos simples, como correr por la banda, ir a portería o evitar a un oponente, y se combinan mediante una capa superior que los activa y desactiva según la situación lo requiera.