Learning expressive numerical planning domains by integrating machine learning techniques
- Segura Muros, José Ángel
- Juan Fernández Olivares Director
- Raúl Pérez Rodríguez Co-director
Universidade de defensa: Universidad de Granada
Fecha de defensa: 21 de decembro de 2021
- Luis Castillo Vidal Presidente
- Jesús Alcalá Fernández Secretario
- Eva Onaindia de la Rivaherrera Vogal
- Susana Fernández Arregui Vogal
- María José del Jesús Díaz Vogal
Tipo: Tese
Resumo
Esta tesis doctoral plantea una novedosa metodología para el aprendizaje de Modelos de Acción para Planificación Automática. Esta metodología se enmarca dentro del campo de la Ingeniería de Conocimiento, concretamente en el área de la Adquisición de Conocimiento. Específicamente, esta tesis doctoral presenta un proceso de aprendizaje que combina de forma jerárquica distintas técnicas de Aprendizaje Automático, con un especial enfoque en el uso de técnicas de Inteligencia Artificial Explicable. Los objetivos considerados en el desarrollo de la tesis doctoral son: 1. Implementación de un algoritmo de aprendizaje capaz de aprender modelos de acción STRIPS cuyas precondiciones y efectos también contengan expresiones aritméticas y relacionales. El estudio empírico realizado para la evaluación de este objetivo compara la solución propuesta con algoritmos de referencia con el fin de analizar su comportamiento y situarlo dentro del estado del arte. 2. Diseño de un algoritmo de aprendizaje que mejore las capacidades del anterior a la hora de trabajar bajo situaciones en las que la calidad de los datos de entrada es baja. Para testear el nuevo procedimiento se implementa un proceso experimental con el objetivo de confrontarlo respecto al algoritmo desarrollado previamente usando datos de entrada con incertidumbre. Además, con afán de obtener una mejor visión de conjunto de la calidad de los métodos desarrollados, se compara la nueva metodología con algoritmos de referencia del estado del arte. 3. Desarrollo de un algoritmo de aprendizaje de modelos de acción capaz de funcionar a partir de datos obtenidos de un entorno simulado. Para un correcto análisis de la metodología implementada se usan datos obtenidos de las ejecuciones de agentes sobre entornos simulados, comprobando que los procesos propuestos pueden replicar el comportamiento de dichos agentes. Los tres objetivos han sido alcanzados de forma satisfactoria implementando una serie de algoritmos de aprendizaje que combinan de forma jerárquica técnicas de regresión, clasificación estadística y análisis de grupos. Cada uno de estos procesos de aprendizaje es el producto de la consecución de cada uno de los objetivos propuestos anteriormente y supone una contribución al estado del arte por sí mismo. Para la correcta implementación de cada algoritmo de aprendizaje se han diseñado diversos métodos de preprocesamiento de datos, de tratamiento de la incertidumbre y de adquisición de modelos de clasificación, usando para ello técnicas bien conocidas del campo del Aprendizaje Automático. Finalmente, indicar que las contribuciones presentadas en la tesis doctoral se han evaluado usando, no solo dominios de planificación de referencia tomados de la comunidad de Planificación Automática, si no también, del entorno de trabajo de videojuegos GVG-AI.