Redes bayesianas híbridas en dominios de alta dimensionalidad

  1. Fernández Álvarez, Antonio
Dirixida por:
  1. Antonio Salmerón Cerdán Director
  2. Rafael Rumí Rodríguez Director

Universidade de defensa: Universidad de Almería

Fecha de defensa: 17 de maio de 2011

Tribunal:
  1. Serafín Moral Callejón Presidente
  2. Carmelo Rodríguez Torreblanca Secretario/a
  3. Prakash Pundalik Shenoy Vogal
  4. Jens D. Nielsen Vogal
  5. Finn V. Jensen Vogal

Tipo: Tese

Teseo: 321929 DIALNET

Resumo

En las últimas décadas la complejidad e incertidumbre de los sistemas de información y la gran cantidad de datos disponibles, han convertido en obsoletas algunas técnicas clásicas de análisis de datos. En su lugar, otros métodos más sofisticados han ido emergiendo en la literatura. Dentro del campo de la Inteligencia Artificial, las redes bayesianas se han mostrado como una herramienta potente para manejar dichos problemas, ya que permiten, por un lado, descubrir conocimiento valioso implícito en los datos y, por otro, llevar a cabo procesos complejos de razonamiento sobre los mismos. Esta tesis supone un avance en la investigación del tratamiento simultáneo de variables discretas y continuas en redes bayesianas, las denomiadas redes bayesianas híbridas, tomando como base el modelo de Mixturas de Exponenciales Truncadas (MTEs). Este modelo no impone ninguna restricción sobre la estructura de la red creada, ni tampoco en las distribuciones de probabilidad subyacentes en los datos. Por un lado, se ha avanzado en el aprendizaje de modelos de regresión basados en estructuras de clasificadores bayesianos a partir de bases de datos completas e incompletas, proponiendo además esquemas de selección de variables sobre dichos modelos. Se ha presentado también un método que permite aprender los parámetros de las distribuciones de probabilidad de una red bayesiana híbrida genérica a partir de datos faltantes. Por otra parte, en el campo de la inferencia, se ha propuesto un algoritmo eficiente de propagación aproximado basado en la técnica de muestreo por importancia, capaz de obtener múltiples probabilidades simultáneamente a partir de una única muestra. Por último, se ha aplicado la metodología MTE en dos problemas reales. Primero, en la caracterización del hábitat de la tortuga mora en la región de Andalucía. Y segundo, en la construcción de indicadores de rendimiento compuestos en gestión universitaria. En definitiva, los avances metodológicos de esta tesis, amplían el abanico de problemas a los que las redes bayesianas híbridas pueden ofrecer una solución.