Imprecisión e incertidumbre en el modelo multidimensionalaplicación a la minería de datos
- María Amparo Vila Miranda Directora
Universidad de defensa: Universidad de Granada
Fecha de defensa: 23 de septiembre de 2005
- Miguel Delgado Calvo-Flores Presidente
- Daniel Sánchez Fernández Secretario
- Enrique López González Vocal
- Luis Jimenes Linares Vocal
- Luis Martínez López Vocal
Tipo: Tesis
Resumen
La utilización de la tecnología OLAP en nuevos campos de conocimiento y el uso de fuentes de datos no estructuradas han hecho que surjan nuevos requerimientos sobre los modelos a utilizar en la definición de los datacubos, Se hace necesaria la utilización de estructuras flexibles que permitan modelar y trabajar sobre la imprecisión resultante de la integración. Una fuente interesante de la información serían los datos proporcionados por expertos para enriquecer los análisis. Normalmente esta información vendrá dada de forma vaga. En estos sistemas también se suelen integrar técnicas de minería de datos para enriquecer las posibilidades de obtención de información de cara al usuario. Estas técnicas deberán ser capaces también de trabajar sobre la imprecisión de estos datos. Lo que proponemos en esta tesis es, por un lado, un modelo multidimensional el cual mediante la utilización de la lógica difusa permite la representación y manejo de información imprecisa. Para ello permite tanto de definición de hechos difusos como la utilización de jerarquías difusas para relacionar los conceptos considerados. De esta manera se pueden representar conceptos más cercanos al usuario. Pero es posible que la imprecisión no sólo surja al definir los conceptos sino también las relaciones entre ellos. Para ayudar en estos casos, el modelo permite definir las relaciones jerárquicas mediante la utilización de etiquetas lingüísticas, permitiendo al experto proporcionarlas mediante el uso de expresiones lingüísticas. Este modelo se ha dotado de las operaciones habituales sobre datacubos. Para aislar al usuario de la complejidad añadida, la estructura propuesta se ha envuelto mediante la utilización de operadores de resumen difuso, de tal manera que el usuario accede a la información de una manera más intuitiva. Para demostrar su aplicación se han construido tres datacubos sobre datos reales tomados de intervenciones quir