Integración del proceso de inferencia de conocimiento con los sistemas de bases de datos relacionales: formalización matemática de la fase de análisis

Menasalvas, Ernestina

Integración del proceso de inferencia de conocimiento con los sistemas de bases de datos relacionalesformalización matemática de la fase de análisis

Menasalvas, Ernestina

Supervised by:

María Covadonga Fernández Baizán Director
Anita Wasilewska Director

Defence university: Universidad Politécnica de Madrid

Year of defence: 1998

Committee:

Julio López Sebastián Chair
Luis María Laita de la Rica Secretary
María Amparo Vila Miranda Committee member
Michael Hadjimichael Committee member
Marta del Socorro Millan González Committee member

Type: Thesis

Teseo: 68189 DIALNET Archivo Digital UPM editor

Abstract

La rápida extensión de la computación en la ciencia, gobierno y negocios de todo tipo, ha hecho que sea esencial el descubrimiento efectivo y eficaz del conocimiento oculto en las grandes cantidades de datos que han sido recogidas en los últimos años. El descubrimiento en las bases de datos (KDD) o Data Mining ha surgido como una solución para el problema del análisis de datos al que se están enfrentando, actualmente, gran cantidad de diferentes organizaciones. En este contexto, Data Mining no es sino un nuevo nombre para el viejo proceso de búsqueda de patrones en datos. Así, los estudios previos que se han realizado desde la aparición del término, se centran en el diseño y programación de algoritmos eficientes para la fase de Data Mining. Sin embargo, hasta el momento, no se ha realizado ningún estudio que intente formalizar el proceso y en concreto la fase de Data Mining de una manera uniforme. Tampoco se ha abordado el proceso del descubrimiento del conocimiento desde la perspectiva de bases de datos, esto es, para intentar que la próxima generación de sistemas de gestión de bases de datos proporcionen consultas que permitan el análisis de los mismos. En este trabajo, en primer lugar, se realizará un estudio detallado de las distintas operacio¬nes que se llevan a cabo a lo largo del proceso del descubrimiento del conocimiento. Como consecuencia de este estudio, dichas operaciones se clasifican en un nuevo ciclo en sus fases correspondientes. El ciclo propuesto, permite establecer ciertos requisitos para las operaciones que se realicen en cada fase, lo que desemboca en una definición de los distintos perfiles de los usuarios. El estudio en profundidad de las características de la fase de Data Mining lleva al descubrimiento de una estructura matemática capaz de modelizar aquellas consultas de Data Mining que se puedan traducir al modelo sintáctico que se propone. Esta estructura matemática es un retículo y por consiguiente, las propiedades del mismo se pueden tener en cuenta en fu turas implementaciones de consultas. De esta manera los resultados de esta Tesis han servido como fundamento teórico en la implementación del sistema RSDM. Las consultas más representativas se han expresado como funciones matemáticas del modelo. Por consiguiente, se demuestra que, efectivamente, la ejecución de las mismas forma un retículo con lo que sus resultados son susceptibles de ser ordenados en el orden establecido por dicho modelo. Finalmente, se analizan los resultados obtenidos y se conforman las bases para una futura investigación en este campo.