Integración del proceso de inferencia de conocimiento con los sistemas de bases de datos relacionalesformalización matemática de la fase de análisis

  1. Menasalvas, Ernestina
Dirigida por:
  1. María Covadonga Fernández Baizán Director/a
  2. Anita Wasilewska Director/a

Universidad de defensa: Universidad Politécnica de Madrid

Año de defensa: 1998

Tribunal:
  1. Julio López Sebastián Presidente/a
  2. Luis María Laita de la Rica Secretario/a
  3. María Amparo Vila Miranda Vocal
  4. Michael Hadjimichael Vocal
  5. Marta del Socorro Millan González Vocal

Tipo: Tesis

Resumen

La rápida extensión de la computación en la ciencia, gobierno y negocios de todo tipo, ha hecho que sea esencial el descubrimiento efectivo y eficaz del conocimiento oculto en las grandes cantidades de datos que han sido recogidas en los últimos años. El descubrimiento en las bases de datos (KDD) o Data Mining ha surgido como una solución para el problema del análisis de datos al que se están enfrentando, actualmente, gran cantidad de diferentes organizaciones. En este contexto, Data Mining no es sino un nuevo nombre para el viejo proceso de búsqueda de patrones en datos. Así, los estudios previos que se han realizado desde la aparición del término, se centran en el diseño y programación de algoritmos eficientes para la fase de Data Mining. Sin embargo, hasta el momento, no se ha realizado ningún estudio que intente formalizar el proceso y en concreto la fase de Data Mining de una manera uniforme. Tampoco se ha abordado el proceso del descubrimiento del conocimiento desde la perspectiva de bases de datos, esto es, para intentar que la próxima generación de sistemas de gestión de bases de datos proporcionen consultas que permitan el análisis de los mismos. En este trabajo, en primer lugar, se realizará un estudio detallado de las distintas operacio¬nes que se llevan a cabo a lo largo del proceso del descubrimiento del conocimiento. Como consecuencia de este estudio, dichas operaciones se clasifican en un nuevo ciclo en sus fases correspondientes. El ciclo propuesto, permite establecer ciertos requisitos para las operaciones que se realicen en cada fase, lo que desemboca en una definición de los distintos perfiles de los usuarios. El estudio en profundidad de las características de la fase de Data Mining lleva al descubrimiento de una estructura matemática capaz de modelizar aquellas consultas de Data Mining que se puedan traducir al modelo sintáctico que se propone. Esta estructura matemática es un retículo y por consiguiente, las propiedades del mismo se pueden tener en cuenta en fu turas implementaciones de consultas. De esta manera los resultados de esta Tesis han servido como fundamento teórico en la implementación del sistema RSDM. Las consultas más representativas se han expresado como funciones matemáticas del modelo. Por consiguiente, se demuestra que, efectivamente, la ejecución de las mismas forma un retículo con lo que sus resultados son susceptibles de ser ordenados en el orden establecido por dicho modelo. Finalmente, se analizan los resultados obtenidos y se conforman las bases para una futura investigación en este campo.