Prospección de datos, aprendizaje computacional y técnicas estadísticas para la obtención de reglas

Fortes Ruiz, Inmaculada

Prospección de datos, aprendizaje computacional y técnicas estadísticas para la obtención de reglas

Fortes Ruiz, Inmaculada

Dirigida por:

Rafael Morales Bueno Director/a

Universidad de defensa: Universidad de Málaga

Fecha de defensa: 12 de enero de 2002

Tribunal:

Francisco Andrés Triguero Ruiz Presidente/a
José Luis Balcázar Navarro Secretario/a
Buenaventura Clares Rodríguez Vocal
José Luis Pérez de la Cruz Vocal
Gabriel Aguilera Venegas Vocal

Tipo: Tesis

Teseo: 88401 DIALNET

Resumen

Este trabajo se enmarca dentro del area de descubrimiento de conocimiento, concretamente en el area de la prospeccion de datos, En los ultimos años, la capacidad de generar y almacenar datos ha crecido de una forma considerable llegando a cantidades enormes. Por lo tanto, surge la necesidad de desarrollar nuevas tecnicas con la capacidad para analizar de manera automatica grandes volumenes de datos y cuyo fin es obtener informacion util y valiosa. Dentro del descubrimiento de conocimiento se encuentra el area de la prospeccion de datos. Este trabajo se centra en las tareas de asociacion, clasificacion y prospeccion en la red. En el capitulo 1 hacemos un rapido recorrido por las nociones basicas utilizadas en los siguientes capitulos. En el capitulo 2 incluimos como primera aportacion de este trabajo la generalizacion de la busqueda en bases de datos de conjuntos frecuentes con atributos positivos y negativos. En primer lugar, se formaliza el problema introduciendo un lenguaje, una relacion de especializacion y un predicado adecuados. A partir de ahí, se introducen las definiciones necesarias para los itemsets con atributos negativos para a continuacion presentar las proposiciones que nos llevaran a los algoritmos que se han desarrollado para obtener todos los conjuntos frecuentes con el menor esfuerzo computacional, es decir, evitado evaluar directamente cada conjunto en la base de datos y calculando su frecuencia a partir de las frecuencias ya calculadas de determinados conjuntos. En el capitulo 3 adaptamos los algoritmos de aprendizaje de arboles de decision para considerar las experiencias que tienen valores desconocidos en algun atributo. Definimos un criterio general de division, asignamos valores a los valores desconocidos teniendo en cuenta la informacion dado por los valores del atributo y de la clase y estudiamos la prediccion de observaciones con valores desconocidos. Incluimos resultados experimentales sobre la evaluaci