Prospección de datos, aprendizaje computacional y técnicas estadísticas para la obtención de reglas
- Fortes Ruiz, Inmaculada
- Rafael Morales Bueno Director/a
Universidad de defensa: Universidad de Málaga
Fecha de defensa: 12 de enero de 2002
- Francisco Andrés Triguero Ruiz Presidente/a
- José Luis Balcázar Navarro Secretario/a
- Buenaventura Clares Rodríguez Vocal
- José Luis Pérez de la Cruz Vocal
- Gabriel Aguilera Venegas Vocal
Tipo: Tesis
Resumen
Este trabajo se enmarca dentro del area de descubrimiento de conocimiento, concretamente en el area de la prospeccion de datos, En los ultimos años, la capacidad de generar y almacenar datos ha crecido de una forma considerable llegando a cantidades enormes. Por lo tanto, surge la necesidad de desarrollar nuevas tecnicas con la capacidad para analizar de manera automatica grandes volumenes de datos y cuyo fin es obtener informacion util y valiosa. Dentro del descubrimiento de conocimiento se encuentra el area de la prospeccion de datos. Este trabajo se centra en las tareas de asociacion, clasificacion y prospeccion en la red. En el capitulo 1 hacemos un rapido recorrido por las nociones basicas utilizadas en los siguientes capitulos. En el capitulo 2 incluimos como primera aportacion de este trabajo la generalizacion de la busqueda en bases de datos de conjuntos frecuentes con atributos positivos y negativos. En primer lugar, se formaliza el problema introduciendo un lenguaje, una relacion de especializacion y un predicado adecuados. A partir de ahí, se introducen las definiciones necesarias para los itemsets con atributos negativos para a continuacion presentar las proposiciones que nos llevaran a los algoritmos que se han desarrollado para obtener todos los conjuntos frecuentes con el menor esfuerzo computacional, es decir, evitado evaluar directamente cada conjunto en la base de datos y calculando su frecuencia a partir de las frecuencias ya calculadas de determinados conjuntos. En el capitulo 3 adaptamos los algoritmos de aprendizaje de arboles de decision para considerar las experiencias que tienen valores desconocidos en algun atributo. Definimos un criterio general de division, asignamos valores a los valores desconocidos teniendo en cuenta la informacion dado por los valores del atributo y de la clase y estudiamos la prediccion de observaciones con valores desconocidos. Incluimos resultados experimentales sobre la evaluaci