Razonamiento basado en casos aplicado a problemas de clasificación
- LAGUÍA BONILLO, MANUEL
- Juan Luis Castro Peña Director
Defence university: Universidad de Granada
Fecha de defensa: 14 November 2003
- Miguel Delgado Calvo-Flores Chair
- José Manuel Benítez Sánchez Secretary
- José Jesús Castro Sánchez Committee member
- Pedro Luis Galindo Riaño Committee member
- Pablo Carmona del Barco Committee member
Type: Thesis
Abstract
Se pretende analizar la adecuación y aplicación del Razonamiento Basado en Casos (R.B.C.) a problemas de clasificación. La noción de similitud entre casos se suelen definir mediante distancias, por lo que se emplean diferentes distancias clásicas de la Geometría y algunas de sus variantes. Para comparar los diferentes métodos de clasificación se han realizado pruebas con 68 Bases de Casos: 19 bases del UCI- Repository (Iris, Pima, Led7 y 24, Wave Form 21 y 40, Letter-Recognition, ..) y 49 bases sintéticas con diferentes densidades de puntos y formas de las clases. Además de calcular el porcentaje de cierto medio se ha realizado una prueba de contraste de hipótesis t-Student con un nivel de significación del 95%. Se proponen nuevos métodos de clasificación basados en distancias mediante la adicción de hasta 3 características sobre el método clásico k-NN: *-entornos, *-entornosk-NN (y *-entornos1-NN), y una Heurística para seleccionar la medida de distancia. Tenemos 6 combinaciones posibles según se añadan o no estas características: k-NN (sirve como referencia), *-entornos, k-NN Heur, *-entornosk-NN, *-entornos Heur, *-entornosk-NN Heur. Se comprueba experimentalmente que todos los métodos propuestos mejoran a k-NN y que la principal fuente de mejora proviene del uso de la Heurística para seleccionar la distancia. En algunos problemas las medidas de distancia clásicas de la Geometría no resultan adecuadas. Se estudia un tipo de estos problemas y se propone una nueva medida de distancia: la distancia basada en bandas o Hiperplanos. Siguiendo con las ideas del R.B.C., se realiza un cambio de enfoque: cada punto va a tener asociada una banda o medida de distancia local que recoge la información de lo que sucede en los alrededores del punto. Cada punto elegirá su banda intentando apuntar hacia direcciones donde se encuentran puntos cercanos de su misma clase y alejándose de direcciones donde hay puntos de otras