Fast k-nearest neighbors for Big Data and Smart Data
- Maillo Hidalgo, Jesús
- Francisco Herrera Triguero Director
- Isaac Triguero Velázquez Director
Universidad de defensa: Universidad de Granada
Fecha de defensa: 07 de mayo de 2020
- Óscar Cordón García Presidente
- Victoria Luzón García Secretaria
- Antonio Peregrín Rubio Vocal
- Daniel Peralta Cámara Vocal
- Javier del Ser Lorente Vocal
Tipo: Tesis
Resumen
En esta tesis hemos presentado un amplio estudio sobre el algoritmo kNN en problemas Big Data y su uso para transformar grandes conjuntos de datos en Smart Data. Como objetivo se ha planteado el diseño, implementación, análisis y evaluación de los algoritmos propuestos. Comienza con la propuesta escalable y exacta del algoritmo kNN y se extiende con la mejora aproximada de FkNN. Posteriormente, se ha analizado la implicación del algoritmo kNN en la obtención de Smart Data, destacando la propuesta como imputador de MVs. Finalmente, se han propuesto dos métricas de complejidad y densidad específicas para problemas Big Data con el propósito de estudiar la redundancia de información en conjuntos de datos de gran escala.