Nuevas técnicas de minería de textosAplicaciones

  1. JUSTICIA DE LA TORRE, MARÍA DEL CONSUELO
Dirigida por:
  1. María José Martín Bautista Directora
  2. Daniel Sánchez Fernández Director

Universidad de defensa: Universidad de Granada

Fecha de defensa: 02 de junio de 2017

Tribunal:
  1. Miguel Delgado Calvo-Flores Presidente
  2. María Amparo Vila Miranda Secretaria
  3. Fernando Bobillo Ortega Vocal
  4. Carmen Martínez Cruz Vocal
  5. José Maria Serrano Chica Vocal
Departamento:
  1. CIENCIAS DE LA COMPUTACIÓN E INTELIGENCIA ARTIFICIAL

Tipo: Tesis

Resumen

Una diferencia fundamental entre Minería de Datos y Minería de Textos es la naturaleza de la información de partida. Los datos tienen una estructura explícita y contienen conocimiento de forma implícita, mientras que con el texto ocurre todo lo contrario, es decir, contiene un conocimiento explícito (aunque por lo general dependiente de un contexto que no está del todo hecho expresado en el documento) y una estructura que se puede sobrentender. Esta diferencia puede interpretarse desde el punto de vista de la Ingeniería del Conocimiento, según el cual los datos constituyen colecciones de hechos simples, representados mediante un modelo de datos que facilita su tratamiento, mientras que el texto contiene una base de conocimiento completa que incorpora, además de hechos, relaciones de diversos tipos, con la desventaja de estar expresados en un lenguaje de representación (el lenguaje natural) que, aunque de una expresividad máxima, resulta totalmente inadecuado para llevar a cabo procesos automáticos de inferencia. Dichas diferencias plantean nuevos retos a la investigación en Minería de Textos y, al mismo tiempo, abren la puerta a un importante paso adelante desde el estado actual de la técnica, con nuevas capacidades y aplicaciones. En este trabajo se muestra una retrospectiva de los principales artículos científicos que han tratado el tema de la Minería de Textos, se revisa su concepto, definición y proceso y se exponen las diferentes formas de representación intermedia del texto que pueden resultar "adecuadas" para trabajar con el lenguaje natural en el que está escrito. Igualmente, se repasan las técnicas de minería existentes y se enumeran algunas de las aplicaciones más frecuentes de la Minería de Textos. Por otro lado, se discuten una serie de retos de futuro dentro de este área de investigación y se presenta el innovador paradigma "Text Knowledge Mining" como complemento a la Minería de Textos tradicional o "basada en datos". Sustentaremos nuestro estudio aportando una técnica de Minería de Textos basada en la localización de contradicciones en textos, atenderemos a su implementación, y a la demostración experimental de que es una técnica factible y con requisitos computacionales razonables. A partir de aquí, abrimos un área de investigación apasionante de la que se pueden esperar muchas contribuciones importantes en un futuro próximo.