Texminer: un modelo para la extracción y desambiguación de textos científicos en el dominio de ingeniería de puertos y costas

Leiva Mederos, Amed Abel

Texminerun modelo para la extracción y desambiguación de textos científicos en el dominio de ingeniería de puertos y costas

Leiva Mederos, Amed Abel

Dirigida per:

José Antonio Senso Ruiz Director

Universitat de defensa: Universidad de Granada

Fecha de defensa: 10 de de febrer de 2012

Tribunal:

José Antonio Félix Gerardo Moreiro González President/a
Carmen Gálvez Secretària
Jesús Tramullas Saz Vocal
María José López-Huertas Pérez Vocal
Mario Pérez-Montoro Gutiérrez Vocal

Departament:

INFORMACIÓN Y COMUNICACIÓN

Tipus: Tesi

Teseo: 321099 DIALNET DIGIBUG editor

Resum

El Procesamiento del Lenguaje Natural se ha convertido desde los años 40 en una herramienta para el desarrollo y tratamiento de resúmenes automáticos. Múltiples disciplinas se han encargado de la formulación y la implementación de modelos para la extracción de texto, entre ellas se encuentran: la Cibernética, la Lingüística, la Semiótica, la Cibersemiótica y la Ciencia de la Información. En esta investigación se propone un Modelo para la Extracción y Desambiguación de Textos Científicos en el dominio de la Ingeniería de Puertos y Costas para facilitar la Representación de la Información textual y la Recuperación de la Información en el referido campo. Para desarrollar el modelo se realiza un abordaje teórico, conceptual y metodológico que engloba el terreno del resumen automático. A partir del análisis teórico y del concurso de métodos de investigación emanados de la Psicología Cognitiva, la Terminología y la Ciencia de la Información se construye el modelo propuesto en la investigación. Para su validación se construye una herramienta de software, sustentada sobre reglas discursivas emanadas del análisis lingüístico de 50 textos asociados al dominio objeto de la investigación. Se evalúa el modelo teniendo en cuenta diversos puntos de vista entre los que se destacan: usabilidad de la herramienta, calidad de la ontología, calidad de los resúmenes obtenidos y la calidad de los corpus. Finalmente se arriba a conclusiones, recomendaciones y se exponen aquellas aportaciones que se han logrado con la investigación de este tema