Texminerun modelo para la extracción y desambiguación de textos científicos en el dominio de ingeniería de puertos y costas
- Leiva Mederos, Amed Abel
- José Antonio Senso Ruiz Director
Universitat de defensa: Universidad de Granada
Fecha de defensa: 10 de de febrer de 2012
- José Antonio Félix Gerardo Moreiro González President/a
- Carmen Gálvez Secretària
- Jesús Tramullas Saz Vocal
- María José López-Huertas Pérez Vocal
- Mario Pérez-Montoro Gutiérrez Vocal
Tipus: Tesi
Resum
El Procesamiento del Lenguaje Natural se ha convertido desde los años 40 en una herramienta para el desarrollo y tratamiento de resúmenes automáticos. Múltiples disciplinas se han encargado de la formulación y la implementación de modelos para la extracción de texto, entre ellas se encuentran: la Cibernética, la Lingüística, la Semiótica, la Cibersemiótica y la Ciencia de la Información. En esta investigación se propone un Modelo para la Extracción y Desambiguación de Textos Científicos en el dominio de la Ingeniería de Puertos y Costas para facilitar la Representación de la Información textual y la Recuperación de la Información en el referido campo. Para desarrollar el modelo se realiza un abordaje teórico, conceptual y metodológico que engloba el terreno del resumen automático. A partir del análisis teórico y del concurso de métodos de investigación emanados de la Psicología Cognitiva, la Terminología y la Ciencia de la Información se construye el modelo propuesto en la investigación. Para su validación se construye una herramienta de software, sustentada sobre reglas discursivas emanadas del análisis lingüístico de 50 textos asociados al dominio objeto de la investigación. Se evalúa el modelo teniendo en cuenta diversos puntos de vista entre los que se destacan: usabilidad de la herramienta, calidad de la ontología, calidad de los resúmenes obtenidos y la calidad de los corpus. Finalmente se arriba a conclusiones, recomendaciones y se exponen aquellas aportaciones que se han logrado con la investigación de este tema