Conceptos relacionados con estrella. Lingüística de corpus de astronomía

  1. Hansen Ruiz, Cristina Silvia
Dirigida por:
  1. Jesús Miguel Pérez Ceballos Director/a

Universidad de defensa: Universidad de La Laguna

Fecha de defensa: 05 de diciembre de 2011

Tribunal:
  1. Fernando Justicia Justicia Presidente
  2. Corina Varela Calvo Secretario/a
  3. María Victoria López Pérez Vocal
  4. María del Carmen Mato Carrodeguas Vocal
  5. Antonia Nelsi Torres González Vocal

Tipo: Tesis

Resumen

La tesis se enmarca en la línea de investigación del GICEC (Grupo de Investigación de Conceptos en la Enseñanza de las Ciencias).La investigación se centra en la mejora y justificación de la metodología usada para la determinación de vocabularios frecuentes, vocabularios específicos, colocaciones y relaciones entre unidades léxicas. Ello requiere el uso conjunto del PAFE (Programa de Análisis de Frecuencias y Estudios de Entorno) y técnicas de detección de vocabularios específicos, vocabularios frecuentes y colocaciones, provenientes o basadas en la lingüística de corpus. La evaluación de la metodología se ha hecho aplicándola a un caso particular de más de 1000 palabras: un texto de Astronomía realizado por El Centro de Información de la Agencia Espacial Europea del Hubble (ESA/ESO) para la Educación Secundaria. Los datos de frecuencia estadística de las unidades léxicas obtenidos con el PAFE son usados para proponer una forma matemática de obtener vocabularios frecuentes basados en el análisis de la distribución de frecuencias absolutas. Los vocabularios específicos se hallan comparando las frecuencias relativas del texto particular con las de un corpus general siguiendo técnicas desarrolladas en la lingüística de corpus. Se obtienen colocaciones comparando frecuencias y relaciones entre unidades léxicas. Las frecuencias y relaciones se usan para construir las redes semánticas enriquecidas por la información detectada previamente. La investigación concluye la necesidad de: eliminar todas las palabras funcionales; unificar grafías de sinónimos sólo para palabras situadas en las franjas alta y media; no eliminar el lenguaje matemático debido a su importancia tanto en frecuencias como en las redes semánticas; requerir de un experto en el tema abordado para corregir los datos obtenidos al hallar colocaciones y vocabulario específico; determinar matemáticamente el vocabulario más frecuente; determinar el sistema óptimo mediante el estudio de la conservación de relaciones por cada lema además de la conservación de relaciones globales del sistema; e incorporar en las redes semánticas la información de vocabulario específico y conservación de relaciones. Además se acotan los errores posibles en la metodología, se precisan las limitaciones que afectan a los resultados y se cuantifican los posibles errores de cada una de las fases del proceso.