Corpus de textos notarials extremenys (cortenex s. XVII). L’edició d’un corpus historicolingüístic a en àmbit de les humanitats digitals

  1. González Sopeña, Inmaculada
Revista:
Dialectologia

ISSN: 2013-2247

Año de publicación: 2023

Número: 31

Páginas: 105-126

Tipo: Artículo

Otras publicaciones en: Dialectologia

Resumen

El presente artículo se centra en la metodología seguida en la elaboración de un corpus de documentación notarial extremeña del siglo XVII (CORTENEX) siguiendo las propuestas del consorcio TEI en lo referente a la codificación y etiquetado de documentos históricos. Todo ello se basa en el uso de lenguaje marcado XML en las transcripciones y en el procesamiento lingüístico de los textos en la plataforma digital TEITOK a través de cuatro fases fundamentales: tokenización, normalización, lematización y anotado morfosintáctico. Este corpus se conforma con un subcorpus de Oralia diacrónica del español (ODE). Actualmente, CORTENEX ya cuenta con documentación accesible y, por el tipo de textos que incluye, su interés fundamental reside en analizar la variación léxica del español desarrollado en el territorio que se corresponde con la Comunidad Autónoma de Extremadura. Esta variedad carece prácticamente de estudios de corte diacrónico que permitan analizar la lengua de aquella región en perspectiva histórica.

Referencias bibliográficas

  • ACADEMIA MEXICANA DE LA LENGUA Corpus diacrónico y diatópico del español de América (CORDIAM). En línea: <http://www.cordiam.org/>.
  • ARIZA VIGUERA, Manuel (1985) “Dos estudios de la historia lingüística de Extremadura”, Anuario de Estudios Filológicos, 8, 7-18.
  • ARRABAL RODRÍGUEZ, Pilar (2020) “Edición de un corpus digital de inventarios de bienes”, Procesamiento del Lenguaje Natural, 65, 67-74.
  • BARROS GARCÍA, Pedro (1974) El habla de Arroyo de San Serván, Granada: Universidad de Granada.
  • CALDERÓN CAMPOS, Miguel (2015) El español del reino de Granada en sus documentos (1492- 1833). Oralidad y escritura, Bern: Peter Lang.
  • CALDERÓN CAMPOS, Miguel & María Teresa GARCÍA-GODOY (2010-2019) Oralia diacrónica del español (ODE). En línea: <http://corpora.ugr.es/ode>. Dialectologia 31 (2023), 105-126. ISSN: 2013-2247
  • CALDERÓN CAMPOS, Miguel (2019) “La edición de corpus históricos en la plataforma TEITOK. El caso de Oralia diacrónica del español”, Chimera, 6, 21-36.
  • CHARTA = Corpus hispánico y americano en la red. En línea: http//www.corpuscharta.es. CorLexIn = Corpus Léxico de Inventarios. En línea: <http://web.frl.es/CORLEXIN.html>.
  • CRADDOCK, Jerry (2015) Cíbola Project. Editing the Documents of the Hispanic Southwest in the 16th and 17th Centuries. En línea: <http://escholarchip.org/uc/rcrs_ias_ucb_cibola>.
  • CUMMINS, John (1974) El habla de Coria y sus cercanías, Londres: Tamesis Book Limited.
  • FERNÁNDEZ DE MOLINA, Elena (2014) “La investigación científica en el habla de Extremadura: monografías dialectales y estudios sobre fonética y fonología extremeña”, Anuario de Estudios Filológicos, 37, 5-20.
  • FLORES MANZANO, Florencio (1988) “Incidencia del factor histórico en la configuración geolingüística de Extremadura”, en Actas del I Congreso Internacional de Historia de la lengua española, Madrid: Arco/Libros, 1449-1460.
  • GARCÍA MOUTON, Pilar (1996) “El extremeño”, en Lenguas y dialectos de España, Madrid: Arco/Libros, 31-34.
  • GARGALLO GIL, José Enrique (1999) Las hablas de San Martín de Trevejo, Eljas y Valverde del Fresno, Mérida: Editora Regional de Extremadura.
  • GONZÁLEZ SALGADO, José Antonio (2003) Cartografía lingüística de Extremadura, Madrid: Universidad Complutense. En línea: http://www.geolectos.com/.
  • GONZÁLEZ SALGADO, José Antonio (2009) “Diez problemas de dialectología extremeña”, Revista de Estudios Extremeños, LXV(1), 347-378.
  • GUERRA GUERRA, Antonio (1977) “Escribanos badajocenses del siglo XVII”, Revista de estudios extremeños, 33(1), 5-68.
  • JANSSEN, Maarten (2012) “Neotag: a POS tagger for grammatical neologism detection”, en Proceedings of the Tenth International Conference on Language Resources and Evaluation, LREC 2012, Estambul.
  • JANSSEN, Maarten (2016) “TEITOK: Text-Faithful Annotated Corpora”, en Proceedings of the Language Resources and Evaluation Conference (LREC 2016) ELRA. Portoroz, Eslovenia, 4037-4043.
  • LORENZO CRIADO, Emilio (1948) “El habla de Albalá. Contribución al estudio de la dialectología extremeña”, Revista de Estudios Extremeños, IV, 398-407.
  • MARCOS ÁLVAREZ, F. (1992) “Algunas precisiones léxicas sobre indumentaria española en el siglo XVII”, en Actas del II Congreso Internacional de Historia de la lengua española, (Madrid: Pabellón de España, 1161-1172.
  • MONTERO CURIEL, Pilar (2006) El extremeño, Madrid: Arco/Libros.
  • MORALA, Ramón (2014) “El CorLexIn, Un corpus para el estudio del léxico histórico y dialectal del Siglo de Oro”, Scriptum Digital, 3, 5-28.
  • PALACIOS MARTÍN, Bonifacio (1988) “Origen de la conciencia regional extremeña: el nombre y el concepto de Extremadura”, Alcántara: Revista del Seminario de Estudios Cacereños, 13- 14, 9-22.
  • TEI CONSORTIUM (2007) TEI PS: Directrices para la codificación e intercambio electrónico de texto. En línea <http://www.tei-c.org/Guidelines/P5/>.
  • SÁNCHEZ SIERRA, Diego8 (2019) Edición y estudio léxico de fuentes documentales extremeñas de los siglos XVI y XVII, Madrid: Universidad de Alcalá de Henares.
  • VAAMONDE, Gael (2015) “P.S. Post Scriptum: Dos corpus diacrónicos de escritura cotidiana”, Procesamiento del lenguaje natural, 55, 57-64.
  • VELO NIETO, Juan José (1956) “El habla de las Hurdes”, Revista de estudios extremeños, 12 (1-4), 59-207.
  • VIUDAS CAMARASA, Antonio, Manuel ARIZA VIGUERA & Antonio SALVADOR PLANS (1987) El habla en Extremadura, Junta de Extremadura: Consejería de Educación y Cultura.
  • ZAMORA VICENTE, Alonso (1943) El habla de Mérida y sus cercanías, Madrid: Anejo XXIX de la Revista de Filología Española.