Corpus de textos notarials extremenys (cortenex s. XVII). L’edició d’un corpus historicolingüístic a en àmbit de les humanitats digitals

  1. González Sopeña, Inmaculada
Journal:
Dialectologia

ISSN: 2013-2247

Year of publication: 2023

Issue: 31

Pages: 105-126

Type: Article

More publications in: Dialectologia

Abstract

This article focuses on the methodology followed in the preparation of a corpus of notarial documentation from Extremadura during the seventeenth century (CORTENEX), thanks to the proposals of the TEI consortium regarding the coding and labeling of historical documents. This is based on the use of XML markup language in the transcriptions and in the linguistic processing of the texts in the TEITOK digital platform through four fundamental phases: tokenization, normalization, stemming and morphosyntactic annotation. CORTENEX is a subcorpus of Oralia diacrónica del español (ODE). Currently, CORTENEX already has accessible documentation, and, due to the type of texts that it includes, its fundamental interest lies in analyzing the lexical variation of the Spanish developed in the territory that corresponds to Extremadura. This variety practically lacks diachronic studies that allow analyze the language of that region from a historical perspective.

Bibliographic References

  • ACADEMIA MEXICANA DE LA LENGUA Corpus diacrónico y diatópico del español de América (CORDIAM). En línea: <http://www.cordiam.org/>.
  • ARIZA VIGUERA, Manuel (1985) “Dos estudios de la historia lingüística de Extremadura”, Anuario de Estudios Filológicos, 8, 7-18.
  • ARRABAL RODRÍGUEZ, Pilar (2020) “Edición de un corpus digital de inventarios de bienes”, Procesamiento del Lenguaje Natural, 65, 67-74.
  • BARROS GARCÍA, Pedro (1974) El habla de Arroyo de San Serván, Granada: Universidad de Granada.
  • CALDERÓN CAMPOS, Miguel (2015) El español del reino de Granada en sus documentos (1492- 1833). Oralidad y escritura, Bern: Peter Lang.
  • CALDERÓN CAMPOS, Miguel & María Teresa GARCÍA-GODOY (2010-2019) Oralia diacrónica del español (ODE). En línea: <http://corpora.ugr.es/ode>. Dialectologia 31 (2023), 105-126. ISSN: 2013-2247
  • CALDERÓN CAMPOS, Miguel (2019) “La edición de corpus históricos en la plataforma TEITOK. El caso de Oralia diacrónica del español”, Chimera, 6, 21-36.
  • CHARTA = Corpus hispánico y americano en la red. En línea: http//www.corpuscharta.es. CorLexIn = Corpus Léxico de Inventarios. En línea: <http://web.frl.es/CORLEXIN.html>.
  • CRADDOCK, Jerry (2015) Cíbola Project. Editing the Documents of the Hispanic Southwest in the 16th and 17th Centuries. En línea: <http://escholarchip.org/uc/rcrs_ias_ucb_cibola>.
  • CUMMINS, John (1974) El habla de Coria y sus cercanías, Londres: Tamesis Book Limited.
  • FERNÁNDEZ DE MOLINA, Elena (2014) “La investigación científica en el habla de Extremadura: monografías dialectales y estudios sobre fonética y fonología extremeña”, Anuario de Estudios Filológicos, 37, 5-20.
  • FLORES MANZANO, Florencio (1988) “Incidencia del factor histórico en la configuración geolingüística de Extremadura”, en Actas del I Congreso Internacional de Historia de la lengua española, Madrid: Arco/Libros, 1449-1460.
  • GARCÍA MOUTON, Pilar (1996) “El extremeño”, en Lenguas y dialectos de España, Madrid: Arco/Libros, 31-34.
  • GARGALLO GIL, José Enrique (1999) Las hablas de San Martín de Trevejo, Eljas y Valverde del Fresno, Mérida: Editora Regional de Extremadura.
  • GONZÁLEZ SALGADO, José Antonio (2003) Cartografía lingüística de Extremadura, Madrid: Universidad Complutense. En línea: http://www.geolectos.com/.
  • GONZÁLEZ SALGADO, José Antonio (2009) “Diez problemas de dialectología extremeña”, Revista de Estudios Extremeños, LXV(1), 347-378.
  • GUERRA GUERRA, Antonio (1977) “Escribanos badajocenses del siglo XVII”, Revista de estudios extremeños, 33(1), 5-68.
  • JANSSEN, Maarten (2012) “Neotag: a POS tagger for grammatical neologism detection”, en Proceedings of the Tenth International Conference on Language Resources and Evaluation, LREC 2012, Estambul.
  • JANSSEN, Maarten (2016) “TEITOK: Text-Faithful Annotated Corpora”, en Proceedings of the Language Resources and Evaluation Conference (LREC 2016) ELRA. Portoroz, Eslovenia, 4037-4043.
  • LORENZO CRIADO, Emilio (1948) “El habla de Albalá. Contribución al estudio de la dialectología extremeña”, Revista de Estudios Extremeños, IV, 398-407.
  • MARCOS ÁLVAREZ, F. (1992) “Algunas precisiones léxicas sobre indumentaria española en el siglo XVII”, en Actas del II Congreso Internacional de Historia de la lengua española, (Madrid: Pabellón de España, 1161-1172.
  • MONTERO CURIEL, Pilar (2006) El extremeño, Madrid: Arco/Libros.
  • MORALA, Ramón (2014) “El CorLexIn, Un corpus para el estudio del léxico histórico y dialectal del Siglo de Oro”, Scriptum Digital, 3, 5-28.
  • PALACIOS MARTÍN, Bonifacio (1988) “Origen de la conciencia regional extremeña: el nombre y el concepto de Extremadura”, Alcántara: Revista del Seminario de Estudios Cacereños, 13- 14, 9-22.
  • TEI CONSORTIUM (2007) TEI PS: Directrices para la codificación e intercambio electrónico de texto. En línea <http://www.tei-c.org/Guidelines/P5/>.
  • SÁNCHEZ SIERRA, Diego8 (2019) Edición y estudio léxico de fuentes documentales extremeñas de los siglos XVI y XVII, Madrid: Universidad de Alcalá de Henares.
  • VAAMONDE, Gael (2015) “P.S. Post Scriptum: Dos corpus diacrónicos de escritura cotidiana”, Procesamiento del lenguaje natural, 55, 57-64.
  • VELO NIETO, Juan José (1956) “El habla de las Hurdes”, Revista de estudios extremeños, 12 (1-4), 59-207.
  • VIUDAS CAMARASA, Antonio, Manuel ARIZA VIGUERA & Antonio SALVADOR PLANS (1987) El habla en Extremadura, Junta de Extremadura: Consejería de Educación y Cultura.
  • ZAMORA VICENTE, Alonso (1943) El habla de Mérida y sus cercanías, Madrid: Anejo XXIX de la Revista de Filología Española.