Corpus de textos notarials extremenys (cortenex s. XVII). L’edició d’un corpus historicolingüístic a en àmbit de les humanitats digitals

  1. González Sopeña, Inmaculada
Revue:
Dialectologia

ISSN: 2013-2247

Année de publication: 2023

Número: 31

Pages: 105-126

Type: Article

D'autres publications dans: Dialectologia

Résumé

Aquest article se centra en la metodologia utilitzada en l’elaboració d'un corpus de documentació notarial extremenya del segle XVII (CORTENEX) que segueix les propostes del consorci TEI pel que fa a la codificació i l'etiquetatge de documents històrics. Es basa en l’ús de llenguatge marcat XML en les transcripcions i en el processament lingüístic dels textos en la plataforma digital TEITOK a través de quatre fases fonamentals: tokenització, normalització, lematització i anotació morfosintàctica. Aquest corpus es conforma amb un subcorpus d’Oralia diacrònica del español (ODE). Actualment, CORTENEX ja compta amb documentació accessible i, pel tipus de textos que inclou, el seu interès fonamental radica a analitzar la variació lèxica de l’espanyol usat en el territori que es correspon amb la Comunitat Autònoma d'Extremadura. Aquesta varietat no té pràcticament estudis de tall diacrònic que permetin analitzar la llengua d’aquella regió des d’una perspectiva històrica.

Références bibliographiques

  • ACADEMIA MEXICANA DE LA LENGUA Corpus diacrónico y diatópico del español de América (CORDIAM). En línea: <http://www.cordiam.org/>.
  • ARIZA VIGUERA, Manuel (1985) “Dos estudios de la historia lingüística de Extremadura”, Anuario de Estudios Filológicos, 8, 7-18.
  • ARRABAL RODRÍGUEZ, Pilar (2020) “Edición de un corpus digital de inventarios de bienes”, Procesamiento del Lenguaje Natural, 65, 67-74.
  • BARROS GARCÍA, Pedro (1974) El habla de Arroyo de San Serván, Granada: Universidad de Granada.
  • CALDERÓN CAMPOS, Miguel (2015) El español del reino de Granada en sus documentos (1492- 1833). Oralidad y escritura, Bern: Peter Lang.
  • CALDERÓN CAMPOS, Miguel & María Teresa GARCÍA-GODOY (2010-2019) Oralia diacrónica del español (ODE). En línea: <http://corpora.ugr.es/ode>. Dialectologia 31 (2023), 105-126. ISSN: 2013-2247
  • CALDERÓN CAMPOS, Miguel (2019) “La edición de corpus históricos en la plataforma TEITOK. El caso de Oralia diacrónica del español”, Chimera, 6, 21-36.
  • CHARTA = Corpus hispánico y americano en la red. En línea: http//www.corpuscharta.es. CorLexIn = Corpus Léxico de Inventarios. En línea: <http://web.frl.es/CORLEXIN.html>.
  • CRADDOCK, Jerry (2015) Cíbola Project. Editing the Documents of the Hispanic Southwest in the 16th and 17th Centuries. En línea: <http://escholarchip.org/uc/rcrs_ias_ucb_cibola>.
  • CUMMINS, John (1974) El habla de Coria y sus cercanías, Londres: Tamesis Book Limited.
  • FERNÁNDEZ DE MOLINA, Elena (2014) “La investigación científica en el habla de Extremadura: monografías dialectales y estudios sobre fonética y fonología extremeña”, Anuario de Estudios Filológicos, 37, 5-20.
  • FLORES MANZANO, Florencio (1988) “Incidencia del factor histórico en la configuración geolingüística de Extremadura”, en Actas del I Congreso Internacional de Historia de la lengua española, Madrid: Arco/Libros, 1449-1460.
  • GARCÍA MOUTON, Pilar (1996) “El extremeño”, en Lenguas y dialectos de España, Madrid: Arco/Libros, 31-34.
  • GARGALLO GIL, José Enrique (1999) Las hablas de San Martín de Trevejo, Eljas y Valverde del Fresno, Mérida: Editora Regional de Extremadura.
  • GONZÁLEZ SALGADO, José Antonio (2003) Cartografía lingüística de Extremadura, Madrid: Universidad Complutense. En línea: http://www.geolectos.com/.
  • GONZÁLEZ SALGADO, José Antonio (2009) “Diez problemas de dialectología extremeña”, Revista de Estudios Extremeños, LXV(1), 347-378.
  • GUERRA GUERRA, Antonio (1977) “Escribanos badajocenses del siglo XVII”, Revista de estudios extremeños, 33(1), 5-68.
  • JANSSEN, Maarten (2012) “Neotag: a POS tagger for grammatical neologism detection”, en Proceedings of the Tenth International Conference on Language Resources and Evaluation, LREC 2012, Estambul.
  • JANSSEN, Maarten (2016) “TEITOK: Text-Faithful Annotated Corpora”, en Proceedings of the Language Resources and Evaluation Conference (LREC 2016) ELRA. Portoroz, Eslovenia, 4037-4043.
  • LORENZO CRIADO, Emilio (1948) “El habla de Albalá. Contribución al estudio de la dialectología extremeña”, Revista de Estudios Extremeños, IV, 398-407.
  • MARCOS ÁLVAREZ, F. (1992) “Algunas precisiones léxicas sobre indumentaria española en el siglo XVII”, en Actas del II Congreso Internacional de Historia de la lengua española, (Madrid: Pabellón de España, 1161-1172.
  • MONTERO CURIEL, Pilar (2006) El extremeño, Madrid: Arco/Libros.
  • MORALA, Ramón (2014) “El CorLexIn, Un corpus para el estudio del léxico histórico y dialectal del Siglo de Oro”, Scriptum Digital, 3, 5-28.
  • PALACIOS MARTÍN, Bonifacio (1988) “Origen de la conciencia regional extremeña: el nombre y el concepto de Extremadura”, Alcántara: Revista del Seminario de Estudios Cacereños, 13- 14, 9-22.
  • TEI CONSORTIUM (2007) TEI PS: Directrices para la codificación e intercambio electrónico de texto. En línea <http://www.tei-c.org/Guidelines/P5/>.
  • SÁNCHEZ SIERRA, Diego8 (2019) Edición y estudio léxico de fuentes documentales extremeñas de los siglos XVI y XVII, Madrid: Universidad de Alcalá de Henares.
  • VAAMONDE, Gael (2015) “P.S. Post Scriptum: Dos corpus diacrónicos de escritura cotidiana”, Procesamiento del lenguaje natural, 55, 57-64.
  • VELO NIETO, Juan José (1956) “El habla de las Hurdes”, Revista de estudios extremeños, 12 (1-4), 59-207.
  • VIUDAS CAMARASA, Antonio, Manuel ARIZA VIGUERA & Antonio SALVADOR PLANS (1987) El habla en Extremadura, Junta de Extremadura: Consejería de Educación y Cultura.
  • ZAMORA VICENTE, Alonso (1943) El habla de Mérida y sus cercanías, Madrid: Anejo XXIX de la Revista de Filología Española.