La multidisciplinariedad en la creación de corpus históricosEl caso de Post Scriptum

  1. Vaamonde, Gael 1
  1. 1 Centro de Lingüística de la Universidad de Lisboa
Revista:
Artnodes: revista de arte, ciencia y tecnología

ISSN: 1695-5951

Año de publicación: 2018

Título del ejemplar: Digital Humanities: societies, policies, knowledge

Número: 22

Páginas: 120-129

Tipo: Artículo

DOI: 10.7238/A.V0I22.3238 DIALNET GOOGLE SCHOLAR lock_openDialnet editor

Otras publicaciones en: Artnodes: revista de arte, ciencia y tecnología

Resumen

Los corpus históricos convencionales suelen estar centrados en el contenido lingüístico de los documentos recopilados, que son almacenados como texto plano para facilitar su procesamiento. Esta aproximación monodisciplinar tiende a obviar aspectos como la grafía original, las características físicas y presentacionales de los manuscritos o la información sociohistórica y contextual asociada a cada texto, aspectos que son relevantes para otros campos de investigación, cuando no para el propio estudio lingüístico. Frente a esta situación, el corpus histórico epistolar «Post Scriptum» es el resultado de un proyecto multidisciplinar formado por lingüistas e historiadores, y que combina métodos de las humanidades digitales y de la lingüística de corpus. Con esto, constituye un recurso electrónico que pretende ser de utilidad a varias disciplinas científicas, como la crítica textual, la lingüística histórica, la historia moderna, la paleografía o la cultura escrita.

Información de financiación

El proyecto de investigación Post Scriptum (http://ps.clul.ul.pt/) ha sido financiado por el Consejo Europeo de Investigación (7FP/ERC Advanced Grant - GA 295562).

Financiadores

Referencias bibliográficas

  • Claridge, C. 2008. «Historical Corpora». En: A. Lüdeling; M. Kytö (eds.). Corpus Linguistics: An International Handbook (Vol. 1), Berlín / Nueva York: Walter de Gruyter, 242-259.
  • Davies, M. 2009. «Creating useful historical corpora: a comparison of CORDE, the Corpus del Español and the Corpus do Português». En: E. Arias (ed.). Diacronía de las lenguas iberorrománicas. Nuevas aportaciones desde la lingüística de corpus. Madrid/Fráncfort: Iberoamericana/Vervuert, 137-166.
  • Dollinger, S. 2004. «“Philological computing” vs. “philological outsourcing” and the compilation of historical corpora: a Late Modern English test case». En: C. Dalton-Puffer y otros (eds.). Vienna English Working Papers (VIEWS), n.º 13: 3-23.
  • Grund, P. 2006. «Manuscripts as sources for linguistic research: A methodological case study based on the Mirror of Lights». Journal of English Linguistics, n.º 34: 105-125.
  • Honkapohja, A.; Samuli, K.; Ville, M. 2009. «Digital Editions for Corpus Linguistics: Representing Manuscript Reality in Electronic Corpora». En: A. H. Jucker; D. Schreier; M. Hundt (eds.). Corpora: Pragmatics and Discourse, Ámsterdam / Nueva York: Rodopi, 451–475.
  • Janssen, M. 2012. «NeoTag: a POS tagger for grammatical neologism detection». Proceedings of the Language Resources and Evaluation Conference (LREC 2012), ELRA. Estambul, Turquía, mayo del 2012, 2118-2124.
  • Janssen, M. 2016. «TEITOK: Text-Faithful Annotated Corpora». Proceedings of the Language Resources and Evaluation Conference (LREC 2016) ELRA. Portoroz, Eslovenia, mayo de 2016, 4037-4043.
  • Kytö, M. 2011. «Corpora and historical linguistics». Revista Brasileira de Linguística Aplicada, Belo Horizonte, n.º 11, vol. 2:417-457.
  • Lass, R. 2004. «Ut custodiant litteras: Editions, Corpora and Witnesshood». En: M. Dossena; R. Lass (eds.). Methods and Data in English Historical Dialectology (Linguistic Insights16). Berna: Peter Lang, 21–48.
  • Meurman-Solin, A. 2001. «Structured text corpora in the study of language variation and change». Literary and Linguistic Computing, n.º 16, vol. 1: 5-27.
  • Meurman-Solin, A. 2013. «Principles and Practices for the Digital Editing and Annotation of Diachronic Data». En: A. Meurman-Solin; J. Tyrkkö (eds.). Studies in Variation, Contacts and Change in English (vol. 14). Helsinki: Varieng.
  • Schulte, K. 2009. «Using non-annotated diachronic corpora: benefits, methods and limitations». En: E. Arias (ed.). Diacronía de las lenguas iberorrománicas. Nuevas aportaciones desde la lingüística de corpus. Madrid/Fráncfort: Iberoamericana/Vervuert, 167-180.
  • Swales, J. M. (2006). «Corpus Linguistics and English for Academic Purposes». En: E. Arnó y otros (eds.). Information Technology in Languauges for Specific Purposes, Springer, 19-33. https://doi. org/10.1007/978-0-387-28624-2_2