La multidisciplinariedad en la creación de corpus históricosEl caso de Post Scriptum
- 1 Centro de Lingüística de la Universidad de Lisboa
ISSN: 1695-5951
Año de publicación: 2018
Título del ejemplar: Digital Humanities: societies, policies, knowledge
Número: 22
Páginas: 120-129
Tipo: Artículo
Otras publicaciones en: Artnodes: revista de arte, ciencia y tecnología
Resumen
Los corpus históricos convencionales suelen estar centrados en el contenido lingüístico de los documentos recopilados, que son almacenados como texto plano para facilitar su procesamiento. Esta aproximación monodisciplinar tiende a obviar aspectos como la grafía original, las características físicas y presentacionales de los manuscritos o la información sociohistórica y contextual asociada a cada texto, aspectos que son relevantes para otros campos de investigación, cuando no para el propio estudio lingüístico. Frente a esta situación, el corpus histórico epistolar «Post Scriptum» es el resultado de un proyecto multidisciplinar formado por lingüistas e historiadores, y que combina métodos de las humanidades digitales y de la lingüística de corpus. Con esto, constituye un recurso electrónico que pretende ser de utilidad a varias disciplinas científicas, como la crítica textual, la lingüística histórica, la historia moderna, la paleografía o la cultura escrita.
Información de financiación
El proyecto de investigación Post Scriptum (http://ps.clul.ul.pt/) ha sido financiado por el Consejo Europeo de Investigación (7FP/ERC Advanced Grant - GA 295562).Financiadores
-
Consejo Europeo de Investigación
- 7FP/ERC Advanced Grant - GA 295562
Referencias bibliográficas
- Claridge, C. 2008. «Historical Corpora». En: A. Lüdeling; M. Kytö (eds.). Corpus Linguistics: An International Handbook (Vol. 1), Berlín / Nueva York: Walter de Gruyter, 242-259.
- Davies, M. 2009. «Creating useful historical corpora: a comparison of CORDE, the Corpus del Español and the Corpus do Português». En: E. Arias (ed.). Diacronía de las lenguas iberorrománicas. Nuevas aportaciones desde la lingüística de corpus. Madrid/Fráncfort: Iberoamericana/Vervuert, 137-166.
- Dollinger, S. 2004. «“Philological computing” vs. “philological outsourcing” and the compilation of historical corpora: a Late Modern English test case». En: C. Dalton-Puffer y otros (eds.). Vienna English Working Papers (VIEWS), n.º 13: 3-23.
- Grund, P. 2006. «Manuscripts as sources for linguistic research: A methodological case study based on the Mirror of Lights». Journal of English Linguistics, n.º 34: 105-125.
- Honkapohja, A.; Samuli, K.; Ville, M. 2009. «Digital Editions for Corpus Linguistics: Representing Manuscript Reality in Electronic Corpora». En: A. H. Jucker; D. Schreier; M. Hundt (eds.). Corpora: Pragmatics and Discourse, Ámsterdam / Nueva York: Rodopi, 451–475.
- Janssen, M. 2012. «NeoTag: a POS tagger for grammatical neologism detection». Proceedings of the Language Resources and Evaluation Conference (LREC 2012), ELRA. Estambul, Turquía, mayo del 2012, 2118-2124.
- Janssen, M. 2016. «TEITOK: Text-Faithful Annotated Corpora». Proceedings of the Language Resources and Evaluation Conference (LREC 2016) ELRA. Portoroz, Eslovenia, mayo de 2016, 4037-4043.
- Kytö, M. 2011. «Corpora and historical linguistics». Revista Brasileira de Linguística Aplicada, Belo Horizonte, n.º 11, vol. 2:417-457.
- Lass, R. 2004. «Ut custodiant litteras: Editions, Corpora and Witnesshood». En: M. Dossena; R. Lass (eds.). Methods and Data in English Historical Dialectology (Linguistic Insights16). Berna: Peter Lang, 21–48.
- Meurman-Solin, A. 2001. «Structured text corpora in the study of language variation and change». Literary and Linguistic Computing, n.º 16, vol. 1: 5-27.
- Meurman-Solin, A. 2013. «Principles and Practices for the Digital Editing and Annotation of Diachronic Data». En: A. Meurman-Solin; J. Tyrkkö (eds.). Studies in Variation, Contacts and Change in English (vol. 14). Helsinki: Varieng.
- Schulte, K. 2009. «Using non-annotated diachronic corpora: benefits, methods and limitations». En: E. Arias (ed.). Diacronía de las lenguas iberorrománicas. Nuevas aportaciones desde la lingüística de corpus. Madrid/Fráncfort: Iberoamericana/Vervuert, 167-180.
- Swales, J. M. (2006). «Corpus Linguistics and English for Academic Purposes». En: E. Arnó y otros (eds.). Information Technology in Languauges for Specific Purposes, Springer, 19-33. https://doi. org/10.1007/978-0-387-28624-2_2