P. S. Post Scriptumdos corpus diacrónicos de escritura cotidiana

  1. Gael Vaamonde
Revista:
Procesamiento del lenguaje natural

ISSN: 1135-5948

Año de publicación: 2015

Número: 55

Páginas: 57-64

Tipo: Artículo

Otras publicaciones en: Procesamiento del lenguaje natural

Resumen

En este trabajo se da a conocer el proyecto de investigación P. S. Post Scriptum, que tiene por objeto la búsqueda sistemática, edición y estudio histórico-lingüístico de cartas privadas escritas en España y Portugal durante la Edad Moderna. Estas cartas constituyen manuscritos inéditos escritos por personas de muy diferente condición social y suelen presentar una retórica cercana a la oralidad, tematizando asuntos de lo cotidiano. Son, por tanto, de gran interés para la investigación en lingüística diacrónica. La finalidad del proyecto es publicar y estudiar 7000 de estas cartas, ofreciendo una edición crítica digital del manuscrito y, simultáneamente, convirtiendo el contenido de las cartas en dos corpus anotados de un millón de palabras cada uno: uno para el español y otro para el portugués.

Referencias bibliográficas

  • Davies, M. 2002. Corpus del Español: 100 million words, 1200s-1900s. Disponible en línea en <http://www.corpusdelespanol.org> Enrique-Arias, A. 2010. Una nueva herramienta para la investigación de fuentes bíblicas en la Edad Media: el corpus Biblia medieval. En Actas del XII Congreso Internacional de la Asociación Hispánica de Literatura Medieva, páginas 85-94, Cáceres, septiembre de 2007.
  • Faria, P., F. Kepler y M. C. de Sousa. 2010. An Integrated Tool for Annotating Historical Corpora. En Proceedings of the Fourth Linguistic Annotation Workshop, páginas 217-221.
  • García, M. y P. Gamallo. 2010. Análise Morfossintáctica para o Português Europeu e Galego: Problemas, Soluções e Avaliação. Linguamática, 2(2): 59-67.
  • Hendrickx, I. y R. Marquilhas. 2012. From old texts to modern spellings: an experiment in automatic normalisation. Journal for Language Technology and Computational Linguistics (JLCL), 26(2). 65-76.
  • Kroch, A., B. Santorini y L. Delfs. 2004. The Penn-Helsinki Parsed Corpus of Early Modern English (PPCEME). Department of Linguistics, University of Pennsylvania. CD-ROM, first edition.
  • Kroch, A., B. Santorini y A. Diertani. 2010. The Penn-Helsinki Parsed Corpus of Modern British English (PPCMBE). Department of Linguistics, University of Pennsylvania. CD-ROM, first edition.
  • Padró Ll. y E. Stanilovsky. 2012. FreeLing 3.0: Towards Wider Multilinguality. En P. S. Post Scriptum: Two Diachronic Corpora of Ordinary Writing 63 Proceedings of the Language Resources and Evaluation Conference (LREC 2012) ELRA, páginas 2473-1479, Estambul (Turquía), mayo de 2012.
  • Real Academia Española. Banco de datos (CORDE) [en línea]. Corpus diacrónico del español. <http://www.rae.es>
  • Sánchez-Marco, C., G. Boleda, J. M. Fontana y J. Domingo. 2010. Annotation and Representation of a Diachronic Corpus of Spanish. En Proceedings of the International Conference on Language Resources and Evaluation (LREC), páginas 2713-2718, Malta.
  • Sánchez-Prieto B., F. Paredes García, R. Martínez Sánchez, R. Miguel Franco, M. Simón Parra e I. Vicente Miguel. 2009. El Corpus de Documentos Españoles Anteriores a 1700 (CODEA). En A. Enrique-Arias (ed.). Diacronía de las lenguas iberorrománicas: nuevas aportaciones desde la lingüística de corpus. Madrid. Frankfurt am Main: Iberoamericana-Vervuert, páginas 25-38