Frecuencia y distintividad en el uso lingüísticocasos tomados de la lematización verbal de corpus de distintos registros

  1. Moreno Sandoval, Antonio
  2. Guirao Miras, José María
Libro:
A survey of corpus-based research [Recurso electrónico]
  1. Cantos Gómez, Pascual (ed. lit.)
  2. Sánchez Pérez, Aquilino (ed. lit.)

Editorial: Murcia: Asociación Española de Lingüística del Corpus, 2009

ISBN: 978-84-692-2198-3

Año de publicación: 2009

Páginas: 195-210

Tipo: Capítulo de Libro

Resumen

El objeto de esta comunicación es establecer una comparación entre el concepto de frecuencia de uso y el de distintividad. Para ello utilizaremos el caso de los lemas verbales del español en diferentes registros y variedades del español. La metodología consistirá en emplear tres corpus lematizados automáticamente en el Laboratorio de Lingüística Informática de la UAM. Los tres corpus representan el habla espontánea de la variedad peninsular (C-ORAL-ROM), el habla infantil espontánea (CHIEDE) y un corpus de noticias de la Agencia EFE. Para realizar la extracción de unidades distintivas, aplicamos el test de Dunning a cada corpus, confeccionando una lista de lemas verbales distintivos del registro. El resultado final son dos listas de verbos para cada registro. En el Apéndice se muestran los 100 primeros casos de cada tipo textual, propuesta que puede ser de interés para la enseñanza de segundas lenguas y la lexicografía.