Corpus Oral del Instituto Caro y Cuervo: Reestructuración, diseño y construcción
Acceso a Texto completo
Fuente
Lexis; Vol. 43 Núm. 1 (2019)Abstract
En este artículo, se describen los avances del proyecto de construcción del Corpus Oral del Instituto Caro y Cuervo, cuyo objetivo es almacenar y sistematizar, en forma electrónica, un corpus oral compuesto por los materiales de audio de tres investigaciones del Instituto: el Atlas Lingüístico- Etnográfico de Colombia (ALEC), el Habla Culta de Bogotá (HCB) y el Español Hablado en Bogotá (EHB). Este texto presenta los fundamentos de la lingüística de corpus y los corpus orales; los parámetros y metodología de las tres investigaciones en las que se recopilaron las muestras y su importancia; el proceso de diseño, reestructuración de los datos y construcción del corpus; las dificultades durante su desarrollo; y las perspectivas futuras. The present article describes the advances of the Instituto Caro y Cuervo Spoken Corpus Project. The investigation aims to stored and systematize electronically a spoken corpus composed of the audio files of three investigations of the Institute: The Atlas Lingüístico-Etnográfico de Colombia (ALEC), the Habla Culta de Bogotá (HCB) and the Español Hablado en Bogotá (EHB). This text presents the foundations of corpus linguistics and oral corpora; the parameters and methodology of the three investigations in which the oral samples were collected and their importance; the design process, data restructuring and corpus construction; the difficulties during its development; and the future perspectives.