Construyendo un corpus oral para el gallego. El proyecto CORILGA

José Manuel Dopazo Entenza

Resumen


El CORILGA (Corpus Oral Informatizado da Lingua Galega) es un corpus de grabaciones alineadas con su transcripción y anotadas en distintos niveles (ortográfico, fonético, morfológico…). Una codificación completa y minuciosa de los datos de las grabaciones y de los informantes permite, mediante un buscador online abierto al público, conseguir unos resultados de búsqueda muy precisos. Esta información se podría utilizar para la realización de estudios de variación y cambio lingüístico, así como para crear materiales para la enseñanza o desarrollar tecnologías del habla.

Palabras clave


CORILGA, variación y cambio lingüístico, corpus oral, reconocimiento de voz

Texto completo:

PDF

Referencias


AGO = FERNÁNDEZ REI, F. (dir.) (2010-): Arquivo do Galego Oral. Santiago de Compostela: Instituto da Lingua Galega. http://ilg.usc.es/ago/ [Consultado: <08/03/2016>]

AMPER-Galicia = FERNÁNDEZ REI, E. (dir.) (2006-): Atlas Multimedia Prosódico do Espazo Románico. Santiago de Compostela: Instituto da Lingua Galega. http://ilg.usc.es/amper/ [Consultado: <08/03/2016>]

BRUGMAN, H. y A. RUSSEL (2004): “Annotating Multimedia/ Multi-modal resources with ELAN”. Proceedings of LREC 2004, Fourth International Conference on Language Resources and Evaluation. https://tla.mpi.nl/tools/tla-tools/elan/citing_elan/ [Consultado: <14/03/2015>]

CORILGA = REGUEIRA FERNÁNDEZ, X. L. (dir.) (2012-): Corpus Oral Informatizado da Lingua Galega. Santiago de Compostela: Instituto da Lingua Galega. http://ilg.usc.es/corilga/ [Consultado: <08/03/2016>]

DUBERT GARCÍA, F. X. (1998): A fala de Santiago de Compostela. Estudio xeolingüístico. Tesis doctoral dirigida por Rosario Álvarez Blanco. Universidade de Santiago de Compostela (inédita)

GARCÍA MATEO, C., A. CARDENAL LÓPEZ, X. L. REGUEIRA FERNÁNDEZ, E. FERNÁNDEZ REI, M. MARTÍNEZ MAQUIEIRA, R. SEARA DOPAZO, R. VARELA FERNÁNDEZ & N. BASANTA LLANES (2014): “CORILGA: a Galician Multilevel Annotated Speech Corpus for Linguistic Analysis”. Proc. 9th Language Resurces and Evaluation Conference (LREC2014). Reykjavik, 26-31 May 2014.

KUCERA, H. & N. FRANCIS (1967): Computational Analysis of Present-Day American English. Michigan: Brown University Press

REGUEIRA FERNÁNDEZ, X. L. (1989): A fala do norte da Terra Cha: estudio descritivo. Tesis doctoral dirigida por Antón L. Santamarina Fernández. Universidade de Santiago de Compostela (inédita).

SANKOFF, D. & G. SANKOFF (1973): “Sample Survey Methods and Computer-Assisted Analysis in the Study of Grammatical Variation”. Canadian Languages in Their Social Context Edmonton: Linguistic Research Incorporated. R. DARNELL (ed.). Edmonton: Linguistic Research Incorporated, pp. 7–64.

SANTAMARINA FERNÁNDEZ, A. L., R. ÁLVAREZ BLANCO, F. FERNÁNDEZ REI & M. GONZÁLEZ GONZÁLEZ (1990-2015): Atlas Lingüístico Galego. Vol. I-VI. A Coruña: Fundación Pedro Barrié de la Maza.


Enlaces refback

  • No hay ningún enlace refback.