Entrar en el corpus COLA

Transcripciones con sonido

Corpus de Madrid (COLAm)

Corpus de Santiago de Chile (COLAs)

Corpus de Buenos Aires (COLAba)


Se obtienen contraseña y usuario para el entrar en el corpus aquí

Sobre las transcripciones

La recogida del material (2002-2004) se realizó con grabadoras minidisk SONY (MZ-N10)  pasados a CD, para ser transcritos con el programa Transcriber. Después del año 2007 se usaron grabadoras Olympus mp3 con archivos legibles directamente en el ordenador.
El corpus COLA  sigue las recomendaciones de TEI para sus tanscripciones.
Las transcripciones son accesibles para la búsqueda en la red mediante programas como KWIC y WORKBENCH.
Las transcripciones son ortográficas con escasos signos de transcripcón. No hay puntuación. Hay que escuchar la grabación mientras se lee la transcripción.
El acceso al corpus ha sido posible desde julio del 2008.

Signos de transcripción del corpus COLA

 [ ] –      Solapamiento
XXX –  Habla poco clara
% –      Palabra interrumpida
/ –         Entonación ascendente de pregunta
\ –        Entonación descendiente de pregunta
. –         Pausa de un segundo
.. –       Pausa de dos segundos
–      Pausa de tres segundos

El corpus Cola es transcrito con transcripción ortográfica. No hay puntuación (puntos, comas, exclamaciones, interrogaciones) por considerarse ésta una interpretación del texto.

La clase social (determinada por: nivel educativo/ingresos/vivienda de padres)

Colegios en MADRID
Clases bajas Clase media Clases altas
mabpe malce, malcb maore
malcc mamte maesb
[masje] mashe
Colegios en BUENOS AIRES
Clases bajas Clase media Clases altas
BABC BABS BABA
BANA11
Colegios en SANTIAGO de CHILE
Clases bajas Clase media Clases altas
Scerb8 Sceab8 Scacb8
Scccm4 Scfab8 Scfob8
Scawm4 Scncm3
Sccpm4 Scpvm3

Conversaciones íntegras

Las conversaciones integras anonimizadas de Madrid están aqui:

EnlaceS:

 Esquemas para las grabaciones