Transcripciones con sonido
Corpus de Santiago de Chile (COLAs)
Corpus de Buenos Aires (COLAba)
Se obtienen contraseña y usuario para el entrar en el corpus aquí
Sobre las transcripciones
La recogida del material (2002-2004) se realizó con grabadoras minidisk SONY (MZ-N10) pasados a CD, para ser transcritos con el programa Transcriber. Después del año 2007 se usaron grabadoras Olympus mp3 con archivos legibles directamente en el ordenador.
El corpus COLA sigue las recomendaciones de TEI para sus tanscripciones.
Las transcripciones son accesibles para la búsqueda en la red mediante programas como KWIC y WORKBENCH.
Las transcripciones son ortográficas con escasos signos de transcripcón. No hay puntuación. Hay que escuchar la grabación mientras se lee la transcripción.
El acceso al corpus ha sido posible desde julio del 2008.
Signos de transcripción del corpus COLA
[ ] – Solapamiento
XXX – Habla poco clara
% – Palabra interrumpida
/ – Entonación ascendente de pregunta
\ – Entonación descendiente de pregunta
. – Pausa de un segundo
.. – Pausa de dos segundos
… – Pausa de tres segundos
El corpus Cola es transcrito con transcripción ortográfica. No hay puntuación (puntos, comas, exclamaciones, interrogaciones) por considerarse ésta una interpretación del texto.
La clase social (determinada por: nivel educativo/ingresos/vivienda de padres)
Colegios en MADRID | ||
Clases bajas | Clase media | Clases altas |
mabpe | malce, malcb | maore |
malcc | mamte | maesb |
[masje] | mashe |
Colegios en BUENOS AIRES | ||
Clases bajas | Clase media | Clases altas |
BABC | BABS | BABA |
BANA11 |
Colegios en SANTIAGO de CHILE | ||
Clases bajas | Clase media | Clases altas |
Scerb8 | Sceab8 | Scacb8 |
Scccm4 | Scfab8 | Scfob8 |
Scawm4 | Scncm3 | |
Sccpm4 | Scpvm3 |
Conversaciones íntegras
Las conversaciones integras anonimizadas de Madrid están aqui:
EnlaceS:
- El corpus es usado en los siguientes países
- El corpus COLA usado en PUBLICACIONES
- El corpus COLA usado en los trabajos de grado