El corpus COLA

Transcripciones con sonido

Corpus de Madrid (COLAm)

Corpus de Santiago de Chile (COLAs)

Corpus de Buenos Aires (COLAba)

Sobre las transcripciones

La recogida del material (2002-2004) se hace mediante grabaciones en minidiscos SONY (MZ-N10) que son pasados a CD para ser transcritos con el programa Transcriber. Después (2007) se usaron grabadoras Olympus mp3 con archivos legibles directamente en el ordenador.

Se siguen las recomendaciones de TEI para las tanscripciones.
Las transcripciones son accesibles para la búsqueda en la red mediante programas como KWIC y WORKBENCH.

Las transcripciones son ortográficas con escasos signos de transcripcón. No hay puntuación tampoco. Hay que escuchar la grabación mientras se lee la transcripción.

El acceso al corpus ha sido posible desde julio del 2008, mediante una contraseña y usuario que se obtienen solicitándola aquí

 

Signos de transcripción

 [ ] – Solapamiento

XXX – Habla poco clara

% – Palabra interrumpida

/ – Entonación ascendente de pregunta

\ – Entonación ascendente de pregunta

. – Pausa de un segundo

.. – Pausa de dos segundos

– Pausa de tres segundos

El corpus Cola es transcrito con transcripción ortográfica. No hay puntuación (puntos, comas, exclamaciones, interrogaciones) por considerarse ésta una interpretación del texto.

La clase social (Basada en: nivel educativo/ingresos/vivienda de padres)

Colegios en Madrid
Clases bajas Clase media Clases altas
mabpe malce, malcb maore
malcc mamte maesb
[masje] mashe
Colegios en Buenos Aires
Clases bajas Clase media Clases altas
BABC BABS BABA
BANA11
Colegios en Santiago de Chile
Clases bajas Clase media Clases altas
Scerb8 Sceab8 Scacb8
Scccm4 Scfab8 Scfob8
Scawm4 Scncm3
Sccpm4 Scpvm3

 

Conversaciones íntegras

Algunas conversaciones integras están colgadas aqui:

El resto se colgará de la red al terminarse el proceso de anonimización.

 

Próximas transcripciones (kommende)

  • Material de Buenos Aires (COLAba): abril 2017
  • Material de Managua (COLAman): 2018

 

Enlace

 Esquemas para las grabaciones