COLA korpuset

Tekst og lyd av transkripsjoner

Madrid-korpuset (COLAm)

Santiago de Chile-korpuset (COLAs)

Buenos Aires-korpuset (COLAba)

Om transkripsjonene

Talespråket er spilt inn på SONY (MZ-N10) minidisker (2002-2004). Dernest ble lydfilene lagt over på CD for å bli transkribert i programmet Transcriber. I senere tid er (2007) Olympus mp3-spillere brukt. I COLA-prosjektet følges TEIs (Text Encoding Iniciative) anbefalinger for transkripsjon.

Transkripsjonene er ortografiske og har få transkripsjonstegn. Det er meningen at man skal høre på lydfilen samtidig som man leser transkripsjonen. Transkripsjonene er lagt ut på nettet koblet til lyd.

Det er mulig å søke på ord, antall ord, sosiale klasser, etc. Tilgang til korpuset (brukernavn og passord) fås ved å søke, Klikk: «Tilgang til korpuset«.

Transkripsjonstegn:

[ ] – Overlapping

XXX – Uklar tale

% – avbrutt ord

/ – Stigende tonefall

\ – Synkende tonefall

. – ett (1) sekunds pause

.. – to (2) sekunders pause

– tre (3) sekunders pause

Cola korpuset er transkribert med ortografisk transkripsjon. Det er ikke satt inn  komma eller punktum, da dette regnes som en tolkning av teksten.

Klassifisering av sosiale lag

Klassifisering av sosiale lag baserer seg på kriterier beskrevet i Blas Arroyo (2005: 210-220) og Trudgill (2000: 24-26).

Skoler i Madrid
Lavere klasser Middelklasser Høyere klasser
mabpe malce, malcb maore
malcc mamte maesb
[masje] mashe
Skoler i Buenos Aires
Lavere klasser Middelklasser Høyere klasser
BABC BABS BABA
BANA11
Skoler i Santiago de Chile
Lavere klasser Middelklasser Høyere klasser
Scerb8 Sceab8 Scacb8
Scccm4 Scfab8 Scfob8
Scawm4 Scncm3
Sccpm4 Scpvm3

Hele samtaler

Hele samtaler fra Madrid ligger på denne linken

  • De endelige transkripsjonene av materialet fra Buenos Aires (COLAba)
    kommer ca. april 2020
  • Transkripsjon av materialet fra Managua, Honduras (COLAman) beregnes være klar i 2020

Om COLA-korpuset

Innspillingsskjema