Tekst og lyd

Tekst og lyd av transkripsjoner

Madrid-korpuset (COLAm)

Santiago de Chile-korpuset (COLAs)

Buenos Aires-korpuset (COLAba)

Om transkripsjonene

Talespråket er spilt inn på SONY (MZ-N10) minidisker. (2002-2004). Dernest ble lydfilene lagt over på CD for å bli transkribert i programmet Transcriber. i senere tid (2007) Olympus mp3-spillere. I COLA-prosjektet følges TEIs (Text Encoding Iniciative) anbefalinger for transkripsjon.

Transkripsjonene er ortografiske og har få transkripsjonstegn. Det er meningen at man skal høre på lydfilen samtidig som man leser transkripsjonen. Transkripsjonene er lagt ut på nettet koblet til lyd.

Det er mulig å søke på ord, antall ord, sosiale klasser, etc. Tilgang til korpuset (brukernavn og passord) fås ved å søke, Klikk: «Tilgang til korpuset«.

 

Transkripsjonstegn:

[ ] – Overlapping

XXX – Uklar tale

% – avbrutt ord

/ – Stigende tonefall

\ – Synkende tonefall

. – ett (1) sekunds pause

.. – to (2) sekunders pause

– tre (3) sekunders pause

Cola korpuset er transkribert med ortografisk transkripsjon. Det er ikke satt inn  komma eller punktum, da dette regnes som en tolkning av teksten.

 

Klassifisering av sosiale lag

Klassifisering av sosiale lag baserer seg på kriterier beskrevet i Blas Arroyo (2005: 210-220) og Trudgill (2000: 24-26).

Skoler i Madrid
Lavere klasser Middelklasser Høyere klasser
mabpe malce, malcb maore
malcc mamte maesb
[masje] mashe
Skoler i Buenos Aires
Lavere klasser Middelklasser Høyere klasser
BABC BABS BABA
BANA11
Skoler i Santiago de Chile
Lavere klasser Middelklasser Høyere klasser
Scerb8 Sceab8 Scacb8
Scccm4 Scfab8 Scfob8
Scawm4 Scncm3
Sccpm4 Scpvm3

 

 

Hele samtaler

Noen hele samtaler ligger på denne linken:

Resten som nå er under en anonymiseringsprosess, skal snart legges ut på nettet.

 

Kommende Transkripsjoner

  • De endelige transkripsjonene av materialet fra Buenos Aires (COLAba)
    kommer ca. april 2017
  • Transkripsjon av materialet fra Mangua, Honduras (COLAman) beregnes være klar i 2018