Litterointi ja transkriptio — määritelmä, erot ja käytännön esimerkit
Transkriptio tarkoittaa tiedon tai puheen muuntamista toisesta muodosta kirjoitettuun tekstiin tai toiseen esitystapaan. Se voi olla esimerkiksi ihmisen puheen muuttamista kirjoitetuksi tai koneellisesti tuotetuksi tekstiksi, mutta transkriptio voi tarkoittaa myös esimerkiksi kirjojen skannausta ja digitaalisten versioiden tekemistä. Kirjoittaja (tai litteroija) on henkilö, joka tekee transkriptioita.
Mitä tarkoittaa litterointi?
Litterointi on puheaineiston sanoittamista kirjoitetuksi tekstiksi. Sitä käytetään erityisesti haastatteluissa, tutkijoiden kenttätyössä, oikeudenkäynneissä ja muussa dokumentoinnissa, jossa ääni- tai videotallenteesta tehdään luettava teksti. Litterointi voi olla:
- Verbatim-litterointi (sanasta sanaan): mukaan merkitään kaikki täytesanat, toistot, tauot ja epäselvät äänteet.
- Siistitty litterointi: puhe puhdistetaan lukemakelpoiseksi (poistetaan täytesanat, korjataan keskeytykset), säilyttäen pääsisältö.
- Lyhennetty tai tiivistetty litterointi: keskeinen sisältö kirjataan ytimekkäästi ilman jokaisen ilmauksen tallentamista.
Transkriptio vs. translitterointi vs. foneettinen transkriptio
On tärkeää erottaa toisistaan useita termejä, jotka usein sekoitetaan:
- Transkriptio (yleiskäsite): tiedon muuntaminen toisesta välineestä tai muodosta tekstiksi. Esimerkiksi äänitallenteen muuttaminen kirjoitukseksi. Katso myös muuntaminen.
- Translitterointi (kirjaimellinen kirjaimesta toiseen): tarkoittaa kirjainten tai merkkien suoraa muuntamista yhdestä kirjoitusjärjestelmästä toiseen (esim. kyrillisestä latinalaiseen). Translitteroinnissa pyritään säilyttämään alkuperäisen sanan kirjainasua, ei välttämättä ääntä.
- Foneettinen transkriptio: kuvaa puheen äänteellistä muotoa käyttäen foneettisia merkkejä, kuten kansainvälisiä foneettisia aakkosia (IPA) tai niiden ASCII-vastaavaa SAMPAa. Foneettinen transkriptio kertoo, miten sana lausutaan, ei miten se kirjoitetaan tietyllä kielellä.
Edellä mainitut käsitteet selkeytyvät esimerkeillä: tässä taulukossa IPA on esimerkki Venäjän entisen presidentin nimen foneettisesta transkriptiosta, joka tunnetaan englanniksi nimellä Boris Jeltsin, ja sen jälkeen eri kielissä hyväksytyt hybridimuodot. Huomaa, että "Boris" on translitteraatio eikä foneettinen transkriptio varsinaisessa merkityksessä.
Kielijärjestelmien erot ja käytännön esimerkkejä
Samat sanat voidaan esittää eri järjestelmissä eri tavoin. Esimerkiksi Kiinan pääkaupungin mandariinikiinankielinen nimi on Peking yleisesti käytetyssä nykyjärjestelmässä Hanyu Pinyin, kun taas historiallisesti merkittävässä Wade–Giles -järjestelmässä se kirjoitetaan Pei-Ching. Näissä tapauksissa kyse on pikemminkin translitteroinnista ja eri järjestelmien normeista kuin puhtaasta foneettisesta transkriptiosta.
Käytännön transkriptio voidaan tehdä myös muulle kuin aakkoselliselle kielelle. Esimerkiksi hongkongilaisessa sanomalehdessä George Bushin nimi translitteroidaan kahdella kiinalaisella merkillä, jotka kuulostavat "Bou-sū"-merkiltä. (布殊) käyttämällä merkkejä, jotka tarkoittavat "kangasta" ja "erityistä". Vastaavasti monet englannin ja muiden länsieurooppalaisten kielten sanat lainataan japaniksi ja kirjoitetaan käyttäen katakanaa, yhtä japanin tavuista.
Kun valita litterointi, transkriptio tai foneettinen transkriptio?
Valinta riippuu käyttötarkoituksesta:
- Akateemisessa kielitieteessä usein tarvitaan foneettista transkriptiota (esim. IPA) äänteiden analysoimiseksi.
- Haastattelujen, haastattelututkimusten ja podcastien dokumentoinnissa käytetään litterointia (verbatim tai siistitty) riippuen siitä, halutaanko säilyttää puheen kaikki piirteet vai tehdä luettavampi teksti.
- Kun siirretään nimiä tai sanoja eri kirjoitusjärjestelmän välillä (esim. kyrillinen → latinalainen), käytetään translitterointia ja sovitaan käytettävästä standardista.
Käytännön vinkkejä litterointiin ja transkriptioon
- Ilmoita aina käytetty tyyli: verbatim, siistitty vai tiivistetty. Jos teet foneettisen transkription, mainitse käytetty järjestelmä (esim. IPA).
- Merkitse puhujat ja aikaleimat selkeästi, erityisesti pidemmissä aineistoissa tai monipuhujatilanteissa.
- Käytä tunnisteita epäselville kohdille, esim. [inaudible], [keskeytys], [naurahtaa].
- Jos käytät automaattista puheentunnistusta (ASR), tarkista ja korjaa tulos manuaalisesti — erityisesti erisnimet ja termit vaativat usein korjauksia.
- Säilytä alkuperäistallenne ja dokumentoi mahdolliset muokkaukset tai redaktionaaliset valinnat.
Kuka tekee transkriptioita?
Transkriptioita tekevät ammattilaiset (litteroijat, transkriptoijat), tutkijat, journalistit ja monet muut. Työssä vaaditaan tarkkuutta, kuuntelutaitoa ja usein myös hyvää kielitaitoa tai tuntemusta erikoistermeistä.
Yhteenvetona: litterointi keskittyy puheen sanoittamiseen tallenteista, translitterointi merkkien muuntamiseen kirjoitusjärjestelmästä toiseen ja foneettinen transkriptio äänten tarkan kuvaamisen foneettisin merkein. Valitse menetelmä käyttötarkoituksen ja vaaditun tarkkuuden mukaan.
Transkription jälkeen
Kun sana on siirretty yhdestä kielestä toisen kielen käsikirjoitukseen:
- toinen tai molemmat kielet voivat kehittyä edelleen. Kahden kielen äänteiden alkuperäinen vastaavuus voi muuttua, jolloin transkriptoidun sanan ääntäminen kehittyy eri suuntaan kuin alkuperäinen ääntäminen.
- transkriboitu sana voidaan ottaa lainasanaksi toiseen kieleen, jolla on sama kirjoitusasu. Tämä johtaa usein erilaiseen ääntämiseen ja oikeinkirjoitukseen kuin suora transkriptio.
Tämä on erityisen ilmeistä kreikan kielen lainasanojen ja nimien kohdalla. Kreikkalaiset sanat tavallisesti ensin transkriboidaan latinaksi (niiden vanhojen ääntämysmuotojen mukaisesti), sitten lainataan muihin kieliin, ja lopulta lainasana on kehittynyt tavoitekielen sääntöjen mukaisesti. Esimerkiksi Aristoteles on nykyisin käytetty englanninkielinen muoto filosofin nimestä, jonka kreikankielinen nimi kirjoitetaan Aριστoτέλης (Aristotélēs), joka transkriboitiin latinaksi Aristóteles, josta se lainattiin muihin kieliin ja seurasi niiden kielellistä kehitystä.(Aristoteleen ajan "klassisessa" kreikassa ei käytetty pieniä kirjaimia, ja nimi kirjoitettiin ΑΡΙΣΤΟΤΕΛΗΣ).
Kun tämä prosessi jatkuu useilla kielillä, alkuperäisen ääntämisen välittäminen voi epäonnistua surkeasti. Eräs muinainen esimerkki on sanskritin sana dhyāna, joka siirtyi buddhalaisten kirjoitusten kautta kiinan sanaksi Ch'an. Ch'an (禪 zen-buddhalaisuus) transkriboitiin japanin kielestä (ゼン zen) englanniksi Zen. dhyāna zeniksi on melkoinen muutos.
Toinen monitahoinen ongelma on "ensisijaisen" transkription myöhempi muuttuminen. Esimerkiksi sana, joka kuvaa filosofiaa tai uskontoa Kiinassa, popularisoitiin englanniksi nimellä Tao, ja sille annettiin pääte -ism, jolloin saatiin englanninkielinen sana Taoism. Tämä transkriptio vastaa Wade-Giles-järjestelmää. Uudemmat Pinyin-translitteroinnit tuottavat Dao ja Daoism.
Aiheeseen liittyvät sivut
- Romanisointi
- Translitterointi
Kysymyksiä ja vastauksia
Q: Mitä transkriptio on?
V: Transkriptio on tekstin muuntaminen toisesta välineestä, kuten ihmisen puheesta, kirjoitettuun, koneella kirjoitettuun tai painettuun muotoon. Se voi tarkoittaa myös kirjojen skannausta ja digitaalisten versioiden tekemistä.
K: Kuka tekee transkriptioita?
A: Kirjoittaja on henkilö, joka tekee transkriptioita.
K: Mitä eroa on transkription ja translitteroinnin välillä?
V: Transkriptiossa siirrytään äänteestä kirjoitukseen, kun taas translitteroinnissa luodaan yhdestä kirjoituksesta toiseen kartoitus, joka on suunniteltu vastaamaan mahdollisimman hyvin alkuperäistä kirjoitusta.
K: Mitkä ovat esimerkkejä kielitieteellisissä tarkoituksissa käytettävistä tavanomaisista transkriptiomenetelmistä?
V: Esimerkkejä kielellisiin tarkoituksiin käytettävistä vakiomuotoisista transkriptiojärjestelmistä ovat kansainväliset foneettiset aakkoset (International Phonetic Alphabet, IPA) ja sen ASCII-ekvivalentti SAMPA.
K: Miten käytännön transkriptio voidaan tehdä muulle kuin aakkoselliselle kielelle?
V: Käytännön transkriptio voidaan tehdä muuhun kuin alfabeettiseen kieleen käyttämällä merkkejä, jotka edustavat alkuperäisen kielen äänteitä muistuttavia äänteitä. Esimerkiksi George Bushin nimi voidaan transkriboida kahdella kiinalaisella merkillä, jotka kuulostavat "Bou-sū" (布殊). Samoin monet englannin ja muiden länsieurooppalaisten kielten sanat lainataan japaniksi ja kirjoitetaan katakanaa käyttäen.
K: Miten eri järjestelmät vaikuttavat siihen, miten sanoja kirjoitetaan?
V: Samat sanat voidaan kirjoittaa eri järjestelmissä eri tavoin; esimerkiksi Peking kirjoitetaan Wade Gilesin järjestelmässä Pei-Ching, mutta Hanyu Pinyin käyttää sen sijaan Pekingiä.