Transkriptio tarkoittaa tiedon tai puheen muuntamista toisesta muodosta kirjoitettuun tekstiin tai toiseen esitystapaan. Se voi olla esimerkiksi ihmisen puheen muuttamista kirjoitetuksi tai koneellisesti tuotetuksi tekstiksi, mutta transkriptio voi tarkoittaa myös esimerkiksi kirjojen skannausta ja digitaalisten versioiden tekemistä. Kirjoittaja (tai litteroija) on henkilö, joka tekee transkriptioita.

Mitä tarkoittaa litterointi?

Litterointi on puheaineiston sanoittamista kirjoitetuksi tekstiksi. Sitä käytetään erityisesti haastatteluissa, tutkijoiden kenttätyössä, oikeudenkäynneissä ja muussa dokumentoinnissa, jossa ääni- tai videotallenteesta tehdään luettava teksti. Litterointi voi olla:

  • Verbatim-litterointi (sanasta sanaan): mukaan merkitään kaikki täytesanat, toistot, tauot ja epäselvät äänteet.
  • Siistitty litterointi: puhe puhdistetaan lukemakelpoiseksi (poistetaan täytesanat, korjataan keskeytykset), säilyttäen pääsisältö.
  • Lyhennetty tai tiivistetty litterointi: keskeinen sisältö kirjataan ytimekkäästi ilman jokaisen ilmauksen tallentamista.

Transkriptio vs. translitterointi vs. foneettinen transkriptio

On tärkeää erottaa toisistaan useita termejä, jotka usein sekoitetaan:

  • Transkriptio (yleiskäsite): tiedon muuntaminen toisesta välineestä tai muodosta tekstiksi. Esimerkiksi äänitallenteen muuttaminen kirjoitukseksi. Katso myös muuntaminen.
  • Translitterointi (kirjaimellinen kirjaimesta toiseen): tarkoittaa kirjainten tai merkkien suoraa muuntamista yhdestä kirjoitusjärjestelmästä toiseen (esim. kyrillisestä latinalaiseen). Translitteroinnissa pyritään säilyttämään alkuperäisen sanan kirjainasua, ei välttämättä ääntä.
  • Foneettinen transkriptio: kuvaa puheen äänteellistä muotoa käyttäen foneettisia merkkejä, kuten kansainvälisiä foneettisia aakkosia (IPA) tai niiden ASCII-vastaavaa SAMPAa. Foneettinen transkriptio kertoo, miten sana lausutaan, ei miten se kirjoitetaan tietyllä kielellä.

Edellä mainitut käsitteet selkeytyvät esimerkeillä: tässä taulukossa IPA on esimerkki Venäjän entisen presidentin nimen foneettisesta transkriptiosta, joka tunnetaan englanniksi nimellä Boris Jeltsin, ja sen jälkeen eri kielissä hyväksytyt hybridimuodot. Huomaa, että "Boris" on translitteraatio eikä foneettinen transkriptio varsinaisessa merkityksessä.

Kielijärjestelmien erot ja käytännön esimerkkejä

Samat sanat voidaan esittää eri järjestelmissä eri tavoin. Esimerkiksi Kiinan pääkaupungin mandariinikiinankielinen nimi on Peking yleisesti käytetyssä nykyjärjestelmässä Hanyu Pinyin, kun taas historiallisesti merkittävässä Wade–Giles -järjestelmässä se kirjoitetaan Pei-Ching. Näissä tapauksissa kyse on pikemminkin translitteroinnista ja eri järjestelmien normeista kuin puhtaasta foneettisesta transkriptiosta.

Käytännön transkriptio voidaan tehdä myös muulle kuin aakkoselliselle kielelle. Esimerkiksi hongkongilaisessa sanomalehdessä George Bushin nimi translitteroidaan kahdella kiinalaisella merkillä, jotka kuulostavat "Bou-sū"-merkiltä. (布殊) käyttämällä merkkejä, jotka tarkoittavat "kangasta" ja "erityistä". Vastaavasti monet englannin ja muiden länsieurooppalaisten kielten sanat lainataan japaniksi ja kirjoitetaan käyttäen katakanaa, yhtä japanin tavuista.

Kun valita litterointi, transkriptio tai foneettinen transkriptio?

Valinta riippuu käyttötarkoituksesta:

  • Akateemisessa kielitieteessä usein tarvitaan foneettista transkriptiota (esim. IPA) äänteiden analysoimiseksi.
  • Haastattelujen, haastattelututkimusten ja podcastien dokumentoinnissa käytetään litterointia (verbatim tai siistitty) riippuen siitä, halutaanko säilyttää puheen kaikki piirteet vai tehdä luettavampi teksti.
  • Kun siirretään nimiä tai sanoja eri kirjoitusjärjestelmän välillä (esim. kyrillinen → latinalainen), käytetään translitterointia ja sovitaan käytettävästä standardista.

Käytännön vinkkejä litterointiin ja transkriptioon

  • Ilmoita aina käytetty tyyli: verbatim, siistitty vai tiivistetty. Jos teet foneettisen transkription, mainitse käytetty järjestelmä (esim. IPA).
  • Merkitse puhujat ja aikaleimat selkeästi, erityisesti pidemmissä aineistoissa tai monipuhujatilanteissa.
  • Käytä tunnisteita epäselville kohdille, esim. [inaudible], [keskeytys], [naurahtaa].
  • Jos käytät automaattista puheentunnistusta (ASR), tarkista ja korjaa tulos manuaalisesti — erityisesti erisnimet ja termit vaativat usein korjauksia.
  • Säilytä alkuperäistallenne ja dokumentoi mahdolliset muokkaukset tai redaktionaaliset valinnat.

Kuka tekee transkriptioita?

Transkriptioita tekevät ammattilaiset (litteroijat, transkriptoijat), tutkijat, journalistit ja monet muut. Työssä vaaditaan tarkkuutta, kuuntelutaitoa ja usein myös hyvää kielitaitoa tai tuntemusta erikoistermeistä.

Yhteenvetona: litterointi keskittyy puheen sanoittamiseen tallenteista, translitterointi merkkien muuntamiseen kirjoitusjärjestelmästä toiseen ja foneettinen transkriptio äänten tarkan kuvaamisen foneettisin merkein. Valitse menetelmä käyttötarkoituksen ja vaaditun tarkkuuden mukaan.