Mojibake

Mojibake (文字化け, lausutaan /modʑibake/) on nimi virheellisille, lukukelvottomille merkeille, jotka näkyvät, kun tietokoneohjelmisto ei pysty näyttämään tekstiä oikein. Tietokoneita käytettäessä teksti koodataan käyttämällä merkkikoodausta. Siirrossa jokainen merkki korvataan sen sijainnilla (tai numerolla) koodauksessa. Kun merkki näytetään uudelleen, asema korvataan jälleen merkillä. Jos alkuperäistä koodausta ei ole määritetty, voidaan käyttää eri merkkiä, kun numero korvataan uudelleen näytettävällä merkillä. Unicode otettiin käyttöön tämän ongelman ratkaisemiseksi: UTF-8 pystyy koodaamaan useimmat tavalliset merkit kahdessa tavussa.

Ennen Unicoden käyttöönottoa käytettiin muita merkkikoodauksia. Esimerkiksi ISO-8859 sisältää 15 eri koodausta. Nämä ovat samat englannissa yleisesti käytetyille merkeille. Niissä on useita "erikoismerkkejä" sisältäviä "lohkoja", jotka on arkistoitu eri tavalla kussakin koodauksessa.



Sivusto voi näyttää tältä, jos käytetään väärää fonttikoodausta.Zoom
Sivusto voi näyttää tältä, jos käytetään väärää fonttikoodausta.

Japaninkielisen Wikipedian artikkeli Mojibake käyttää UTF-8-koodausta. Tässä kuvakaappauksessa näkyy, miltä se näyttää, kun se puretaan Windows-standardin CP1252-koodauksen avulla.Zoom
Japaninkielisen Wikipedian artikkeli Mojibake käyttää UTF-8-koodausta. Tässä kuvakaappauksessa näkyy, miltä se näyttää, kun se puretaan Windows-standardin CP1252-koodauksen avulla.

Sanan alkuperä

Mojibake on japanilainen sana. Sana 文字化け ([moʥibake]) koostuu kahdesta osasta. 文字 (moji) tarkoittaa kirjainta, merkkiä. 化け (bake), verbistä 化ける (bakeru), tarkoittaa esiintyä naamioituneena, ottaa muodon, muuttua huonompaan suuntaan. Kirjaimellisesti se tarkoittaa "luonteen muuttumista".



Kysymyksiä ja vastauksia

K: Mikä on "mojibake"?


V: Mojibake on termi virheellisille ja lukukelvottomille merkeille, jotka näkyvät, kun tietokoneohjelmisto ei pysty näyttämään tekstiä oikein.

K: Miten teksti koodataan tietokoneita käytettäessä?


V: Teksti koodataan käyttämällä merkkikoodausta, jossa jokainen merkki korvataan sen sijainnilla tai numerolla koodauksessa.

K: Mitä tapahtuu, kun alkuperäistä koodausta ei määritetä tekstiä siirrettäessä?


V: Kun alkuperäistä koodausta ei ole määritetty, voidaan käyttää eri merkkiä, kun numero korvataan näytettävällä merkillä.

K: Mikä on Unicode ja miten se ratkaisee tämän ongelman?


V: Unicode on merkkien koodausstandardi, joka voi esittää useimmat merkit kahdella tavulla. Se ratkaisee erilaisten merkkikoodausten käytön ongelman ja varmistaa, että merkit näytetään oikein.

K: Mitkä ovat esimerkkejä muista merkkikoodauksista, joita käytettiin ennen Unicodea?


V: ISO-8859 on esimerkki toisesta merkkikoodauksesta, jota käytettiin ennen Unicodea.

K: Kuinka monta eri koodausta ISO-8859 sisältää?


V: ISO-8859 sisältää 15 eri koodausta.

K: Ovatko ISO-8859:n erikoismerkit samat kaikissa sen koodauksissa?


V: Ei, ISO-8859:n erikoismerkit on arkistoitu eri tavoin jokaisessa koodauksessa.

AlegsaOnline.com - 2020 / 2023 - License CC3