Kuvaskanneri: toiminta, skannausmenetelmät, tyypit ja OCR
Kuvaskanneri: opas toimintaan, skannausmenetelmiin, laitetyyppeihin ja OCR-tekstitunnistukseen — vertaa malleja, opi skannaamaan negatiiveja, kirjoja ja muokkaamaan digikuvia.
Tietojenkäsittelyssä kuvaskanneri on laite, jota käytetään kuvien tai tekstin siirtämiseen tietokoneeseen. On olemassa erityisiä malleja valokuvanegatiivien skannaamiseen tai kirjojen skannaamiseen. Tietokoneessa skannerin signaali siirretään digitaaliseksi kuvaksi. Tätä kuvaa voidaan sitten muokata, tulostaa jne. Kaikissa skannereissa on erityisiä osia, joita käytetään kuvan ottamiseen esineestä. Latauskytkentäiset laitteet tai kosketinkuva-anturin osat ottavat kohteesta tulevan valon ja muuttavat sen digitaaliseksi signaaliksi. Digitaalinen signaali siirretään sitten tietokoneen muistiin tai luetaan skannerin prosessorissa. Joidenkin ohjelmistojen avulla se voidaan muuttaa pakatuksi digitaaliseksi kuvaksi, kuten JPEG- tai PNG-kuvaksi. Käsin tulostettu tai kirjoitettu teksti voidaan OCR-ohjelmalla muuttaa ASCII-koodiksi.
Toimintaperiaate
Skanneri käyttää valonlähdettä, optista järjestelmää ja anturia muutaman vaiheen kautta: valo heijastuu tai kulkee läpi skannattavasta kohteesta, optiikka suuntaa valon anturille, ja anturi muuttaa valon sähköiseksi signaaliksi. Tämä signaali näytteistetään ja kvantisoidaan, minkä jälkeen siitä muodostetaan digitaalinen kuva. Skannerin sisäinen elektroniikka ja ohjelmisto hallitsevat näitä vaiheita ja tekevät mahdolliseksi erilaiset kuvaprosessointitoiminnot ennen tallennusta.
Skannausmenetelmät ja teknologiat
- CCD (charge-coupled device): Perinteinen anturitekniikka, jolla on hyvä dynaaminen alue ja värintoisto. Käytetään usein tasoskannereissa ja filmiskannereissa.
- CIS (contact image sensor): Ohut, kontaktipohjainen anturi, joka vie vähemmän tilaa ja virtaa. Sopii hyvin paperidokumenteille mutta sisältää yleensä pienemmän dynaamisen alueen kuin CCD.
- Drum-scanner (rummutyyppinen skanneri): Ammattikäyttöön suunnattu laite, jossa originaatti kiinnitetään pyörivään rumpuun ja valoa mitataan fotomultipliersäteen avulla. Erittäin korkea laatu filmien ja taidepainatusten skannaukseen.
- Planetaarinen / yläpuolelta kuvaava skanneri: Käytetään kirjoille ja hauraille aineistoille; kuva otetaan ylhäältä ilman, että kappaletta pitää puristaa lasiin.
Skannerityypit
- Flatbed (tasoskanneri): Monipuolinen ja yleinen. Sopii valokuville, asiakirjoille ja kirjoille. Usein mukana läpinäkyvyysmoduuli filmien skannaukseen.
- Sheetfed (arkinsyöttöskanneri): Suunniteltu pikatallennukseen ja monisivuisille dokumenteille. Usein automaattinen arkinsyöttö (ADF) ja kaksipuolinen (duplex) skannaus.
- Käsiskanneri: Kannettava, käytetään isompien tai paikallaan olevien kohteiden skannaukseen. Laadussa voi olla vaihtelua käsivakaudesta johtuen.
- Film- ja negatiiviskannerit: Erityisesti 35 mm ja suuremmille filmeille tarkoitettuja laitteita, jotka tarjoavat korkean resoluution ja dynaamisen alueen.
- Erikoisskannerit: Kirjaskannerit, suurformaattilaitteet ja arkistolaitteet, jotka on suunniteltu tiettyihin kohteisiin tai korkeaan läpimenoon.
Resoluutio, väri ja tiedostomuodot
Resoluutio mitataan yleensä DPI-yksikössä (dots per inch). Tekstille ja OCR:lle suositellaan yleensä 300 dpi, pienelle tai hienolle tekstille 400–600 dpi. Kuvien skannaamiseen tarvittava DPI riippuu lopullisesta käyttötarkoituksesta — painoon meneville kuvamateriaaleille voi tarvita 600–2400 dpi tai enemmän (erityisesti filmiskannereissa).
Värisyvyys ilmaistaan bitteinä per kanava (esim. 8 bittiä per RGB-kanava = 24 bittiä väriä). Syväväri ja laaja dynaaminen alue parantavat värintoistoa ja mahdollistavat haalistuneiden kuvien palauttamisen.
Tiedostomuodot: TIFF (häviötön, suosittu arkistoinnissa), JPEG (häviöllinen, pienempi koko), PNG (häviötön, rasterigrafiikkaan), PDF (usein dokumenttien arkistointiin; voi sisältää tekstikerroksen OCR:n jälkeen), PDF/A (arkistointivakaa PDF-muoto).
OCR ja tekstin tunnistus
OCR (Optical Character Recognition) muuttaa skannatun kuvan sisältämän tekstin muokattavaksi ja haettavaksi tekstiksi. Prosessi sisältää yleensä seuraavat vaiheet:
- Esikäsittely: kohinanpoisto, kontrastin säätö, vinouden korjaus (deskew), kirjainosien erottelu (binarisointi).
- Merkintunnistus: yksittäisten kirjainten ja sanojen tunnistaminen hyödyntäen mallipohjaisia tai koneoppimispohjaisia algoritmeja.
- Jälkikäsittely: sanakirja- ja kielimallitarkistukset, rivivälien ja erikoismerkkien korjaus.
OCR-tarkkuuteen vaikuttavat skannauksen laatu (resoluutio, kontrasti), fontti ja tekstin kunto. Monikielisissä aineistoissa on tärkeää valita oikea kielipaketti. Haettavan PDF:n luomiseksi OCR-ohjelmisto upottaa tunnistetun tekstin PDF-tiedostoon säilyttäen alkuperäisen kuvan visuaalisesti.
Hyvät käytännöt ja ylläpito
- Puhdista skannerin lasi säännöllisesti nukattomalla liinalla ja sopivalla puhdistusaineella; pöly ja sormenjäljet heikentävät tuloksia.
- Käytä väritarkkuuden kannalta tarvittaessa kalibrointipalvelua ja ICC-väriprofiileja.
- Valitse skannausasetukset käyttötarkoituksen mukaan: mustavalkoinen läpikäynti OCR:lle, harmaasävyt monille tekstisivuilla, väri valokuville.
- Arkistointia varten suositaan häviötöntä tallennusta (TIFF, PDF/A). Jos tiedostokoko on kriittinen, käytä JPEG:n säätöä laadun ja koon kompromissina.
- Ota huomioon tietoturva ja yksityisyys, erityisesti kun skannataan arkaluonteisia asiakirjoja: käytä suojattua tiedonsiirtoa ja poista väliaikaiset tiedostot.
Skannauksen nopeus ja liitettävyys
Skannerien nopeutta mitataan usein sivuina minuutissa (ppm) tai kuvasyke (images per minute). Ammattiskannereissa käytetään myös IPS (inches per second) filmiskannereissa. Liitäntä voi olla USB, Ethernet, Wi‑Fi tai vanhemmissa laitteissa SCSI; verkkoyhteydellä varustetut skannerit tarjoavat keskitetyn käytön ja skannauspalvelut organisaatioille.
Yhteenveto
Skanneri muuttaa fyysiset kuvat ja tekstit digitaalisiksi tiedostoiksi, ja valinta (teknologia, tyyppi, asetukset) riippuu käyttötarkoituksesta: arkistointi, painotyö, valokuvien digitointi tai OCR. Tuntemalla perusperiaatteet, eri teknologiat ja hyvän käytännön neuvoja voi saavuttaa luotettavia ja laadukkaita skannaustuloksia.
Tyypit
Skannerin päätyypit
- Pöytäskanneri (tasoskanneri) Tämä on luultavasti suosituin tyyppi. Skannattava kohde (kuva, kuva, tekstiarkki) asetetaan lasille. Lasin alla on liikkuva kuvantunnistin.
- Käsiskanneri. Laite siirretään paperille käsin. Se oli suosittu 1990-luvulla.
- Pyörivä skanneri (rumpuskanneri), jota käytetään suurten paperimäärien nopeaan skannaukseen.
Tuottajat
- Canon
- HP
- Lexmark
- Mustek
- Plustek
- Muut
Aiheeseen liittyvät sivut
- Digitaalinen kamera
Kysymyksiä ja vastauksia
K: Mikä on kuvaskanneri?
V: Kuvaskanneri on laite, jota käytetään kuvien tai tekstin siirtämiseen tietokoneeseen.
K: Onko kuvaskannereissa erityisiä malleja?
V: Kyllä, on olemassa erikoismalleja valokuvanegatiivien skannaamiseen tai kirjojen skannaamiseen.
K: Miten kuvaskanneri siirtää signaalin digitaaliseksi kuvaksi?
V: Skannerin signaali siirretään tietokoneessa digitaaliseksi kuvaksi.
K: Mihin skannerin erityisosia käytetään?
V: Kaikissa skannereissa on erityisosia, joita käytetään kuvan ottamiseen kohteesta.
K: Mitä ovat varaajakytkentälaitteen tai kosketuskuvasensorin osat?
V: Varauskytkentälaitteen tai kosketuskuvasensorin osat ottavat kohteesta tulevan valon ja muuttavat sen digitaaliseksi signaaliksi.
K: Mitä skannerilla saadulla digitaalisella kuvalla voidaan tehdä?
V: Saatu digitaalinen kuva voidaan muokata, tulostaa jne.
K: Voidaanko käsin tulostettu tai kirjoitettu teksti muuttaa ASCII-koodiksi?
V: Kyllä, käsin painettu tai kirjoitettu teksti voidaan muuttaa ASCII-koodiksi OCR-ohjelmalla.
Etsiä