Dale-Challin kaava on yksi tunnetuista tavoista arvioida tekstin luettavuutta eli sitä, kuinka vaikeaa tekstiä on lukea ja ymmärtää. Se on yksi klassisista luettavuustesteistä, ja sen erityispiirre on sanastopohjainen lähestymistapa: kaava arvioi tekstin vaikeutta vertaamalla siinä käytettyjä sanoja ennalta määriteltyyn helppojen sanojen luetteloon. Kaava mittaa siis pääasiassa käytettyjen sanojen vaikeutta eikä suoraan syntaksin tai lauserakenteiden monimutkaisuutta.
Tausta ja sanastoluettelo
Dale ja Chall kehittivät kaavan 1940-luvulla vastauksena tarpeeseen luokitella oppikirjoja ja muita tekstejä opiskelijoiden lukutaidon mukaan. Alkupään työssä käytettiin noin 3000 sanaa sisältävää "helppojen sanojen" listaa, jonka ajatus oli kattavasti listata ne sanat, jotka 4. luokan oppilaat yleensä tuntevat. Tätä sanastoluetteloa on sittemmin päivitetty; esimerkiksi kirjoittajat julkaisivat päivitetyn sanaluettelon vuonna 1995, ja luetteloita voidaan soveltaa myös eri käyttötarkoituksiin ja kieliin. Alun perin kaavaa käytettiin laajasti oppikirjojen luokitteluun Yhdysvaltain koulupiireissä.
Kaavan periaate ja laskukaava
Perusajatus on yksinkertainen: lasketaan tekstissä esiintyvien "vaikeiden" sanojen osuus verrattuna kaikkiin sanoihin, mitataan lauseiden keskipituus ja yhdistetään nämä luvut kaavalla. Dale–Challin yleisimmin käytetty muoto on
- ASL = average sentence length (keskiarvo sanoja per lause)
- PDW = percentage of difficult words (vaikeiden sanojen prosenttiosuus, eli sellaiset sanat, joita ei ole "helppojen" sanojen listassa)
Itse laskukaava on:
raw score = 0.1579 × PDW + 0.0496 × ASL
Jos PDW on yli 5 % (eli vaikeita sanoja on yli viisi prosenttia sanoista), lisätään pisteihin korjausvakio 3.6365. Lopputulos tulkitaan asteikkona, joka kertoo lukijaryhmän tai koululuokan, jolle teksti tyypillisesti sopii.
Kuinka kaava lasketaan käytännössä
- Jaa teksti lauseisiin ja laske lauseiden lukumäärä.
- Laske tekstin sanamäärä ja laske ASL = sanojen määrä / lauseiden määrä.
- Tarkista jokainen sana helppojen sanojen listasta; niitä, joita listassa ei ole, pidetään "vaikeina". Laske PDW = (vaikeiden sanojen määrä / kaikkien sanojen määrä) × 100.
- Sovella yllä annettua kaavaa ja lisää korjausvakio 3.6365, jos PDW > 5 %.
Lyhyt esimerkki
Oletetaan tekstissä 200 sanaa ja 10 lausetta (ASL = 20). Jos vaikeita sanoja on 20, niin PDW = (20/200)×100 = 10. Lasketaan raw score:
raw = 0.1579×10 + 0.0496×20 = 1.579 + 0.992 = 2.571. Koska PDW > 5 %, lisätään 3.6365 → lopullinen pisteytys ≈ 6.2075.
Tämän pistemäärän tulkinta riippuu käytetystä taulukosta, mutta korkeampi luku tarkoittaa vaikeampaa tekstiä.
Edut ja rajoitukset
- Edut: Dale–Chall korostaa sanaston merkitystä ja toimii hyvin silloin, kun halutaan tietää, kuinka tuttu sanasto on tietylle lukijaryhmälle. Kaava on yksinkertainen ja helppo automatisoida tietokoneella.
- Rajoitukset: Kaava ei mittaa lauserakenteen monimutkaisuutta tai tekstin semanttista vaikeutta. Erityisesti erikoistermit, nimet ja lainasanat voivat nostaa PDW:tä vaikka teksti olisi muuten selkeä. Kaava on alkujaan kehitetty englannille; eri kielille tarvitaan omat helppojen sanojen listat ja mahdolliset parametrisovitukset.
Tietokoneellinen toteutus ja käytännön sovellukset
Sanastoluettelon käyttö on helppo integroida tietokonepohjaiseen luettavuusmittaukseen: luettelo järjestetään hakutaulukoksi tai hajautustaulukoksi ja jokainen tekstin sana tarkistetaan sitä vasten. Sanaluettelossa olevien sanojen prosenttiosuus tekstissä antaa PDW-arvon, ja kaavan lopputulos esitetään käyttäjälle luokka-asteena tai suosituksena (esim. sopii tämän-ikäisille lukijoille tai vaatii sanaston selitystä).
Kaavaa käytetään yhä oppimateriaalien arvioinnissa, verkkosisällön analysoinnissa ja tutkimuksessa, mutta usein sen tuloksia käytetään yhdessä muiden luettavuusmittareiden (esim. Flesch–Kincaid) ja manuaalisen arvioinnin kanssa kattavamman kuvan saamiseksi.
Vertailu ja päivitykset
Dale–Chall eroaa esimerkiksi Flesch–Kincaid -mittareista siinä, että se painottaa sanaston tuttavuutta eikä pelkästään lauseiden ja sanojen pituutta. Vuoden 1995 päivityksen jälkeen lista on ollut käytännöllisempi nykyaikaisissa teksteissä, mutta sanaston muutos ja uudet sanastot (esim. digitaaliset termit) vaativat säännöllistä päivitystä, jos kaavaa halutaan käyttää luotettavasti nykykielessä.
Yhteenvetona: Dale–Challin kaava on hyödyllinen työkalu sanastopohjaiseen luettavuusarvioon, erityisesti opetuksen ja oppimateriaalien suunnittelussa, mutta sen tuloksia kannattaa tulkita tiedostaen kaavan rajoitukset ja täydentää muilla arviointimenetelmillä.