Sanasto on yksinkertaisesti luettelo sanoista — mutta kielitieteessä ja arkikielessä sanastolla tarkoitetaan yleensä kaikkia niitä sanoja, jotka henkilö tuntee tai käyttää tietyssä kielellisessä kontekstissa.

Määritelmä ja eri tavoin mitattava sanavarasto

Sanavarasto voidaan jakaa ainakin kahteen päätyyppiin:

  • Passiivinen (receptiivinen) sanavarasto: sanat, joita henkilö ymmärtää kuunnellessaan tai lukiessaan mutta ei välttämättä käytä itse.
  • Aktiivinen (produktiivinen) sanavarasto: sanat, joita henkilö käyttää puheessa tai kirjoittaessa.

Nämä erot selittävät sen, miksi käsitys sanoista voi olla suurempi kuin aktiivinen sanavarasto: kuullunymmärtämisen ja lukemisen sanavarasto on usein suurempi kuin puhumisen tai kirjoittamisen sanavarasto.

Sanavaraston koko — arvioita ja mittaustapoja

Sanavaraston koosta on useita arviointitapoja. Yksittäinen sanakirja listaa tyypillisesti kymmeniä tai satoja tuhansia sanoja — yhdessä tunnetussa esimerkissä voi olla jopa 500 000 (puoli miljoonaa) sanaa. Koska eri sanakirjat sisältävät eri sanastoja, kaikkien sanakirjojen yhteenlaskettu määrä voi olla suurempi (esimerkiksi noin 750 000 sanaa englannin kielellä), ja todellista kokonaismäärää on vaikea määritellä tismalleen.

Yksittäisen ihmisen sanavaraston laajuus vaihtelee iän, koulutuksen, ammatin ja harrastusten mukaan. Esimerkiksi:

  • Viisivuotias lapsi osaa arvioiden mukaan 4 000–5 000 sanaa.
  • Aikuiset, jotka opiskelevat yliopistossa, saattavat tuntea noin 20 000 sanaa aktiivisesti tai passiivisesti.

Arviointi perustuu erilaisiin testeihin: sanalistakokeisiin, tekstikorpusten analyysiin, sanaperehtymistesteihin ja sananlöytötehtäviin. On myös eroja siinä, lasketaananko sanaston yksittäiset taivutusmuodot (word forms) vai perusmuodot/lemmas (esim. runo, runot, runossa laskettaisiin usein yhdeksi lemma-tasoiseksi sanaksi). Lisäksi sanaperheet (word families) — esimerkiksi runo, runoilija, runollinen — voidaan laskea yhdeksi laajemmaksi perheeksi.

Yleisimmät sanat ja niiden ominaisuudet

Sanastotutkimuksissa havaitaan, että kielen yleisimmin käytetyt sanat ovat usein lyhyitä ja hyvin yleiskielisiä. Tämä pätee monissa kielissä: englannin 50 yleisimmän sanan joukossa useimmat ovat alle seitsemän kirjainta ja monissa alle neljän kirjainta. Frekvenssijakauma (esimerkiksi Zipfin laki) tarkoittaa, että pieni joukko sanoja esiintyy teksteissä ja puheessa erittäin usein, kun taas suurin osa sanoista on harvinaisia.

Kielen muutos ja uudet sanat

Kielen sanasto muuttuu jatkuvasti: uusia sanoja syntyy, vanhojen merkitys muuttuu ja jotkut sanat jäävät pois käytöstä. Esimerkiksi tietokoneita koskevat termit, kuten "download", ovat uusia tai muuttaneet asemaansa kielessä; kulttuuriset virtaukset tuovat mukanaan sanoja, kuten hip hop -kulttuurista tullut "bling" (bling) tai arkikielen "cool", joka on saanut uusia merkityksiä ajan myötä. Myös lainasanat ja teknologia vaikuttavat sanaston laajenemiseen — erityisesti globaalit mediat ja internet nopeuttavat muutosta.

Miksi emme tarvitse kaikkia sanoja?

Vaikka kielessä voisi olla satoja tuhansia sanoja, useimmat arkipäivän asiat voi ilmaista rajoitetulla sanamäärällä. Opiskelun ja viestinnän näkökulmasta usein noin 3 000–5 000 yleisintä sanaa kattaa suuren osan jokapäiväisestä viestinnästä ja tekstien ymmärtämisestä. Tämä selittää kysymyksen: "Jos sanoja on 750 000, miten voimme puhua vain 3 000 sanalla?" — vastaus on, että useimmat tarpeet hoituvat pienellä, mutta tehokkaalla perussanastolla ja kontekstilla.

Miten kasvattaa sanavarastoa?

Sanaston kehittäminen on tärkeää sekä kielen oppijoille että äidinkielen puhujille. Käytännön keinoja:

  • Lue monipuolisesti: kirjat, artikkelit ja eri tyylilajit laajentavat sekä yleistä että erikoissanastoa.
  • Käytä uusia sanoja aktiivisesti puheessa ja kirjoituksessa, jotta passiivinen sana muuttuu aktiiviseksi.
  • Opettele sanaperheitä (esim. juosta, juoksu, juoksija) ja sanaluokkien muutoksia, jotta opit useampia muotoja yhdellä opettelukerralla.
  • Käytä muistitekniikoita, sanakortteja tai sovelluksia, jotka perustuvat toistoon ja kontekstiin.
  • Kiinnitä huomiota sanan yleisyyteen ja käyttöyhteyteen: tärkeimmät sanat kannattaa oppia ensin.

Lopuksi

Sanasto on elävä ja moniulotteinen ilmiö: sen koko riippuu laskutavasta, mittaustavasta ja siitä, mihin tarkoitukseen sanavarastoa mitataan. Ero aktiivisen ja passiivisen sanaston välillä on keskeinen, ja sanojen yleisyys sekä kulttuurinen muutos ohjaavat sitä, mitä sanoja ihmiset oppivat ja käyttävät.