Keskihajonta on luku, jota käytetään kertomaan, miten ryhmän mittaustulokset poikkeavat keskiarvosta (keskiarvosta tai odotusarvosta). Pieni keskihajonta tarkoittaa, että useimmat luvut ovat lähellä keskiarvoa, kun taas suuri keskihajonta tarkoittaa, että luvut ovat enemmän hajallaan.

Ilmoitettu virhemarginaali on yleensä kaksi kertaa keskihajonta. Tutkijat ilmoittavat yleisesti kokeissa esiintyvien lukujen keskihajonnan keskimääräisestä luvusta. He päättävät usein, että vain kaksi- tai kolminkertaista keskihajontaa suuremmat erot ovat tärkeitä. Keskihajonta on käyttökelpoinen myös rahassa, jossa korkotulojen keskihajonta osoittaa, kuinka paljon yhden henkilön korkotulot voivat poiketa keskiarvosta.

Usein voidaan mitata vain näyte tai osa ryhmästä. Tällöin voidaan löytää koko ryhmän keskihajontaa lähellä oleva luku hieman erilaisella yhtälöllä, jota kutsutaan otoksen keskihajonnaksi ja joka selitetään jäljempänä. Tällöin koko ryhmän keskihajonta esitetään kreikkalaisella kirjaimella {\displaystyle \sigma }ja otoksen hajontaa {\displaystyle s}




 

Keskihajonnan laskukaavat

Koko populaation keskihajonta (σ) lasketaan kaavalla

σ = sqrt( (1/N) Σ_{i=1}^N (x_i − μ)^2 )

missä N on populaation koko, x_i ovat havaintoja ja μ on populaation keskiarvo.

Otoksen (näytteen) keskihajonta (s) lasketaan tyypillisesti kaavalla, joka sisältää Besselin korjauksen:

s = sqrt( (1/(n−1)) Σ_{i=1}^n (x_i − x̄)^2 )

missä n on otoskoko, x̄ on otoksen keskiarvo. Jakaminen (n−1):llä korjaa otosvarianssin ala- tai yliarviointia ja antaa paremman arvion populaation varianssista.

Esimerkki laskusta

Data: 2, 4, 4, 4, 5, 5, 7, 9 (n = 8)

1) Laske keskiarvo: x̄ = (2+4+4+4+5+5+7+9)/8 = 40/8 = 5

2) Erotukset ja neliöt: (2−5)^2=9, (4−5)^2=1, …, (9−5)^2=16. Näiden neliöiden summa = 32.

3) Populaation varianssi (jos nämä olisivat koko populaatio): σ^2 = 32/8 = 4 → σ = 2.

4) Otoksen varianssi (jos kyseessä on näyte populaatiosta): s^2 = 32/(8−1) ≈ 4,571 → s ≈ 2,14.

Tulkinta ja käytännön huomioita

  • Yksikkö: Keskihajonta on samassa yksikössä kuin alkuperäiset havainnot (esim. senttimetreissä, euroissa).
  • Pieni vs. suuri: Pieni keskihajonta kertoo, että arvot ovat kohtuullisen lähellä keskiarvoa. Suuri keskihajonta kertoo suurista vaihteluista.
  • Herkkyys ääripäille: Keskihajonta reagoi voimakkaasti poikkeaviin arvoihin (outliereihin). Jos data sisältää paljon ääripäitä, keskihajonta voi antaa harhaanjohtavan kuvan hajonnasta—tällöin vaihtoehtoja ovat mm. mediaaniin perustuva keskipoikkeama (MAD) tai kvartiiliväli (IQR).
  • Suhde varianssiin: Varianssi on keskihajonnan neliö (σ^2 tai s^2). Varianssia käytetään monissa matemaattisissa johtopäätöksissä, mutta se on eri yksikössä kuin alkuperäinen muuttuja.
  • Normaaliarvon sääntö: Jos data on likimain normaalijakautunutta, noin 68 % arvoista on yhden keskihajonnan sisällä, 95 % kahden ja 99,7 % kolmen sisällä (ns. 68–95–99,7-sääntö).
  • Virhemarginaali ja keskivirhe: Monet tekstit mainitsevat, että virhemarginaali on "noin kaksi kertaa" jokin arvo. On tärkeää erottaa keskihajonta ja keskivirhe (standard error). Keskivirhe (SE) on otoksen keskihajonta jaettuna juurella otoskoosta: SE = s / sqrt(n). Luottamusvälin leveys (virhemarginaali) perustuu yleensä SE:ään (esim. noin 2·SE ~ 95 % luottamusväli normaalijakaumalle), ei suoraan yksittäiseen havaintojen keskihajontaan.

Käyttökohteet

Keskihajontaa käytetään lähes kaikissa tilastollisissa analyyseissä: kuvailevassa tilastotieteessä vaihtelun mittarina, hypoteesitestauksessa, regressioanalyysissä ja riskin mittaamisessa rahoituksessa (esim. tuottojen volatiliteetti).

Yhteenveto

Keskihajonta on keskeinen mittari, joka kertoo kuinka paljon havaintosi yleensä poikkeavat keskiarvosta. Muista erottaa populaation ja otoksen laskukaavat, huomioida outlierien vaikutus ja käyttää keskivirhettä, kun arvioit keskiarvon tarkkuutta ja lasket virhemarginaaleja.