Keskivirhe on tilaston otantajakauman keskihajonta. Termiä voidaan käyttää myös estimaatista (hyvä arvaus), joka saadaan koko joukosta otetusta otoksesta. Keskivirhe kertoo, kuinka paljon saman kokoisista otoksista laskettu estimaatti (esim. keskiarvo) tyypillisesti vaihtelee otoksesta toiseen.
Ryhmän jonkin osan (jota kutsutaan otokseksi) keskiarvo on tavanomainen tapa arvioida koko ryhmän keskiarvo. Koko ryhmän mittaaminen on usein liian vaikeaa tai maksaa liikaa rahaa. Jos kuitenkin mitataan toinen otos, sen keskiarvo on hieman erilainen kuin ensimmäisen otoksen. Keskiarvon keskivirhe on tapa tietää, kuinka lähellä otoksen keskiarvo on koko ryhmän keskiarvoa. Se ilmaisee, kuinka varma voit olla otoksen keskiarvosta.
Todellisissa mittauksissa koko ryhmän keskiarvon keskihajonnan todellista arvoa ei yleensä tiedetä. Niinpä termiä keskivirhe käytetään usein tarkoittamaan koko ryhmän todellista arviota. Mitä enemmän mittauksia otoksessa on, sitä lähempänä koko ryhmän todellista lukua arvaus on.
Määritelmä ja yleisimmät kaavat
Keskivirhe (standard error, SE) riippuu estimaatista. Yleisimmät kaavat:
- Keskimääräisen (keskiarvon) keskivirhe: kun populaation varianssi σ² tunnetaan: SE = σ / √n.
- Kun populaation keskihajontaa σ ei tunneta ja käytetään otoskeskihajontaa s: SE = s / √n, missä n on otoskoko.
- Osuuden (proportion) keskivirhe binomijakaumassa: SE = √(p̂(1−p̂)/n), missä p̂ on otososuus.
Tulkinta ja käyttö
Keskivirhe kertoo estimaatin otos‑otokselta tapahtuvan vaihtelun suuruuden. Pieni SE tarkoittaa, että eri otoksista saadut estimaatit ovat yleensä lähellä toisiaan ja siten luotettavampia. SE käyttää usein luottamusvälien ja hypoteesitestien laskemiseen:
- Esimerkiksi 95 % luottamusväli keskiarvolle ≈ otoskeskiarvo ± 1,96 × SE (kun normaalisuus tai keskimmäinen raja-arvolauseke pätee).
- Hypoteesitestauksessa SE tarvitaan testisuureiden (esim. z- tai t‑arvon) laskemiseen.
Yksinkertainen laskuesimerkki
Oletetaan otoskoko n = 25, otoskeskihajonta s = 10 ja otoskeskiarvo x̄ = 50. Keskivirhe lasketaan:
SE = s / √n = 10 / √25 = 10 / 5 = 2.
95 % luottamusväli ≈ 50 ± 1,96 × 2 = 50 ± 3,92 → (46,08; 53,92).
Lisähuomioita ja käytännön seikat
- Keskivirhe vs. keskihajonta: Keskihajonta kuvaa yksittäisten havaintojen hajontaa populaatiossa; keskivirhe kuvaa estimaatin (esim. otoskeskiarvon) hajontaa eri otoksissa. Ne kuvaavat eri asiaa, vaikka molemmat käyttävät samoja yksiköitä.
- Riippuvuus otoskoosta: SE pienenee n:n mukana suhteessa √n:ään. Jos n nelinkertaistetaan, SE puolittuu.
- Finito‑populaatio: Kun otos on merkittävä osa koko populaatiosta (esim. yli ~5–10 %), käytetään finito‑korjausta: SE_f = (σ/√n) × √((N−n)/(N−1)), missä N on populaation koko.
- Ehdot: Oletetaan yleensä, että otos on satunnaisotos ja että havaintojen jakauma on riittävän "hyvä" (esim. normaalinen tai suuri n, jolloin keskeinen raja‑arvolause pätee). Muussa tapauksessa SE‑estimaatin tulkintaa on arvioitava varovaisesti.
- Muilla estimaateilla: Keskivirhe voidaan laskea myös muille tilastollisille estimaateille (erojen, regressiokertoimien, mediaanin ym. tapauksissa) käyttäen sopivia kaavoja tai bootstrap‑menetelmiä.
Yhteenveto
Keskivirhe on keskeinen käsite tilastotieteessä: se mittaa, kuinka paljon estimaatti vaihtelee satunnaisotosten välillä ja kertoo, kuinka tarkka arvio on. Tuntemalla keskivirheen voit rakentaa luottamusvälejä, tehdä hypoteesitestejä ja suunnitella otoskokoja järkevästi.



.jpg)