Matematiikassa ja tilastotieteessä keskiarvo on eräänlainen keskiarvo. Keskiarvon lisäksi on olemassa muitakin keskiarvon lajeja, ja myös keskiarvoja on muutamia.

Aritmeettinen keskiarvo on yleisin tapa mitata aineiston keskikohtaa. Se lasketaan summaamalla kaikki arvot yhteen ja jakamalla summa arvojen lukumäärällä. Merkitään usein x̄ (lue "iks-palkki") otoksen keskiarvolle ja μ populaation keskiarvolle.

Esimerkki

Olkoon havaintosarja 1, 2, 2, 2, 100, 100. Summa on 1 + 2 + 2 + 2 + 100 + 100 = 207 ja havaintoja on 6, joten aritmeettinen keskiarvo on 207 / 6 = 34,5. Tästä voidaan huomata, että keskiarvo voi olla harhaanjohtava, jos joukossa on hyvin suuria tai pieniä arvoja (ns. poikkeavat havainnot eli outlierit): tässä esimerkissä kukaan ei saanut arvoa 34,5 eikä se kuvaa aineiston "tyypillistä" pistemäärää kovin hyvin.

Muuta tavallista keskiosuutta kuvaavaa mittaria

  • Mediaani: järjestetyn aineiston keskimmäinen arvo. Jos havaintoja on parillinen määrä, mediaani on kahden keskimmäisen arvojen keskiarvo. Mediaani on robustimpi poikkeaville havainnoille: yllä olevassa esimerkissä mediaani on (3. ja 4. arvo) = 2.
  • Modus (moodiarvo): yleisin arvo aineistossa. Esimerkissämme modus on 2, koska se esiintyy useimmin.
  • Painotettu keskiarvo: käytetään, kun eri havainnoilla on eri merkitys. Lasketaan kaavalla sum(wi·xi) / sum(wi), missä wi ovat painoja.
  • Geometrinen keskiarvo: (x1·x2·...·xn)^(1/n), sopii kuvaamaan kasvukertoimia tai suhteellisia muutoksia. Edellyttää yleensä positiivisia arvoja.
  • Harmoninen keskiarvo: n / sum(1/xi), käyttökelpoinen esimerkiksi keskinopeuksissa (kun keskimääräinen nopeus lasketaan eri matkoille). Myös vaatii positiivisia arvoja.
  • Trimmaamaton ja winsorisoitu keskiarvo: poistaa tai korvaa äärimmäisiä arvoja ennen keskiarvon laskemista, jolloin tuloksesta tulee vähemmän herkkä outliereille.

Milloin käyttää mitä

  • Käytä aritmeettista keskiarvoa, kun arvot ovat symmetrisesti jakautuneet ja poikkeavia havaintoja ei ole paljon.
  • Käytä mediaania, kun aineisto on vino tai siinä on poikkeavia arvoja, ja haluat kuvailla "tyypillistä" arvoa.
  • Käytä moodia kategorisissa aineistoissa tai silloin, kun haluat tietää yleisimmän yksittäisen arvon.
  • Geometrinen keskiarvo sopii kasvuprosenteille ja suhteellisille muutoksille; harmoninen keskiarvo sopii tilanteisiin, joissa keskimääräistetään suhdelukuja (esim. nopeudet).
  • Painotettu keskiarvo, kun eri havainnoilla on eri tärkeys tai eri havaintomäärät.

Lyhyitä huomioita

  • Tilastollinen tulkinta: otoksen keskiarvo on usein käytetty estimaatti populaation keskiarvolle ja se on odotusarvoltaan tasapainossa (eli ei-biased).
  • Optimointi: aritmeettinen keskiarvo minimoi neliöllisten poikkeamien summan (∑(xi − c)^2), kun taas mediaani minimoi itseisarvojen summan (∑|xi − c|).
  • Rajoitukset: geometrinen ja harmoninen keskiarvo edellyttävät yleensä positiivisia lukuja; painotetussa keskiarvossa painojen tulee olla ei-negatiivisia ja mielellään positiivisia.

Keskiarvo on siis yksi tapa tiivistää aineiston keskeistä suuntaa, mutta aina kannattaa tarkastella myös mediaania, moodia, hajontaa (esim. keskihajonta) ja aineiston jakaumaa ennen johtopäätösten tekemistä.