Frekvenssitodennäköisyys (frekventismi) — määritelmä ja keskeiset ajattelijat
Frekvenssitodennäköisyys (frekvenssismi) — selkeä määritelmä, keskeiset ajattelijat (von Mises, Neyman, Fisher ym.) ja käytännön näkökulmat tilastotieteessä.
Frekvenssitodennäköisyys eli frekvenssismi on yksi todennäköisyysteorian tulkinnoista. Perusajatus on yksinkertainen: jos tieteellinen koe tai sattumanvarainen tapahtuma toistetaan pitkän ajan kuluessa monta kertaa, voidaan laskea, kuinka usein jokin tietty tapahtuma esiintyy suhteessa kokeiden kokonaismäärään. Todennäköisyys määritellään tällöin tapahtuman suhteellisena esiintymistiheytenä pitkässä juoksussa (engl. long-run frequency). Käytännössä tätä ilmaistaan usein muotoon P(A) = lim_{n→∞} k/n, missä k on tapahtuman A esiintymiskertojen määrä n kokeessa.
Keskeiset periaatteet
Frekvenssismi korostaa seuraavia seikkoja:
- Objektiivisuus: todennäköisyys on ominaisuus toistettavasta ilmiöstä, ei subjektivinen uskomus.
- Long-run‑näkemys: todennäköisyydet määritellään suhteellisina frekvensseinä äärettömän pitkissä toistoketjuissa.
- Empiirinen mittaus: todennäköisyydet voidaan arvioida keräämällä havaintoja ja laskemalla frekvenssit.
Keskeiset ajattelijat ja heidän kontribuutionsa
- John Venn — 1800-luvun lopulla Venn kannatti todennäköisyyden ymmärtämistä suhteellisena esiintymistiheytenä ja kirjoitti siitä yleiskielisesti ymmärrettäviä tekstejä. John Venn on mainittu alkuperäisessä tekstissä.
- Richard von Mises — ehdotti frekvenssipohjaista perustelua todennäköisyydelle käyttämällä niin kutsuttuja "collectives" eli pitkän juoksun eriä, joissa suhteellinen frekvenssi lähestyy rajaarvoa.
- R. A. Fisher — kehitti tilastollisen päättelyn työkaluja (esim. suurimman uskottavuuden estimointi, significance‑testit), joita usein käytetään frekvenssistisesta näkökulmasta käsin.
- Jerzy Neyman ja Egon Pearson — muodostivat Neyman–Pearson‑kehyksen, joka formalisoitiin hypoteesien testaamiseksi, ja toivat mukaan käsitteet kuten tyypin I ja II virheet sekä testien teho.
Sovellukset käytännössä
Frekvenssistä tulkintaa käytetään laajalti monilla aloilla, esimerkiksi:
- Laadunvalvonnassa ja teollisuudessa (esim. viallisten osien osuus pitkässä tuotantosarjassa).
- Kliinisissä kokeissa ja epidemiologiassa, joissa tarkastellaan hoitotulosten esiintyvyyttä populaatiossa toistettavissa tutkimuksissa.
- Perinteisessä hypotestauksessa, p‑arvojen ja luottamusvälien tulkinnassa (frequenssinen tulkinta ei anna todennäköisyyttä yksittäiselle hypoteesille, vaan kertoo testin pitkän ajan ominaisuuksista).
Yksinkertainen esimerkki
Kolikon heiton tapauksessa frekvenssismi määrittelisi kruunan todennäköisyyden kertomalla, kuinka monta kertaa kruuna esiintyy n heitossa ja katsomalla suhdetta k/n, kun n kasvaa suureksi. Esimerkiksi 1000 heitossa 600 kruunaa antaa suhteellisen frekvenssin 0,6, joka on arvio todellisesta todennäköisyydestä.
Rajoituksia ja kritiikkiä
Frekvenssismiin liittyy myös useita rajoituksia ja esitettyä kritiikkiä:
- Yksittäistapaukset: frekvenssismi ei suoraan anna mielekästä todennäköisyyslukua yksittäiselle, ainutkertaiselle tapahtumalle (esimerkiksi tietyn potilaan paranemiselle yhden hoitokokeen jälkeen).
- Ideaalinen äärettömyys: käsitys luotettavasta todennäköisyydestä perustuu usein ajatukseen äärettömän monista toistoista, mikä on todellisessa maailmassa ideaalitapaus.
- Riippuvuus kokeen suunnittelusta: frekvenssi riippuu kokeen toistettavuudesta ja olosuhteiden pysyvyydestä; erilaiset kokeen asetelmat voivat antaa erilaiset frekvenssit.
- Sivuuttaa subjektivisen informaation: frekvenssi ei ota huomioon ennakkotietoa tai asiantuntijan uskomuksia samalla tavalla kuin bayesilainen lähestymistapa.
Muita todennäköisyyden tulkintoja ovat Bayesin todennäköisyys ja aksiomaattinen todennäköisyysteoria. Nykytilanteessa käytännön tilastotieteessä frekvenssiset menetelmät rinnastuvat bayesilaisiin menetelmiin: kumpikin lähestymistapa tarjoaa työkaluja eri tarkoituksiin ja tulkinnat poikkeavat erityisesti siinä, miten todennäköisyyden merkitys ymmärretään ja millaista lisätietoa voidaan sisällyttää analyysiin. Frekvenssinen ajattelu on kuitenkin säilyttänyt keskeisen asemansa erityisesti klassisessa hypoteesitestauksessa, laadunvalvonnassa ja monissa tieteellisissä käytännöissä.
Kysymyksiä ja vastauksia
K: Mikä on todennäköisyysteorian taajuustodennäköisyystulkinta?
V: Taajuustodennäköisyys on yksi todennäköisyysteorian tulkinnoista. Se perustuu siihen, että tieteellinen koe toistetaan monta kertaa ja lasketaan, kuinka monta kertaa tietty tapahtuma tapahtuu.
K: Miksi frekvenssitodennäköisyys on tärkeää tilastojen kannalta?
V: Frekvenssitodennäköisyys on tärkeä tilastotieteen kannalta, koska sen avulla voidaan verrata tietyn tapahtuman esiintymiskertojen lukumäärää kokeiden kokonaismäärään, mikä voi antaa tietoa tulevien tapahtumien todennäköisyydestä.
K: Miksi kutsutaan ihmisiä, jotka käyttävät frekvenssitodennäköisyystulkintaa?
V: Frekvenssitodennäköisyystulkintaa käyttäviä ihmisiä kutsutaan usein frekvenssistiksi.
K: Keitä ovat tunnetut frequentistit?
V: Tunnettuja frequentisteja ovat muun muassa Richard von Mises, Egon Pearson, Jerzy Neyman, R. A. Fisher ja John Venn.
K: Mitä muita todennäköisyystulkintoja on frekvenssitodennäköisyyden lisäksi?
V: Muita todennäköisyyden tulkintoja ovat Bayesin todennäköisyys ja aksiomaattinen todennäköisyysteoria.
K: Miten frekvenssitodennäköisyys toimii?
V: Frekvenssitodennäköisyys toimii laskemalla, kuinka monta kertaa tietty tapahtuma esiintyy tietyssä määrässä kokeita, ja vertaamalla sitä kokeiden kokonaismäärään, jotta voidaan määrittää tulevien tapahtumien todennäköisyys.
K: Mikä on frekvenssitodennäköisyyden ja tieteellisten kokeiden välinen suhde?
V: Frekvenssitodennäköisyys perustuu tieteellisten kokeiden toistamiseen monta kertaa ja tulosten analysointiin, jotta saadaan tietoa tulevien tapahtumien todennäköisyydestä.
Etsiä