Todennäköisyysteoriassa ja sovelluksissa Bayesin teoreema osoittaa ehdollisen todennäköisyyden ja sen käänteisen muodon välisen suhteen. Esimerkiksi hypoteesin todennäköisyys joidenkin havaittujen todisteiden perusteella ja todisteiden todennäköisyys hypoteesin perusteella. Tämä teoreema on nimetty Thomas Bayesin (/ˈbeɪz/ tai "bays") mukaan, ja sitä kutsutaan usein Bayesin laiksi tai Bayesin säännöksi.




 

Mitä Bayesin teoreema sanoo

Yksinkertaisessa muodossaan Bayesin teoreema antaa kaavan ehdolliselle todennäköisyydelle:

P(H|E) = P(E|H) · P(H) / P(E)

Missä

  • P(H|E) on posterioritodennäköisyys: hypoteesin H todennäköisyys, kun todisteet E ovat havaitut.
  • P(E|H) on likelihood eli todisteiden todennäköisyys hypoteesin H vallitessa.
  • P(H) on prior: hypoteesin ennakkotodennäköisyys ennen E-havaintoa.
  • P(E) on marginaalitodennäköisyys (todennäköisyys havainnoille), usein laskettavissa summana tai integraalina kaikista mahdollisista hypoteeseista.

Esimerkki: lääketieteellinen testi

Kuvitellaan sairauden esiintyvyys (prevalenssi) on 1 %: P(D) = 0,01. Testi on herkkyydeltään 99 % (P(+|D) = 0,99) ja spesifisyydeltään 95 % (P(-|¬D) = 0,95, joten virhepositiivisuus P(+|¬D) = 0,05). Mikä on todennäköisyys sairaudelle, jos testi on positiivinen?

Käyttämällä Bayesia:

P(D|+) = P(+|D) P(D) / [P(+|D) P(D) + P(+|¬D) P(¬D)] = (0,99·0,01) / (0,99·0,01 + 0,05·0,99) ≈ 0,167.

Tuloksena positiivisen testin jälkeen sairauden todennäköisyys on noin 16,7 %, eli vaikka testi on hyvä, harvinainen tauti johtaa usein edelleen suureen osaan vääriä hälytyksiä — se on klassinen Bayesin teoreeman käytännön havainnollistus.

Käytännön käsitteitä ja laajennuksia

  • Jatkuvat jakaumat: Bayesin menetelmiä käytetään myös jatkuville parametreille, jolloin summan sijasta käytetään integraalia ja tiheitä.
  • Konjugaattiset prioreet: Valitsemalla priorin, joka on konjugaatti likelihoodin kanssa, saadaan posteriorille sama perhe ja usein suljettu muoto, mikä helpottaa laskentaa.
  • MAP-estimaatti: Maksimi-a-posteriori (MAP) on posteriorin huippuarvo, vastaava pisteestimaatti.
  • Bayesilainen epävarmuus: Posteriorijakauma antaa koko epävarmuuden määrän parameterista, ei vain yksittäistä pistettä.
  • Luottamusvälin sijasta credible interval: Bayesilainen interval-tulkinta on suoraviivainen: esimerkiksi 95 % credible interval sisältää parametrin 95 % todennäköisyydellä posteriorin mukaisesti.

Laskennalliset menetelmät

Usein posteriorin analyysi ei ole analyyttisesti ratkaistavissa, jolloin käytetään numeerisia menetelmiä:

  • MCMC (Markov chain Monte Carlo) — tuottaa näytteitä posteriorijakaumasta.
  • Importance sampling ja sequential Monte Carlo — näytteiden painottamista ja päivitystä.
  • Variational inference — approksimoi posteriorin optimoimalla yksinkertaisemman jakauman.

Sovelluksia

  • Luokittelu ja koneoppiminen (esim. Naive Bayes-luokitin).
  • Diagnostiikka ja lääketieteellinen päätöksenteko.
  • Bayesilainen verkostoanalyysi ja syy-seurausmallit.
  • Signaalinkäsittely, paikannus ja sensorifuusio.
  • A/B-testaukset ja jatkuva oppiminen päätöksenteossa.

Vahvuudet ja rajoitukset

Bayesin teoreema antaa johdonmukaisen tavan päivittää uskomuksia uusien todisteiden perusteella ja ottaa huomioon aiempitiedon. Sen käytännön haasteita ovat priorin valinta (voi vaikuttaa tuloksiin erityisesti vähän dataa sisältävissä tapauksissa) ja laskennallinen monimutkaisuus suurissa tai monimutkaisissa malleissa.

Lyhyt yhteenveto

Bayesin teoreema on perusta bayesilaiselle päättelylle: se yhdistää priorin ja havaintojen kautta saadun tiedon posterioriksi. Se on sekä matemaattinen kaava että filosofinen tapa tulkita todennäköisyyksiä mielipiteiden tai uskottavuuksien mittana, ja se on laajasti käytössä tilastotieteessä, koneoppimisessa ja monilla sovellusalueilla.