Simpsonin paradoksi
Simpsonin paradoksi on tilastollinen paradoksi. Se on nimetty brittiläisen tilastotieteilijän Edward H. Simpsonin mukaan, joka kuvasi sen ensimmäisen kerran vuonna 1951. Tilastotieteilijä Karl Pearson kuvasi hyvin samanlaisen ilmiön vuonna 1899.- Udny Yulen kuvaus on vuodelta 1903. Joskus sitä kutsutaan Yule-Simpson-ilmiöksi. Kun tarkastellaan ryhmien tilastollisia pistemääriä, nämä pisteet voivat muuttua riippuen siitä, tarkastellaanko ryhmiä yksitellen vai yhdistetäänkö ne suuremmaksi ryhmäksi. Tämä tapaus esiintyy usein yhteiskuntatieteissä ja lääketieteellisissä tilastoissa. Se voi hämmentää ihmisiä, jos frekvenssitietoja käytetään selittämään syy-yhteyttä. Muita nimiä paradoksille ovat muun muassa käänteisparadoksi ja yhdistämisparadoksi.
Esimerkki: Munuaiskivien hoito
Tämä on tosielämän esimerkki lääketieteellisestä tutkimuksesta, jossa verrattiin kahden munuaiskivien hoidon onnistumisprosenttia.
Taulukossa esitetään onnistumisprosentit ja hoitojen määrät sekä pieniä että suuria munuaiskiviä koskevissa hoidoissa, joissa hoito A sisältää kaikki avoimet toimenpiteet ja hoito B on perkutaaninen nefrolitotomia:
Hoito A | Hoito B | |||
menestys | epäonnistuminen | menestys | epäonnistuminen | |
Pienet kivet | Ryhmä 1 | Ryhmä 2 | ||
potilaiden määrä | 81 | 6 | 234 | 36 |
93% | 7% | 87% | 13% | |
Suuret kivet | Ryhmä 3 | Ryhmä 4 | ||
potilaiden määrä | 192 | 71 | 55 | 25 |
73% | 27% | 69% | 31% | |
Molemmat | Ryhmä 1+3 | Ryhmä 2+4 | ||
potilaiden määrä | 273 | 77 | 289 | 61 |
78% | 22% | 83% | 17% |
Paradoksaalinen johtopäätös on, että hoito A on tehokkaampi, kun sitä käytetään pieniin kiviin ja myös kun sitä käytetään suuriin kiviin, mutta hoito B on tehokkaampi, kun molemmat kivikoot käsitellään samanaikaisesti. Tässä esimerkissä ei tiedetty, että munuaiskiven koko vaikuttaa tulokseen. Tätä kutsutaan tilastotieteessä piilomuuttujaksi (tai piileväksi muuttujaksi).
Se, mitä hoitoa pidetään parempana, määräytyy kahden suhdeluvun (onnistumiset/kokonaismäärät) välisen epätasa-arvon perusteella. Simpsonin paradoksin synnyttävä suhteiden välisen epätasapainon kääntyminen päinvastaiseksi johtuu siitä, että kaksi vaikutusta esiintyy yhdessä:
- Niiden ryhmien koot, jotka yhdistetään, kun lurking-muuttujaa ei oteta huomioon, ovat hyvin erilaisia. Lääkäreillä on taipumus antaa vakaville tapauksille (suuret kivet) parempaa hoitoa (A) ja lievemmille tapauksille (pienet kivet) huonompaa hoitoa (B). Tämän vuoksi kokonaislukuja hallitsevat ryhmät kolme ja kaksi eivätkä kaksi paljon pienempää ryhmää yksi ja neljä.
- Piilevällä muuttujalla on suuri vaikutus suhdelukuihin, eli onnistumisprosenttiin vaikuttaa voimakkaammin tapauksen vakavuus kuin hoidon valinta. Näin ollen hoitoa A käyttävien potilaiden ryhmä, joilla on suuret kivet (ryhmä kolme), menestyy huonommin kuin ryhmä, jolla on pienet kivet, vaikka jälkimmäiset käyttivät huonompaa hoitoa B (ryhmä kaksi).