Simpsonin paradoksi

Simpsonin paradoksi on tilastollinen paradoksi. Se on nimetty brittiläisen tilastotieteilijän Edward H. Simpsonin mukaan, joka kuvasi sen ensimmäisen kerran vuonna 1951. Tilastotieteilijä Karl Pearson kuvasi hyvin samanlaisen ilmiön vuonna 1899.- Udny Yulen kuvaus on vuodelta 1903. Joskus sitä kutsutaan Yule-Simpson-ilmiöksi. Kun tarkastellaan ryhmien tilastollisia pistemääriä, nämä pisteet voivat muuttua riippuen siitä, tarkastellaanko ryhmiä yksitellen vai yhdistetäänkö ne suuremmaksi ryhmäksi. Tämä tapaus esiintyy usein yhteiskuntatieteissä ja lääketieteellisissä tilastoissa. Se voi hämmentää ihmisiä, jos frekvenssitietoja käytetään selittämään syy-yhteyttä. Muita nimiä paradoksille ovat muun muassa käänteisparadoksi ja yhdistämisparadoksi.

Esimerkki: Munuaiskivien hoito

Tämä on tosielämän esimerkki lääketieteellisestä tutkimuksesta, jossa verrattiin kahden munuaiskivien hoidon onnistumisprosenttia.

Taulukossa esitetään onnistumisprosentit ja hoitojen määrät sekä pieniä että suuria munuaiskiviä koskevissa hoidoissa, joissa hoito A sisältää kaikki avoimet toimenpiteet ja hoito B on perkutaaninen nefrolitotomia:

Hoito A

Hoito B

menestys

epäonnistuminen

menestys

epäonnistuminen

Pienet kivet

Ryhmä 1

Ryhmä 2

potilaiden määrä

81

6

234

36

93%

7%

87%

13%

Suuret kivet

Ryhmä 3

Ryhmä 4

potilaiden määrä

192

71

55

25

73%

27%

69%

31%

Molemmat

Ryhmä 1+3

Ryhmä 2+4

potilaiden määrä

273

77

289

61

78%

22%

83%

17%

Paradoksaalinen johtopäätös on, että hoito A on tehokkaampi, kun sitä käytetään pieniin kiviin ja myös kun sitä käytetään suuriin kiviin, mutta hoito B on tehokkaampi, kun molemmat kivikoot käsitellään samanaikaisesti. Tässä esimerkissä ei tiedetty, että munuaiskiven koko vaikuttaa tulokseen. Tätä kutsutaan tilastotieteessä piilomuuttujaksi (tai piileväksi muuttujaksi).

Se, mitä hoitoa pidetään parempana, määräytyy kahden suhdeluvun (onnistumiset/kokonaismäärät) välisen epätasa-arvon perusteella. Simpsonin paradoksin synnyttävä suhteiden välisen epätasapainon kääntyminen päinvastaiseksi johtuu siitä, että kaksi vaikutusta esiintyy yhdessä:

  1. Niiden ryhmien koot, jotka yhdistetään, kun lurking-muuttujaa ei oteta huomioon, ovat hyvin erilaisia. Lääkäreillä on taipumus antaa vakaville tapauksille (suuret kivet) parempaa hoitoa (A) ja lievemmille tapauksille (pienet kivet) huonompaa hoitoa (B). Tämän vuoksi kokonaislukuja hallitsevat ryhmät kolme ja kaksi eivätkä kaksi paljon pienempää ryhmää yksi ja neljä.
  2. Piilevällä muuttujalla on suuri vaikutus suhdelukuihin, eli onnistumisprosenttiin vaikuttaa voimakkaammin tapauksen vakavuus kuin hoidon valinta. Näin ollen hoitoa A käyttävien potilaiden ryhmä, joilla on suuret kivet (ryhmä kolme), menestyy huonommin kuin ryhmä, jolla on pienet kivet, vaikka jälkimmäiset käyttivät huonompaa hoitoa B (ryhmä kaksi).

AlegsaOnline.com - 2020 / 2023 - License CC3