Korrelaatio
Tilastotieteessä ja todennäköisyysteoriassa korrelaatiolla tarkoitetaan sitä, kuinka läheisesti kaksi tietoaineistoa liittyy toisiinsa.
Korrelaatio ei aina tarkoita, että yksi aiheuttaa toisen. On hyvin mahdollista, että asiaan liittyy jokin kolmas tekijä.
Korrelaatio on yleensä jompaankumpaan suuntaan. Nämä ovat positiivinen tai negatiivinen. Jos se on positiivinen, kaksi sarjaa nousee yhdessä. Jos se on negatiivinen, toinen nousee ja toinen laskee.
Korrelaation mittaamiseen käytetään paljon erilaisia mittareita eri tilanteissa. Esimerkiksi hajontakuvioon piirretään parhaan sopivuuden viiva osoittamaan korrelaation suunta.
Tämä hajontakuvaaja korreloi positiivisesti. Sen huomaa siitä, että suuntaus on ylöspäin ja oikealle. Punainen viiva on parhaan sovituksen viiva.
Korrelaation selittäminen
Vahva ja heikko ovat sanoja, joita käytetään kuvaamaan korrelaatiota. Jos korrelaatio on vahva, pisteet ovat kaikki lähellä toisiaan. Jos korrelaatio on heikko, pisteet ovat kaikki hajallaan toisistaan. On olemassa keinoja, joilla numerot saadaan näyttämään, kuinka vahva korrelaatio on. Näitä mittauksia kutsutaan korrelaatiokertoimiksi. Tunnetuin on Pearsonin tuotosmomenttikorrelaatiokerroin. Kun syötät tiedot kaavaan, se antaa sinulle luvun. Jos luku on 1 tai -1, korrelaatio on vahva. Jos vastaus on 0, korrelaatiota ei ole. Toinen korrelaatiokerroin on Spearmanin rank-korrelaatiokerroin.
Korrelaatio vs. syy-yhteys
Korrelaatio ei aina tarkoita, että yksi asia aiheuttaa toisen asian (kausaalisuus), koska jokin muu asia on voinut aiheuttaa molemmat. Esimerkiksi kuumina päivinä ihmiset ostavat jäätelöä, ja ihmiset menevät myös rannalle, jossa jotkut joutuvat haiden syömiksi. Jäätelön myynnin ja haihyökkäysten välillä on korrelaatio (molemmat nousevat lämpötilan noustessa tässä tapauksessa). Mutta se, että jäätelön myynti nousee, ei tarkoita, että jäätelön myynti aiheuttaa (kausaalisesti) enemmän haihyökkäyksiä tai päinvastoin.
Koska korrelaatio ei tarkoita syy-yhteyttä, tutkijat, taloustieteilijät jne. testaavat teoriansa luomalla eristettyjä ympäristöjä, joissa vain yhtä tekijää muutetaan (jos se on mahdollista). Poliitikot, myyntimiehet, uutistoimittajat ja muut tahot antavat kuitenkin usein ymmärtää, että tietty korrelaatio merkitsee syy-yhteyttä. Tämä voi johtua tietämättömyydestä tai halusta vakuuttaa. Niinpä uutinen voi herättää huomiota sanomalla, että tiettyä tuotetta useammin käyttävillä ihmisillä on jokin tietty terveysongelma, mikä viittaa kausaaliseen yhteyteen, joka voi todellisuudessa johtua jostain muusta.
Aiheeseen liittyvät sivut
- Cohen, J., Cohen P., West, S.G., & Aiken, L.S. (2003). Sovellettu moninkertainen regressio/korrelaatioanalyysi käyttäytymistieteissä. (3. painos) Hillsdale, NJ: Lawrence Erlbaum Associates.
Kysymyksiä ja vastauksia
K: Mitä on korrelaatio?
V: Korrelaatio on tapa osoittaa, kuinka läheisesti kaksi tietoaineistoa liittyvät toisiinsa.
K: Tarkoittaako korrelaatio sitä, että yksi datajoukko aiheuttaa toisen?
V: Ei, korrelaatio ei aina tarkoita, että yksi datajoukko aiheuttaa toisen. Itse asiassa asiaan liittyy usein kolmas tekijä.
K: Mitkä ovat korrelaation kaksi suuntaa?
V: Korrelaation kaksi suuntaa ovat positiivinen ja negatiivinen.
K: Mitä positiivinen korrelaatio tarkoittaa?
A: Positiivinen korrelaatio tarkoittaa, että kaksi tietoaineistoa nousee yhdessä.
K: Mitä tarkoittaa negatiivinen korrelaatio?
V: Negatiivinen korrelaatio tarkoittaa, että toinen tietosarja nousee ja toinen laskee.
K: Onko korrelaatiolle olemassa erilaisia mittaustapoja?
V: Kyllä, eri tilanteissa käytetään paljon erilaisia korrelaatiomittauksia.
K: Miten korrelaation suunta usein osoitetaan hajontakuvassa?
V: Ihmiset piirtävät usein parhaan sovituksen viivan näyttääkseen korrelaation suunnan hajontakuvaajassa.