Spearmanin järjestyskorrelaatiokerroin

Spearmanin korrelaatiokerroin on matematiikassa ja tilastotieteessä korrelaation mittari, joka on nimetty sen kehittäjän Charles Spearmanin mukaan. Se kirjoitetaan lyhyesti kreikkalaisella kirjaimella rho ( ρ {\displaystyle \rho }{\displaystyle \rho } ) tai joskus muodossa r s {\displaystyle r_{s}}. {\displaystyle r_{s}}. Se on luku, joka osoittaa, kuinka läheisesti kaksi tietoaineistoa on yhteydessä toisiinsa. Sitä voidaan käyttää vain sellaisille tiedoille, jotka voidaan asettaa järjestykseen, kuten korkeimmasta matalimpaan.

Yleinen kaava r s:lle {\displaystyle r_{s}}{\displaystyle r_{s}} on ρ = 1 - 6 ∑ d 2 n ( n 2 - 1 ) {\displaystyle \rho =1-{\cfrac {6\sum d^{2}}{n(n^{2}-1)}}} {\displaystyle \rho =1-{\cfrac {6\sum d^{2}}{n(n^{2}-1)}}}.

Jos sinulla on esimerkiksi tietoja siitä, kuinka kalliita eri tietokoneet ovat, ja tietoja siitä, kuinka nopeita tietokoneet ovat, voit nähdä, ovatko ne yhteydessä toisiinsa ja kuinka tiiviisti ne ovat yhteydessä toisiinsa käyttämällä r s {\displaystyle r_{s}} {\displaystyle r_{s}}.

Työstää sitä

Vaihe yksi

Jotta voit laskea r s {\displaystyle r_{s}}{\displaystyle r_{s}}, sinun on ensin asetettava kukin tieto paremmuusjärjestykseen. Käytämme esimerkkinä tietokoneiden ja niiden nopeuden esittelyä.

Halvimman hinnan omaava tietokone olisi siis sijalla 1. Sitä korkeampi olisi sijalla 2. Sitten se menee ylöspäin, kunnes kaikki ovat sijoittuneet paremmuusjärjestykseen. Tämä on tehtävä molemmille tietokokonaisuuksille.

PC

Hinta ($)

R a n k 1 {\displaystyle Rank_{1}} {\displaystyle Rank_{1}}

Nopeus (GHz)

R a n k 2 {\displaystyle Rank_{2}} {\displaystyle Rank_{2}}

A

200

1

1.80

2

B

275

2

1.60

1

C

300

3

2.20

4

D

350

4

2.10

3

E

600

5

4.00

5

Vaihe kaksi

Seuraavaksi meidän on löydettävä näiden kahden sijan välinen ero. Sitten kerrotaan erotus itsellään, mitä kutsutaan neliöimiseksi. Eroa kutsutaan nimellä d {\displaystyle d}{\displaystyle d} , ja luku, jonka saat neliöimällä d {\displaystyle d}{\displaystyle d}, on nimeltään d 2 {\displaystyle d^{2}}. {\displaystyle d^{2}}.

R a n k 1 {\displaystyle Rank_{1}} {\displaystyle Rank_{1}}

R a n k 2 {\displaystyle Rank_{2}} {\displaystyle Rank_{2}}

d {\displaystyle d} {\displaystyle d}

d 2 {\displaystyle d^{2}} {\displaystyle d^{2}}

1

2

-1

1

2

1

1

1

3

4

-1

1

4

3

1

1

5

5

0

0

Vaihe kolme

Laske, kuinka paljon tietoja meillä on. Tässä datassa on sijat 1-5, joten meillä on 5 dataa. Tätä lukua kutsutaan nimellä n {\displaystyle n}n .

Vaihe neljä

Käytä lopuksi kaikkea tähän mennessä selvittämäämme tähän kaavaan: r s = 1 - 6 ∑ d 2 n ( n 2 - 1 ) {\displaystyle r_{s}=1-{\cfrac {6\sum d^{2}}{n(n^{2}-1)}}} {\displaystyle r_{s}=1-{\cfrac {6\sum d^{2}}{n(n^{2}-1)}}}.

∑ d 2 {\displaystyle \sum d^{2}}{\displaystyle \sum d^{2}} tarkoittaa, että otamme kaikkien sarakkeessa d 2 {\displaystyle d^{2}} olleiden lukujen summan. {\displaystyle d^{2}}. Tämä johtuu siitä, että ∑ {\displaystyle \sum } {\displaystyle \sum }tarkoittaa summaa.

∑ d 2 {\displaystyle \sum d^{2}}{\displaystyle \sum d^{2}} on siis 1 + 1 + 1 + 1 + 1 {\displaystyle 1+1+1+1+1}{\displaystyle 1+1+1+1}, joka on 4. Kaavassa sanotaan, että kerro se kuudella, joka on 24.

n ( n 2 - 1 ) {\displaystyle n(n^{2}-1)} {\displaystyle n(n^{2}-1)}on 5 × ( 25 - 1 ) {\displaystyle 5\times (25-1)}{\displaystyle 5\times (25-1)} eli 120.

Joten saadaksemme selville r s {\displaystyle r_{s}} {\displaystyle r_{s}}saadaan yksinkertaisesti 1 - 24 120 = 0.8 {\displaystyle 1-{\cfrac {24}{120}}=0.8}}{\displaystyle 1-{\cfrac {24}{120}}=0.8} .

Tämän vuoksi Spearmanin korrelaatiokerroin on 0,8 tämän aineiston osalta.

Mitä numerot tarkoittavat

r s {\displaystyle r_{s}}{\displaystyle r_{s}} antaa aina vastauksen väliltä -1 ja 1. Välillä olevat luvut ovat kuin asteikko, jossa -1 on erittäin vahva yhteys, 0 ei ole mitään yhteyttä ja 1 on myös erittäin vahva yhteys. Ero 1:n ja -1:n välillä on se, että 1 on positiivinen korrelaatio ja -1 on negatiivinen korrelaatio. Aineiston kuvaaja, jonka r s {\displaystyle r_{s}}-arvo on -1, näyttäisi esitetyn kuvaajan kaltaiselta, paitsi että viiva ja pisteet kulkisivat vasemmalta ylhäältä oikealle.

Esimerkiksi edellä tekemiemme tietojen osalta r s {\displaystyle r_{s}}{\displaystyle r_{s}} oli 0,8. Tämä tarkoittaa siis sitä, että korrelaatio on positiivinen. Koska se on lähellä 1:tä, se tarkoittaa, että yhteys on vahva näiden kahden tietokokonaisuuden välillä. Voimme siis sanoa, että nämä kaksi tietoaineistoa ovat yhteydessä toisiinsa ja nousevat yhdessä. Jos se olisi -0,8, voisimme sanoa, että ne ovat yhteydessä toisiinsa, ja kun toinen nousee, toinen laskee.

Zoom

Tämä hajontakuvaaja korreloi positiivisesti. R s{\displaystyle r_{s}}{\displaystyle r_{s}}-arvo olisi lähellä 1 tai 0,9. Punainen viiva on parhaan sovituksen viiva.

Jos kaksi lukua on sama

Joskus tietoja järjestettäessä on kaksi tai useampia numeroita, jotka ovat samoja. Kun näin tapahtuu r s:ssä {\displaystyle r_{s}} {\displaystyle r_{s}}otamme samanarvoisten sijoitusten keskiarvon tai keskiarvon. Näitä kutsutaan tasavertaisiksi sijoiksi. Tätä varten asetamme sidotut luvut paremmuusjärjestykseen ikään kuin ne eivät olisi sidottuja. Sitten laskemme yhteen kaikki sijat, jotka niillä olisi, ja jaamme sen sillä, kuinka monta niitä on. Sanotaan esimerkiksi, että järjestämme eri henkilöiden tulokset oikeinkirjoituskokeessa.

Testitulos

Sijoitus

Sijoitus (sidottu)

4

1

1

6

2

2 + 3 + 4 3 = 3 {\displaystyle {\tfrac {2+3+4}{3}}=3}} {\displaystyle {\tfrac {2+3+4}{3}}=3}

6

3

2 + 3 + 4 3 = 3 {\displaystyle {\tfrac {2+3+4}{3}}=3}} {\displaystyle {\tfrac {2+3+4}{3}}=3}

6

4

2 + 3 + 4 3 = 3 {\displaystyle {\tfrac {2+3+4}{3}}=3}} {\displaystyle {\tfrac {2+3+4}{3}}=3}

8

5

5 + 6 2 = 5.5 {\displaystyle {\tfrac {5+6}{2}}=5.5}} {\displaystyle {\tfrac {5+6}{2}}=5.5}

8

6

5 + 6 2 = 5.5 {\displaystyle {\tfrac {5+6}{2}}=5.5}} {\displaystyle {\tfrac {5+6}{2}}=5.5}

Näitä numeroita käytetään täsmälleen samalla tavalla kuin tavallisia sijoituksia.

Aiheeseen liittyvät sivut

Kysymyksiä ja vastauksia

Kysymys: Mikä on Spearmanin järjestyskorrelaatiokerroin?


V: Spearmanin rank-korrelaatiokerroin on korrelaation mitta, joka osoittaa, kuinka läheisesti kaksi tietosarjaa on yhteydessä toisiinsa. Sitä voidaan käyttää vain sellaisten tietojen osalta, jotka voidaan asettaa järjestykseen, esimerkiksi suurimmasta pienimpään.

K: Kuka on luonut Spearmanin korrelaatiokertoimen?


V: Charles Spearman loi Spearmanin korrelaatiokertoimen.

K: Miten Spearmanin rank-korrelaatiokertoimen yleinen kaava kirjoitetaan?


V: Spearmanin korrelaatiokertoimen yleinen kaava on ρ = 1 - 6∑d2/n(n2-1).

K: Milloin Spearmanin rank-korrelaatiokerrointa pitäisi käyttää?


V: Spearmanin rank-korrelaatiokerrointa kannattaa käyttää silloin, kun halutaan nähdä, kuinka läheisesti kaksi tietoaineistoa ovat yhteydessä toisiinsa ja ovatko ne ylipäätään yhteydessä toisiinsa.

K: Minkä tyyppisten tietojen kanssa se toimii?


V: Se toimii minkä tahansa tyyppisten tietojen kanssa, jotka voidaan asettaa järjestykseen, esimerkiksi suurimmasta pienimpään.

K: Voitko antaa esimerkin, jossa voisit käyttää tätä toimenpidettä?



V: Esimerkki, jossa tätä toimenpidettä voisi käyttää, voisi olla, että jos sinulla on tietoja siitä, kuinka kalliita eri tietokoneet ovat, ja tietoja siitä, kuinka nopeita tietokoneet ovat, voisit nähdä, ovatko ne yhteydessä toisiinsa ja kuinka tiiviisti ne ovat yhteydessä toisiinsa r_s:n avulla.

AlegsaOnline.com - 2020 / 2023 - License CC3