Pearson korrelaatio on luku väliltä -1 ja +1, joka osoittaa
missä määrin 2 muuttujat ovat lineaarisesti toisiinsa.Pearsonin korrelaatio tunnetaan myös nimellä” tuotteen momenttikorrelaatiokerroin ”(pmcc) tai yksinkertaisesti”korrelaatio”.
Pearsonin korrelaatiot soveltuvat vain kvantitatiivisiin muuttujiin (mukaan lukien dikotomiset muuttujat).
- Varten järjestysluku muuttujia, käytetään Spearmanin korrelaatiota tai Kendallin tau-ja
- nimellisten muuttujien, käytä Cramér on V.,
korrelaatiokerroin – Esimerkki
pyysimme 40 freelancereita niiden vuosittain tuloja yli 2010 kautta 2014. Osa raakatiedoista on esitetty alla.
tämän päivän kysymys kuuluu:onko vuoden 2010 tulojen
ja vuoden 2011 tulojen välillä mitään yhteyttä?No, loistava tapa selvittää on tutkia scatterplot näiden kahden muuttujan osalta: edustamme jokaista freelanceria pisteellä. Kunkin pisteen vaaka-ja pystyasennot kertovat freelancerin tuloista vuosina 2010 ja 2011. Tulos on esitetty alla.,
– Meidän scatterplot osoittaa vahvaa suhdetta tulot vuosien 2010 ja 2011: freelancereita, joilla oli alhainen tulotaso yli 2010 (vasemmanpuoleisin pistettä) oli tyypillisesti alhainen tulot ylittävät 2011 (alempi pisteet) ja päinvastoin. Lisäksi tämä suhde on karkeasti lineaarinen; pisteiden pääkuvio on suora viiva.
se, missä määrin pisteemme sijaitsevat suoralla viivalla, kertoo suhteen vahvuudesta. Pearsonin korrelaatio on luku, joka ilmaisee tämän suhteen tarkan vahvuuden.,
korrelaatiokertoimet ja Scatterplots
korrelaatiokerroin ilmaisee, missä määrin pisteitä scatterplot makaamaan suorassa linjassa. Tämä tarkoittaa sitä, että voimme yleensä arvioida korrelaatioita melko tarkasti vain scatterplots. Alla oleva luku havainnollistaa tätä asiaa hienosti.
korrelaatiokerroin – Perusteet
Joitakin perusasioita, jotka koskevat korrelaatiokertoimet ovat kauniisti kuvitettu, jonka edellinen kuva. Vähiten sinun pitäisi tietää, että
- korrelaatiot eivät ole koskaan alhaisempia kuin -1., Korrelaatio -1 osoittaa, että tiedot pistettä sirontakuvio olla täsmälleen suorassa alenevassa polvessa; kaksi muuttujaa ovat täydellisesti negatiivisesti lineaarisesti toisiinsa.
- korrelaatio 0 tarkoittaa, että kahdella muuttujalla ei ole minkäänlaista lineaarista suhdetta. Näiden kahden muuttujan välillä voi kuitenkin olla jokin epälineaarinen suhde.
- korrelaatiokertoimet eivät ole koskaan korkeammat kuin 1. Korrelaatiokerroin 1 tarkoittaa, että kaksi muuttujaa ovat täydellisesti positiivisesti lineaarisesti liittyvät; pisteitä sirontakuvio olla täsmälleen suoraan ylenevässä polvessa.,
korrelaatiokertoimen Tulkinta Huomautuksia
tulkittaessa korrelaatiot, sinun pitäisi pitää jotkut asiat mielessä. Taidokas keskustelu ansaitsee erillisen opetusohjelman, mutta mainitsemme lyhyesti kaksi pääkohtaa.
- korrelaatiot voivat tai eivät välttämättä viitata syy-seuraussuhteisiin. Toisin sanoen kausaaliset suhteet jostakin muuttujasta toiseen muuttujaan voivat tai eivät voi johtaa näiden kahden muuttujan väliseen korrelaatioon.
- Korrelaatiot ovat hyvin herkkiä harha; yksi epätavallinen havainto voi olla valtava vaikutus korrelaatio., Tällaiset poikkeamat on helppo havaita nopealla tarkastuksella sironta.
korrelaatiokerroin – Ohjelmisto
Useimmat taulukkolaskenta toimittajat, kuten Excel, Google docs ja OpenOffice voi laskea korrelaatioita sinulle. Alla olevassa kuvassa on esimerkki Googlesheetsistä.
korrelaatiokerroin – Korrelaatio Matriisi
Pitää mielessä, että korrelaatioiden sovelletaan paria muuttujaa. Jos olet kiinnostunut yli 2 muuttujaa, sinun luultavasti halua tarkastella korrelaatioita kaikkien eri muuttujan paria., Nämä korrelaatiot esitetään yleensä neliömatriisiksi kutsutussa taulukossa. Tilastolliset ohjelmistopaketit, kuten SPSS, luovat korrelaatiomatriiseja ennen kuin voit räpäyttää silmiäsi. Alla on esimerkki.
Huomaa, että diagonaalialkiot (punainen) ovat väliset korrelaatiot kunkin muuttujan ja itse. Siksi ne ovat aina 1.
Huomaa myös, että diagonaalin alapuolella (harmaassa) olevat korrelaatiot ovat tarpeettomia, koska ne ovat identtisiä diagonaalin yläpuolella olevien korrelaatioiden kanssa. Teknisesti tämä on symmetrinen matriisi.,
Huomaa lopuksi, että korrelaatioiden kuvio on täysin järkevä: vuositulojen väliset korrelaatiot pienenevät, jos nämä vuodet ovat kauempana toisistaan.
Pearson Korrelaatio – Kaava
Korrelaatio – Tilastollisen Merkitsevyyden
tiedot meillä käytettävissä ovat usein -mutta ei aina – pieni-näyte on paljon suurempi väestöstä. Jos näin on, otoksestamme
saattaa löytyä ei-nollakorrelaatio, vaikka se olisi väestössä nolla. Alla oleva kuva havainnollistaa, miten näin voisi käydä.,
Jos jätämme värejä toiseksi, kaikki 1000 pisteitä tässä scatterplot visualisoida joitakin väestöstä. Populaatiokorrelaatio, joka merkitään ρ-on nolla testin 1 ja testin 2 välillä.
nyt voisimme piirtää otoksen n = 20 tästä populaatiosta, jolle korrelaatio r = 0,95.Käänteisesti tämä tarkoittaa sitä, että näyte korrelaatio 0,95 ei todista varmuudella, että siellä on muuta kuin nolla korrelaatio koko väestöstä. R = 0,95: n löytäminen n = 20: n kanssa on kuitenkin erittäin epätodennäköistä, jos ρ = 0. Mutta kuinka epätodennäköistä? Mistä tiedämme?,
Korrelaatio – Testin Tilastollinen tulos
Jos ρ -väestö korrelaatio on nolla, niin todennäköisyys tietyn otoksen korrelaatio -sen tilastollinen merkitsevyys riippuu otoksen koosta. Siksi me yhdistää näytteen koko ja r osaksi yhden numeron, meidän testimuuttuja t:$$T = R\sqrt{\frac{(n – 2)}{(1 – R^2)}}$$
Nyt, T itsessään ei ole kiinnostava. Tarvitsemme sitä kuitenkin, jotta voimme löytää merkityksellisen tason jollekin korrelaatiolle. T seuraa t-jakaumaa ν = n – 2 vapausasteen kanssa, mutta vain jos tietyt oletukset täyttyvät.,
Korrelaatio Testi – Oletukset
tilastollisen merkitsevyyden testi Pearsonin korrelaatio vaatii 3 oletukset:
- riippumattomia havaintoja;
- väestön korrelaatio, ρ = 0;
- normaaliuden: 2 muuttujia ovat bivariately normaalisti jakautunut väestössä. Tätä ei kuitenkaan tarvita kohtuullisen otoskoon-vaikkapa n ≥ 20.Syy tähän on keskeisessä raja-arvolauseessa.
Pearsonin korrelaatio – Näytteenottojakauma
esimerkissämme näytteen koko N oli 20., Joten jos me täyttää meidän oletukset, T seuraa t-Jakelu df = 18 kuten alla.
Kiitos käsittelyssä!