en Pearson korrelation är ett tal mellan -1 och +1 som indikerar
i vilken utsträckning 2 variabler är linjärt relaterade.Pearson korrelationen är också känd som” produktmoment korrelationskoefficient ”(PMCC) eller helt enkelt”korrelation”.
Pearson korrelationer är endast lämpliga för kvantitativa variabler (inklusive dikotomösa variabler).
- för ordningsvariabler, använd Spearman-korrelationen eller Kendalls tau och
- för nominella variabler, använd Cramér V.,
korrelationskoefficient – exempel
vi frågade 40 frilansare för deras årliga inkomster under 2010 till 2014. En del av rådata visas nedan.
dagens fråga Är:finns det något samband mellan intäkter över 2010
och intäkter över 2011?Tja, ett utmärkt sätt att ta reda på är att inspektera en scatterplot för dessa två variabler: Vi representerar varje frilansare med en punkt. De horisontella och vertikala positionerna för varje punkt indikerar en frilansares inkomst under 2010 och 2011. Resultatet visas nedan.,
vår scatterplot visar ett starkt samband mellan intäkter under 2010 och 2011: frilansare som hade en låg inkomst under 2010 (längst till vänster) hade vanligtvis en låg inkomst över 2011 samt (lägre punkter) och vice versa. Dessutom är detta förhållande ungefär linjärt; huvudmönstret i prickarna är en rak linje.
i vilken utsträckning våra prickar ligger på en rak linje indikerar styrkan i relationen. Pearson-korrelationen är ett tal som indikerar den exakta styrkan i detta förhållande.,
korrelationskoefficienter och Scatterplots
en korrelationskoefficient indikerar i vilken utsträckning prickarna i en scatterplot ligger på en rak linje. Detta innebär att vi vanligtvis kan uppskatta korrelationer ganska exakt från ingenting annat än scatterplots. Figuren nedan illustrerar snyggt denna punkt.
korrelationskoefficient – Basics
några grundläggande punkter angående korrelationskoefficienter illustreras snyggt av föregående figur. Det minsta du bör veta är att
- korrelationer är aldrig lägre än -1., En korrelation av -1 indikerar att datapunkterna i en scatter-plot ligger exakt på en rak fallande linje; de två variablerna är helt negativt linjärt relaterade.
- en korrelation av 0 innebär att två variabler inte har någon linjär relation alls. Vissa icke-linjära relationer kan dock finnas mellan de två variablerna.
- korrelationskoefficienter är aldrig högre än 1. En korrelationskoefficient på 1 innebär att två variabler är helt positivt linjärt relaterade; prickarna i en scatter plot ligger exakt på en rak stigande linje.,
korrelationskoefficient – Tolkning Caveats
vid tolkning av korrelationer bör du hålla några saker i åtanke. En utarbetad diskussion förtjänar en separat handledning, men vi kommer kortfattat att nämna två huvudpunkter.
- korrelationer kan eller kan inte indikera orsakssamband. Omvänt kan orsakssamband från en variabel till en annan variabel eller inte resultera i en korrelation mellan de två variablerna.
- korrelationer är mycket känsliga för avvikare; en enda ovanlig observation kan ha en enorm inverkan på en korrelation., Sådana outliers detekteras lätt genom en snabb inspektion en scatterplot.
korrelationskoefficient – programvara
de flesta kalkylbladsredaktörer som Excel, Google sheets och OpenOffice kan beräkna korrelationer för dig. Illustrationen nedan visar ett exempel i Googlesheets.
korrelationskoefficient – korrelationsmatris
Tänk på att korrelationer gäller för par av variabler. Om du är intresserad av mer än 2 variabler, kommer du förmodligen vill ta en titt på korrelationer mellan alla olika variabla par., Dessa korrelationer visas vanligtvis i en fyrkantig tabell som kallas en korrelationsmatris. Statistiska programvarupaket som SPSS skapar korrelationer matriser innan du kan blinka dina ögon. Ett exempel visas nedan.
Observera att de diagonala elementen (i rött) är korrelationen mellan varje variabel och sig själv. Det är därför de alltid är 1.
Observera också att korrelationerna under diagonalen (i grått) är överflödiga eftersom de är identiska med korrelationerna ovanför diagonalen. Tekniskt säger vi att detta är en symmetrisk matris.,
Slutligen, notera att korrelationsmönstret är helt meningsfullt: korrelationer mellan årliga inkomster blir lägre i den mån dessa år ligger längre ifrån varandra.
Pearson korrelation – formel
korrelation – statistisk signifikans
de data vi har tillgängliga är ofta-men inte alltid – ett litet prov från en mycket större befolkning. Om så är fallet kan vi hitta en icke noll korrelation i vårt prov
även om det är noll i befolkningen. Figuren nedan visar hur detta kan hända.,
om vi ignorerar färgerna i en sekund visualiserar alla 1000 punkter i denna scatterplot en viss population. Populationskorrelationen-betecknad med ρ – är noll mellan test 1 och test 2.
nu kunde vi rita ett urval av N = 20 från denna population för vilken korrelationen r = 0.95.Omvänt betyder det att en provkorrelation på 0.95 inte med säkerhet bevisar att det finns en icke-nollkorrelation i hela befolkningen. Att hitta r = 0,95 med N = 20 är dock extremt osannolikt Om ρ = 0. Men exakt hur osannolikt? Och hur vet vi det?,
korrelation-teststatistik
Om ρ-En populationskorrelation – är noll, beror sannolikheten för en given provkorrelation-dess statistiska betydelse – på provstorleken. Vi kombinerar därför provstorleken och r till ett enda nummer, vår teststatistik t:$$T = R\sqrt{\frac{(n – 2)}{(1 – r^2)}}$$
Nu är inte i sig intressant. Men vi behöver det för att hitta signifikansnivån för viss korrelation. T följer en T-fördelning med ν = n – 2 frihetsgrader men endast om vissa antaganden är uppfyllda.,
Korrelationstest – antaganden
det statistiska signifikanstestet för en Pearson-korrelation kräver 3 antaganden:
- oberoende observationer;
- populationskorrelationen, ρ = 0;
- normalitet: de 2 variabler som är involverade är bivariately normalt fördelade i befolkningen. Detta behövs dock inte för en rimlig provstorlek-säg N ≥ 20 eller så.Anledningen till detta ligger i central limit theorem.
Pearson Correlation – Sampling Distribution
i vårt exempel var provstorleken n 20., Så om vi uppfyller våra antaganden följer T en t-distribution med DF = 18 som visas nedan.
Tack för att du läste!