Pearson Correlatiecoëfficiënt (r) Berekenen en Interpreteren (2024)

Vertaald op 17 augustus 2022 door Veronique Scharwächter. Oorspronkelijk gepubliceerd door Shaun Turney

De Pearson correlatiecoëfficiënt (Pearson correlation coefficient), aangeduid met r, is de meest gebruikelijke manier om een lineaire correlatie te meten. Het is een getal tussen de -1 en 1 dat de sterkte en de richting van het verband tussen twee variabelen meet.

Pearson correlatie coëfficiënt (r)SoortcorrelatieInterpretatieVoorbeeld
Tussen 0 en 1Positieve correlatieAls één variabele verandert, verandert de andere variabele in dezelfde richting.Lengte en gewicht van baby’s:

Hoe langer de baby, hoe zwaarder hun gewicht.

0Geen correlatieEr is geen verband tussen de variabelen.Prijs van de auto en de breedte van de ruitenwissers:

De prijs van een auto houdt geen verband met de breedte van de ruitenwissers.

Tussen
0 en –1
Negatieve correlatieAls één variabele verandert, verandert de andere variabele in de tegengestelde richting.Hoogte en luchtdruk:

Hoe hoger je bent, hoe lager de luchtdruk.

Inhoudsopgave

  1. Wat is de Pearson correlatiecoëfficiënt?
  2. Pearson correlatie visualiseren
  3. Wanneer gebruik je de Pearson correlatie?
  4. Pearson correlatie berekenen
  5. Toetsen op de significantie van de Pearson correlatie
  6. Pearson correlatie rapporteren
  7. Veelgestelde vragen over Pearson correlatiecoëfficiënt

Wat is de Pearson correlatiecoëfficiënt?

De Pearson correlatiecoëfficiënt (r) is de meest gebruikte correlatiecoëfficiënt en is bekend onder vele namen:

  • Pearson’s r
  • Bivariate correlatie
  • Pearson product-moment correlatiecoëfficiënt (PPMCC)
  • De correlatiecoëfficiënt

De Pearson correlatie is een beschrijvende statistiek, wat betekent dat de correlatie de kenmerken van een dataset samenvat. De Pearson correlatie beschrijft de sterkte en de richting van het lineaire verband tussen twee kwantitatieve variabelen.

Hoewel de interpretaties van de sterkte van het verband (ook wel effectgrootte genoemd) van vakgebied tot vakgebied verschillen, geeft onderstaande tabel de algemene vuistregels:

Waarde van de Pearson correlatie coëfficiënt (r)SterkteRichting
Groter dan .5SterkPositief
Tussen .3 en .5MatigPositief
Tussen 0 en .3ZwakPositief
0GeenGeen
Tussen 0 en –.3ZwakNegatief
Tussen –.3 en –.5MatigNegatief
Groter dan –.5SterkNegatief

De Pearson correlatie is ook een inferentiële (toetsende of verklarende) statistiek, wat betekent dat deze kan worden gebruikt voor hypothesetoetsing. Met de correlatie kan worden nagegaan of er een significant verband bestaat tussen twee variabelen.

De Pearson correlatie impliceert geen oorzaak-gevolgrelatie tussen twee variabelen. De Pearson correlatie weergeeft de samenhang van twee variabelen, maar duidt niet op een oorzakelijk verband.

Met de Pearson correlatie kun je dus niet zeggen of de ene variabele de andere veroorzaakt.

Hoeveel fouten bevat jouw scriptie?

De taalexperts van Scribbr verbeteren gemiddeld 150 fouten per 1000 woorden. Benieuwd wat er precies wordt verbeterd? Verschuif de cursor van links naar rechts!

Pearson Correlatiecoëfficiënt (r) Berekenen en Interpreteren (1)Pearson Correlatiecoëfficiënt (r) Berekenen en Interpreteren (2)

Scriptie nakijken op taal

Pearson correlatie visualiseren

Een andere manier om over de Pearson correlatie (r) na te denken is als een maatstaf voor hoe dicht de observaties bij een best passende lijn (line of best fit) liggen.

De Pearson correlatie vertelt je ook of de helling van de best passende lijn negatief of positief is. Als de helling negatief is, is r negatief. Als de helling positief is, is r positief.

Als r 1 of -1 is, vallen alle observaties precies op de best passende lijn:

Pearson Correlatiecoëfficiënt (r) Berekenen en Interpreteren (3)

Als r groter is dan .5 of kleiner dan -.5, liggen de observatiepunten dicht bij de best passende lijn:

Pearson Correlatiecoëfficiënt (r) Berekenen en Interpreteren (4)

Als r tussen 0 en .3 of tussen 0 en -.3 ligt, liggen de observatiepunten ver van de best passende lijn:

Pearson Correlatiecoëfficiënt (r) Berekenen en Interpreteren (5)

Als r 0 is, is een best passende lijn niet behulpzaam om het verband tussen de variabelen te beschrijven:

Pearson Correlatiecoëfficiënt (r) Berekenen en Interpreteren (6)

Wanneer gebruik je de Pearson correlatie?

De Pearson correlatie (r) is één van de verschillende correlatiecoëfficiënten waartussen je moet kiezen als je een correlatie wilt meten. De Pearson correlatie is een goede keuze als alle onderstaande punten waar zijn:

  • Beide variabelen zijn kwantitatief: Je zult een andere methode moeten gebruiken als minstens één van de variabelen kwalitatief is.
  • Beide variabelen zijn continu: Discrete variabelen kunnen enkel worden uitgedrukt in telbare, ronde getallen (e.g., 1,2,3). Continue variabelen kunnen elke waarde aannemen (e.g., 1.25, 3.491, 4.3327).
  • De variabelen zijn normaal verdeeld: Je kunt van elke variabele een histogram maken om na te gaan of de verdeling bij benadering normaal zijn. Het is geen probleem als de variabelen een beetje niet-normaal verdeeld zijn.
  • De data hebben geen uitschieters (outliers): Uitschieters of uitbijters zijn observaties die niet dezelfde patronen volgen als de rest van de data. Aan de hand van een scatterplot kun je controleren of er uitschieters zijn. Je kijkt dan naar observatiepunten die ver van de rest afliggen.
  • De relatie is lineair: “Lineair” betekent dat de relatie tussen twee variabelen redelijk goed kan worden beschreven door een rechte lijn. Je kunt een scatterplot gebruiken om te zien of het verband tussen twee variabelen lineair is.

Pearson vs Spearmans rangcorrelatiecoëfficiënt

Spearmans rangcorrelatiecoëfficiënt is een andere veelgebruikte correlatiecoëfficiënt. Het is een betere keuze dan de Pearson correlatie als één of meer van de volgende punten waar zijn:

  • De variabelen zijn van ordinaal meetniveau.
  • De variabelen zijn niet-normaal verdeeld.
  • De data bevatten uitschieters.
  • Het verband tussen de variabelen is niet-lineair en monotoon.

Pearson correlatie berekenen

Dit is de formule voor het berekenen van de Pearson correlatie (r):

Pearson Correlatiecoëfficiënt (r) Berekenen en Interpreteren (7)

De formule is makkelijk te gebruiken als je onderstaand stappenplan volgt. Je kunt ook software zoals R of Excel gebruiken om de Pearson correlatie voor je te laten berekenen.

Stel je voor dat je de relatie tussen het gewicht en de lengte van pasgeborenen bestudeert. Je hebt de gewichten en lengtes van 10 baby’s verzameld die vorige maand in het plaatselijke ziekenhuis geboren zijn. Nadat je de imperiale maten hebt omgezet naar metrische, voer je de data in een tabel in:
Gewicht (kg)Lengte (cm)
3.6353.1
3.0249.7
3.8248.4
3.4254.2
3.5954.9
2.8743.7
3.0347.2
3.4645.2
3.3654.4
3.350.4

Stap 1: Bereken de som van x en de som van y

Start met het hernoemen van de variabelen naar “x” en “y”. Het maakt niet uit welke variabele x heet en welke variabele y. De formule zal op beide manieren hetzelfde antwoord geven.

Ook maakt het niet uit in welke eenheden de variabelen staan uitgedrukt (e.g., kilogram, pond, percentages, etc.). Het antwoord wordt niet beïnvloed door de eenheden van de variabelen.

Tel vervolgens alle waarden van x bij elkaar op, en alle waarden van y. In de formule wordt deze stap aangegeven met het symbool Σ, wat “neem de som van” betekent.

Gewicht = x

Lengte = y

Σx = 3.63 + 3.02 + 3.82 + 3.42 + 3.59 + 2.87 + 3.03 + 3.46 + 3.36 + 3.30

Σx = 33.5

Σy = 53.1 + 49.7 + 48.4 + 54.2 + 54.9 + 43.7 + 47.2 + 45.2 + 54.4 + 50.4

Σy = 501.2

Stap 2: Bereken x2 en y2 en hun sommen

Maak twee nieuwe kolommen die de kwadraten van x en y weergeven. Neem vervolgens weer de sommen van deze kolommen.

xyx2y2
3.6353.1(3.63)2 = 13.18(53.1)2 = 2819.6
3.0249.79.122470.1
3.8248.414.592342.6
3.4254.211.72937.6
3.5954.912.893014
2.8743.78.241909.7
3.0347.29.182227.8
3.4645.211.972043
3.3654.411.292959.4
3.350.410.892540.2

Σx2= 13.18 + 9.12 + 14.59 + 11.70 + 12.89 + 8.24 + 9.18 + 11.97 + 11.29 + 10.89

Σx2= 113.05

Σy2= 2819.6 + 2470.1 + 2342.6 + 2937.6 + 3014.0 + 1909.7 + 2227.8 + 2043.0 + 2959.4 + 2540.2

Σy2= 25264

Stap 3: Bereken het kruisproduct en tel de waarden op

In een laatste kolom vermenigvuldig je x en y met elkaar (dit heet ook wel het kruisproduct). Vervolgens tel je weer de waarden van deze kolom bij elkaar op.

xyx2y2xy (x*y)
3.6353.113.182819.63.63 * 53.1 = 192.8
3.0249.79.122470.1150.1
3.8248.414.592342.6184.9
3.4254.211.72937.6185.4
3.5954.912.893014197.1
2.8743.78.241909.7125.4
3.0347.29.182227.8143
3.4645.211.972043156.4
3.3654.411.292959.4182.8
3.350.410.892540.2166.3

Σxy = 192.8 + 150.1 + 184.9 + 185.4 + 197.1 + 125.4 + 143.0 + 156.4 + 182.8 + 166.3

Σxy = 1 684.2

Stap 4: Bereken r

Gebruik de formule en de getallen die je in de vorige stappen hebt berekend om r te vinden.

Pearson Correlatiecoëfficiënt (r) Berekenen en Interpreteren (8)

Pearson Correlatiecoëfficiënt (r) Berekenen en Interpreteren (9)

Pearson Correlatiecoëfficiënt (r) Berekenen en Interpreteren (10)

Pearson Correlatiecoëfficiënt (r) Berekenen en Interpreteren (11)

Pearson Correlatiecoëfficiënt (r) Berekenen en Interpreteren (12)

Pearson Correlatiecoëfficiënt (r) Berekenen en Interpreteren (13)

Pearson Correlatiecoëfficiënt (r) Berekenen en Interpreteren (14)

Pearson Correlatiecoëfficiënt (r) Berekenen en Interpreteren (15)

Pearson Correlatiecoëfficiënt (r) Berekenen en Interpreteren (16)

Pearson Correlatiecoëfficiënt (r) Berekenen en Interpreteren (17)

Pearson Correlatiecoëfficiënt (r) Berekenen en Interpreteren (18)

Hoeveel fouten bevat jouw scriptie?

De taalexperts van Scribbr verbeteren gemiddeld 150 fouten per 1000 woorden. Benieuwd wat er precies wordt verbeterd? Verschuif de cursor van links naar rechts!

Pearson Correlatiecoëfficiënt (r) Berekenen en Interpreteren (19)Pearson Correlatiecoëfficiënt (r) Berekenen en Interpreteren (20)

Scriptie nakijken op taal

Toetsen op de significantie van de Pearson correlatie

De Pearson correlatie kan ook worden gebruikt om te toetsen of het verband tussen twee variabelen significant is.

De Pearson correlatie van de steekproef is r. Het is een schatting van rho (ρ), de Pearson correlatie van de populatie. Als je r en n (de steekproefgrootte) kent, kun je afleiden of ρ significant verschillend is van 0 (geen verband).

  • Nulhypothese (H0): ρ = 0
  • Alternatieve hypothese (Ha): ρ ≠ 0

Om de hypothesen te toetsen, kun je gebruikmaken van software zoals R of Stata, of je kunt de hypothesetoetsing handmatig uitvoeren door de onderstaande drie stappen te volgen.

Stap 1: Bereken de t-waarde

Bereken de t-waarde (een teststatistiek) met deze formule:

Pearson Correlatiecoëfficiënt (r) Berekenen en Interpreteren (21)

Het gewicht en de lengte van 10 pasgeborenen hebben een Pearson correlatie van .47. Aangezien je weet dat n = 10 en r = .47, kun je de t-waarde berekenen:

Pearson Correlatiecoëfficiënt (r) Berekenen en Interpreteren (22)

Pearson Correlatiecoëfficiënt (r) Berekenen en Interpreteren (23)

Pearson Correlatiecoëfficiënt (r) Berekenen en Interpreteren (24)

Pearson Correlatiecoëfficiënt (r) Berekenen en Interpreteren (25)

Stap 2: Vind de kritieke waarde van t

Je kunt de kritieke waarde van t (t*) vinden in een t-tabel. Om de t-tabel te gebruiken, moet je drie dingen weten:

  • Vrijheidsgraden (df): Voor de Pearson correlatietoets is de formule df = n – 2.
  • Significantieniveau (α): Normaal gesproken is het significantieniveau .05.
  • Eenzijdig (one-tailed) of tweezijdig (two-tailed): Meestal is een tweezijdige toets een goede keuze voor de Pearson correlatie.
Voor een tweezijdige significantietoets met α = .05 en df = 8, de kritieke waarde van t (t*) is 1.86.

Stap 3: Vergelijk de t-waarde met de kritieke waarde

Bepaalde of de absolute t-waarde groter is dan de kritieke waarde van t. “Absoluut” betekent dat je het minteken moet negeren als de t-waarde negatief is.

t = 1.506

t* = 1.86

De t-waarde is kleiner dan de kritieke waarde van t.

Stap 4: Beslis of de nulhypothese verworpen moet worden

  • Als de t-waarde groter is dan de kritieke waarde, dan is het verband statistisch significant (p < α). De data tonen aan dat de nulhypothese verworpen kan worden en de alternatieve hypothese kan worden ondersteund.
  • Als de t-waarde kleiner is dan de kritieke waarde, dan is het verband niet statistisch significant (p > α). De data tonen niet aan dat de nulhypothese verworpen kan worden en bieden geen ondersteuning voor de alternatieve hypothese.
Voor de correlatie tussen gewicht en lengte in een steekproef van 10 pasgeborenen is de t-waarde kleiner dan de kritieke waarde.

Daarom wordt de nulhypothese dat de Pearson correlatie van de populatie (ρ) 0 is niet verworpen. Er is geen significant verband tussen gewicht en lengte (p > .05).

(Merk op dat de steekproef van 10 heel erg klein is. Het is mogelijk dat je een significant verband kan vinden als je de steekproefgrootte uitbreidt.)

Pearson correlatie rapporteren

Als je besluit om een Pearson correlatie (r) in je paper of scriptie op te nemen, moet je dat in je onderzoeksresultaten vermelden. Je kunt deze regels volgen als je statistieken in APA-stijl wilt rapporteren:

  • Het is niet nodig om een referentie of formule toe te voegen, aangezien de correlatiecoëfficiënt een veelgebruikte statistiek is.
  • Cursiveer r wanneer je de waarde rapporteert.
  • Voeg nooit een voorloopnul toe (een nul voor het decimale punt), want de correlatiecoëfficiënt kan niet groter dan 1 of kleiner dan -1 zijn.
  • Achter de decimale punt dienen twee significante getallen te staan.

Als de Pearson correlatie wordt gebruikt als inferentiële statistiek (om te toetsen of het verband significant is), dan wordt de r meestal gerapporteerd in combinatie met de vrijheidsgraden en p-waarde. De vrijheidsgraden staan tussen haakjes naast r.

Het gewicht en de lengte van pasgeborenen waren matig gecorreleerd aan elkaar, hoewel het verband niet statistisch significant was, r(8) = .47, p > .17.

Veelgestelde vragen over Pearson correlatiecoëfficiënt

Wanneer gebruik ik de Pearson correlatiecoëfficiënt?

Je kunt de Pearson correlatiecoëfficiënt (r) gebruiken als je een correlatie tussen twee variabelen wilt meten en (1) het verband tussen de variabelen lineair is, (2) beide variabelen kwantitatief zijn, (3) beide variabelen continu van aard zijn, (4) normaal verdeeld zijn en (5) geen uitschieters hebben.

Hoe bereken ik de Pearson correlatiecoëfficiënt in R?

Je kunt de cor() functie gebruiken om de Pearson correlatiecoëfficiënt (r) in R te berekenen. Om de significantie van de correlatie te testen, kun je de cor.test() functie gebruiken.

Hoe bereken ik de Pearson correlatiecoëfficiënt in Excel?

Je kunt de PEARSON() functie gebruiken om de Pearson correlatiecoëfficiënt (r) in Excel te berekenen. Als je variabelen in de kolommen A en B staan, klik je op een lege cel en typ je “PEARSON(A:A, B:B)”.

Er is geen functie om de significantie van de correlatie direct te berekenen.

Wat is het verschil tussen correlatie en causaliteit?

Een correlatie is een statistische indicator voor een verband tussen variabelen: als de ene variabele verandert, verandert de andere variabele ook, maar er hoeft geen oorzaak-gevolgrelatie te zijn. Correlaties worden onderzocht in correlationeel onderzoek.

Causaliteit betekent dat een verandering in de ene variabele een verandering in de andere variabele veroorzaakt. Er is dus wel sprake van een oorzaak-gevolgrelatie. De variabelen correleren én er is een causaal verband. Causaliteit wordt onderzocht in experimenteel onderzoek.

Wat is een pearson correlation?

Pearson correlationis de Engelse term voor Pearson correlatiecoëfficiënt.

Deze correlatiecoëfficiënt, aangeduid metr, is de meest gebruikelijke manier om een lineairecorrelatiete meten. Het is een getal tussen de -1 en 1 dat de sterkte en de richting van het verband tussen twee variabelen meet.

Citeer dit Scribbr-artikel

Als je naar deze bron wilt verwijzen, kun je de bronvermelding kopiëren of op “Citeer dit Scribbr-artikel” klikken om de bronvermelding automatisch toe te voegen aan onze gratis Bronnengenerator.

Scharwächter, V. (2022, 17 augustus). Pearson Correlatiecoëfficiënt (r) Berekenen en Interpreteren. Scribbr. Geraadpleegd op 25 november 2024, van https://www.scribbr.nl/statistiek/pearson-correlatie/

Citeer dit artikel

Wat vind jij van dit artikel?

Je hebt al gestemd op dit artikel. Bedankt :-) Je stem is doorgevoerd :-) Bezig met het verwerken van je stem...

Pearson Correlatiecoëfficiënt (r) Berekenen en Interpreteren (26)

Veronique Scharwächter

Veronique heeft twee bachelors: één in Taal- en Cultuurstudies en één in Philosophy, Politics and Economics. Daarnaast heeft zij een boek geschreven over hoe filosofie je kan helpen in je studentenleven. Ze hoopt haar brede, interdisciplinaire kennis in te kunnen zetten om zo veel mogelijk studenten te helpen met het schrijven van hun scriptie.

Pearson Correlatiecoëfficiënt (r) Berekenen en Interpreteren (2024)
Top Articles
Latest Posts
Recommended Articles
Article information

Author: Reed Wilderman

Last Updated:

Views: 6223

Rating: 4.1 / 5 (52 voted)

Reviews: 83% of readers found this page helpful

Author information

Name: Reed Wilderman

Birthday: 1992-06-14

Address: 998 Estell Village, Lake Oscarberg, SD 48713-6877

Phone: +21813267449721

Job: Technology Engineer

Hobby: Swimming, Do it yourself, Beekeeping, Lapidary, Cosplaying, Hiking, Graffiti

Introduction: My name is Reed Wilderman, I am a faithful, bright, lucky, adventurous, lively, rich, vast person who loves writing and wants to share my knowledge and understanding with you.