Spearman's rho is een niet-parametrische afhankelijkheidsmaatstaf waarin de gemiddelde hiërarchie van de waarnemingen wordt berekend, de verschillen worden gekwadrateerd en in de formule worden verwerkt.
Met andere woorden, we kennen een rangorde toe aan de waarnemingen van elke variabele en bestuderen de afhankelijkheidsrelatie tussen twee gegeven variabelen.
Geclassificeerde correlaties zijn een niet-parametrisch alternatief als een maat voor de afhankelijkheid tussen twee variabelen wanneer we de correlatiecoëfficiënt van Pearson niet kunnen toepassen.
Over het algemeen wordt de letter giega toegewezen rho aan de correlatiecoëfficiënt.
Spearman's rho-schatting wordt gegeven door:
Rho Spearman-procedure
0. We gaan uit van een steekproef van nee waarnemingen (Aik, Bik).
1. Classificeer de waarnemingen van elke variabele en pas ze aan voor verbanden.
- We gebruiken een Excel-functie die de waarnemingen voor ons classificeert en automatisch aanpast als er verbanden tussen de elementen worden gevonden. Deze functie heet HERARCH.MEDIA (classificatie Aik; Een classificatienee;bestellen).
- De laatste factor van de functie is optioneel en vertelt ons in welke volgorde we de waarnemingen willen ordenen. Een getal dat niet nul is, sorteert de waarnemingen in oplopende volgorde. Het zal bijvoorbeeld het kleinste element een rang van 1 toekennen. Als we een nul in de variabele zetten bestellen, geeft het grootste item een rangorde van 1 (aflopende volgorde).
praktijkvoorbeeld
- In ons geval kennen we de volgordevariabele een getal toe dat niet nul is om de waarnemingen in oplopende volgorde te ordenen. Dat wil zeggen, het kleinste element van de variabele een rang van 1 toekennen.
- We controleren of de totale sommen van de kolommen van Classificatie A Y Classificatie B ze zijn gelijk aan elkaar en voldoen aan:
In dit geval n = 10 omdat we in elke variabele in totaal 10 elementen/waarnemingen hebben NAAR Y B.
De totale som van Classificatie A is gelijk aan de totale som van Classificatie Y en ze voldoen ook aan bovenstaande formule.
NAAR | B | Classificatie A | Classificatie B | Kwadraat verschillen |
0 | 50 | 2,5 | 8,5 | 36 |
70 | -20 | 9 | 3 | 36 |
-20 | 30 | 1 | 6,5 | 30,25 |
40 | -90 | 6 | 1 | 25 |
30 | 0 | 5 | 4 | 1 |
50 | 30 | 7 | 6,5 | 0,25 |
20 | 20 | 4 | 5 | 1 |
0 | -40 | 2,5 | 2 | 0,25 |
80 | 70 | 10 | 10 | 0 |
60 | 50 | 8 | 8,5 | 0,25 |
Totaal | 55 | 55 | 130 |
2. Tel de verschillen tussen de ranglijsten op en kwadrater ze.
- Zodra we alle geclassificeerde waarnemingen hebben, rekening houdend met de onderlinge verbanden, berekenen we het verschil in de vorm:
dik = Aik - Bik
We definiëren (dik) als het verschil tussen de classificatie van Aik en de classificatie van Bik.
- Zodra het verschil is verkregen, kwadrateren we het. De kwadraten van de verschillen worden toegepast om alleen positieve waarden te hebben.
We definiëren dik2 als het kwadraat verschil tussen de classificatie van Aik en de classificatie van Bik.
In de kolom met gekwadrateerde verschillen hebben we:
dik2 = (Aik - Bik)2
3. Bereken Spearman's rho:
- We berekenen de totale som van de gekwadrateerde verschillen van de vorm:
In ons voorbeeld:
- We nemen het resultaat op in de rho-formule van Spearman:
In ons voorbeeld:
Vergelijking: Pearson vs Spearman
Als we de correlatiecoëfficiënt van Pearson berekenen op basis van de eerdere waarnemingen en deze vergelijken met de correlatiecoëfficiënt van Spearman, krijgen we:
- Pearson = 0,1109
- Speerman = 0.2121
We kunnen zien dat de afhankelijkheid tussen variabelen A en B zwak blijft, zelfs met Spearman in plaats van Pearson.
Als de uitbijters veel invloed zouden hebben op de resultaten, zouden we een groot verschil tussen Pearson en Spearman vinden en daarom zouden we Spearman als maat voor afhankelijkheid moeten gebruiken.