Het is een niet-parametrische afhankelijkheidsmaatstaf die de concordante en discordante paren van twee variabelen identificeert. Eenmaal geïdentificeerd, worden de totalen berekend en wordt het quotiënt gemaakt.
Met andere woorden, we kennen een rangorde toe aan de waarnemingen van elke variabele en bestuderen de afhankelijkheidsrelatie tussen twee gegeven variabelen.
Er zijn twee manieren om Kendall's Tau te berekenen; we kiezen ervoor om de afhankelijkheidsrelatie te berekenen zodra de waarnemingen van elke variabele zijn geordend. In ons voorbeeld zullen we zien dat we de rankings in kolom X in oplopende volgorde sorteren.
Geclassificeerde correlaties zijn een niet-parametrisch alternatief als maatstaf voor de afhankelijkheid tussen twee variabelen wanneer we de correlatiecoëfficiënt van Pearson niet kunnen toepassen.
Dit zijn de resultaten waarnaar we hebben verwezen in het eerste artikel -> Kendall's Tau (I):
Skigebied (ik) | X | Z | C | NC | |
NAAR | 1 | 1 | 6 | 0 | |
B | 2 | 3 | 5 | 0 | |
C | 3 | 4 | 5 | 1 | |
D | 4 | 2 | 4 | 0 | |
EN | 5 | 7 | 4 | 1 | |
F | 6 | 6 | 4 | 1 | |
G | 7 | 5 | 43 | 3 | TOTAAL |
- Het BC-CB-paar is een dissonant paar. We vullen 1 in in de NC-kolom en bevriezen de teller op de laatste positie totdat we weer een passend paar vinden. In dit geval hebben we het aantal koppelparen op 5 bevroren tot aan station D. Station D kan maar 4 koppelparen vormen: AD-DA, DE-ED, DF-FD, DG-GD.
Een ander dissonant paar zou EF-FE zijn:
- Het EF-FE-paar is een dissonant paar. We schrijven 1 in de NC-kolom en gaan verder met het slepen van het nummer 4 van concordante paren die kunnen worden gevormd. De overeenkomende paren van station E zouden zijn: EA-AE, EB-BE, EC-CE, ED-DE omdat EF-FE niet overeenstemt.
- Het FG-GF-paar is een dissonant paar. We schrijven 1 in de NC-kolom en gaan verder met het slepen van het nummer 4 van concordante paren die kunnen worden gevormd. De concordante paren van het station F s (we hebben de in plaats van 4 niet gevarieerd. De concordante paren die we eerder konden laten zien (we hebben niet gevarieerd zouden zijn: FA-AF, FB-BF, FC-CF, FD-DF omdat FG-GF schokkend is.
We berekenen Kendall's Tau
Kendall's Tau heeft geen geheim, behalve dat het het quotiënt is van de concordante en discordante paren van een steekproef van waarnemingen.
Interpretatie
Onze eerste vraag was: is er een afhankelijkheidsrelatie tussen de voorkeuren van downhill-skiërs en nordic-skiërs in bepaalde skigebieden?
In dit geval hebben we een afhankelijkheid tussen de twee variabelen van 0,8695. Een resultaat dat heel dicht bij de bovengrens ligt. Dit resultaat vertelt ons dat alpine skiërs (X) en langlaufers (Z) de resorts met vergelijkbare classificaties hebben geclassificeerd.
Zonder enige berekening te hoeven maken, kunnen we zien dat de eerste stations (A, B, C) de beste scores krijgen van de twee groepen. Met andere woorden, de beoordelingen van de skiërs volgen dezelfde richting.
Vergelijking: Pearson vs Kendall
Als we de correlatiecoëfficiënt van Pearson berekenen op basis van de eerdere waarnemingen en deze vergelijken met Kendall's Tau, krijgen we:
In dit geval vertelt Kendall's Tau ons dat er een sterkere afhankelijkheidsrelatie is tussen variabelen X en Z in vergelijking met de correlatiecoëfficiënt van Pearson: 0,8695> 0,75.
Als de uitbijters veel invloed zouden hebben op de resultaten, zouden we een groot verschil tussen Pearson en Spearman vinden en daarom zouden we Spearman als maat voor afhankelijkheid moeten gebruiken.