Kendall's Tau (I) - Wat het is, definitie en concept

Inhoudsopgave:

Kendall's Tau (I) - Wat het is, definitie en concept
Kendall's Tau (I) - Wat het is, definitie en concept
Anonim

Het is een niet-parametrische afhankelijkheidsmaatstaf die de concordante en discordante paren van twee variabelen identificeert. Eenmaal geïdentificeerd, worden de totalen berekend en wordt het quotiënt gemaakt.

Geclassificeerde correlaties zijn een niet-parametrisch alternatief als maatstaf voor de afhankelijkheid tussen twee variabelen wanneer we de correlatiecoëfficiënt van Pearson niet kunnen toepassen.

Met andere woorden, we kennen een rangorde toe aan de waarnemingen van elke variabele en bestuderen de afhankelijkheidsrelatie tussen twee gegeven variabelen. Er zijn twee manieren om Kendall's Tau te berekenen; we kiezen ervoor om de afhankelijkheidsrelatie te berekenen zodra de waarnemingen van elke variabele zijn geordend. In ons voorbeeld zullen we zien dat we de rankings in kolom X in oplopende volgorde hebben gesorteerd.

wiskundig,

Wij definiëren:

Cnee = totaal aantal overeenkomende paren.

NCnee = totaal aantal niet-concordante (discordante) paren.

Werkwijze en praktijkvoorbeeld

Om Kendall's Tau te verkrijgen, moeten we eerst weten hoe we de concordante en discordante paren van twee variabelen kunnen identificeren.

We zullen de voorkeuren van de skiërs gebruiken. In dit voorbeeld nemen we aan dat we willen evalueren of de skiërs hun voorkeuren voor alpineskiën of langlaufen in dezelfde volgorde in een station i classificeren. Hun beoordelingen kunnen variëren van 1 (zeer de voorkeur) tot 7 (zeer weinig de voorkeur).

Onze vraag zou zijn: is er een afhankelijkheid tussen de voorkeuren van downhill skiërs en nordic skiërs in de gegeven skigebieden?

Wij definiëren:

X = beoordeling van de skiërs voor alpineskiën in station i.

Y = beoordeling van de skiërs voor langlaufen op station i.

C = concordante paren.

NC = niet-overeenkomende/discordante paren.

ENik = skigebied i.

Werkwijze

  • We gaan uit van een voorbeeld van n = 7 observaties van het skigebied. Elke rij van de tabel zijn classificaties gegeven door de skiërs. Elk paar stations kan concordant of discordant zijn. In kolommen C en NC tellen we de paren slechts in één richting. Het paar AB en BA worden bijvoorbeeld als één paar geteld om herhalingen te voorkomen.

De verkregen waarnemingen zijn:

Skigebied (ik) X Z
NAAR 1 1
B 2 3
C 3 4
D 4 2
EN 5 7
F 6 6
G 7 5
  1. We hebben de elementen van kolom X in oplopende volgorde gesorteerd om ze te kunnen vergelijken met de elementen van kolom Z
  2. We vinden de concordante paren en de discordante paren.
Skigebied (ik) X Z CNC
NAAR 1 1 6 0
B 2 3 5 0
C 3 4 5 1
D 4 2 4 0
EN 5 7 4 1
F 6 6 4 1
G 7 5 43 3 Totaal
  • Eerst kijken we naar kolom Z aangezien kolom X al in oplopende volgorde is gesorteerd. Bijgevolg zullen alle classificaties in kolom Z die niet oplopend zijn, discordante stationsparen zijn.
    • Als we paren van stations zoeken (concordant en niet-concordant) zullen we altijd de laatste rij waarnemingen hebben omdat we paren zoeken (sets van twee waarnemingen).
    • Al degenen die onder een referentieclassificatie vallen, zijn concordante paren. In het eerste geval stellen beide skiërs die referentieclassificatie vast op 1. Alle classificaties onder 1 zullen paren zijn die overeenkomen met A. In totaal hebben we 7 stations om te classificeren. Er zullen dus 6 concordante paren van A zijn. Aangezien we geen dissonante paren hebben die geassocieerd zijn met A, zullen we een nul plaatsen.

Lees het tweede deel van Kendall's Tau (II)