Kendall's Tau (II) - Hvad det er, definition og koncept

Det er et ikke-parametrisk afhængighedsmål, der identificerer de konkordante og uoverensstemmende par med to variabler. Når de er identificeret, beregnes totalerne, og kvotienten oprettes.

Med andre ord tildeler vi en rangordning til observationer af hver variabel og studerer afhængighedsforholdet mellem to givne variabler.

Der er to måder at beregne Kendalls Tau på; vi vælger at beregne afhængighedsforholdet, når observationer af hver variabel er blevet bestilt. I vores eksempel ser vi, at vi sorterer placeringen i kolonne X i stigende rækkefølge.

Klassificerede korrelationer er et ikke-parametrisk alternativ som et mål for afhængighed mellem to variabler, når vi ikke kan anvende Pearson's korrelationskoefficient.

Dette er de resultater, vi har henvist til i den første artikel -> Kendalls Tau (I):

Skisportssted (jeg) x Z C NC
TIL 1 1 6 0
B 2 3 5 0
C 3 4 5 1
D 4 2 4 0
OG 5 7 4 1
F 6 6 4 1
G 7 5 43 3 TOTAL
  • BC-CB-parret er et uoverensstemmende par. Vi indtaster 1 i NC-kolonnen og fryser tælleren i den sidste position, indtil vi finder et matchende par igen. I dette tilfælde har vi frosset antallet af matchende par ved 5 op til station D. Station D kan kun danne 4 matchende par: AD-DA, DE-ED, DF-FD, DG-GD.

Et andet uoverensstemmende par ville være EF-FE:

  • EF-FE-parret er et uoverensstemmende par. Vi skriver 1 i NC-kolonnen og fortsætter med at trække antallet af 4 sammenfaldende par, der kan dannes. De matchende par af station E ville være: EA-AE, EB-BE, EC-CE, ED-DE, fordi EF-FE er uoverensstemmende.
    • FG-GF-parret er et uoverensstemmende par. Vi skriver 1 i NC-kolonnen og fortsætter med at trække antallet af 4 sammenfaldende par, der kan dannes. De konkordante par af stationen F s (vi har ikke varieret i stedet for 4. De konkordante par, som vi kunne vise før (vi har ikke varieret, ville være: FA-AF, FB-BF, FC-CF, FD-DF fordi FG-GF knager.

Vi beregner Kendalls Tau

Kendalls Tau har ingen hemmelighed ud over at være kvotienten for de konkordante og uoverensstemmende par af en prøve af observationer.

Fortolkning

Vores oprindelige spørgsmål var: er der et afhængighedsforhold mellem downhill skiløbere og nordiske skiløbere på givne skisportssteder?

I dette tilfælde har vi en afhængighed mellem de to variabler på 0,8695. Et resultat meget tæt på den øvre grænse. Dette resultat fortæller os, at alpine skiløbere (X) og nordiske skiløbere (Z) har klassificeret resorts med lignende klassifikationer.

Uden at skulle foretage nogen form for beregning kan vi se, at de første stationer (A, B, C) får de bedste score fra de to grupper. Med andre ord følger skiløbernes rang i samme retning.

Sammenligning: Pearson vs Kendall

Hvis vi beregner Pearsons korrelationskoefficient i betragtning af de tidligere observationer og sammenligner den med Kendalls Tau, får vi:

I dette tilfælde fortæller Kendalls Tau os, at der er en stærkere afhængighedsforhold mellem variablerne X og Z sammenlignet med Pearsons korrelationskoefficient: 0,8695> 0,75.

Hvis outliers havde stor indflydelse på resultaterne, ville vi finde en stor forskel mellem Pearson og Spearman, og derfor skulle vi bruge Spearman som et mål for afhængighed.