Kendall's Tau (I) - Hvad det er, definition og koncept

Indholdsfortegnelse:

Kendall's Tau (I) - Hvad det er, definition og koncept
Kendall's Tau (I) - Hvad det er, definition og koncept
Anonim

Det er et ikke-parametrisk afhængighedsmål, der identificerer de konkordante og uoverensstemmende par med to variabler. Når de er identificeret, beregnes totalerne, og kvotienten oprettes.

Klassificerede korrelationer er et ikke-parametrisk alternativ som et mål for afhængighed mellem to variabler, når vi ikke kan anvende Pearson's korrelationskoefficient.

Med andre ord tildeler vi en rangordning til observationer af hver variabel og studerer afhængighedsforholdet mellem to givne variabler. Der er to måder at beregne Kendalls Tau på; vi vælger at beregne afhængighedsforholdet, når observationer af hver variabel er blevet bestilt. I vores eksempel ser vi, at vi har sorteret placeringen i kolonne X i stigende rækkefølge.

Matematisk,

Vi definerer:

Cn = samlet antal matchende par.

NCn = samlet antal ikke-overensstemmelse (uoverensstemmende) par.

Procedure og praktisk eksempel

For at opnå Kendalls Tau skal vi først vide, hvordan man identificerer de konkordante og uoverensstemmende par med to variabler.

Vi bruger skiløbernes præferencer. I dette eksempel antager vi, at vi vil evaluere, om skiløberne klassificerer deres præferencer for alpint eller nordisk skiløb i samme rækkefølge i en station i. Deres ratings kan variere fra 1 (meget at foretrække) til 7 (meget lidt at foretrække).

Vores spørgsmål ville være: er der en afhængighed mellem præference for downhill skiløbere og nordiske skiløbere på de givne skisportssteder?

Vi definerer:

X = vurdering af skiløbere til alpint skiløb i station i.

Y = vurdering af skiløbere til nordisk skiløb på station i.

C = konkordante par.

NC = uoverensstemmende / uoverensstemmende par.

OGjeg = skisportssted i.

Behandle

  • Vi starter med en prøve af n = 7 observationer af skisportssteder. Hver række i tabellen er klassifikationer givet af skiløberne. Hvert par stationer kan være overensstemmelse eller uoverensstemmende. I kolonne C og NC tæller vi kun parene i en retning. For eksempel tælles parret AB og BA som et enkelt par for at undgå gentagelser.

De opnåede observationer er:

Skisportssted (jeg) x Z
TIL 1 1
B 2 3
C 3 4
D 4 2
OG 5 7
F 6 6
G 7 5
  1. Vi har sorteret elementerne i kolonne X i stigende rækkefølge for at kunne sammenligne dem med elementerne i kolonne Z
  2. Vi finder de sammenhængende par og de uoverensstemmende par.
Skisportssted (jeg) x Z CNC
TIL 1 1 6 0
B 2 3 5 0
C 3 4 5 1
D 4 2 4 0
OG 5 7 4 1
F 6 6 4 1
G 7 5 43 3 Total
  • Først ser vi på kolonne Z, da kolonne X allerede er sorteret i stigende rækkefølge. Derfor vil alle klassifikationer i kolonne Z, der ikke stiger, være uoverensstemmende stationspar.
    • Når vi ser efter par stationer (concordant og non-concordant), vil vi altid have den sidste række observationer, fordi vi leder efter par (sæt med to observationer).
    • Alle dem, der er under en referenceklassifikation, vil være konkordante par. I det første tilfælde fastslår begge skiløbere, at referenceklassificeringen er 1. Alle klassifikationer under 1 vil være par i overensstemmelse med A. I alt har vi 7 stationer at klassificere. Så der vil være 6 sammenhængende par A. Da vi ikke har nogen uoverensstemmende par forbundet med A, sætter vi nul.

Læs anden del af Kendall's Tau (II)