Spearmans rho er et ikke-parametrisk afhængighedsmål, hvori middelhierarkiet for observationer beregnes, forskellene er kvadreret og indarbejdet i formlen.
Med andre ord tildeler vi en rangordning til observationer af hver variabel og studerer afhængighedsforholdet mellem to givne variabler.
Klassificerede korrelationer er et ikke-parametrisk alternativ som et mål for afhængighed mellem to variabler, når vi ikke kan anvende Pearson's korrelationskoefficient.
Generelt tildeles brevet giega rho til korrelationskoefficienten.
Spearmans rho estimat er givet af:
Rho Spearman procedure
0. Vi starter fra en prøve på n observationer (Ajeg, Bjeg).
1. Klassificer observationer af hver variabel, og juster dem for bånd.
- Vi bruger en excel-funktion, der klassificerer observationer for os og justerer dem automatisk, hvis den finder bånd mellem elementerne. Denne funktion kaldes HERARCH.MEDIA (klassifikation Ajeg; En klassifikationn;bestille).
- Den sidste faktor i funktionen er valgfri og fortæller os i hvilken rækkefølge vi vil bestille observationer. Et ikke-nul nummer sorterer observationer i stigende rækkefølge. For eksempel tildeler det det mindste element en rang på 1. Hvis vi sætter nul i variablen bestille, tildeler den største vare en rang på 1 (faldende rækkefølge).
Praktisk eksempel
- I vores tilfælde tildeler vi ordrevariablen et ikke-nul-nummer for at bestille observationer i stigende rækkefølge. Det vil sige at tildele det mindste element i variablen en rang på 1.
- Vi kontrollerer, at de samlede summer af kolonnerne på Klassifikation A Y Klassifikation B de er lige til hinanden og mødes:
I dette tilfælde er n = 10, fordi vi har i alt 10 elementer / observationer i hver variabel TIL Y B.
Den samlede sum af klassifikation A er lig med den samlede sum af klassificering Y, og de opfylder også ovenstående formel.
TIL | B | Klassifikation A | Klassifikation B | Kvadratiske forskelle |
0 | 50 | 2,5 | 8,5 | 36 |
70 | -20 | 9 | 3 | 36 |
-20 | 30 | 1 | 6,5 | 30,25 |
40 | -90 | 6 | 1 | 25 |
30 | 0 | 5 | 4 | 1 |
50 | 30 | 7 | 6,5 | 0,25 |
20 | 20 | 4 | 5 | 1 |
0 | -40 | 2,5 | 2 | 0,25 |
80 | 70 | 10 | 10 | 0 |
60 | 50 | 8 | 8,5 | 0,25 |
Total | 55 | 55 | 130 |
2. Tilføj forskellene mellem placeringen og firkant dem.
- Når vi har alle de klassificerede observationer under hensyntagen til båndene mellem dem, beregner vi forskellen i formen:
djeg = Ajeg - Bjeg
Vi definerer (djeg) som forskellen mellem klassificeringen af Ajeg og klassificeringen af Bjeg.
- Når forskellen er opnået, kvadrerer vi den. Kvadraterne for forskellene anvendes til kun at have positive værdier.
Vi definerer djeg2 som den kvadratiske forskel mellem klassificeringen af Ajeg og klassificeringen af Bjeg.
I kolonnen med firkantede forskelle har vi:
djeg2 = (Ajeg - Bjeg)2
3. Beregn Spearmans rho:
- Vi beregner den samlede sum af formens kvadratiske forskelle:
I vores eksempel:
- Vi inkorporerer resultatet i Spearmans rho-formel:
I vores eksempel:
Sammenligning: Pearson vs Spearman
Hvis vi beregner Pearsons korrelationskoefficient givet de tidligere observationer og sammenligner den med Spearmans korrelationskoefficient, får vi:
- Pearson = 0.1109
- Spearman = 0.2121
Vi kan se, at afhængigheden mellem variablerne A og B forbliver svag, selv når vi bruger Spearman i stedet for Pearson.
Hvis outliers havde stor indflydelse på resultaterne, ville vi finde en stor forskel mellem Pearson og Spearman, og derfor skulle vi bruge Spearman som et mål for afhængighed.