Variationskoefficient - Hvad er det, definition og betydning
Variationskoefficienten, også kendt som Pearson's variationskoefficient, er et statistisk mål, der informerer os om den relative spredning af et datasæt.
Det vil sige, det informerer os ligesom andre målinger af spredning om, hvorvidt en variabel bevæger sig meget, lidt, mere eller mindre end en anden.
Formel for variationskoefficient
Dens beregning opnås ved at dividere standardafvigelsen med den absolutte værdi af middelværdien af sættet og udtrykkes normalt som en procentdel for bedre forståelse.

- X: variabel, som variansen skal beregnes på
- σx: Standardafvigelse for variabel X.
- | x̄ |: Det er gennemsnittet af variablen X i absolut værdi med x̄ ≠ 0
Variationskoefficienten kan ses udtrykt med bogstaverne CV eller r, afhængigt af manualen eller den anvendte skrifttype. Dens formel er følgende:
Variationskoefficienten bruges til at sammenligne datasæt, der tilhører forskellige populationer. Hvis vi ser på dens formel, ser vi, at det tager hensyn til middelværdien. Derfor tillader variationskoefficienten os at have et dispersionsmål, der eliminerer de mulige forvrængninger af midlerne til to eller flere populationer.
RangEksempler på anvendelse af variationskoefficienten i stedet for standardafvigelsen
Her er nogle eksempler på dette mål for spredning:
Sammenligning af datasæt med forskellige dimensioner
Vi ønsker at købe spredningen mellem højden på 50 studerende i en klasse og deres vægt. For at sammenligne højden kunne vi bruge meter og centimeter som måleenhed og kilogram for vægt. At sammenligne disse to distributioner ved hjælp af standardafvigelsen ville ikke give mening, da vi forsøger at måle to forskellige kvalitative variabler (et mål for længde og en for masse).
Sammenlign sæt med stor forskel mellem midler
Forestil dig for eksempel, at vi vil måle vægten af biller og flodheste. Vægten af biller måles i gram eller milligram, og flodhestens vægt måles normalt i tons. Hvis vi til vores måling konverterer billenes vægt til tons, så begge populationer er på samme skala, ville det ikke være passende at bruge standardafvigelsen som et mål for spredning. Den gennemsnitlige billevægt målt i tons ville være så lille, at hvis vi brugte standardafvigelsen, ville der næppe være nogen spredning i dataene. Dette ville være en fejltagelse, da vægten mellem forskellige billearter kan variere betydeligt.
Eksempel på beregning af variationskoefficienten
Overvej en population af elefanter og en anden af mus. Elefantpopulationen har en gennemsnitlig vægt på 5.000 kg og en standardafvigelse på 400 kg. Muspopulationen har en gennemsnitlig vægt på 15 gram og en standardafvigelse på 5 gram. Hvis vi sammenligner dispersionen af begge populationer ved hjælp af standardafvigelsen, tror vi måske, at der er større spredning for populationen af elefanter end for mus.
Men når vi beregner variationskoefficienten for begge populationer, ville vi indse, at det er lige det modsatte.
Elefanter: 400/5000 = 0,08
Mus: 5/15 = 0,33
Hvis vi gange begge data med 100, har vi, at variationskoefficienten for elefanter kun er 8%, mens den for mus er 33%. Som en konsekvens af forskellen mellem populationerne og deres gennemsnitlige vægt ser vi, at befolkningen med den største spredning ikke er den med den største standardafvigelse.
KonfidensintervalLineær korrelationskoefficient