Kvartilafvigelse - Hvad det er, definition og koncept
Kvartilafvigelse er et statistisk mål for spredning, der returnerer den centrale værdi af interkvartilområdet og bruges i skæve datasæt.
Med andre ord er kvartilafvigelsen at beregne medianen for interkvartilområdet (IQR) og bruges i datasæt med en hel del ekstreme værdier.
Forkortelsen for kvartilafvigelse er DQ.
Interkvartil rækkevidde
Interkvartilområdet er et mål for spredning af et datasæt, der generelt bruges i boksplottet. Interkvartilområdet er med andre ord forskellen mellem det næstsidste og de første kvartiler i en distribution, der bruges i boksplottet.
IQR = Q3 - Q1
Fordelen ved at bruge interkvartilområdet er, at kvartilafvigelsen (DQ) kan beregnes, hvilket er et meget passende mål for spredning, når vi har forudindtagede datasæt.
Kvartilafvigelsesformel
Kvartilafvigelsen beregnes som divisionen af interkvartilområdet med 2.
DQ = (Q3 - Q1) / 2 = RIC / 2
Da vi kun overvejer spredningen mellem tredje og første kvartil, ignorerer vi alle data uden for dette interval. Og derfor er alle værdier tæt på at være ekstreme. Så hvis vi deler interkvartilområdet med to, opnår vi medianværdien af dispersionen.
Eksempel på kvartilafvigelse
Vi antager, at vi ønsker at beregne interkvartilområdet og kvartilafvigelsen for antallet af cyklister, der passerer vores hus i løbet af året.
- Først tæller vi cyklisterne og samler oplysningerne i en tabel.

- For det andet beregner vi det første og tredje kvartil for at opnå interkvartilområdet.
Q3 = 550
Q1 = 200
IQR = Q3 - Q1 = 550-200 = 350
- For det tredje beregner vi kvartildispersionen ved blot at dividere interkvartilområdet med to.
DQ = (Q3 - Q1) / 2 = IQR / 2 = 350/2 = 175
Kvartilspredningen for dette datasæt er 175. Dette tal er den centrale værdi i interkvartilområdet.
Det er vigtigt at bemærke, at dataene for juli måned er ekstreme data, da de er flere gange højere end alle andre data. Så vi kan sige, at dette datasæt er partisk mod den måned. Takket være ”uvidenheden” om kvartilens spredning mod ekstreme data er resultatet af denne foranstaltning meget lig, hvis kun 600 cyklister cirkulerede i juli. Hvis der kun var 600 cyklister i juli, ville kvartildispersionen være 162,5, meget tæt på 175 i betragtning af at antallet af cyklister den måned er 10 gange mindre.