Kvartilafvigelse - Hvad det er, definition og koncept

Kvartilafvigelse er et statistisk mål for spredning, der returnerer den centrale værdi af interkvartilområdet og bruges i skæve datasæt.

Med andre ord er kvartilafvigelsen at beregne medianen for interkvartilområdet (IQR) og bruges i datasæt med en hel del ekstreme værdier.

Forkortelsen for kvartilafvigelse er DQ.

Interkvartil rækkevidde

Interkvartilområdet er et mål for spredning af et datasæt, der generelt bruges i boksplottet. Interkvartilområdet er med andre ord forskellen mellem det næstsidste og de første kvartiler i en distribution, der bruges i boksplottet.

IQR = Q3 - Q1

Fordelen ved at bruge interkvartilområdet er, at kvartilafvigelsen (DQ) kan beregnes, hvilket er et meget passende mål for spredning, når vi har forudindtagede datasæt.

Kvartilafvigelsesformel

Kvartilafvigelsen beregnes som divisionen af ​​interkvartilområdet med 2.

DQ = (Q3 - Q1) / 2 = RIC / 2

Da vi kun overvejer spredningen mellem tredje og første kvartil, ignorerer vi alle data uden for dette interval. Og derfor er alle værdier tæt på at være ekstreme. Så hvis vi deler interkvartilområdet med to, opnår vi medianværdien af ​​dispersionen.

Eksempel på kvartilafvigelse

Vi antager, at vi ønsker at beregne interkvartilområdet og kvartilafvigelsen for antallet af cyklister, der passerer vores hus i løbet af året.

  1. Først tæller vi cyklisterne og samler oplysningerne i en tabel.
  1. For det andet beregner vi det første og tredje kvartil for at opnå interkvartilområdet.

Q3 = 550

Q1 = 200

IQR = Q3 - Q1 = 550-200 = 350

  1. For det tredje beregner vi kvartildispersionen ved blot at dividere interkvartilområdet med to.

DQ = (Q3 - Q1) / 2 = IQR / 2 = 350/2 = 175

Kvartilspredningen for dette datasæt er 175. Dette tal er den centrale værdi i interkvartilområdet.

Det er vigtigt at bemærke, at dataene for juli måned er ekstreme data, da de er flere gange højere end alle andre data. Så vi kan sige, at dette datasæt er partisk mod den måned. Takket være ”uvidenheden” om kvartilens spredning mod ekstreme data er resultatet af denne foranstaltning meget lig, hvis kun 600 cyklister cirkulerede i juli. Hvis der kun var 600 cyklister i juli, ville kvartildispersionen være 162,5, meget tæt på 175 i betragtning af at antallet af cyklister den måned er 10 gange mindre.

Populære Indlæg

Afledt af en terningrod

✅ Afledt af en terningrod | Hvad det er, mening, koncept og definition. Derivatet af en terningrod er lig med 1 ud af tre gange basen ...…

Afledt af kvadratroden

✅ Afledt af kvadratroden | Hvad det er, mening, koncept og definition. Derivatet af en kvadratrode er lig med 1 mellem basen ganget med ...…