Quantile - Hvad er det, definition og koncept

Indholdsfortegnelse:

Anonim

En kvantil er det punkt, der deler fordelingsfunktionen for en tilfældig variabel i regelmæssige intervaller.

Derfor er det intet andet end en statistisk teknik at adskille dataene fra en distribution. Naturligvis skal det være opfyldt, at grupperne er ens. Af denne grund er der forskellige typer kvantiler, som vi vil se senere, afhængigt af antallet af partitioner, de laver.

De er yderst nyttige i mange praktiske anvendelser, i eksemplet viser vi en.

Kvantilberegningsformular

Kvantiler kan beregnes ud fra et parametrisk og ikke-parametrisk synspunkt. Lad os se på både mere detaljeret og også den såkaldte "kvantilfunktion."

  • Parametrisk: De bruges i distributioner, hvis form vi kender. Det vil sige, fordelingen vil være normal, ensartet, eksponentiel osv. På denne måde antages det, at det er kendt, og dets hovedparametre (aritmetisk gennemsnit og varians) også.
  • Ikke parametrisk: Den er velegnet til små prøver, hvor det er svært at kende dens nøjagtige form, og derfor kender vi ikke dens fordelingsfunktion. Denne metode giver lignende værdier som den foregående, når prøven stiger, og brugen af ​​begge er derfor ligeglad.
  • Kvantilfunktion: Vi står over for en sandsynlig form for beregning. Målet er at beregne en værdi, der har en vis sandsynlighed i en distributionsfunktion. Vi vil ikke gå ind på matematiske spørgsmål, der komplicerer konceptet.

Hyppigste kvantiler

Vi skal vise, hvilke der er de mest anvendte kvantiler i statistikker. De fleste af dem bruges ofte til at være i stand til at analysere i detaljer distributionen af ​​data. Derudover er en anden af ​​dens anvendelser at adskille dataene i grupper og være i stand til at vælge den højeste eller den laveste. I eksemplet vil vi se dette mere detaljeret.

  • Kvartil: Opdel værdierne i fire lige store grupper, og der er tre kvartiler. Det er den hyppigste. Kvartil en (Q1) er den laveste data, og kvartil tre (Q3) er den højeste. På den anden side svarer kvartil to (Q2) til medianen (Me), som er en positionsstatistik, der deler fordelingen af ​​data i halvdelen. Kvantilværdierne ville være 0,25 (Q1), 0,5 (Q2) og 0,75 (Q3).
  • Kvintil: I lighed med den foregående er det mindre hyppigt og deler dataene i fem lige store dele. Derfor er der fire kvintiler. Kvantilværdierne i dette tilfælde ville være 0,20, 0,40, 0,60, 0,80.
  • Decil: I dette tilfælde er de opdelt i ti dele, og derfor er der ni deciler. Igen er dette heller ikke for hyppigt. Deres værdier ville være 0,1 til 0,9.
  • Percentiler: Vi står over for en variant, hvor fordelingen er opdelt i hundrede lige store dele. Det kan være af interesse for meget store prøver. Deres værdier varierer fra 0,01 til 0,99.

Kvantileksempel

Lad os se på et eksempel, hvor vi har en række data om indkomsten for indbyggerne i en bestemt kommune. Vi har beregnet de tre mest repræsentative kvartiler og tre deciler. Vi inkluderer de anvendte formler under hensyntagen til, at vi bruger de ækvivalente i percentiler til deciler. Husk, at dataene i Q2 og D5 svarer til medianen.

Vi kan konstatere, at indkomsten for de personer, der repræsenterer de mindst begunstigede 25% (Q1), er 2.900. I forhold til decilet er indkomsten for de 10% (D1) af de personer, der modtager mindst, 2.800. Den samme fortolkning er lavet med overordnede, men i omvendt retning. De 25% (Q3), der tjener mest, får en indkomst på 4.100 og de 10% på 4.800. Kvantilen afspejler derfor relevant information for at lære mere om en variabel.