Curtosis - Hvad er det, definition og koncept

Indholdsfortegnelse:

Curtosis - Hvad er det, definition og koncept
Curtosis - Hvad er det, definition og koncept
Anonim

Kurtosen er et statistisk mål, der bestemmer graden af ​​koncentration, som værdierne af en variabel findes omkring den centrale zone i frekvensfordelingen. Det er også kendt som en målretningsforanstaltning.

Når vi måler en tilfældig variabel, er resultaterne med den højeste frekvens generelt de omkring gennemsnittet af fordelingen. Lad os forestille os elevernes højde i en klasse. Hvis klassens gennemsnitlige højde er 1,72 cm, er den mest normale ting, at resten af ​​de studerendes højder er omkring denne værdi (med en vis grad af variation, men uden at være for stor). Hvis dette sker, betragtes fordelingen af ​​den tilfældige variabel som normalfordelt. Men i betragtning af uendelighed af variabler, der kan måles, er dette ikke altid tilfældet.

Der er nogle variabler, der præsenterer en højere grad af koncentration (mindre dispersion) af værdierne omkring deres gennemsnit, og andre, tværtimod, præsenterer en lavere grad af koncentration (større dispersion) af deres værdier omkring deres centrale værdi. Derfor informerer kurtosis os om, hvor spids (højere koncentration) eller fladtrykt (lavere koncentration) en distribution er.

Foranstaltninger af central tendensKumulativ frekvens

Typer af kurtose

Afhængig af graden af ​​kurtose har vi tre typer fordelinger:

1. Leptokurtic: Der er en stor koncentration af værdier omkring deres gennemsnit (g2>3)

2. Mesocúrtic: Der er en normal koncentration af værdier omkring deres gennemsnit (g2=3).

3. Platicúrtica: Der er en lav koncentration af værdierne omkring deres gennemsnit (g2<3).

Kurtosis målinger i henhold til dataene

Afhængig af grupperingen af ​​dataene eller ikke anvendes en eller anden formel.

Ikke-grupperede data:

Data grupperet i hyppighedstabeller:

Data grupperet i intervaller:

Eksempel på beregning af kurtose for ikke-grupperede data

Antag, at vi vil beregne kurtosen af ​​følgende fordeling:

8,5,9,10,12,7,2,6,8,9,10,7,7.

Vi beregner først det aritmetiske gennemsnit (µ), som ville være 7,69.

Dernæst beregner vi standardafvigelsen, som ville være 2,43.

Efter at have haft disse data og for nemheds skyld i beregningen kan der laves en tabel til beregning af tællerens del (fjerde øjeblik af fordelingen). For den første beregning ville det være: (Xi-µ) 4 = (8-7.69) 4 = 0.009.

Data(Xi-µ) 4
80,0090
552,5411
92,9243
1028,3604
12344,3330
70,2297
21049,9134
68,2020
80,0090
92,9243
1028,3604
70,2297
70,2297
N = 13∑ = 1.518,27

Når vi først har lavet denne tabel, bliver vi simpelthen nødt til at anvende den formel, der tidligere var udsat for at have kurtosen.

g2 = 1.518,27/13*(2,43)^4 = 3,34

I dette tilfælde siden g2 er større end 3, ville fordelingen være leptokurtisk og præsentere en større pege end normalfordelingen.

Overskydende kurtose

I nogle manualer præsenteres kurtosis som overskydende kurtosis. I dette tilfælde sammenlignes det direkte med normalfordelingens. Da normalfordelingen har kurtosis 3, ville vi kun trække 3 fra vores resultat for at opnå det overskydende.

Overskydende kurtosis = g2-3 = 3,34-3 = 0,34.

Fortolkningen af ​​resultatet i dette tilfælde ville være følgende:

g2-3> 0 -> leptokurtisk fordeling.

g2-3 = 0 -> mesokortisk (eller normal) fordeling.

g2-3 platisk fordeling.

Beskrivende statistik