Statistisk spredning - Hvad det er, definition og koncept

Indholdsfortegnelse:

Anonim

Statistisk spredning er den grad, i hvilken en datadistribution bevæger sig væk fra eller tættere, i absolut værdi på det aritmetiske gennemsnit, som en central positionsstatistik.

Derfor vil dispersionsmålene altid ledsage det gennemsnit eller gennemsnit.

På denne måde rapporterer de variabiliteten eller spredningen af ​​dataene i forhold til det. Jo højere værdierne er, som vi vil se nedenfor, jo større er den statistiske spredning.

Betydningen af ​​statistisk spredning

Når vi ønsker at udføre en beskrivende analyse, beregner vi først de sammenfattende mål for position. De mest almindelige er middelværdien, medianen, tilstanden eller kvartiler, deciler, kvintiler eller percentiler. Vi skal også kende den statistiske spredning.

Spredningsforanstaltningerne giver meget relevant information. Hvis spredningen er meget høj, påvirker det middelværdien, og dette er ikke længere repræsentativt for gruppen som en sammenfattende foranstaltning. Derfor går begge data normalt sammen.

Statistiske spredningsforanstaltninger

Der er forskellige målinger af spredning, der muliggør måling. Lad os se et resumé af det mest relevante. Vi har analyseret dem mere detaljeret her.

  • Rang: Det er ikke mere end forskellen mellem den mindste og den største værdi af distributionen.
  • Gennemsnitlig afvigelse: Det svarer til gennemsnittet af de forskellige afvigelser for hver data fra gennemsnittet.
  • Variant og standardafvigelse: De er de bedst kendte målinger af spredning. Det andet, der er lettere at beregne (rod på variansen) og at fortolke, bruges normalt. De udtrykkes i absolutte værdier.
  • Variationskoefficient: I dette tilfælde beregnes det med standardafvigelsen og gennemsnittet og bruges til sammenligning, da det udtrykkes i relative værdier (%).
Statistiske spredningsforanstaltninger

Eksempel på statistisk spredning

Endelig vil vi se et eksempel på ti fiktive lande og deres BNP.

Vi kan se, at de er meget forskellige, når det kommer til deres BNP. Fra den største med 7.000 millioner enheder til den mindste med 2.500 millioner.

Vi ser, at gennemsnittet er næsten 4.500 millioner, men spredningsforanstaltningerne er meget høje. På den ene side er den gennemsnitlige afvigelse på næsten 1.500 millioner enheder. Variationen, som ikke bidrager meget, men tillader beregning af standardafvigelsen på næsten 1.500 millioner enheder. Endelig en variationskoefficient på næsten 33%.

Vi kan sige, at den statistiske spredning er meget høj, og middelværdien ikke er repræsentativ. Noget, der kan verificeres, fordi der er få data, og lande med et højt BNP og andre med et lavt observeres. Men forestil dig de 194 anerkendte af FN, der er de ganske nyttige, ikke?