Statistisk normalisering - Hvad det er, definition og koncept

Indholdsfortegnelse

Statistisk normalisering er skalatransformationen af ​​fordelingen af ​​en variabel for at kunne sammenligne med hensyn til sæt af elementer og middelværdien ved at eliminere virkningerne af påvirkninger.

Med andre ord er normalisering proportioner uden måleenheder (dimensionsløs eller skala-uforanderlig), der giver os mulighed for at sammenligne elementer af forskellige variabler og forskellige måleenheder.

I statistik og økonometri bruges standardiserede sandsynlighedsfordelingstabeller til at finde sandsynligheden for, at en observation tager den fordelingsfunktion, som variablen følger.

Det er vigtigt ikke kun at begrænse normaliseringsperioden til sæt af elementer, hvor normalfordelingen er en god tilnærmelse til deres frekvens.

Statistisk variabel

Bord

Følgende tabel viser de mest almindelige standardiseringer i statistikker anvendt på økonomi og økonomi.

  • Den typificerede eller standardscore normaliserer fejlene, når vi kan beregne prøveparametrene.
  • Normaliseringen i studentens t-distribution normaliserer resterne, når parametrene er ukendte, og vi foretager et skøn for at opnå dem.
  • Variationskoefficienten bruger middelværdien som et målestok i modsætning til den standardiserede score og Student's t, som bruger standardafvigelsen. Fordelingen normaliseres for Poisson- og eksponentielle distributioner.
  • Det standardiserede øjeblik kan anvendes på enhver sandsynlighedsfordeling, der har en momentgenererende funktion. Med andre ord, at momentenes integraler er konvergente.

Ansøgninger

Hvor mange gange har vi læst, at den normale sandsynlighedsfordeling virker som en tilstrækkelig tilnærmelse til observationsfrekvensen, og vi bliver bedt om at finde sandsynligheden for, at variablen X tager en bestemt værdi?

Med andre ord indstiller vi X ~ N (μ, σ2), og vi bliver bedt om at finde P (X ≤ xjeg)

Vi ved, at for at finde P (X ≤ xjeg), skal vi slå sandsynligheden op i sandsynlighedsfordelingstabellerne. I dette tilfælde i tabellerne over fordelingen af ​​normalfordelingen. De mest anvendte sandsynlighedsfordelingstabeller i økonometri og kvantitativ finansiering er: chi-kvadrat, Student's t, Fisher-Snedecor's F, Poisson, eksponentiel, cauchy og standardnormalen.

Sandsynlighederne beregnet i distributionstabellerne opfylder egenskaben:

Det vil sige, sandsynlighederne (tallene i tabellen) er typificeret. Derefter bliver vi også nødt til at skrive vores variabel i henhold til parametrene for fordelingsfunktionen, hvis vi vil finde sandsynligheden for P (X ≤ xjeg).

Praktisk eksempel

Vi vil vide sandsynligheden for, at antallet af skiløbere, der går på ski en fredag ​​morgen, er 288.

Skisportsstedet fortæller os, at hyppigheden af ​​skiløbervariablen kan tilnærme en normalfordeling af gennemsnit 280 og varians 16.

Så vi har:

X ~ N (μ, σ2)

hvor X er defineret som variablen 'skiløbere'

De beder os om sandsynligheden for, at antallet af skiløbere, der går på ski en fredag, er mindre end eller lig med 288. Det vil sige:

P (X ≤ 288)

Behandle

For at finde sandsynligheden for, at antallet af skiløbere er lig med 288, skal vi først skrive variablen.

Derefter ser vi på distributionstabellen for den kontinuerlige standardnormal:

Z 0 1 2 3
2,0 0,9772 0,9778 0,9783 0,9788

Sandsynligheden for, at 288 skiløbere vil stå på ski en fredag ​​morgen, er 97,72% i betragtning af middel- og variansparametrene.

Du vil bidrage til udviklingen af ​​hjemmesiden, at dele siden med dine venner

wave wave wave wave wave