Variancia - Hvad er det, definition og betydning

Indholdsfortegnelse:

Anonim

Varians er et mål for spredning, der repræsenterer variationen i en dataserie i forhold til dens gennemsnit. Formelt beregnes det som summen af ​​de kvadratiske rester divideret med det samlede antal observationer.

Det kan også beregnes som standardafvigelsen i kvadrat. I øvrigt forstår vi restværdien som forskellen mellem værdien af ​​en variabel ad gangen og middelværdien af ​​hele variablen.

Se alle målinger af spredning

Før vi ser på variansformlen, må vi sige, at variansen i statistik er meget vigtig. Da selvom det er en simpel foranstaltning, kan den give en masse information om en bestemt variabel.

Formel til beregning af variansen

Måleenheden for variansen vil altid være den måleenhed, der svarer til dataene, men i kvadrat. Variansen er altid større end eller lig med nul. Da resterne er kvadreret, er det matematisk umuligt for variansen at komme negativ ud. Og på den måde kan det ikke være mindre end nul.

Hvor

  • X: variabel, som variansen skal beregnes på
  • xjeg: observationsnummer i for variabel X. Jeg kan tage værdier mellem 1 og n.
  • n: antal observationer.
  • x: Det er gennemsnittet af variablen X.

Eller hvad er det samme:

Hvorfor er resterne kvadreret?

Årsagen til, at resterne er kvadreret, er enkel. Hvis de ikke blev kvadreret, ville summen af ​​rester være nul. Det er en egenskab ved affald. Så for at undgå dette, som med standardafvigelsen, er de kvadreret. Resultatet er den måleenhed, hvor dataene måles, men er kvadratiske.

For eksempel, hvis vi havde data om lønningerne til et sæt mennesker i euro, ville de data, der giver variationen være i kvadrat euro. For at fortolkningen skal give mening, beregner vi standardafvigelsen og overfører dataene til euro.

  1. Afvigelse -> (2-3) = -1
  2. Afvigelse -> (4-3) = 1
  3. Afvigelse -> (2-3) = -1
  4. Afvigelse -> (4-3) = 1
  5. Afvigelse -> (2-3) = -1
  6. Afvigelse -> (4-3) = 1

Hvis vi tilføjer alle afvigelser, er resultatet nul.

Rang

Hvad er forskellen mellem variansen og standardafvigelsen?

Et spørgsmål, der kunne stilles, og med god grund, ville være forskellen mellem varians og standardafvigelse. I virkeligheden kommer de til at måle det samme. Variansen er standardafvigelsen i kvadrat. Eller omvendt er standardafvigelsen kvadratroden af ​​variansen.

Standardafvigelsen er lavet for at kunne arbejde i de indledende måleenheder. Som det er normalt, kan man selvfølgelig undre sig over, hvad nytter det at have varians som begreb? Selvom fortolkningen af ​​den værdi, den returnerer, ikke giver os meget information, er dens beregning nødvendig for at opnå værdien af ​​andre parametre.

For at beregne kovariansen har vi brug for variansen og ikke standardafvigelsen, for at beregne nogle økonometriske matricer anvendes variansen og ikke standardafvigelsen. Det er et spørgsmål om komfort, når man arbejder med dataene i henhold til hvilke beregninger.

Eksempel på variansberegning

Vi skal mønte en række data om lønninger. Vi har fem personer, hver med en anden løn:

Juan: 1.500 euro

Pepe: 1.200 euro

José: 1.700 euro

Miguel: 1.300 euro

Mateo: 1.800 euro

Den gennemsnitlige løn, som vi har brug for til vores beregning, er ((1.500 + 1.200 + 1.700 + 1.300 + 1.800) / 5) 1.500 euro.

Da variansformlen i dens nedbrudte form er formuleret som følger:

Vi opnår, at det skal beregnes således, at:

Resultatet er 52.000 euro i kvadrat. Det er vigtigt at huske, at når vi beregner variansen, har vi måleenhederne kvadratisk. For at konvertere det til euro skal vi i dette tilfælde udføre standardafvigelsen. Det omtrentlige resultat ville være 228 euro. Dette betyder, at forskellen mellem de forskellige menneskers løn i gennemsnit vil være 228 euro.