Varians er et mål for spredning, der repræsenterer variationen i en dataserie i forhold til dens gennemsnit. Formelt beregnes det som summen af de kvadratiske rester divideret med det samlede antal observationer.
Det kan også beregnes som standardafvigelsen i kvadrat. I øvrigt forstår vi restværdien som forskellen mellem værdien af en variabel ad gangen og middelværdien af hele variablen.
Se alle målinger af spredningFør vi ser på variansformlen, må vi sige, at variansen i statistik er meget vigtig. Da selvom det er en simpel foranstaltning, kan den give en masse information om en bestemt variabel.
Formel til beregning af variansen
Måleenheden for variansen vil altid være den måleenhed, der svarer til dataene, men i kvadrat. Variansen er altid større end eller lig med nul. Da resterne er kvadreret, er det matematisk umuligt for variansen at komme negativ ud. Og på den måde kan det ikke være mindre end nul.
Hvor
- X: variabel, som variansen skal beregnes på
- xjeg: observationsnummer i for variabel X. Jeg kan tage værdier mellem 1 og n.
- n: antal observationer.
- x: Det er gennemsnittet af variablen X.
Eller hvad er det samme:
Hvorfor er resterne kvadreret?
Årsagen til, at resterne er kvadreret, er enkel. Hvis de ikke blev kvadreret, ville summen af rester være nul. Det er en egenskab ved affald. Så for at undgå dette, som med standardafvigelsen, er de kvadreret. Resultatet er den måleenhed, hvor dataene måles, men er kvadratiske.
For eksempel, hvis vi havde data om lønningerne til et sæt mennesker i euro, ville de data, der giver variationen være i kvadrat euro. For at fortolkningen skal give mening, beregner vi standardafvigelsen og overfører dataene til euro.
- Afvigelse -> (2-3) = -1
- Afvigelse -> (4-3) = 1
- Afvigelse -> (2-3) = -1
- Afvigelse -> (4-3) = 1
- Afvigelse -> (2-3) = -1
- Afvigelse -> (4-3) = 1
Hvis vi tilføjer alle afvigelser, er resultatet nul.
RangHvad er forskellen mellem variansen og standardafvigelsen?
Et spørgsmål, der kunne stilles, og med god grund, ville være forskellen mellem varians og standardafvigelse. I virkeligheden kommer de til at måle det samme. Variansen er standardafvigelsen i kvadrat. Eller omvendt er standardafvigelsen kvadratroden af variansen.
Standardafvigelsen er lavet for at kunne arbejde i de indledende måleenheder. Som det er normalt, kan man selvfølgelig undre sig over, hvad nytter det at have varians som begreb? Selvom fortolkningen af den værdi, den returnerer, ikke giver os meget information, er dens beregning nødvendig for at opnå værdien af andre parametre.
For at beregne kovariansen har vi brug for variansen og ikke standardafvigelsen, for at beregne nogle økonometriske matricer anvendes variansen og ikke standardafvigelsen. Det er et spørgsmål om komfort, når man arbejder med dataene i henhold til hvilke beregninger.
Eksempel på variansberegning
Vi skal mønte en række data om lønninger. Vi har fem personer, hver med en anden løn:
Juan: 1.500 euro
Pepe: 1.200 euro
José: 1.700 euro
Miguel: 1.300 euro
Mateo: 1.800 euro
Den gennemsnitlige løn, som vi har brug for til vores beregning, er ((1.500 + 1.200 + 1.700 + 1.300 + 1.800) / 5) 1.500 euro.
Da variansformlen i dens nedbrudte form er formuleret som følger:
Vi opnår, at det skal beregnes således, at:
Resultatet er 52.000 euro i kvadrat. Det er vigtigt at huske, at når vi beregner variansen, har vi måleenhederne kvadratisk. For at konvertere det til euro skal vi i dette tilfælde udføre standardafvigelsen. Det omtrentlige resultat ville være 228 euro. Dette betyder, at forskellen mellem de forskellige menneskers løn i gennemsnit vil være 228 euro.