Analyse af varians - Hvad er det, definition og begreb

Variansanalyse eller ANOVA (variansanalyse) er multivariate afhængighedsanalyseteknikker, der anvendes til at bestemme, om der er signifikante forskelle mellem middelværdien af ​​tre eller flere befolkningsgrupper.

Derfor vil vi med denne analyse finde ud af, om der er forskelle mellem bestemte grupper, når vi ændrer en eller flere egenskaber. For at finde ud af bruger vi værdien af ​​gennemsnittet af dataene.

Dens anvendelse er meget hyppig inden for områder som økonomi eller medicin.

Tidligere antagelser om variansanalysen

Der er en række forudsætninger for at udføre ANOVA, som skal være kendt. Disse er afgørende for at resultaterne skal være tilstrækkelige.

  • For det første skal befolkningen følge en normalfordeling. Derfor har vi at gøre med en type parametrisk kontrast, da populationsparametrene for middelværdien og standardafvigelsen er kendt.
  • Desuden skal de anvendte prøver være uafhængige af hinanden. Dette betyder, at en ændring i en af ​​dem ikke behøver at påvirke andres værdi.
  • På den anden side skal afvigelserne fra de undersøgte populationer være ens. Dette kaldes homoscedasticity.

Klassificering af analysen af ​​variansmodeller

Til analysen af ​​variansmodeller kan de tre klassifikationer vist nedenfor anvendes:

  • Model med faste effekter: Befolkningen er normal og adskiller sig kun i værdien af ​​deres respektive midler.
  • Tilfældige effekter model: I dette tilfælde har dataene et hierarki, og befolkningsforskellene afhænger af det.
  • Model med blandede effekter: Vi står overfor en model, der er en blanding af de to foregående.

ANOVA-eksempel: vigtige begreber

Der er matematiske ligninger af en vis kompleksitet til at udføre ANOVA. Men på Economy-Wiki.com vælger vi den enkle økonomi, og derfor vil vi udnytte teknologien vise, hvordan det kunne gøres i et regneark.

Lad os forestille os, at vi vil vide, om der er betydelige forskelle mellem Economy-Wiki.com-læsere, baseret på deres tilknytning til økonomi.

Advarsel: De data, vi vil bruge, er fiktive.

Vi skal gå til data, dataanalyse, og vi vælger variansanalysen for en faktor.

Rangen ville være matrixen for de tre grupper. Det kan være mere interessant at inkludere overskrifter bagefter og give den ønskede formatering. I vores tilfælde med logoet og farven blå.

Vi ser, at der er nogle begreber såsom grader af frihed og sandsynlighed eller betydning. Den første beregnes automatisk og er antallet af grupper minus en. Det andet fortæller os, om forskellene er signifikante eller ej.

Normalt starter du fra et accepteret niveau af tillid. I økonomi er det normalt 95% (0,95), hvilket er relateret til en betydning på 0,05 (1-0,095). Således, hvis denne sandsynlighed eller p-værdi er under den accepterede betydning, er forskellene signifikante.

I dette tilfælde ser det ud til, at graden ikke påvirker antallet af læsere (betydning> 0,05). Derfor synes variansanalysen at indikere, at Economy-Wiki.com interesserer alle, ikke kun specialiserede læsere. Selvfølgelig er de fiktive data eller ej?