Dummy-variabel - Hvad er det, definition og koncept

Indholdsfortegnelse:

Dummy-variabel - Hvad er det, definition og koncept
Dummy-variabel - Hvad er det, definition og koncept
Anonim

En dummyvariabel er en variabel, der bruges til at forklare kvalitative værdier i en regressionsmodel.

Regressionsmodeller forsøger at forklare en variabel i forhold til andre. For eksempel en persons løn baseret på deres alder, uddannelse og erfaring. Disse variabler kan kvantificeres. En persons alder, uddannelse og erfaring kan kvantificeres i antal år. Men hvad sker der, når vi har variabler, der ikke kan kvantificeres? For eksempel hårfarve, land hvor du bor eller køn. Løsningen på dette problem er i dummy-variablerne. De er variabler, der normalt tager binære værdier. Det vil sige værdi nul eller en.

For eksempel er det variable køn, som vi har sagt, en kvalitativ variabel. For at inkludere det i en regressionsmodel skal du oprette en dummy-variabel. Vi vil kalde variablen "kvinde" således, at:

Kvinde = 1 (hvis personen er kvinde)

Kvinde = 0 (hvis individet ikke er kvinde, det vil sige, han er en mand)

I dette tilfælde betragtes "mand" som en referencekategori eller basegruppe.

Der er to typer dummyvariabler. På den ene side er der additive dummy-variabler, og på den anden side er der de multiplicative dummy-variabler.

Regressions analyse

Additiv dummy-variabel

En additiv dummyvariabel indsamler en fast ændring. Denne ændring påvirker kun ligningens konstante sigt. For eksempel en model, der sigter mod at forklare lønninger baseret på køn og år med uddannelse. Vi kan sætte ligningen tager som en reference til mænd (anden ligning) eller tager som en reference til kvinder (første ligning):

Den grafiske repræsentation af ligningerne ville være: I tilfælde af at mænd har højere lønninger, idet de tager en additiv dummyvariabel, ville modellen blive repræsenteret som det foregående billede.

I dit tilfælde, hvis kvinder havde højere lønninger end mænd, idet de tog en additiv dummyvariabel, ville modellen blive vist grafisk som det foregående billede.

Den kvantitative forskel mellem den blå linje (mænd) og den orange linje (kvinder) vil være lig med værdien af ​​variablen «Kvinder"eller"Mænd»I henhold til den valgte model. I dette tilfælde afhænger lønforskellen af ​​additivdummy-variablerne ikke af niveauet for undersøgelser. Med andre ord afhænger lønforskellen udelukkende af køn.

Multiplikativ dummyvariabel

En multiplikativ dummyvariabel fanger en ændring i ligningenes hældning for mænd og kvinder. Fortsat med det foregående eksempel har vi:

Grafisk vil en mulig repræsentation være:

I dette tilfælde fortæller modellen os to ting. Først og fremmest er kvinders lønninger lavere end mænds. Og for det andet, at et ekstra år med uddannelse betaler bedre for mænd end kvinder. Vi ved dette, fordi hældningen på den blå linje (mænd) er større end hældningen på den orange linje (kvinder).

Hvis et ekstra år med uddannelse blev bedre betalt til kvinder, ville hældningen af ​​den orange linje (kvinder) være større. Og den blå linje (mænd) ville være under.

Statistisk variabel