Modeller med binært valg
Modeller med binært valg er modeller, hvor den afhængige variabel kun tager to værdier: 1 for at angive "succes" eller "0" for at indikere fiasko. De konkrete estimeringsmodeller er: lineær sandsynlighed, logit og probit.
I den enkle eller multiple regressionsmodel, der undervises i det indledende Econometrics-kursus, har den afhængige variabel normalt en økonomisk fortolkning (såsom stigningen i BNP, investering eller forbrug) fra andre forklarende variabler.
Men hvilken model bruger vi, når vi vil forklare begivenheder, der kun har to muligheder? For eksempel: beståelse af emnet eller ikke beståelse, eksamen fra college eller ikke eksamen, arbejde eller arbejdsløs osv. Dette er hvad binære valgmodeller reagerer på.
I hvert af disse tilfælde kan du lave Y = 1 betegner "succes"; Y = 0 betegne "fiasko." Af denne grund kaldes de binære valgmodeller, og ligningen, den bruger, er sådan:

På denne måde opnår vi sandsynligheden for succes for en bestemt variabel.
Indtil videre har den ingen større komplikationer. Imidlertid kræver estimering og fortolkning af parametrene større omhu.
RegressionsmodelModeller til estimering af binære parametre
I betragtning af de ovennævnte egenskaber ved den uafhængige variabel er der tre modeller til estimering af parametrene:
- Lineær sandsynlighedsmodel. Det beregnes gennem normal OLS.
- Logit-model. Det beregnes med en standard logistisk fordelingsfunktion.
- Probit-model. Det beregnes med en standard normalfordelingsfunktion.
Lineær sandsynlighedsmodel
Den lineære sandsynlighedsmodel (MPL) er så navngivet, fordi sandsynligheden
svaret er lineært med hensyn til ligningens parametre. Brug almindelige mindste kvadrater (OLS) til estimationen
Den estimerede ligning er skrevet

Den uafhængige variabel (og hat) er den forudsagte sandsynlighed for succes.
B0 cap er den forudsagte sandsynlighed for succes, når hver af x'erne er lig med nul. Koefficienten B1 cap måler variationen af den forudsagte sandsynlighed for succes, når x1 øger en enhed.For korrekt at fortolke en lineær sandsynlighedsmodel skal vi tage højde for, hvad der betragtes som en succes, og hvad der ikke er.
Eksempel på model for binært valg
Økonomen Jeffrey Wooldridge estimerede en økonometrisk model, hvor den binære variabel angiver, om en gif.webpt kvinde deltog i arbejdsstyrken (forklaret variabel) i løbet af 1975. I dette tilfælde Y = 1 betød, at e deltog Y = 0 som ikke gjorde det.
Modellen bruger mands indkomstniveau som forklarende variabler (hinc), års uddannelse (uddannelse), års erfaring på arbejdsmarkedet (eksper), alder (alder), antallet af børn under seks år (kidslt6) og antallet af børn mellem 6 og 18 år (kidsge6).

Vi kan kontrollere, at alle variabler undtagen kidsge6 er statistisk signifikante, og at alle signifikante variabler har den forventede effekt.
Nu er fortolkningen af parametrene sådan:
- Hvis du øger et års uddannelse, ceteris paribus, øges sandsynligheden for at blive medlem af arbejdsstyrken med 3,8%.
- Hvis oplevelsen stiger om et år, øges sandsynligheden for at være en del af arbejdsstyrken med 3,9%.
- Hvis du har et barn under 6 år, ceteris paribus, mindskes sandsynligheden for at være en del af arbejdsstyrken med 26,2%.
Så vi ser, at denne model fortæller os effekten af hver situation på sandsynligheden for, at en kvinde formelt ansættes.
Denne model kan bruges til at evaluere offentlige politikker og sociale programmer, da ændringen i den "forudsagte sandsynlighed for succes" kan kvantificeres med hensyn til enheds- eller marginale ændringer i de forklarende variabler.
Ulemper ved den lineære sandsynlighedsmodel
Denne model har dog to hoved ulemper:
- Det kan give sandsynligheder mindre end nul og større end en, hvilket ikke giver mening med hensyn til fortolkning af disse værdier.
- De delvise effekter er altid konstante. I denne model er der ingen forskel mellem at gå fra nul børn til et barn end at gå fra to til tre børn.
- Da den forklarende variabel kun tager værdier på nul eller en, kan heteroscedasticitet genereres. Standardfejl bruges til at løse dette.
For at løse de to første problemer, som er de vigtigste i den lineære sandsynlighedsmodel, blev Logit- og Probit-modellerne designet.
Referencer:
Wooldridge, J. (2010) Introduktion til økonometri. (4. udgave) Mexico: Cengage Learning.