Den lineære sandsynlighedsmodel er en binær valgmodel. I dette er den betingede forventning af den afhængige variabel en lineær funktion, dvs. forholdet mellem den afhængige variabel og den forklarende variabel (er) er konstant.
For at se det på en anden måde er den lineære sandsynlighedsmodel en model, hvor vi har en afhængig variabel og en uafhængig variabel (er) ganget med en permanent koefficient (er).
Vi skal påpege, at den lineære sandsynlighedsmodel er en binær valgmodel, det vil sige hvor den afhængige variabel kan tage to værdier. Disse værdier er henholdsvis 1 eller 0 for at angive henholdsvis succes eller fiasko.
Den lineære sandsynlighedsmodel udtrykkes som følger:
E (Y | X = x) = Pr (Y = 1 | X = x) = p (x) = β0 + β1x
I den viste ligning fortolkes den betingede forventning af Y givet X som lig med β0 + β1x.
I dette tilfælde tager vi den betingede forventning, da vi er interesseret i at vide sandsynligheden for, at et individ træffer en beslutning i betragtning af deres egenskaber, for eksempel (eller en anden uafhængig variabel kan tages som reference).
Ulemper ved den lineære sandsynlighedsmodel
Nogle ulemper ved den lineære sandsynlighedsmodel er som følger:
- Den lineære sandsynlighedsmodel kan vise heteroskedasticitet. Nemlig afvigelsen af fejlene er ikke den samme i alle de observerede observationer. I så fald anvendes standardfejl.
- Det kan ikke antages, at fejlene normalt fordeles.
- Den afhængige variabel kan kun tage to værdier.
- Det antages, at de uafhængige og afhængige variabler har et lineært forhold, dvs. ændringshastigheden er altid den samme. Det kan dog være mere nøjagtigt at opbygge en model, hvor ændringshastigheden stiger, når Y når en højere værdi, og det modsatte sker, når Y falder.
I betragtning af disse ulemper er der logit- og probit-modellerne.
Eksempel på en lineær sandsynlighedsmodel
En lineær sandsynlighedsmodel kan f.eks. Konstrueres, hvor den afhængige variabel er, om personen i øjeblikket har et formelt job, som de har haft i et år eller længere. De uafhængige variabler kunne være niveauet for studier eller uddannelsesniveau, køn og alder.
I det viste eksempel vil den afhængige variabel være 1 eller 0, men den skal fortolkes kvalitativt, uanset dens numeriske værdi. Således betyder 1, at personen har et formelt job, der er blevet opretholdt i mere end 1 år, og 0 ville være den situation, hvor dette ikke forekommer.