Relevant variabel udeladt

Indholdsfortegnelse:

Anonim

Undladelsen af ​​en relevant variabel er ikke-inkludering af en vigtig forklarende variabel i en regression. I betragtning af Gauss-Markov-antagelserne ville denne udeladelse medføre bias og inkonsekvens i vores estimater.

Med andre ord forekommer udeladelsen af ​​en relevant variabel, når vi indarbejder den i fejludtrykket u, fordi vi ikke tager den i betragtning. Dette vil medføre, at der findes en sammenhæng mellem den afhængige variabel og fejludtrykket u.

Matematisk antager vi, at:

Cov (x, u) = 0

Hvis vi indarbejder en relevant variabel i fejludtrykket eller, derefter:

Cov (x, u) ≠ 0

I betragtning af Gauss-Markov-antagelserne er denne sammenhæng:

(ρ (x, u) ≠ 0)

Det ville ikke opfylde det:

E (u | x) = E (u) = 0

Dvs. forventningen om de fejl, der er betinget af de forklarende, er lig med forventningen om fejlen, og at den også er nul. Dette er antagelserne om upartiskhed (streng eksogenitet + null middelværdi)

I tilfælde af udeladelse af den relevante variabel er OLS-estimatoren partisk og bliver inkonsekvent. Så det overtræder to af estimatoregenskaberne og får vores estimat til at være forkert.

Teoretisk eksempel

Vi antager, at vi ønsker at undersøge antallet af sæsonbestemte skiløbere (t) under hensyntagen til flere faktorer: prisen på skipasserne (skipasserne) og antallet af åbne pister (pister) og kvaliteten af ​​sneen (sneen).

Model 0

Vi antager, at de forklarende variabler (skipas, pister og sne) er relevante variabler for Model 0, fordi de hører til populationsmodellen. Med andre ord har de forklarende variabler i vores model 0 en delvis effekt på de afhængige variable skiløbere i befolkningsmodellen. Derefter vil både i populationen og stikprøvemodellerne (Model 0) have andre koefficienter end nul.

Fortolkning

En stigning i kvaliteten af ​​sneen (sneen) og antallet af åbne kørsler (sporene) medfører en stigning i estimaterne af β2 og β3. Derfor afspejles dette i antallet af skiløbere (skiløbere).

En procentvis stigning i skipasspriserne medfører et fald i β1/ 100 i antallet af skiløbere (skiløbere)

Behandle

Vi behandler snevariablen som en udeladt variabel fra modellen. Derefter:

Model 1

Vi adskiller fejludtrykket u fra model 0 og fejludtrykket v fra model 1, fordi den ene ikke inkluderer den relevante variabel sne, og den anden gør det.

I model 1 har vi udeladt en relevant variabel fra modellen og introduceret den i fejludtrykket u. Det betyder at:

  • Cov (sne, v) ≠ 0 → ρ (sne, v) ≠ 0
  • E (v | sne) ≠ 0

Hvis vi udelader den relevante variable sne i vores Model 1, får vi OLS-estimatoren til at præsentere bias og inkonsekvens. Så vores skøn over antallet af sæsonbestemte skiløbere er forkert. Skisportsstedet kan være i alvorlige økonomiske problemer, hvis du tager vores model 1-skøn i betragtning.