Relevant variabel udeladt

Undladelsen af ​​en relevant variabel er ikke-inkludering af en vigtig forklarende variabel i en regression. I betragtning af Gauss-Markov-antagelserne ville denne udeladelse medføre bias og inkonsekvens i vores estimater.

Med andre ord forekommer udeladelsen af ​​en relevant variabel, når vi indarbejder den i fejludtrykket u, fordi vi ikke tager den i betragtning. Dette vil medføre, at der findes en sammenhæng mellem den afhængige variabel og fejludtrykket u.

Matematisk antager vi, at:

Cov (x, u) = 0

Hvis vi indarbejder en relevant variabel i fejludtrykket eller, derefter:

Cov (x, u) ≠ 0

I betragtning af Gauss-Markov-antagelserne er denne sammenhæng:

(ρ (x, u) ≠ 0)

Det ville ikke opfylde det:

E (u | x) = E (u) = 0

Dvs. forventningen om de fejl, der er betinget af de forklarende, er lig med forventningen om fejlen, og at den også er nul. Dette er antagelserne om upartiskhed (streng eksogenitet + null middelværdi)

I tilfælde af udeladelse af den relevante variabel er OLS-estimatoren partisk og bliver inkonsekvent. Så det overtræder to af estimatoregenskaberne og får vores estimat til at være forkert.

Teoretisk eksempel

Vi antager, at vi ønsker at undersøge antallet af sæsonbestemte skiløbere (t) under hensyntagen til flere faktorer: prisen på skipasserne (skipasserne) og antallet af åbne pister (pister) og kvaliteten af ​​sneen (sneen).

Model 0

Vi antager, at de forklarende variabler (skipas, pister og sne) er relevante variabler for Model 0, fordi de hører til populationsmodellen. Med andre ord har de forklarende variabler i vores model 0 en delvis effekt på de afhængige variable skiløbere i befolkningsmodellen. Derefter vil både i populationen og stikprøvemodellerne (Model 0) have andre koefficienter end nul.

Fortolkning

En stigning i kvaliteten af ​​sneen (sneen) og antallet af åbne kørsler (sporene) medfører en stigning i estimaterne af β2 og β3. Derfor afspejles dette i antallet af skiløbere (skiløbere).

En procentvis stigning i skipasspriserne medfører et fald i β1/ 100 i antallet af skiløbere (skiløbere)

Behandle

Vi behandler snevariablen som en udeladt variabel fra modellen. Derefter:

Model 1

Vi adskiller fejludtrykket u fra model 0 og fejludtrykket v fra model 1, fordi den ene ikke inkluderer den relevante variabel sne, og den anden gør det.

I model 1 har vi udeladt en relevant variabel fra modellen og introduceret den i fejludtrykket u. Det betyder at:

  • Cov (sne, v) ≠ 0 → ρ (sne, v) ≠ 0
  • E (v | sne) ≠ 0

Hvis vi udelader den relevante variable sne i vores Model 1, får vi OLS-estimatoren til at præsentere bias og inkonsekvens. Så vores skøn over antallet af sæsonbestemte skiløbere er forkert. Skisportsstedet kan være i alvorlige økonomiske problemer, hvis du tager vores model 1-skøn i betragtning.

Populære Indlæg

Robots succeser og fiaskoer

Robotter er en stadig vigtigere del af økonomien. Vi ved ikke, hvor langt de vil gå, men vi ved, hvor langt de allerede er gået. Nogle gange tror vi, at ankomsten af ​​robotter alvorligt truer økonomien, men ikke ud fra et globalt synspunkt, men individuelt. Det vil sige, vi har tendens til at tro, at Læs mere…

Hvorfor køber Rusland massivt guld?

Rusland har erhvervet 56 tons guld i første kvartal af 2019. Ruslands interesse i at udvide sine guldreserver har gjort det til det femte største guldreserverland i verden. Men hvad ligger bag disse bevægelser fra Rusland? Gennem historien kan du læse mere…

Handelskrig: Trump hæver taksterne 150%

Donald Trump hæver igen told på kinesiske produkter. Præsidenten har i betragtning af den forværring, som handelsbalancen lider i landet, kastet en ny puls mod Kina, der har sat alarm på Wall Street inden handelskrigens genopblussen. I løbet af i går læste præsident Donald mere…