Metoden Instrumental Variables (VI) bruges til at løse endogenitetsproblemet for en eller flere uafhængige variabler i en lineær regression.
Udseendet af endogenitet i en variabel indikerer, at denne variabel er korreleret med fejludtrykket. Med andre ord er en variabel, der er korreleret med de andre, udeladt. Vi taler om forklarende variabler, der viser en sammenhæng med fejludtrykket. En anden meget populær metode til at løse endogenitetsproblemet er Estimator med to trin til mindste kvadrater (LS2E). VI's vigtigste funktion er at detektere tilstedeværelsen af en forklarende variabel i fejludtrykket.
Introduktion til konceptet
Vi vil undersøge variationen i priser på skipas afhængigt af antallet af pister og skiløbernes risikoaversion, hvilket afspejles i kvaliteten af forsikringen. Begge forklarende variabler er kvantitative variabler.
Vi antager, at vi inkluderer variablen forsikring i fejludtrykket (u), hvilket resulterer i:
Derefter bliver forsikringsvariablen en endogen forklarende variabel, fordi den hører til fejludtrykket og derfor er korreleret med den. Da vi fjerner en forklarende variabel, fjerner vi også dens regressor, i dette tilfælde B2.
Hvis vi havde estimeret denne model med ordinære mindste kvadrater (OLS), ville vi have opnået et inkonsekvent og partisk estimat for B0 og Bk.
Vi kan bruge model 1.A, hvis vi finder en instrumental variabel (z) for at spor opfylder:
- Cov (z, eller) = 0 => z er ikke korreleret med eller.
- Cov (z, spor) ≠ 0 => z ja det er korreleret med spor.
Denne instrumentale variabel (z) er eksogen i forhold til model 1 og har derfor ingen delvis virkning på log (forfaits). Alligevel er det relevant at forklare variation i spor.
Hypotesekontrast
For at vide, om den instrumentale variabel (z) er statistisk korreleret med den forklarende variabel (spor), kan vi teste tilstanden Cov (z, spor) ≠ 0 givet en tilfældig stikprøve af befolkningen. For dette er vi nødt til at gøre regression mellem spor Y z. Vi bruger en anden nomenklatur til at differentiere, hvilke variabler der returneres.
Vi fortolker π0 Y πk på samme måde som B0 og Bk i konventionelle regressioner.
Vi forstår π1 = Cov (z, spor) / Var (z)
- Definition af hypotesen
I denne kontrast vil vi teste, om det kan afvises π1 = 0 ved et tilstrækkeligt lille signifikansniveau (5%). Derfor, hvis den instrumentale variabel (z) er korreleret med den forklarende variabel (spor) og for at kunne afvise H0.
2. Kontraststatistik
3. Afvisningsregel
Vi bestemmer signifikansniveauet på 5%. Derfor vil vores afvisningsregel være baseret på | t | > 1,96.
- | t | > 1,96: vi afviser H0. Det vil sige, vi afviser ingen sammenhæng mellem z og spor.
- | t | <1,96: vi har ikke tilstrækkelig signifikant bevis til at afvise H0. Det vil sige, vi afviser ikke, at der ikke er nogen sammenhæng mellem z og spor.
4. Konklusion
Hvis vi konkluderer det π1 = 0, statistisk set er den instrumentale variabel (z) ikke en god tilnærmelse til den endogene variabel.