Multikollinearitet er det stærke lineære afhængighedsforhold mellem mere end to forklarende variabler i en multipel regression, der overtræder Gauss-Markov-antagelsen, når den er nøjagtig.
Med andre ord er multikollinearitet den høje sammenhæng mellem mere end to forklarende variabler.
Vi understreger, at den lineære sammenhæng (korrelation) mellem forklarende variabler skal være stærk. Det er meget almindeligt, at de forklarende variabler for regression er korreleret. Så det skal påpeges, at dette forhold skal være stærkt, men aldrig perfekt, for at det kan betragtes som et tilfælde af multikollinearitet. Det lineære forhold ville være perfekt, hvis korrelationskoefficienten var 1.
Når dette stærke lineære (men ikke perfekte) forhold kun forekommer mellem to forklarende variabler, siger vi, at det er et tilfælde af kollinearitet. Det ville være multikollinearitet, når det stærke lineære forhold opstår mellem mere end to uafhængige variabler.
Antagelsen fra Gauss-Markov om nøjagtig ikke-multikollinearitet definerer, at de forklarende variabler i en prøve ikke kan være konstante. Desuden skal der ikke være nogen nøjagtige lineære sammenhænge mellem forklarende variabler (ingen nøjagtig multikollinearitet). Gauss-Markov tillader os ikke nøjagtig multikollinearitet, men tilnærmer multikollinearitet.
Regressions analyseAnsøgninger
Der er meget specielle tilfælde, normalt urealistiske, hvor regressionsvariablerne er fuldstændigt uafhængige af hinanden. I disse tilfælde taler vi om eksogenitet af de forklarende variabler. Samfundsvidenskaberne er generelt berømte for at inkorporere omtrentlig multikollinearitet i deres regressioner.
Præcis multikollinearitet
Præcis multikollinearitet opstår, når mere end to uafhængige variabler er en lineær kombination af andre uafhængige variabler i regressionen.
Problemer
Når Gauss Markov forbyder nøjagtig multikollinearitet, er det fordi vi ikke kan få estimatoren for Ordinary Least Squares (OLS).
Matematisk udtryk for den estimerede beta-sub-i i matrixform:
Så hvis der er nøjagtig multikollinearitet, får det matrixen (X'X) til at have en determinant 0 og derfor ikke være inverterbar. Ikke at være inverterbar indebærer ikke at være i stand til at beregne (X'X)-1 og følgelig hverken estimeret Beta-under-i.
Omtrentlig multikollinearitet
Omtrentlig multikollinearitet opstår, når mere end to uafhængige variabler ikke nøjagtigt er (tilnærmelse) en lineær kombination af andre uafhængige variabler i regressionen.
Variablen k repræsenterer en tilfældig variabel (uafhængig og identisk fordelt (i.i.d)). Frekvensen af dine observationer kan tilnærmes tilfredsstillende til en standard Normalfordeling med gennemsnit 0 og varians 1. Da det er en tilfældig variabel, betyder det, at i hver observation i vil værdien af k være forskellig og uafhængig af enhver tidligere værdi.
Problemer
Matematisk udtrykkende i matrixform:
Så hvis der er en tilnærmet multikollinearitet, får den matrixen (X'X) til at være cirka 0 og bestemmelseskoefficienten meget tæt på 1.
Opløsning
Multikollinearitet kan reduceres ved at eliminere regressorerne af variablerne med et højt lineært forhold mellem dem.
Lineær korrelationskoefficient