Bayesisk informationskriterium

Bayesian-informationskriteriet eller Schwarz-kriteriet er en metode, der fokuserer på summen af ​​kvadraterne for resterne for at finde antallet af forsinkede perioder s der minimerer denne model.

Med andre ord ønsker vi at finde det mindste antal forsinkede perioder, som vi inkluderer i autoregressionen for at hjælpe os med forudsigelsen af ​​den afhængige variabel.

På denne måde har vi kontrol over antallet af forsinkede perioder s at vi er med i regressionen. Når vi overstiger dette optimale niveau, stopper Schwarz-modellen med at falde, og derfor har vi nået minimumet. Det vil sige, vi vil have nået antallet af forsinkede perioder s der minimerer Schwarz-modellen.

Det kaldes også Bayes Information Criterion (BIC).

Anbefalede artikler: autoregression, summen af ​​kvadrater af rester (SCE).

Bayesian Information Criterion Formula

Selvom det ved første øjekast virker som en kompliceret formel, vil vi gennemgå dele for at forstå det. Først og fremmest skal vi på en generel måde:

  • Logaritmerne i begge faktorer med formlen repræsenterer den marginale effekt af at inkludere en forsinket periode s mere i selvregression.
  • N er det samlede antal observationer.
  • Vi kan dele formlen i to dele: venstre del og højre del.

Delen til venstre:

Repræsenterer summen af ​​kvadraterne for residualerne (SCE) for autoregressionen afs forsinkede perioder divideret med det samlede antal observationer (N).

For at estimere koefficienterne bruger vi almindelige mindste kvadrater (OLS). Så når vi inkluderer nye forsinkede perioder, kan SCE (p) kun opretholdes eller formindskes.

Derefter forårsager stigningen i en forsinket periode i autoregressionen:

  • SCE (p): falder eller forbliver konstant.
  • Bestemmelseskoefficient: øges.
  • TOTAL EFFECT: en stigning i en forsinket periode medfører et fald i den venstre del af formlen.

Nu den rigtige del:

(p + 1) repræsenterer det samlede antal koefficienter i autoregressionen, dvs. regressorerne med deres forsinkede perioder (s) og skæringspunktet (1).

Derefter forårsager stigningen i en forsinket periode i autoregressionen:

  • (p + 1): øges, fordi vi inkorporerer en forsinket periode.
  • TOTAL EFFECT: en stigning i en forsinket periode medfører en stigning i den rigtige del af formlen.

Praktisk eksempel

Vi formoder, at vi ønsker at forudsige priserne påskipas for den næste 2020-sæson med en 5-årig prøve, men vi ved ikke, hvor mange forsinkelsesperioder der skal bruges: AR (2) eller AR (3)?

  • Vi downloader dataene og beregner de naturlige logaritmer af priserne på skipas.

1. Vi estimerer koefficienterne ved hjælp af OLS og opnår:

Summen af ​​kvadrater af rester (SCE) for AR (2) = 0,011753112

Bestemmelseskoefficient for AR (2) = 0,085

2. Vi tilføjer 1 mere forsinket periode for at se, hvordan SCE ændres:

Summen af ​​kvadrater af rester for AR (3) = 0,006805295

Bestemmelseskoefficient for AR (3) = 0,47

Vi kan se, at når vi tilføjer en forsinket periode i autoregressionen, øges bestemmelseskoefficienten, og SCE falder i dette tilfælde.

  • Vi beregner det Bayesiske informationskriterium:

Jo mindre BIC-modellen er, jo mere foretrukket er modellen. Derefter ville AR (3) være den foretrukne model med hensyn til AR (2) i betragtning af at dens bestemmelseskoefficient er højere, SCE er lavere og Schwarz-modellen eller Bayesian-informationskriteriet også er lavere.

Du vil bidrage til udviklingen af ​​hjemmesiden, at dele siden med dine venner

wave wave wave wave wave