Enkel autokorrelationsfunktion - Eksempel i R

Med andre ord, Simple Autocorrelation Function (FAS) eller fra engelsk, Autokorrelationsfunktion, Det er en matematisk funktion, der hjælper os med at vide, hvor afhængige dataene i en given periode er af de samme data fra k tidligere perioder.

Vi genererer en årlig tidsserie X, der følger en normalfordeling plus en inerti. Vi kan også bruge reelle data.

Metodologi

Programmer er vigtige for at arbejde på autokorrelationsanalysen. Programmer som Python kan bruges, men til statistisk analyse og datastyring anbefaler vi R, eller den forbedrede version, R Studio. Her vil vi arbejde med R.

Beregning

Og hvordan skriver vi FAS-formlen i R-kode?

Både R og Python har biblioteker, hvor formler er knyttet til et navn. Så er det nok, at vi har installeret biblioteket, der indeholder den formel, vi vil bruge, og kalder det i scriptet.

I spørgsmålet om R er vi nødt til at skrive:

Funktionen acf det er inde i biblioteket statistik.

x -> Tidsserier, som vi bruger som en prøve til at beregne FAS.

acf (X, ylim = c (-1,1)) -> Enkel autokorrelationsfunktion på X med grænser på den lodrette akse mellem -1 og 1, som er de værdier, som autokorrelationskoefficienten kan tage.

Verifikation

Dette trin er ikke nødvendigt, hvis vi har brugt den forrige kode, da den beregner selve konfidensbåndene.

For at bestemme, om de beregnede autokorrelationskoefficienter er statistisk signifikante, bliver vi nødt til at etablere konfidensbånd med de kritiske værdier. På denne måde, givet en procentdel af betydning, kan vi med statistisk sikkerhed sige, om der er tilstedeværelse af autokorrelation i dataene eller ej.

På samme måde som korrelationskoefficienten antager autokorrelationskoefficienten også normalitet, og derfor beregner vi konfidensintervallet som følger:

Vi definerer hypotesetestning som:

Ved 95% konfidens med et signifikansniveau på 5% finder vi den berømte 1,96 i de normale tabeller. Kritisk værdi gives af:

Hvor koefficienternes varians er givet ved tilnærmelsen:

Selvom vi giver formlen, anbefaler vi at bruge statistiske programmer til større præcision og hastighed.

Resultat

Alle linjer, der slutter uden for tillidsbåndet, betyder, at tidsserien udviser autokorrelation i den angivne periode.

Så baseret på grafen ser vi, at der er tilstedeværelse af autokorrelation i denne tidsserie i de perioder, som linjen stikker ud fra det diskontinuerlige bånd.

Den første linje, der er ved 0 og affyrer mod 1, kan ignoreres, da t skal være strengt større end 0, og i dette tilfælde er det ikke. Det giver ikke meget mening at skulle gøre alle de foregående trin for at kende autokorrelationen nu med nu, fordi vi allerede ved det: Korrelationen af ​​en variabel med sig selv er 1, så vi har allerede svaret.

Du vil bidrage til udviklingen af ​​hjemmesiden, at dele siden med dine venner

wave wave wave wave wave