Eenvoudige autocorrelatiefunctie - Voorbeeld in R

Inhoudsopgave:

Eenvoudige autocorrelatiefunctie - Voorbeeld in R
Eenvoudige autocorrelatiefunctie - Voorbeeld in R
Anonim

Met andere woorden, de Simple Autocorrelation Function (FAS), of uit het Engels, Autocorrelatiefunctie, Het is een wiskundige functie die ons helpt te weten hoe afhankelijk de gegevens van een bepaalde periode zijn van dezelfde gegevens uit k voorgaande perioden.

We genereren een jaarlijkse tijdreeks X die een normale verdeling plus een traagheid volgt. We kunnen ook echte data gebruiken.

Methodologie

Programma's zijn essentieel om aan de autocorrelatieanalyse te werken. Programma's zoals Python kunnen worden gebruikt, maar voor statistische analyse en gegevensbeheer raden we R aan, of de verbeterde versie ervan, R Studio. Hier werken we samen met R.

Berekening

En hoe schrijven we de FAS-formule in R-code?

Zowel R als Python hebben bibliotheken waarin formules aan een naam zijn gekoppeld. Dan is het voldoende dat we de bibliotheek hebben geïnstalleerd die de formule bevat die we willen gebruiken en deze in het script noemen.

In de quion van R moeten we schrijven:

De functie acf het is in de bibliotheek statistieken.

X -> Tijdreeksen die we als voorbeeld gebruiken om de FAS te berekenen.

acf (X, ylim = c (-1,1)) -> Eenvoudige autocorrelatiefunctie op X met limieten op de verticale as tussen -1 en 1, dit zijn de waarden die de autocorrelatiecoëfficiënt kan aannemen.

Verificatie

Deze stap is niet nodig als we de vorige code hebben gebruikt, omdat deze de betrouwbaarheidsbanden zelf berekent.

Om te bepalen of de berekende autocorrelatiecoëfficiënten statistisch significant zijn, zullen we betrouwbaarheidsbanden met de kritische waarden moeten vaststellen. Op deze manier kunnen we, gegeven een significantiepercentage, met statistische zekerheid zeggen of er al dan niet sprake is van autocorrelatie in de gegevens.

Op dezelfde manier als de correlatiecoëfficiënt, gaat de autocorrelatiecoëfficiënt ook uit van normaliteit en daarom zullen we het betrouwbaarheidsinterval als volgt berekenen:

We definiëren hypothesetoetsing als:

Bij 95% betrouwbaarheid met een significantieniveau van 5% vinden we de bekende 1,96 in de normale tabellen. Kritische waarde wordt gegeven door:

Waar de variantie van de coëfficiënten wordt gegeven door de benadering:

Hoewel we de formule geven, raden we aan om statistische programma's te gebruiken voor meer precisie en snelheid.

Resultaat

Alle regels die buiten de betrouwbaarheidsband eindigen, betekenen dat de tijdreeks autocorrelatie vertoont in de aangegeven periode.

Dus op basis van de grafiek zien we dat er autocorrelatie is in deze tijdreeks in de perioden dat de lijn uit de discontinue band steekt.

De eerste regel die op 0 staat en naar 1 vuurt, kan worden genegeerd omdat t strikt groter moet zijn dan 0 en in dit geval is dat niet het geval. Het heeft weinig zin om alle voorgaande stappen te moeten doorlopen om de autocorrelatie van nu met nu te kennen, omdat we die al weten: de correlatie van een variabele met zichzelf is 1, dus we hebben het antwoord al.