Het Bayesiaanse informatiecriterium of Schwarz-criterium is een methode die zich richt op de som van de kwadraten van de residuen om het aantal vertraagde perioden te vinden p die dit model minimaliseren.
Met andere woorden, we willen het minimale aantal vertraagde perioden vinden dat we in de autoregressie opnemen om ons te helpen bij de voorspelling van de afhankelijke variabele.
Op deze manier hebben we controle over het aantal uitgestelde perioden p die we opnemen in de regressie. Wanneer we dit optimale niveau overschrijden, stopt het Schwarz-model met afnemen en hebben we daarom het minimum bereikt. Dat wil zeggen dat we het aantal uitgestelde perioden hebben bereikt p die het Schwarz-model minimaliseren.
Het wordt ook wel het Bayes Informatie Criterium (BIC) genoemd.
Aanbevolen artikelen: autoregressie, som van kwadraten van residuen (SCE).
Bayesiaanse informatiecriteriumformule Cri
Hoewel het op het eerste gezicht een ingewikkelde formule lijkt, zullen we delen doornemen om het te begrijpen. Allereerst moeten we in het algemeen:
- De logaritmen in beide factoren van de formule vertegenwoordigen het marginale effect van het opnemen van een vertraagde periode p meer in zelfregressie.
- N is het totale aantal waarnemingen.
- We kunnen de formule in twee delen verdelen: linkerdeel en rechterdeel.
Het gedeelte aan de linkerkant:
Vertegenwoordigt de som van de kwadraten van de residuen (SCE) van de autoregressie vanp vertraagde perioden, gedeeld door het totale aantal waarnemingen (N).
Om de coëfficiënten te schatten gebruiken we gewone kleinste kwadraten (OLS). Dus als we nieuwe vertraagde perioden opnemen, kan de SCE (p) alleen worden gehandhaafd of verlaagd.
Dan veroorzaakt de toename van een vertraagde periode in de autoregressie:
- SCE (p): neemt af of blijft constant.
- Bepalingscoëfficiënt: neemt toe.
- TOTAAL EFFECT: een toename in een vertraagde periode veroorzaakt een afname in het linkerdeel van de formule.
Nu het juiste deel:
(p + 1) vertegenwoordigt het totale aantal coëfficiënten in de autoregressie, dat wil zeggen de regressoren met hun vertraagde perioden (p) en het onderscheppen (1).
Dan veroorzaakt de toename van een vertraagde periode in de autoregressie:
- (p + 1): neemt toe omdat we een vertraagde periode opnemen.
- TOTAAL EFFECT: een toename in een vertraagde periode veroorzaakt een toename in het rechterdeel van de formule.
praktijkvoorbeeld
We veronderstellen dat we een voorspelling willen doen over de prijzen van deskipassen voor het volgende seizoen van 2020 met een steekproef van 5 jaar, maar we weten niet hoeveel vertragingsperioden we moeten gebruiken: AR (2) of AR (3)?
- We downloaden de gegevens en berekenen de natuurlijke logaritmen van de prijzen van de skipassen.
1. We schatten de coëfficiënten met behulp van OLS en verkrijgen:
Som van kwadraten van residuen (SCE) voor AR (2) = 0,011753112
Determinatiecoëfficiënt voor AR (2) = 0,085
2. We voegen nog 1 vertraagde periode toe om te zien hoe de SCE verandert:
Som van kwadraten van residuen voor AR (3) = 0,006805295
Determinatiecoëfficiënt voor AR (3) = 0,47
We kunnen zien dat wanneer we een vertraagde periode toevoegen aan de autoregressie, de determinatiecoëfficiënt toeneemt en de SCE in dit geval afneemt.
- We berekenen het Bayesiaanse informatiecriterium:
Hoe kleiner het BIC-model, hoe meer het model de voorkeur heeft. Dan zou AR (3) het voorkeursmodel zijn met betrekking tot AR (2), aangezien de determinatiecoëfficiënt hoger is, de SCE lager is en het Schwarz-model of het Bayesiaanse informatiecriterium ook lager is.