Het Lagged Distributed Autoregressive (ADR) -model, uit het Engels Autoregressief gedistribueerd vertragingsmodel(ADL), is een regressie die een nieuwe vertraagde onafhankelijke variabele omvat naast de vertraagde afhankelijke variabele.
Met andere woorden, het ADR-model is een uitbreiding van het p-order autoregressieve model, AR (p), dat een andere onafhankelijke variabele bevat in een periode voorafgaand aan de periode van de afhankelijke variabele.
Voorbeeld
Op basis van de gegevens van 1995 tot 2018 berekenen we de natuurlijke logaritmen van deskipassen voor elk jaar en we gaan één periode terug voor de variabelenskipassent en sporent:
Jaar | Skipassen (€) | ln_t | ln_t-1 | Tracks_t | Tracks_t-1 | Jaar | Skipassen (€) | ln_t | ln_t-1 | Tracks_t | Tracks_t-1 |
1995 | 32 | 3,4657 | 8 | 2007 | 88 | 4,4773 | 4,3820 | 6 | 9 | ||
1996 | 44 | 3,7842 | 3,4657 | 6 | 8 | 2008 | 40 | 3,6889 | 4,4773 | 5 | 6 |
1997 | 50 | 3,9120 | 3,7842 | 6 | 6 | 2009 | 68 | 4,2195 | 3,6889 | 6 | 5 |
1998 | 55 | 4,0073 | 3,9120 | 5 | 6 | 2010 | 63 | 4,1431 | 4,2195 | 10 | 6 |
1999 | 40 | 3,6889 | 4,0073 | 5 | 5 | 2011 | 69 | 4,2341 | 4,1431 | 6 | 10 |
2000 | 32 | 3,4657 | 3,6889 | 5 | 5 | 2012 | 72 | 4,2767 | 4,2341 | 8 | 6 |
2001 | 34 | 3,5264 | 3,4657 | 8 | 5 | 2013 | 75 | 4,3175 | 4,2767 | 8 | 8 |
2002 | 60 | 4,0943 | 3,5264 | 5 | 8 | 2014 | 71 | 4,2627 | 4,3175 | 5 | 8 |
2003 | 63 | 4,1431 | 4,0943 | 6 | 5 | 2015 | 73 | 4,2905 | 4,2627 | 9 | 5 |
2004 | 64 | 4,1589 | 4,1431 | 6 | 6 | 2016 | 63 | 4,1431 | 4,2905 | 10 | 9 |
2005 | 78 | 4,3567 | 4,1589 | 5 | 6 | 2017 | 67 | 4,2047 | 4,1431 | 8 | 10 |
2006 | 80 | 4,3820 | 4,3567 | 9 | 5 | 2018 | 68 | 4,2195 | 4,2047 | 6 | 8 |
2019 | ? | ? | 4,2195 | 6 |
Om de regressie uit te voeren, gebruiken we de waarden van ln_t als een afhankelijke variabele en de waardenln_t-1 Ytracks_t-1 als onafhankelijke variabelen. Waarden in rood vallen buiten de regressie.
We verkrijgen de coëfficiënten van de regressie:
In dit geval is het teken van de regressoren positief:
- Een stijging van 1€ in de prijs deskipassen in het vorige seizoen (t-1) bewoog het met een stijging van 0,48€in de prijs vanskipassen voor dit seizoen (t).
- Een stijging van een zwarte baan die in het vorige seizoen (t-1) werd geopend, vertaalt zich in een stijging van 4,1% in de prijs van deskipassen voor dit seizoen (t).
De waarden tussen haakjes onder de coëfficiënten zijn de standaardfouten van de schattingen.
wij vervangen
Dan,
Jaar | Skipassen (€) | Sporen | Jaar | Skipassen (€) | Sporen |
1995 | 32 | 8 | 2007 | 88 | 6 |
1996 | 44 | 6 | 2008 | 40 | 5 |
1997 | 50 | 6 | 2009 | 68 | 6 |
1998 | 55 | 5 | 2010 | 63 | 10 |
1999 | 40 | 5 | 2011 | 69 | 6 |
2000 | 32 | 5 | 2012 | 72 | 8 |
2001 | 34 | 8 | 2013 | 75 | 8 |
2002 | 60 | 5 | 2014 | 71 | 5 |
2003 | 63 | 6 | 2015 | 73 | 9 |
2004 | 64 | 6 | 2016 | 63 | 10 |
2005 | 78 | 5 | 2017 | 67 | 8 |
2006 | 80 | 9 | 2018 | 68 | 6 |
2019 | 63 |
ADR (p, q) vs. AR (p)
Welk model is het meest geschikt voor het voorspellen van de prijzen van?skipassen gezien bovenstaande observaties, AR (1) of ADR (1,1)? Met andere woorden, neem je de onafhankelijke variabele op?sporent-1 in de regressie helpt om onze voorspelling beter te passen?
We kijken naar het R-kwadraat van de regressies van de modellen:
Model AR (1): R2= 0,33
Model ADR (1,1): R2= 0,40
de R2 van model ADR (1,1) is hoger dan R2 van het AR-model (1). Dit betekent dat het invoeren van de onafhankelijke variabelesporent-1 in de regressie helpt het wel om onze voorspelling beter te passen.