De specificatiefouten van een econometrisch model verwijzen naar de verschillende fouten die kunnen worden gemaakt bij het selecteren en behandelen van een reeks onafhankelijke variabelen om een afhankelijke variabele te verklaren.
Wanneer een model wordt gebouwd, moet het voldoen aan de juiste specificatiehypothese. Dit is gebaseerd op het feit dat de verklarende variabelen die voor het model zijn geselecteerd die zijn die de onafhankelijke variabele kunnen verklaren. Daarom wordt aangenomen dat er geen onafhankelijke variabele (x) is die de onafhankelijke variabele (y) kan verklaren en dat op deze manier de variabelen zouden zijn gekozen die de benadering van het juiste model mogelijk maken.
Modelspecificatiefouten
Er zijn een aantal fouten in de specificatie van het model die in drie grote groepen kunnen worden gegroepeerd:
Groep 1: De manier waarop het werkt is niet correct gespecificeerd
- Weglating van relevante variabelen: Stel dat we het rendement op de aandelen van bedrijf Y willen verklaren.Om dit te doen, selecteren we de PER, marktkapitalisatie en boekwaarde als onafhankelijke variabelen. Als de free float gecorreleerd is met een van de variabelen in het model, zou de fout van ons model gecorreleerd zijn met de variabelen in het model. Dit zou ertoe leiden dat de door het model geschatte parameters onbevooroordeeld en inconsistent zijn. De resultaten van de voorspellingen en de verschillende tests die op het model zijn uitgevoerd, zouden dus niet geldig zijn.
- Variabelen die moeten worden getransformeerd: De hypothese van het regressiemodel gaat ervan uit dat de afhankelijke variabele lineair gerelateerd is aan de onafhankelijke variabelen. In veel gevallen is de relatie tussen deze echter niet lineair. Als de noodzakelijke transformatie niet wordt uitgevoerd op de onafhankelijke variabele, zal het model niet de juiste pasvorm hebben. Als voorbeelden van transformatie van onafhankelijke variabelen hebben we onder andere het nemen van logaritmen, de vierkantswortel of kwadratuur.
- Slechte verzameling van voorbeeldgegevens: De gegevens van de onafhankelijke variabelen moeten consistent zijn met de tijd, dat wil zeggen dat er geen structurele veranderingen van de onafhankelijke variabelen mogen zijn. Stel dat we de variatie in het BBP in land X willen verklaren door consumptie en investeringen als onafhankelijke variabelen te gebruiken. Stel dat er in dat land een olieveld wordt ontdekt op staatsgrond en de regering besluit de belastingen af te schaffen. Dit zou kunnen leiden tot een verandering in de consumptiegewoonten van het land die vanaf die datum voor onbepaalde tijd in de tijd zullen worden gehandhaafd. In dit geval moeten we twee verschillende tijdreeksen verzamelen en twee modellen schatten. Het ene model voor de verandering en het andere erna. Als we de gegevens in één enkele steekproef zouden groeperen en een model zouden schatten, zouden we een slecht gespecificeerd model hebben en zouden de hypothesen, contrasten en voorspellingen onjuist zijn.
Groep 2: De onafhankelijke variabelen zijn gecorreleerd met de foutterm in tijdreeksen
- Gebruik van de afhankelijke variabele met lag als onafhankelijke variabele: Het gebruik van een variabele met een vertraging is het gebruik van de gegevens van dezelfde variabelen, maar gemeten in een eerdere periode. Stel dat we het vorige model van het BBP gebruiken als de afhankelijke variabele. Laten we naast consumptie en investeringen het BBP van het voorgaande jaar (BBP previous) aan het model toevoegent-1). Als het BBP van het voorgaande jaar serieel gecorreleerd is met de fout, zouden de geschatte coëfficiënten vertekend zijn en niet inconsistent zijn. Dit zou opnieuw alle hypothesetests, voorspellingen enz. ongeldig maken.
- Het verleden voorspellen: Wanneer we een variabele meten, moeten we altijd de periode nemen vóór degene die we willen schatten. Stel dat onze afhankelijke variabele het rendement van voorraad X is en onze onafhankelijke variabele PER is. Stel verder dat we de definitieve gegevens voor februari nemen. Als we dit in ons model gebruiken, zullen we concluderen dat het aandeel met de hoogste PER eind februari het hoogste rendement had eind februari. De juiste specificatie van het model houdt in dat de gegevens vanaf het begin van de periode worden genomen om de latere gegevens te voorspellen en niet andersom zoals in het vorige geval. Dit heet het verleden voorspellen.
- Meet de onafhankelijke variabele met fout: Stel dat onze onafhankelijke variabele het rendement op een aandeel is en een van onze onafhankelijke variabelen de nominale rente. Houd er rekening mee dat de nominale rente de rente plus inflatie is. Aangezien de inflatiecomponent van de nominale rente in de toekomst niet waarneembaar is, zouden we de variabele met een fout meten. Om de rente correct te meten, zouden we de verwachte rente moeten gebruiken en dat deze rekening houdt met de verwachte inflatie en niet met de huidige.