Relevante variabele weggelaten

Inhoudsopgave:

Anonim

Het weglaten van een relevante variabele is het niet opnemen van een belangrijke verklarende variabele in een regressie. Gezien de aannames van Gauss-Markov zou deze weglating leiden tot vertekening en inconsistentie in onze schattingen.

Met andere woorden, het weglaten van een relevante variabele treedt op wanneer we deze opnemen in de foutterm u omdat we er geen rekening mee houden. Hierdoor ontstaat er een correlatie tussen de afhankelijke variabele en de foutterm u.

Wiskundig nemen we aan dat:

Cov (x, u) = 0

Als we een relevante variabele opnemen in de foutterm of, dan:

Cov (x, u) ≠ 0

Gezien de veronderstellingen van Gauss-Markov, deze correlatie:

(ρ (x, u) ≠ 0)

Het zou niet voldoen aan dat:

E (u | x) = E (u) = 0

Dat wil zeggen dat de verwachting van de fouten, geconditioneerd tot verklarende fouten, gelijk is aan de verwachting van de fout en dat deze ook nul is. Dit zijn de aannames van onbevooroordeeldheid (strikte exogeniteit + nulgemiddelde)

Als de relevante variabele wordt weggelaten, is de OLS-schatter vertekend en wordt deze inconsistent. Het schendt dus twee van de eigenschappen van de schatter en zorgt ervoor dat onze schatting verkeerd is.

Theoretisch voorbeeld

We veronderstellen dat we het aantal seizoenskiërs (t) willen bestuderen rekening houdend met verschillende factoren: de prijs van de skipassen (skipassen) en het aantal open pistes (pistes) en de kwaliteit van de sneeuw (sneeuw).

Model 0

We nemen aan dat de verklarende variabelen (skipassen, hellingen en sneeuw) relevante variabelen zijn voor Model 0 omdat ze behoren tot het populatiemodel. Met andere woorden, de verklarende variabelen van ons Model 0 hebben een gedeeltelijk effect op de afhankelijke variabele skiërs in het populatiemodel. Dan zullen zowel in de populatie- als in het steekproefmodel (Model 0) coëfficiënten anders dan nul hebben.

Interpretatie

Een toename van de kwaliteit van de sneeuw (sneeuw) en van het aantal open pistes (tracks) zorgt voor een toename van de schattingen van β2 en3. Dit komt dan ook tot uiting in het aantal skiërs (skiërs).

Een procentuele stijging van de skipasprijzen zorgt voor een daling van β1/ 100 in het aantal skiërs (skiërs)

Werkwijze

We behandelen de sneeuwvariabele als een weggelaten variabele uit het model. Dan:

Model 1

We onderscheiden de foutterm u van Model 0 en de foutterm v van Model 1 omdat de ene de relevante variabele sneeuw niet bevat en de andere wel.

In Model 1 hebben we een relevante variabele uit het model weggelaten en geïntroduceerd in de foutterm u. Dit betekent dat:

  • Cov (sneeuw, v) ≠ 0 → ρ (sneeuw, v) ≠ 0
  • E (v | sneeuw) ≠ 0

Als we de relevante variabele sneeuw weglaten in ons Model 1, zullen we ervoor zorgen dat de OLS-schatter vertekening en inconsistentie vertoont. Onze schatting van het aantal seizoenskiërs zal dus fout zijn. Het skigebied kan in ernstige financiële problemen komen als u rekening houdt met onze schatting van Model 1.