Binaire keuzemodellen - 2021 - Economie-Wiki.com

Binaire keuzemodellen zijn modellen waarbij de afhankelijke variabele slechts twee waarden aanneemt: 1 om "succes" aan te geven of "0" om mislukking aan te geven. De concrete schattingsmodellen zijn: lineaire kans, logit en probit.

In het enkelvoudige of meervoudige regressiemodel dat in de inleidende cursus Econometrie wordt gedoceerd, heeft de afhankelijke variabele meestal een economische interpretatie (zoals de stijging van het BBP, investeringen of consumptie) uit andere verklarende variabelen.

Maar welk model gebruiken we als we gebeurtenissen willen verklaren die maar twee mogelijkheden hebben? Bijvoorbeeld: wel of niet slagen voor het vak, wel of niet afstuderen, wel of niet werken, etc. Dit is waar binaire keuzemodellen op reageren.

In elk van deze gevallen kunt u Y = 1 geeft "succes" aan; Y = 0 duiden op "falen". Om deze reden worden ze binaire keuzemodellen genoemd en de vergelijking die het gebruikt is als volgt:

Op deze manier krijgen we de kans op succes van een bepaalde variabele.

Tot nu toe heeft het geen grote complicatie. De schatting en interpretatie van de parameters vereist echter meer zorgvuldigheid.

Regressie model

Modellen voor het schatten van binaire parameters

Gezien de bovengenoemde kenmerken van de onafhankelijke variabele, zijn er drie modellen voor het schatten van de parameters:

  • Lineair kansmodel. Het wordt berekend via normale OLS.
  • Logit-model. Het wordt berekend met een standaard logistieke distributiefunctie.
  • Probit-model. Het wordt berekend met een standaard normale verdelingsfunctie.

Lineair waarschijnlijkheidsmodel

Het lineaire kansmodel (MPL) wordt zo genoemd omdat de kans
respons is lineair met betrekking tot de parameters van de vergelijking. Gebruik voor de schatting gewone kleinste kwadraten (OLS)

De geschatte vergelijking is geschreven

De onafhankelijke variabele (en hoed) is de voorspelde kans op succes.

de B0 cap is de voorspelde kans op succes wanneer elk van de x's gelijk is aan nul. De coëfficiënt B1 cap meet de variatie van de voorspelde kans op succes wanneer x1 verhoogt een eenheid.

Om een ​​lineair kansmodel correct te interpreteren, moeten we rekening houden met wat als een succes wordt beschouwd en wat niet.

Voorbeeld van binair keuzemodel

De econoom Jeffrey Wooldridge schatte een econometrisch model waarbij de binaire variabele aangeeft of een getrouwde vrouw in 1975 deelnam aan de beroepsbevolking (verklaarde variabele). In dit geval Y = 1 betekende dat e deelnam Y = 0 wat niet het geval was.

Het model gebruikt het inkomensniveau van de man als verklarende variabelen (hinc), jaren van Onderwijs (opvoeden), jarenlange ervaring op de arbeidsmarkt (ervaring), leeftijd (leeftijd), het aantal kinderen onder de zes jaar (kidslt6) en het aantal kinderen tussen 6 en 18 jaar (kidsge6).

We kunnen verifiëren dat alle variabelen behalve kidsge6 statistisch significant zijn en dat alle significante variabelen het verwachte effect hebben.

Nu is de interpretatie van de parameters als volgt:

  • Als je een jaar onderwijs verhoogt, ceteris paribus, neemt de kans om op de arbeidsmarkt te komen toe met 3,8%.
  • Als de ervaring in één jaar toeneemt, neemt de kans om deel uit te maken van het personeelsbestand met 3,9% toe.
  • Als u een kind heeft dat jonger is dan 6 jaar, ceteris paribus, neemt de kans om deel uit te maken van de beroepsbevolking af met 26,2%.

We zien dus dat dit model ons vertelt wat het effect is van elke situatie op de kans dat een vrouw formeel wordt aangenomen.

Dit model kan worden gebruikt om overheidsbeleid en sociale programma's te evalueren, aangezien de verandering in de "voorspelde kans op succes" kan worden gekwantificeerd met betrekking tot eenheids- of marginale veranderingen in de verklarende variabelen.

Nadelen van het lineaire kansmodel

Dit model heeft echter twee belangrijke nadelen:

  • Het kan kansen kleiner dan nul en groter dan één geven, wat niet logisch is voor de interpretatie van die waarden.
  • De deeleffecten zijn altijd constant. In dit model is er geen verschil tussen van nul kinderen naar één kind gaan, dan van twee naar drie kinderen.
  • Omdat de verklarende variabele alleen waarden van nul of één aanneemt, kan heteroscedasticiteit worden gegenereerd. Om dit op te lossen worden standaardfouten gebruikt.

Om de eerste twee problemen op te lossen, die het belangrijkste zijn in het lineaire kansmodel, zijn de Logit- en Probit-modellen ontworpen.

Referenties:

Wooldridge, J. (2010) Inleiding tot econometrie. (4e ed.) Mexico: Cengage Learning.