Dummyvariabele - Wat is het, definitie en concept - 2021 - Economie-Wiki.com

Inhoudsopgave:

Dummyvariabele - Wat is het, definitie en concept - 2021 - Economie-Wiki.com
Dummyvariabele - Wat is het, definitie en concept - 2021 - Economie-Wiki.com
Anonim

Een dummyvariabele is een variabele die wordt gebruikt om kwalitatieve waarden in een regressiemodel te verklaren.

Regressiemodellen proberen een variabele uit te leggen in termen van andere. Bijvoorbeeld het salaris van een persoon op basis van leeftijd, opleiding en ervaring. Deze variabelen kunnen worden gekwantificeerd. De leeftijd, opleiding en ervaring van een persoon kunnen worden gekwantificeerd in aantal jaren. Maar wat gebeurt er als we variabelen hebben die niet kunnen worden gekwantificeerd? Bijvoorbeeld haarkleur, land waar je woont of geslacht. De oplossing voor dit probleem ligt in de dummyvariabelen. Het zijn variabelen die gewoonlijk binaire waarden aannemen. Dat wil zeggen, waarde nul of één.

Zo is de variabele geslacht, zoals we zeiden, een kwalitatieve variabele. Om het in een regressiemodel op te nemen, moet u een dummyvariabele maken. We zullen de variabele "vrouw" noemen zodat:

Vrouw = 1 (als het individu een vrouw is)

Vrouw = 0 (als het individu geen vrouw is, dat wil zeggen, hij is een man)

In dit geval wordt "man" beschouwd als een referentiecategorie of basisgroep.

Er zijn twee soorten dummyvariabelen. Enerzijds zijn er de additieve dummyvariabelen en anderzijds de multiplicatieve dummyvariabelen.

Regressie analyse

Additieve dummy variabele

Een additieve dummyvariabele verzamelt een vaste verandering. Deze verandering heeft alleen invloed op de constante term van de vergelijking. Bijvoorbeeld een model dat lonen wil verklaren op basis van geslacht en opleidingsjaren. We kunnen de vergelijking nemen als een verwijzing naar mannen (tweede vergelijking) of als een verwijzing naar vrouwen (eerste vergelijking):

De grafische weergave van de vergelijkingen zou zijn: In het geval dat mannen hogere salarissen hebben, met een additieve dummyvariabele, zou het model worden weergegeven als de vorige afbeelding.

In uw geval, als vrouwen hogere salarissen hadden dan mannen, en een additieve dummyvariabele nemen, zou het model grafisch worden weergegeven als de vorige afbeelding.

Het kwantitatieve verschil tussen de blauwe lijn (mannen) en de oranje lijn (vrouwen) zal gelijk zijn aan de waarde van de variabele «Dames" of "Mannen»Volgens het gekozen model. In dit geval, dat van de additieve dummyvariabelen, is het salarisverschil niet afhankelijk van het opleidingsniveau. Met andere woorden, het salarisverschil is uitsluitend en uitsluitend afhankelijk van het geslacht.

Multiplicatieve dummy variabele

Een multiplicatieve dummy-variabele legt een verandering in de helling van de vergelijkingen voor mannen en vrouwen vast. Verdergaand met het vorige voorbeeld hebben we:

Grafisch zou een mogelijke weergave zijn:

In dit geval zou het model ons twee dingen vertellen. Ten eerste zijn de lonen van vrouwen lager dan die van mannen. En ten tweede dat een extra jaar onderwijs voor mannen beter betaalt dan voor vrouwen. We weten dit omdat de helling van de blauwe lijn (mannen) groter is dan de helling van de oranje lijn (vrouwen).

Als een extra jaar onderwijs beter betaald zou worden aan vrouwen, dan zou de helling van de oranje lijn (vrouwen) groter zijn. En de blauwe lijn (mannen) zou hieronder zijn.

statistische variabele