Aangepast R kwadraat (Aangepaste determinatiecoëfficiënt)

Inhoudsopgave:

Anonim

De aangepaste R-kwadraat (of aangepaste determinatiecoëfficiënt) wordt gebruikt in meervoudige regressie om de mate van intensiteit of effectiviteit van de onafhankelijke variabelen te zien bij het verklaren van de afhankelijke variabele.

In eenvoudiger bewoordingen vertelt het aangepaste R-kwadraat ons welk percentage van de variatie van de afhankelijke variabele gezamenlijk wordt verklaard door alle onafhankelijke variabelen.

Het gebruik van deze coëfficiënt is gerechtvaardigd omdat als we variabelen aan een regressie toevoegen, de niet-gecorrigeerde determinatiecoëfficiënt de neiging heeft toe te nemen. Zelfs als de marginale bijdrage van elk van de nieuwe toegevoegde variabelen geen statistische relevantie heeft.

Door variabelen aan het model toe te voegen, zou de determinatiecoëfficiënt dus kunnen toenemen en zouden we ten onrechte kunnen denken dat de gekozen reeks variabelen een groter deel van de variatie van de onafhankelijke variabele kan verklaren. Dit probleem staat algemeen bekend als "modeloverschatting".

VariatiecoëfficiëntRegressie analyse

Aangepaste determinatiecoëfficiënt formule

Om het hierboven beschreven probleem op te lossen, stellen veel onderzoekers voor om de determinatiecoëfficiënt aan te passen met behulp van de volgende formule:

R2 naar → Aangepaste R-kwadraat of aangepaste determinatiecoëfficiënt

R2 → R kwadraat of determinatiecoëfficiënt

nee → Aantal waarnemingen in de steekproef

k → Aantal onafhankelijke variabelen

Gezien het feit dat 1-R2 is een constant getal en aangezien n groter is dan k, wordt het quotiënt tussen haakjes groter als we variabelen aan het model toevoegen. Bijgevolg. ook het resultaat van vermenigvuldiging met 1-R2 . Waarmee we zien dat de formule is gebouwd om het opnemen van coëfficiënten in het model aan te passen en te bestraffen.

Naast het vorige voordeel, stelt de aanpassing die in de vorige formule werd gebruikt ons ook in staat om modellen met verschillende aantallen onafhankelijke variabelen te vergelijken. Nogmaals, de formule past het aantal variabelen tussen het ene model en het andere aan en stelt ons in staat om een ​​homogene vergelijking te maken.

Terugkerend naar de vorige formule, kunnen we afleiden dat de aangepaste determinatiecoëfficiënt altijd gelijk zal zijn aan of kleiner is dan de coëfficiënt van R2. In tegenstelling tot de determinatiecoëfficiënt die varieert tussen 0 en 1, kan de aangepaste determinatiecoëfficiënt om 2 redenen negatief zijn:

  • Hoe dichter k n nadert.
  • Hoe lager de determinatiecoëfficiënt.
Lineaire correlatiecoëfficiënt