Discriminerende analyse - Wat is het, definitie en concept

Inhoudsopgave:

Anonim

Lineaire discriminantanalyse, of Linear Discriminant Analysis (LDA), is een statistische techniek die een functie creëert die in staat is verschijnselen te classificeren, rekening houdend met een reeks discriminerende variabelen en een waarschijnlijkheid om erbij te horen.

Daarom hebben we te maken met een soort statistische procedure die probeert te groeperen op basis van bepaalde overeenkomsten. Op deze manier maakt het het mogelijk om de kans te kwantificeren om tot de ene of de andere groep te behoren. Deze groepen zijn a priori bekend, in tegenstelling tot de clusteranalyse.

Wiskundig model van discriminantanalyse

Laten we eens kijken hoe het wiskundige model van een discriminantanalyse eruit zou zien.

Het is heel eenvoudig, omdat het gebaseerd is op een stelsel van lineaire vergelijkingen. Natuurlijk is de analyse ingewikkelder, maar dit valt buiten het werk van Economy-Wiki.com, de simpele economie.

Zoals we kunnen zien, zijn ze een reeks vergelijkingen waarvan de afhankelijke variabele (y) bepaalde scores vertegenwoordigt. Dit zijn op hun beurt lineaire functies van andere discriminantvariabelen (X) en van een reeks parameters (a).

Het doel van deze lineaire combinaties is om de variantie tussen groepen te maximaliseren en de variantie tussen groepen te minimaliseren. Op deze manier kunnen nieuwe gevallen worden gegroepeerd met een bepaalde waarschijnlijkheid waarvan we hun waarde kunnen kennen, op voorwaarde dat ze aan deze criteria voldoen.

Te volgen proces om een ​​discriminantanalyse uit te voeren

Laten we eens kijken hoe een dergelijke analyse kan worden uitgevoerd:

  1. Eerst moet u een gegevenstabel maken met gevallen en variabelen. Ook inbegrepen is een categorische variabele die elk van de groepen definieert.
  2. Vervolgens wordt het wiskundige model gegenereerd met numerieke gegevens. Dit zal gebaseerd zijn op degene die we in de vorige sectie hebben gezien. Statistische software zoals SPSS of de gratis R automatiseert het hele proces.
  3. Ten slotte zullen we met deze analyse kunnen uitleggen waarom elke zaak tot een of andere groep behoort en bovendien een lidmaatschapscriterium kunnen vaststellen voor nieuwe gevallen. Dit zal gebaseerd zijn op de waarschijnlijkheid om in het een of het ander te worden opgenomen.

Voorbeelden van toepassing van discriminantanalyse

Laten we tot slot enkele voorbeelden bekijken van de toepassing van discriminantanalyse.

Laten we ook niet vergeten dat het doel in alle gevallen is om een ​​discriminantfunctie te creëren die elk nieuw geval groepeert op basis van een waarschijnlijkheid.

  • We willen verschillende landen classificeren op basis van hun macro-economische gegevens: Onderontwikkelde, opkomende of ontwikkelde landen (groepen). We creëren de discriminantfunctie zodat we de kans kunnen berekenen dat een land tot de ene of de andere groep behoort.
  • We willen een marketingcampagne uitvoeren en we zijn geïnteresseerd om te weten in welke groepen individuen moeten worden ingedeeld: Zo kunnen we bepaalde vragen beantwoorden, zoals wat de kenmerken zijn van een occasionele klant.
  • Wij willen de hoogte van het risico (groep) van bepaalde klanten weten met betrekking tot het verstrekken van een lening: We zullen variabelen gebruiken die verband houden met uw inkomen, maandelijkse uitgaven, geschiedenis of soort werk. De discriminantfunctie geeft ons relevante informatie over de solvabiliteit.

Zoals we kunnen zien, is discriminantanalyse in veel situaties erg handig. Maar niet alleen gerelateerd aan economie, het wordt ook gebruikt in onder meer de geneeskunde, geologie of biologie.