Standaard- of standaardscores zijn een methode om de relatieve posities van twee of meer items ten opzichte van de reeks waarnemingen te vergelijken.
Met andere woorden, de gestandaardiseerde scores geven het aantal standaarddeviaties terug dat de score xik wijkt af van het gemiddelde.
wiskundig, laat xik element i van een variabele X met gemiddelde en standaarddeviatie S. De gestandaardiseerde score van dit element i is dan:
Met gestandaardiseerde scores kunt u items van verschillende variabelen en verschillende meeteenheden vergelijken, zolang aan de eigenschappen wordt voldaan.
Eigendommen
Gestandaardiseerde scores hebben geen meeteenheden. De eenheden van de teller heffen elkaar op met de eenheden van de noemer. Gezien deze eigenschap wordt de gestandaardiseerde score ook wel de standaardscore genoemd.
De absolute waarde van de score is het aantal standaarddeviaties die het item scheiden van de gemiddelde waarde van de variabele waar het thuishoort. Dan:
Als we kijken naar het teken van de gestandaardiseerde scores, kunnen we de positie van het element ten opzichte van het gemiddelde van de variabele bepalen.
- Zik> 0: element ik is boven het gemiddelde = element i bevindt zich rechts van het gemiddelde.
- Zik<0: element ik is onder het gemiddelde = element i bevindt zich links van het gemiddelde.
De gestandaardiseerde scores van alle elementen vormen een nieuwe variabele met de naam zik.
Deze variabele zik wordt verkregen door de aftrekking (xi - Xvoor de helft) en de schaalverandering met de deling van de standaarddeviatie (S).
Typering wordt gekenmerkt door het hebben van gemiddelde 0 en variantie 1.
- Het gemiddelde van alle gestandaardiseerde scores is 0.
- De variantie van alle gestandaardiseerde scores is 1.
Toepassingen
In statistiek en econometrie worden kansverdelingstabellen gebruikt getypeerd om de kans te vinden dat een waarneming zal plaatsvinden, gegeven de verdelingsfunctie die de variabele volgt.
praktijkvoorbeeld
We hebben twee skigebieden A en B waar skiërs alpineskiën (Alpine) of Nordic skiën (Nordic) kunnen doen. We zullen onderzoeken welke activiteit het populairst is in elk skigebied, afhankelijk van het aantal skiërs dat elke activiteit uitvoert.
elementen | ||||
Seizoenen | Voor de helft | ontwikkelaar Standaard | Alpine | Noords |
NAAR | 96 | 2,6 | 112 | 52 |
B | 22 | 4 | 24 | 41 |
We berekenen de gestandaardiseerde scores:
We bouwen de resultatenmatrix:
Gestandaardiseerde scores |
||
Seizoenen | Alpine | Noords |
NAAR | 6,1538 | -16,923 |
B | 0,5 | 4,75 |
Als resultaat hebben we dat:
Alpineskiën is populairder dan langlaufen in skigebied A omdat:
ZA, Alpine > 0, ZA, Noords <0 en ZA, Alpine > ZA, Noords.
Langlaufen is populairder dan alpineskiën in skigebied B omdat
ZB, Noords > ZB, Alpine met beide groter dan nul.
Boven gemiddeld:
ZA, Alpine > 0, ZB, Alpine > 0 en ZB, Noords > 0
Onder het gemiddelde:
ZA, Noords <0