De maten van centrale tendens zijn statistische parameters die informatie geven over het centrum van de verdeling van de steekproef of statistische populatie.
Soms hebben we te maken met een grote hoeveelheid informatie. Variabelen die veel gegevens presenteren en zeer ongelijksoortig zijn. Gegevens met veel decimalen, van verschillend teken of lengte. In deze gevallen verdient het altijd de voorkeur om maatregelen te berekenen die ons summiere informatie over de variabele geven. Bijvoorbeeld metingen die ons vertellen wat de waarde is die het vaakst wordt herhaald.
Ondanks het bovenstaande hoef je niet zo ver te gaan. Als we naar de volgende tabel kijken die het salaris laat zien dat wordt ontvangen door elk van de werknemers van een bedrijf dat kartonnen dozen vervaardigt, zien we het volgende:
Werknemer | Salaris |
1 | € 1.235 |
2 | € 1.002 |
3 | € 859 |
4 | € 486 |
5 | € 1.536 |
6 | € 1.248 |
7 | € 1.621 |
8 | € 978 |
9 | € 1.125 |
10 | € 768 |
Iemand vraagt zich misschien af, hoeveel verdient de gemiddelde werknemer in dit bedrijf? In dat geval zouden centrale tendens maatregelen ons kunnen helpen. Namelijk het gemiddelde. Het enige dat we echter a priori weten, is dat het aantal tussen het minimum en het maximum zal liggen.
Maatregelen van centrale tendens
Onder de maten van centrale tendens kunnen we het volgende vinden:
Voor de helft
Het gemiddelde is de gemiddelde waarde van een reeks numerieke gegevens, berekend als de som van de reeks waarden gedeeld door het totale aantal waarden. Hieronder staat de formule voor het rekenkundig gemiddelde:
Raadpleeg uitleg en voorbeeld van het gemiddeldeZoals uitgelegd in het artikel waarnaar hierboven is gelinkt, zijn er veel soorten media. De keuze voor elk type gemiddelde heeft vooral te maken met het type gegevens waarop het wordt berekend.
Mediaan
De mediaan is een centrale positiestatistiek die de verdeling in tweeën splitst, dat wil zeggen, het laat hetzelfde aantal waarden aan de ene kant als aan de andere kant. De voorgestelde formules geven ons niet de mediaanwaarde, maar de positie waarin deze zich binnen de dataset bevindt. De formules die de positie van de mediaan in de reeks aangeven zijn de volgende:
- Als het aantal waarnemingen even is:
Mediaan = (n + 1) / 2 → Gemiddelde van de waargenomen posities
- Als het aantal waarnemingen oneven is:
Mediaan = (n + 1) / 2 → Waarnemingswaarde
Raadpleeg uitleg en voorbeeld van de mediaanmode
De modus is de waarde die het meest voorkomt in een statistische steekproef of populatie. Het heeft geen formule op zich. Wat moet worden gedaan, is de som van de herhalingen van elke waarde. Wat is bijvoorbeeld de modus van de volgende loontabel?
Werknemer | Salaris |
1 | € 1.236 |
2 | € 1.236 |
3 | € 859 |
4 | € 486 |
5 | € 1.536 |
6 | € 1.536 |
7 | € 1.621 |
8 | € 978 |
9 | € 1.236 |
10 | € 768 |
De modus zou € 1.236 zijn. Als we naar de lonen van de 10 arbeiders kijken, zien we dat € 1.236 drie keer wordt herhaald.
Kritiek op maatregelen van centrale tendens
De maatregelen van centrale positie zijn nuttig in samenvattende vorm, maar zijn niet categorisch. Samenvattend kunnen ze ons informatie geven over wat men gemiddeld zou verwachten. Maar ze zijn niet altijd nauwkeurig.
Om deze maatregelen beter te analyseren, is het raadzaam om maatregelen van centrale tendens te combineren met maatregelen van spreiding. Dispersiematen zijn ook niet onfeilbaar, maar ze geven ons informatie over de variabiliteit van een bepaalde variabele. Stel dus, naar het voorbeeld van de lonen, dat er twee bedrijven A en B zijn. In bedrijf A is het gemiddelde salaris $ 3.100, terwijl bedrijf B ook $ 3.100 is. Dit kan ertoe leiden dat we de fout maken dat de lonen hetzelfde of zeer vergelijkbaar zijn. Maar het is niet noodzakelijk zo.
Het kan voorkomen dat bedrijf A een standaarddeviatie heeft van $ 400, terwijl bedrijf B een standaarddeviatie heeft van $ 1.000. Dit geeft aan dat er, om welke reden dan ook, grotere ongelijkheid is in de lonen van bedrijf B dan in die van bedrijf A.