De mediaan is een centrale positiestatistiek die de verdeling in tweeën splitst, dat wil zeggen, het laat hetzelfde aantal waarden aan de ene kant als aan de andere kant.
Voor het berekenen van de mediaan is het belangrijk dat de gegevens van hoog naar laag worden gerangschikt, of omgekeerd van laag naar hoog. Dat wil zeggen, ze hebben een bevel.
De mediaan, samen met het gemiddelde en de variantie, is een zeer illustratieve statistiek van een verdeling. In tegenstelling tot het gemiddelde dat naar de ene of de andere kant kan worden verschoven, bevindt de mediaan zich, afhankelijk van de verdeling, altijd in het midden ervan. Trouwens, de vorm van de verdeling staat bekend als kurtosis. Met kurtosis kunnen we zien waar de distributie zich beweegt. Zie kurtosis
Maatregelen van centrale tendensMediaan formule
Zodra de mediaan is gedefinieerd, gaan we verder met het berekenen ervan. Hiervoor hebben we een formule nodig.
De formule geeft ons niet de waarde van de mediaan, maar de positie waarin deze zich binnen de dataset bevindt. In die zin moeten we er rekening mee houden of het totale aantal gegevens of waarnemingen dat we hebben (n) even of oneven is. De mediaanformule is dus:
- Als het aantal waarnemingen even is:
Mediaan = (n + 1) / 2 → Gemiddelde van de waarnemingen
- Als het aantal waarnemingen oneven is:
Mediaan = (n + 1) / 2 → Waarnemingswaarde
Dat wil zeggen, als we 50 gegevens hebben, bij voorkeur gerangschikt van klein naar groot, zou de mediaan in waarnemingsgetal 25,5 liggen. Dit is het resultaat van het toepassen van de formule op een even dataset (50 is een even getal) en delen door 2. Het resultaat is 25,5 aangezien we delen door 50 + 1. De mediaan is het gemiddelde tussen waarneming 25 en 26.
In de volgende sectie zullen we het in meer detail bekijken, met visuele voorbeelden.
Voorbeeld van het berekenen van de mediaan
Stel dat we de volgende gegevens hebben:
2,4,12,6,8,14,16,10,18.
In de eerste plaats bestellen we ze van klein naar groot met wat we zouden hebben het volgende:
2,4,6,8,10,12,14,16,18.
Welnu, de mediaanwaarde, zoals de formule aangeeft, is er een die aan de ene kant hetzelfde aantal waarden laat als aan de andere kant. Hoeveel waarnemingen hebben we? 9 waarnemingen. We berekenen de positie met de bijbehorende mediaanformule.
Mediaan = 9 + 1/2 = 5
Wat betekent deze 5? Het vertelt ons dat de mediaanwaarde wordt gevonden in de waarneming waarvan de positie de vijfde is.
Daarom zou de mediaan van deze gegevens het getal 10 zijn, aangezien het op de vijfde positie staat. Daarnaast kunnen we controleren hoe zowel links van 5 zijn er 4 waarden (2, 4, 6 en 8) als rechts van 10 zijn er andere 4 waarden (12, 14, 16 en 18) .
Een ander voorbeeld van de mediaan
Laten we ons nu voorstellen dat we de volgende getallen hebben:
1,2,4,2,5,9,8,9.
Als we ze bestellen zouden we het volgende hebben:
1,2,2,4,6,8,9,9.
In dit geval is het aantal waarnemingen even. Om dus rekening te houden met de overwegingen voor het aantal waarnemingen even. De formule vertelt ons het volgende:
Mediaan = 8 + 1/2 = 4,5
Natuurlijk zult u denken, wat is positie 4.5? Of het staat op positie 4 of het staat op positie 5, maar 4,5 bestaat niet. Wat we gaan doen is een gemiddelde van de waarden die op positie 4 en 5 staan. Die getallen zijn 4 en 6. Het gemiddelde tussen deze twee getallen is 5 ((4 + 6) / 2).
De mediaanwaarde zou daarom 5 zijn. Het getal 5 (we stellen het ons voor) zou hetzelfde aantal waarnemingen aan de linkerkant (1, 2, 2 en 4) achterlaten als aan de rechterkant (6, 8, 9 en 9).
Rekenkundig gemiddelde