Het percentiel is een statistische maatstaf voor de positie, die de geordende verdeling van de gegevens in honderd gelijke delen verdeelt.
Deze niet-centrale positiemaat geeft informatie over het percentage waarnemingen van een variabele, geordend van laag naar hoog, die onder zijn waarde liggen.
Op deze manier zou het 20e percentiel (P20) de waarde van de variabele zijn, gelegen op de grens van de eerste 20.
Hoe wordt het percentiel berekend?
Zoals alle kwantielen, kan het percentiel worden berekend voor gegroepeerde gegevens of niet. Voor de eerste zijn er enigszins complexe formules die we kunnen vinden in statistische handleidingen. Voor dat laatste is het eenvoudigst om een spreadsheet te gebruiken.
In de afbeelding zien we een vorm van representatie. De hoofdrechthoek vertegenwoordigt de gegevens die van laag naar hoog zijn gerangschikt, en de lichtblauwe vertegenwoordigen de verschillende percentielen.
We hebben de drie meest relevante weergegeven. Vooral de P50, die overeenkomt met de mediaan.
We nemen ook de formule voor uw berekening op.
Percentiel kenmerk
Laten we eens kijken naar enkele van de meest relevante kenmerken van het percentiel.
- Allereerst is het vergelijkbaar met andere niet-centrale positiemetingen. Daarom informeert het ons over de positie van gegevens ten opzichte van anderen.
- Aan de andere kant geeft het in veel situaties meer gedetailleerde informatie dan andere. Sommige impactindices van wetenschappelijke tijdschriften gebruiken dit bijvoorbeeld in plaats van het kwartiel.
- Daarnaast is het erg handig voor het groeperen van een grote hoeveelheid gegevens. Wanneer we met veel gevallen werken, kunnen de andere kwantielen groepen geven die te groot en moeilijk te interpreteren zijn.
- Het heeft echter een keerzijde in verband met het bovenstaande. Het is niet nuttig voor steekproeven met weinig gevallen, omdat de groepen te klein zouden zijn. Daarom worden in deze omstandigheden andere, zoals het kwartiel of het deciel, aanbevolen.
Voorbeeld van percentiel en impactindex
Wetenschappelijke tijdschriften meten hun belang met de zogenaamde impactindexen. Dit is een veelgebruikte indicator in de wetenschap.
De bekendste is de JCR, die publicaties opdeelt in kwartielen. De tweede in belang is echter de SJR die dit in percentielen doet.
Laten we ons een fictief voorbeeld voorstellen zoals in de afbeelding.
We kunnen zien dat wat we tijdschrift 1 hebben genoemd in P15 staat, terwijl 2 in P55 en 3 in P95 staat.
In dit geval is degene met de grootste impact nummer drie, omdat de indices van laag naar hoog worden gerangschikt.