Box Plot - Wat is het, definitie en concept

Inhoudsopgave:

Box Plot - Wat is het, definitie en concept
Box Plot - Wat is het, definitie en concept
Anonim

Een boxplot, uit het Engels, boxplot, is een weergave van een kwantitatieve of categorische variabele met het doel snel de kwartielen van de dataset te identificeren.

Met andere woorden, een boxplot is een grafiek die een kwantitatieve of kwalitatieve variabele door de kwartielen vertegenwoordigt.

In de statistiek is het een handig hulpmiddel om zowel discrete als continue datasets weer te geven.

Het is belangrijk om in gedachten te houden dat de kwalitatieve variabele variabelen of die bedoeld zijn om een ​​bestelling of een categorie te vertegenwoordigen altijd gekoppeld moeten zijn aan een numerieke index groter dan 0 zodat ze in de grafiek kunnen verschijnen en de bijbehorende statistieken kunnen worden berekend.

Boxplot en histogram

Een boxplot is niets meer dan een histogram van bovenaf gezien, en op dezelfde manier is een histogram een ​​boxplot gezien vanaf de zijkant. Een voorbeeld is hieronder te zien.

Het eerste kenmerk dat beide grafieken delen, is het minimum en maximum van de dataset. De eindbalken na de streepjes geven het minimum (onderste balk) en maximum (bovenste balk) aan. Uitschieters zouden buiten het bereik van het maximum en het minimum worden weergegeven. Dat wil zeggen, voorbij de balken na de koppeltekens. We kunnen ook horizontale boxplots vinden.

In één oogopslag kun je zien dat de meeste gegevens zijn gecentreerd rond de waarnemingen in de buurt van het minimum in beide grafieken. Dit wordt aangegeven door de boxplot waarin de box dichter bij het minimum dan het maximum ligt. Als we naar het histogram kijken, zullen we zien dat de meest voorkomende waarnemingen de waarnemingen zijn die dicht bij het minimum en ver van het maximum liggen.

Boxplot informatie

De informatie die door de boxplot wordt verstrekt, is als volgt:

  1. De onderkant van de doos is het eerste kwartiel (Q1).
  2. De balk in het midden van het vak is de mediaan of het tweede kwartiel (Q2).
  3. De bovenkant van de box is het derde kwartiel (Q3).
  4. Het interkwartielbereik of IQR zou de hoogte van de doos zijn, dat wil zeggen het verschil tussen Q3 en Q1.

Boxplotsleutel

Deze grafische weergave wordt een boxplot genoemd omdat het op een box lijkt. Om deze grafiek te onthouden, hoeven we dus alleen maar aan een vierkant object of een doos te denken.

Voor lezers die bekend zijn met de prijs van financiële activa, zullen ze meer gelijkenis met een kaars zien. De kaarsen die je in de offerte ziet zijn boxplots aangepast aan het gekozen tijdvenster.

Voor- en nadelen van de boxplot

Onder de voor- en nadelen van dit diagram vinden we het volgende:

Voordeel

  • Geglobaliseerde visie op de absolute frequentie van een kwantitatieve of kwalitatieve variabele.
  • Kennis van het minimum, het maximum en de kwartielen van de dataset zonder deze te hoeven berekenen.
  • Herkenning van extreme waarden sneller dan met een histogram doordat extreme waarden worden aangegeven met cirkels buiten het maximum en minimum.

nadelen

  • Als de gegevensset klein is, zal het moeilijker te begrijpen zijn om een ​​boxplot te maken om die gegevens uit te drukken.

Boxplot voorbeeld

We veronderstellen dat we het aantal fietsers willen vertegenwoordigen dat in de loop van een jaar ons huis passeert. Eerst tellen we de fietsers en verzamelen we de informatie in een tabel.

Via sommige programma's zoals R of Excel kunnen we onderstaande grafiek genereren.

Dankzij de weergave van het aantal fietsers via de boxplot, kunnen we snel aanvoelen waar de mediaan is, de andere kwartielen, het maximum en het minimum. In dit geval hebben we geen atypische gegevens, omdat er verder dan het maximum en het minimum niets is.

De toepassing van dit type grafiek is heel gebruikelijk gezien de eenvoud en bruikbaarheid op veel gebieden buiten financiën en economie.