Kwartielafwijking - Wat het is, definitie en concept

Inhoudsopgave:

Kwartielafwijking - Wat het is, definitie en concept
Kwartielafwijking - Wat het is, definitie en concept
Anonim

Kwartielafwijking is een statistische maatstaf voor spreiding die de centrale waarde van het interkwartielbereik retourneert en wordt gebruikt in scheve gegevenssets.

Met andere woorden, de kwartielafwijking is om de mediaan van de interkwartielafstand (IQR) te berekenen en wordt gebruikt in datasets met nogal wat extreme waarden.

De afkorting voor kwartielafwijking is DQ.

Interkwartielbereik

Het interkwartielbereik is een maatstaf voor de spreiding van een gegevensset die over het algemeen in de boxplot wordt gebruikt. Met andere woorden, het interkwartielbereik is het verschil tussen het voorlaatste en het eerste kwartiel van een verdeling die in de boxplot wordt gebruikt.

IQR = Q3 - Q1

Het voordeel van het gebruik van het interkwartielbereik is dat de kwartielafwijking (DQ) kan worden berekend, wat een zeer adequate maatstaf voor spreiding is wanneer we vertekende datasets hebben.

Kwartielafwijking formule:

De kwartielafwijking wordt berekend als de verdeling van de interkwartielafstand door 2.

DQ = (Q3 - Q1) / 2 = RIC / 2

Aangezien we alleen de spreiding tussen het derde en eerste kwartiel beschouwen, negeren we alle gegevens buiten dat bereik. En daarom zijn alle waarden bijna extreem. Dus als we het interkwartielbereik door twee delen, krijgen we de mediaanwaarde van de spreiding.

Voorbeeld van kwartielafwijking

We veronderstellen dat we de interkwartielafstand en de kwartielafwijking willen berekenen van het aantal fietsers dat in de loop van het jaar ons huis passeert.

  1. Eerst tellen we de fietsers en verzamelen we de informatie in een tabel.
  1. Ten tweede berekenen we het eerste en derde kwartiel om het interkwartielbereik te verkrijgen.

Q3 = 550

Q1 = 200

IQR = Q3 - Q1 = 550 - 200 = 350

  1. Ten derde berekenen we de kwartielspreiding door het interkwartielbereik eenvoudig door twee te delen.

DQ = (Q3 - Q1) / 2 = IQR / 2 = 350/2 = 175

De kwartielspreiding voor deze dataset is 175. Dit getal is de centrale waarde van de interkwartielafstand.

Het is belangrijk op te merken dat de gegevens voor de maand juli extreme gegevens zijn, aangezien deze meerdere keren hoger zijn dan alle andere gegevens. We zouden dus kunnen zeggen dat deze dataset gericht is op die maand. Dankzij de "onwetendheid" van de kwartielspreiding naar extreme gegevens, lijkt het resultaat van deze maatregel erg op als er in juli maar 600 fietsers zouden rondrijden. Als er in juli maar 600 fietsers waren, zou de kwartielspreiding 162,5 zijn, zeer dicht bij 175, aangezien het aantal fietsers die maand 10 keer minder is.