Betrouwbaarheidsinterval - Wat is het, definitie en concept

Inhoudsopgave:

Betrouwbaarheidsinterval - Wat is het, definitie en concept
Betrouwbaarheidsinterval - Wat is het, definitie en concept
Anonim

Een betrouwbaarheidsinterval is een schattingstechniek die wordt gebruikt bij statistische inferentie en waarmee een paar of meerdere paren waarden kunnen worden beperkt waarbinnen de gewenste puntschatting zal worden gevonden (met een bepaalde waarschijnlijkheid).

Met een betrouwbaarheidsinterval kunnen we twee waarden rond een steekproefgemiddelde berekenen (een bovenste en een onderste). Deze waarden beperken een bereik waarbinnen, met een bepaalde waarschijnlijkheid, de populatieparameter zich zal bevinden.

Betrouwbaarheidsinterval = gemiddelde + - foutmarge

Het kennen van de ware populatie is in het algemeen iets heel ingewikkelds. Denk aan een bevolking van 4 miljoen mensen. Kunnen we de gemiddelde consumptieve bestedingen per huishouden van deze populatie kennen? In principe wel. We zouden gewoon alle huishoudens moeten onderzoeken en het gemiddelde moeten berekenen. Het volgen van dat proces zou echter uiterst arbeidsintensief zijn en het onderzoek behoorlijk ingewikkeld maken.

In dergelijke situaties is het beter om een ​​statistische steekproef te trekken. Bijvoorbeeld 500 mensen. En bereken voor dat monster het gemiddelde. Hoewel we de werkelijke populatiewaarde nog steeds niet zouden weten, kunnen we aannemen dat deze dicht bij de steekproefwaarde zal liggen. Daarbij tellen we de foutmarge op en hebben we een betrouwbaarheidsintervalwaarde. Aan de andere kant trekken we die foutmarge af van het gemiddelde en hebben we een andere waarde. Tussen deze twee waarden ligt het populatiegemiddelde.

Concluderend, het betrouwbaarheidsinterval dient niet om een ​​puntschatting van de populatieparameter te geven, als het ons gaat helpen om bij benadering een idee te krijgen van wat de ware zou kunnen zijn. Het stelt ons in staat om te beperken tussen twee waarden waar het populatiegemiddelde zal worden gevonden.

variatiecoëfficiëntCumulatieve frequentie

Factoren waarvan een betrouwbaarheidsinterval afhangt

De berekening van een betrouwbaarheidsinterval hangt voornamelijk af van de volgende factoren:

  • Geselecteerde steekproefomvang: Afhankelijk van de hoeveelheid gegevens die is gebruikt om de steekproefwaarde te berekenen, zal deze min of meer dicht bij de werkelijke populatieparameter liggen.
  • Betrouwbaarheidsniveau: Het zal ons informeren in welk percentage van de gevallen onze schatting correct is. De gebruikelijke niveaus zijn 95% en 99%.
  • Foutmarge van onze schatting: Dit wordt alfa genoemd en informeert ons over de kans dat de populatiewaarde buiten ons bereik ligt.
  • De schatting in de steekproef (gemiddelde, variantie, verschil van gemiddelden …): De spilstatistiek voor het berekenen van het interval hangt hiervan af.

Voorbeeld van betrouwbaarheidsinterval voor het gemiddelde, uitgaande van normaliteit en de bekende standaarddeviatie

De spilstatistiek die voor de berekening wordt gebruikt, is de volgende:

Het resulterende interval zou het volgende zijn:

We zien hoe we in het interval links en rechts van de ongelijkheid respectievelijk de onder- en bovengrens hebben. Daarom vertelt de uitdrukking ons dat de kans dat het populatiegemiddelde tussen deze waarden ligt 1-alpha (betrouwbaarheidsniveau) is.

Laten we het bovenstaande eens beter bekijken met een opgeloste oefening als voorbeeld.

U wilt een schatting maken van de gemiddelde tijd die een hardloper nodig heeft om een ​​marathon te voltooien. Hiervoor zijn 10 marathons getimed en is een gemiddelde van 4 uur met een standaarddeviatie van 33 minuten (0,55 uur) behaald. U wilt een betrouwbaarheidsinterval van 95% verkrijgen.

Om het interval te verkrijgen, hoeven we alleen de gegevens in de intervalformule te vervangen.

Het betrouwbaarheidsinterval zou het deel van de verdeling zijn dat blauw is gearceerd. De 2 waarden die hierdoor worden begrensd, zijn die welke overeenkomen met de 2 rode lijnen. De centrale lijn die de verdeling in 2 verdeelt, zou de werkelijke populatiewaarde zijn.

Het is belangrijk op te merken dat in dit geval, aangezien de dichtheidsfunctie van de verdeling N (0,1) ons de cumulatieve kans geeft (van links naar de kritische waarde), we de waarde moeten vinden die ons 0,975 op het linker % (dit is 1,96).