Een zuivere schatter is een schatter waarvan de wiskundige verwachting samenvalt met de waarde van de parameter die u wilt schatten. Als ze niet samenvallen, wordt gezegd dat de schatter bias heeft.
De reden voor het zoeken naar een zuivere schatter is dat de parameter die we willen schatten goed geschat is. Met andere woorden, als we de gemiddelde doelpunten per wedstrijd van een bepaalde voetballer willen schatten, moeten we een formule gebruiken die ons een waarde geeft die zo dicht mogelijk bij de werkelijke waarde ligt.
In het geval dat de verwachting van de schatter niet samenvalt met de werkelijke waarde van de parameter, wordt gezegd dat de schatter een bias heeft. De bias wordt gemeten als het verschil tussen de verwachtingswaarde van de schatter en de werkelijke waarde. Wiskundig kan het als volgt worden genoteerd:
Uit bovenstaande formule is het eerste en laatste deel duidelijk. Dat wil zeggen, de verwachting van de schatter is gelijk aan de werkelijke waarde van de parameter. Als deze gelijkheid geldt, is de schatter onbevooroordeeld. Het wiskundig meer abstracte middendeel wordt in de volgende paragraaf toegelicht.
Het gemiddelde van alle schattingen die de schatter kan maken voor elke verschillende steekproef is gelijk aan de parameter. Als we bijvoorbeeld 30 verschillende steekproeven hebben, is het normaal dat in elke steekproef de schatter (zelfs al is het maar een klein beetje) verschillende waarden biedt. Als we het gemiddelde nemen van de 30 waarden van de schatter in de 30 verschillende steekproeven, dan zou de schatter een waarde moeten retourneren die gelijk is aan de werkelijke waarde van de parameter.
PuntschattingDe bias van een schatter
Een zuivere schatter kan niet altijd worden gevonden om een bepaalde parameter te berekenen. Onze schatter kan dus bevooroordeeld zijn. Dat een schatter bias heeft, betekent niet dat hij niet valide is. Het betekent gewoon dat het niet zo goed past als we statistisch zouden willen.
Dat gezegd hebbende, zelfs als het niet zo goed past als we zouden willen, hebben we soms geen andere keuze dan een bevooroordeelde schatter te gebruiken. Daarom is het van vitaal belang dat we weten hoe groot die vooringenomenheid is. Als we hiervan op de hoogte zijn, kunnen we die informatie gebruiken in de conclusies van ons onderzoek. Wiskundig wordt de bias als volgt gedefinieerd:
In de bovenstaande formule is de bias een waarde die niet nul is. Als het nul was, zou de schatter onbevooroordeeld zijn.
Voorbeeld van een onbevooroordeelde schatter
Een voorbeeld van een zuivere schatter is te vinden in de gemiddelde schatter. Deze schatter staat in de statistieken bekend als het steekproefgemiddelde. Als we de aan het begin beschreven wiskundige formule gebruiken, concluderen we dat het steekproefgemiddelde een zuivere schatter is. Voordat we gaan werken, moeten we rekening houden met de volgende informatie:
We duiden X aan met een balk boven het steekproefgemiddelde.
De formule voor het steekproefgemiddelde is de som van de n waarden die we hebben gedeeld door het aantal waarden. Als we 20 gegevens hebben, is n gelijk aan 20. We zullen de waarden van de 20 gegevens moeten optellen en delen door 20.
De bovenstaande notatie betekent verwachting of verwachte waarde van het steekproefgemiddelde. In de volksmond zouden we kunnen zeggen dat het wordt berekend als de gemiddelde waarde van het steekproefgemiddelde. Met dit in gedachten kunnen we met behulp van de juiste wiskundige technieken het volgende afleiden:
De verwachting van de schatter valt samen met 'mu', de werkelijke waarde van de parameter. Dat wil zeggen, het echte gemiddelde. Alles is gezegd, enkele basisconcepten over wiskunde zijn nodig om de vorige ontwikkeling te begrijpen.
Op dezelfde manier zouden we kunnen proberen hetzelfde te doen met de schatter van de steekproefvariantie. In wat volgt is S kwadraat de steekproefvariantie en is de Griekse letter sigma (die eruitziet als de letter o met een stokje aan de rechterkant) de echte variantie.
Het verschil met de bovenstaande formule is het tweede deel van de eerste formule. Namelijk:
We concluderen dat de steekproefvariantie als schatter van de populatievariantie vertekend is. De bias is gelijk aan de hierboven aangegeven waarde. Het hangt dus af van de populatievariantie en de steekproefomvang (n). Merk op dat als n (steekproefomvang) erg groot wordt, de bias naar nul neigt.
Als wanneer de steekproef de neiging heeft erg groot te zijn, de schatter de werkelijke waarde van de parameter nadert, dan hebben we het over een asymptotisch zuivere schatter.