Een robuuste schatter of een schatter die de eigenschap robuustheid heeft, is een schatter waarvan de validiteit niet wordt gewijzigd als gevolg van het schenden van een van de uitgangspunten.
Het idee van een robuuste schatter is om je voor te bereiden op mogelijke fouten in de initiële aannames. In statistiek en economie worden normaal gesproken aanvankelijke hypothesen gebruikt. Dat wil zeggen, aannames waaronder een formuleert dat een theorie kan worden vervuld. Bijvoorbeeld: "Ervan uitgaande dat Messi niet geblesseerd is, speelt hij zijn 100e wedstrijd met Barcelona."
We hebben een starthypothese en een resultaat. De hypothese is dat hij zichzelf niet verwondt. Als hij geblesseerd raakt, komt de voorspelling dat hij zijn 100ste competitiewedstrijd gaat spelen niet uit. In dit geval werken we niet met een robuuste schatter. Waarom? Want als hij een robuuste schatter was, zou het feit dat hij een blessure had de voorspelling niet in gevaar brengen.
PuntschattingDe robuuste schatter en de uitgangspunten
Het bovenstaande voorbeeld is een eerlijk gezegd eenvoudig voorbeeld. In statistiek zijn het niet zulke gemakkelijke voorbeelden, tenzij we basiskennis hebben. We gaan echter proberen de aanvankelijke veronderstelling uit te leggen die meestal wordt verbroken wanneer we een schatting maken.
De uitgangspunten of initiële aannames zijn gebruikelijk in de economie. Het is heel gebruikelijk dat een economisch model initiële veronderstellingen specificeert. Bijvoorbeeld, aannemen dat een markt perfect concurrerend is, is gebruikelijk in veel economische modellen.
In het geval dat we te maken hebben met een perfect concurrerende markt, gaan we ervan uit - veel vereenvoudigend - dat we allemaal hetzelfde zijn. We hebben allemaal hetzelfde geld, de producten zijn hetzelfde en niemand kan de prijs van een goed of dienst beïnvloeden.
Vanuit dit perspectief is in de statistiek de uitgangsveronderstelling die boven alle andere uitsteekt, die van de kansverdeling. Om aan bepaalde eigenschappen van onze schatter te voldoen, moet worden voldaan dat het te bestuderen fenomeen wordt verdeeld volgens een waarschijnlijkheidsstructuur.
Normale verdeling
De normale kansverdeling is de meest voorkomende. Vandaar de naam. Het wordt zo genoemd omdat het "normaal" of gebruikelijk is. Het komt heel vaak voor, om te zien hoe in veel statistische onderzoeken wordt gesteld: "We nemen aan dat de willekeurige variabele X normaal verdeeld is."
Onder de normale verdeling zijn er enkele schatters die goed werken. Natuurlijk moeten we ons afvragen wat als de verdeling van de willekeurige variabele X geen normale verdeling is? Het kan bijvoorbeeld een hypergeometrische verdeling zijn.
Robuust schattervoorbeeld
Nu we een klein idee hebben, laten we een voorbeeld nemen. Stel dat we het gemiddelde van de doelpunten van Leo Messi per seizoen willen berekenen. In onze studie nemen we aan dat de kansverdeling van Messi's doelen een normale verdeling is. We gebruiken dus een schatter van het gemiddelde. Die schatter heeft een formule. We passen het toe en het geeft ons resultaat. Bijvoorbeeld 48,5 goals per seizoen.
Stel dat we, rekening houdend met het bovenstaande, een fout hebben gemaakt in het type kansverdeling. Als de kansverdeling eigenlijk de t-verdeling van een student zou zijn, zou het toepassen van de overeenkomstige gemiddelde formule ons dan hetzelfde resultaat geven? Het resultaat kan bijvoorbeeld 48 goals zijn. Het resultaat is niet hetzelfde, maar we zijn heel dichtbij gekomen. Concluderend kunnen we stellen dat de schatter robuust is, aangezien het maken van een fout in de initiële aanname de resultaten niet significant verandert.