Vertekening bij het verzamelen van gegevens treedt op wanneer we ten onrechte de onderwerpen selecteren die zullen behoren tot de willekeurige steekproef die wordt geanalyseerd.
We hebben het probleem wanneer deze selectie ervoor zorgt dat de willekeurige steekproef niet representatief is voor de statistische populatie. En daarom is elk resultaat dat we uit de steekproef halen vertekend, en we konden niet bevestigen dat het werd vervuld in de geanalyseerde populatie.Binnen deze vertekening kunnen we verschillende typen onderscheiden, die we hieronder zullen uitleggen.
Overlevingsvooroordeel
Doet zich voor wanneer gegevens worden uitgesloten van analyse omdat ze niet meer bestaan op het moment van analyse.
Met andere woorden, we richten ons alleen op de gegevens die bestaan en negeren de gegevens die eerder in de populatie bestonden. In de praktijk zijn er veel voorbeelden van dit soort vooroordelen. Een daarvan is om alleen enquêtes uit te voeren onder de klanten van een bedrijf, waardoor potentiële klanten worden uitgesloten. Een andere mogelijkheid zou zijn om het gedrag van aandelenindexen te evalueren en uit de analyse de bedrijven te verwijderen die wel en niet langer in die index zaten.
De oplossing voor dit vooroordeel is heel eenvoudig. Voer het onderzoek uit met alle gegevens, bestaande en eerder bestaande.
Anticipatie vooringenomenheid
Het komt voor wanneer een analyse wordt uitgevoerd met gegevens die niet beschikbaar zijn op het moment van de analyse. Een voorbeeld zou zijn om een analyse te maken van de relatie van de prijs van een aandeel met een variabele van het financiële saldo. De koers van het aandeel is een dynamische variabele waarvan als we op het moment van analyse over de juiste informatie beschikken. De variabelen die in de balans zijn vastgelegd zijn echter statisch en daarom moeten we wachten op de publicatie van de jaarrekening voor deze analyse.
Stel dat we aan het eind van het boekjaar voor een aantal bedrijven de relatie tussen koers en eigen vermogen willen onderzoeken. In dat geval beschikken wij pas over de vermogensgegevens over de publicatie van de jaarrekening. Publicatie die meestal een paar maanden na het einde van het boekjaar wordt gegeven.
Een oplossing voor deze bias zou dan ook zijn te wachten op de publicatie van de jaarrekening. En voer de analyse uit met de gepubliceerde gegevens samen met de prijs op het moment van publicatie.
Tijdsperiode bias
Deze vertekening treedt op wanneer de geselecteerde periode voor de gegevens te kort of te lang is.Als deze te kort is, kan de analyse specifieke resultaten weergeven die alleen voor die periode worden behaald. Dat wil zeggen dat ze voor een langere periode niet representatief zouden zijn.
Stel je een tijdsbestek van vijf jaar voor waarin kleine bedrijven op de aandelenmarkt beter hebben gepresteerd dan grote bedrijven. Hieruit konden we de conclusie trekken dat kleine bedrijven in de toekomst altijd beter zullen presteren dan grote. Maar voor zo'n korte periode kunnen dergelijke conclusies niet worden getrokken. Vooral omdat de situatie op langere termijn zou kunnen veranderen. Daarom zijn de verkregen resultaten vertekend door deze kortere tijdsperiode.