Eenvoudige willekeurige steekproef - Wat het is, definitie en concept
Gegeven een willekeurige variabele X, is een eenvoudige willekeurige steekproef een reeks willekeurige variabelen, onafhankelijk en identiek verdeeld, verkregen uit de willekeurige variabele X en die op dezelfde manier worden verdeeld.
Formeel is de vorige definitie degene die een eenvoudige willekeurige steekproef definieert. Nu kan het concept eigenlijk eenvoudiger worden gedefinieerd. Om het concept van een eenvoudige willekeurige steekproef goed te begrijpen, is het natuurlijk belangrijk om het nauwkeurig te definiëren.
Omdat de formele definitie complex is, gaan we elk deel van de definitie beetje bij beetje afwikkelen.
Het eenvoudige willekeurige steekproefconcept stap voor stap
We moeten er dus in de eerste plaats rekening mee houden dat een eenvoudige willekeurige steekproef een steekproef is. Als steekproef wordt het verkregen uit een willekeurige variabele. We hebben deze willekeurige variabele X genoemd. Een voorbeeld van een willekeurige variabele zou het cijfer in wiskunde van middelbare scholieren kunnen zijn. Het eerste deel van de definitie is dus duidelijk. Een eenvoudige willekeurige steekproef is een steekproef die is verkregen uit een willekeurige variabele.
Het tweede deel van de definitie is ingewikkelder. Vooral door de begrippen "onafhankelijk en identiek verdeeld willekeurig". Het concept van willekeur betekent toeval. Omdat de steekproef willekeurig is verkregen, zijn de variabelen bijgevolg willekeurig. Het concept van onafhankelijk verwijst naar het feit dat de verkregen gegevens niet aan elkaar gerelateerd zijn. Dat wil zeggen dat het kiezen van een bepaalde data niet afhankelijk is van de data die eerder zijn gekozen of die later zullen worden gekozen. Ten slotte verwijst identiek verdeeld naar de statistische verdeling die hetzelfde is.
Samenvattend hebben we dat een eenvoudige willekeurige steekproef een steekproef is die op een totaal willekeurige manier is verkregen. De gegevens waaruit de steekproef bestaat, zijn dus niet aan elkaar gerelateerd en erven de kenmerken van de willekeurige populatievariabele X.
Waarom is het eenvoudige willekeurige steekproefconcept zo belangrijk?
Wanneer we onderzoek willen doen naar bepaalde kenmerken van een dataset, is de kwaliteit van de steekproef essentieel. Om de berekende metrieken en dus de onderzoeksconclusies betrouwbaar te maken, moeten we een zogenaamde representatieve steekproef hebben. Dat wil zeggen, een steekproef die de kenmerken van de totale populatie adequaat weergeeft.
Een van de belangrijkste kenmerken van een representatieve steekproef is dat deze willekeurig is. Daarom is het kennen van het concept van een eenvoudige willekeurige steekproef van vitaal belang voor onze studie om geldig te zijn in de wetenschappelijke gemeenschap.
Eenvoudig willekeurig voorbeeldvoorbeeld
Stel dat we een onderzoek willen doen naar de maandsalarissen van de burgers van een land. Onze willekeurige variabele is het maandsalaris van de burgers.
Het voorbeeldconcept komt voort uit de onmogelijkheid om het aan alle burgers van een land te vragen. Dat kost veel tijd of veel financiële middelen. Dus in plaats van 50 miljoen mensen te vragen, hebben we besloten om 50.000 te vragen.
Zodra we de variabele waaraan we gaan werken en de gegevenspopulatie hebben gedefinieerd, moeten we doorgaan met het verkrijgen van de steekproef. Er is een uitgebreide literatuur over het verkrijgen van het juiste monster. Maar aangezien het doel van deze definitie is om dit concept op een eenvoudige manier te benaderen, gaan we hier niet op in.
Veel vereenvoudigen, over het algemeen hebben we twee opties. Of vraag het burgers op een totaal willekeurige manier of kies een selectieproces. Om ervoor te zorgen dat de steekproef aan het criterium "willekeurig" voldoet, moeten we het volledig willekeurig doen. We kunnen geen steden, of zones, of buurten, of wat dan ook kiezen.
Als we het selectieproces bewust kiezen, zal onze steekproef waarschijnlijk bevooroordeeld zijn. Het juiste om te doen zou zijn om een tool te gebruiken die willekeurig de namen van burgers extraheert.
Zodra we onze eenvoudige willekeurige steekproef hebben, moeten we met de gegevens werken. Dat wil zeggen, statistische gevolgtrekkingen maken. Deze statistische gevolgtrekking stelt ons in staat om conclusies uit het onderzoek te trekken. Bijvoorbeeld uitspraken als: "het gemiddelde maandsalaris in Spanje is 1.200 euro" of "slechts 5% van de burgers met de hoogste salarissen verdient het equivalent van de armste 30%."
Dit alles met een duidelijke foutenmarge. Maar dat is al geregeld door statistische gevolgtrekking.