De normale verdeling is een theoretisch model dat in staat is om de waarde van een willekeurige variabele op bevredigende wijze te benaderen voor een ideale situatie.
Met andere woorden, de normale verdeling past een willekeurige variabele aan een functie die afhangt van het gemiddelde en de standaarddeviatie. Dat wil zeggen, de functie en de willekeurige variabele hebben dezelfde weergave, maar met kleine verschillen.
Een continue willekeurige variabele kan elk reëel getal aannemen. Aandelenrendementen, testresultaten, IQ en standaardfouten zijn bijvoorbeeld continue willekeurige variabelen.
Een discrete willekeurige variabele neemt natuurlijke waarden aan. Bijvoorbeeld het aantal studenten aan een universiteit.
De normale verdeling is de basis voor andere verdelingen zoals Student's t-verdeling, chikwadraatverdeling, Fisher's F-verdeling en andere verdelingen.
Formule van de normale verdeling
Gegeven een willekeurige variabele X, zeggen we dat de frequentie van zijn waarnemingen op bevredigende wijze kan worden benaderd met een normale verdeling, zodat:
Waarbij de parameters van de verdeling de gemiddelde of centrale waarde en de standaarddeviatie zijn:
Met andere woorden, we zeggen dat de frequentie van een willekeurige variabele X kan worden weergegeven door een normale verdeling.
Vertegenwoordiging
Kansdichtheidsfunctie van een willekeurige variabele die een normale verdeling volgt.
Eigendommen
- Het is een symmetrische verdeling. De waarde van het gemiddelde, de mediaan en de modus vallen samen. wiskundig,
Gemiddelde = Mediaan = Modus
- Unimodale distributie. De waarden die vaker voorkomen of die vaker voorkomen, liggen rond het gemiddelde. Met andere woorden, wanneer we van het gemiddelde afwijken, neemt de kans dat de waarden verschijnen en hun frequentie af.
Wat hebben we nodig om een normale verdeling weer te geven?
- Een willekeurige variabele.
- Bereken het gemiddelde.
- Bereken de standaarddeviatie.
- Bepaal de functie die we willen vertegenwoordigen: kansdichtheidsfunctie of verdelingsfunctie.
Theoretisch voorbeeld
We gaan ervan uit dat we willen weten of de resultaten van een test een normale verdeling voldoende kunnen benaderen.
We weten dat 476 studenten deelnemen aan deze test en dat de resultaten kunnen variëren van 0 tot 10. We berekenen het gemiddelde en de standaarddeviatie van de waarnemingen (testresultaten).
We definiëren de willekeurige variabele X dus als de testscores die afhankelijk zijn van elke individuele uitkomst. wiskundig,
De score van elke student wordt vastgelegd in een tabel. Op die manier krijgen we een globale visie op de resultaten en hun frequentie.
Resultaten | Frequentie |
0 | 20 |
1 | 31 |
2 | 44 |
3 | 56 |
4 | 64 |
5 | 66 |
6 | 62 |
7 | 51 |
8 | 39 |
9 | 26 |
10 | 16 |
TOTAAL | 476 |
Zodra de tabel is gemaakt, geven we de resultaten van het onderzoek en de frequenties weer. Als de grafiek eruitziet als de vorige afbeelding en voldoet aan de eigenschappen, dan kan de testresultaatvariabele naar tevredenheid worden benaderd tot een normale verdeling van gemiddelde 4,8 en standaarddeviatie van 3,09.
Kunnen de testresultaten een normale verdeling benaderen?
Redenen om aan te nemen dat de variabele testresultaten een normale verdeling volgt:
- Symmetrische verdeling. Dat wil zeggen, er zijn hetzelfde aantal waarnemingen zowel rechts als links van de centrale waarde. Ook dat het gemiddelde, de mediaan en de modus dezelfde waarde hebben.
Gemiddelde = Mediaan = Modus = 5
- De waarnemingen met de meeste frequentie of waarschijnlijkheid liggen rond de centrale waarde. Met andere woorden, de waarnemingen met minder frequentie of waarschijnlijkheid zijn verre van de centrale waarde.
De normale verdeling beschrijft de willekeurige variabele door een benadering die standaardfouten produceert (de balken boven elke kolom). Deze fouten zijn het verschil tussen de feitelijke waarnemingen (resultaten) en de dichtheidsfunctie (normale verdeling).