Student's t-verdeling of t-verdeling is een theoretisch model dat wordt gebruikt om het eerste-orde-moment van een normaal verdeelde populatie te benaderen wanneer de steekproefomvang klein is en de standaarddeviatie onbekend is.
Met andere woorden, de t-verdeling is een kansverdeling die de waarde schat van het gemiddelde van een kleine steekproef getrokken uit een populatie die een normale verdeling volgt en waarvan we de standaarddeviatie niet kennen.
Aanbevolen artikelen: vrijheidsgraden, vrijheidsgraden (voorbeeld) en normale verdeling.
Student's t-verdelingsformule
Gegeven een continue stochastische variabele L, zeggen we dat de frequentie van zijn waarnemingen bevredigend kan worden benaderd tot een t-verdeling met g vrijheidsgraden zodanig dat:
Vertegenwoordiging van de Student's t-verdeling
Dichtheidsfunctie van een t-verdeling met 3 vrijheidsgraden (df).
Zoals we kunnen zien, lijkt de weergave van de t-verdeling veel op de normale verdeling, behalve dat de normale verdeling bredere staarten heeft en meer ondersteund is. Met andere woorden, we zouden meer vrijheidsgraden aan de t-verdeling moeten toevoegen, zodat de verdeling "groeit" en meer op de normale verdeling lijkt.
Specialiteit
En… Waarom is de t-verdeling zo bijzonder?
Nou, want in tegenstelling tot de normale verdeling die afhangt van het gemiddelde en de variantie, hangt de t-verdeling alleen af van de vrijheidsgraden, uit het Engels, graden van vrijheid (df). Met andere woorden, door de vrijheidsgraden te beheersen, beheersen we de verdeling.
Student's t-applicatie
De t-verdeling wordt gebruikt wanneer:
- We willen het gemiddelde van een normaal verdeelde populatie schatten op basis van een kleine steekproef.
- De steekproefomvang is minder dan 30 items, dat wil zeggen n <30.
Van 30 waarnemingen lijkt de t-verdeling sterk op de normale verdeling, dus we zullen de normale verdeling gebruiken.
- De standaarddeviatie van een populatie is niet bekend en moet worden geschat op basis van de waarnemingen van de steekproef.
Voorbeeld
We nemen aan dat we 28 waarnemingen hebben van een willekeurige variabele G die een Student's t-verdeling volgt met 27 vrijheidsgraden (df).
wiskundig,
Omdat we met echte gegevens werken, zal er altijd een benaderingsfout zijn tussen de gegevens en de verdeling. Met andere woorden, het gemiddelde, de mediaan en de modus zijn niet altijd nul (0) of exact hetzelfde.
We geven de frequentie van elke waarneming van variabele G weer door middel van een histogram.
Kan de willekeurige variabele G een t-verdeling benaderen?
Redenen om aan te nemen dat de variabele G een t-verdeling volgt:
- De verdeling is symmetrisch. Dat wil zeggen, er zijn hetzelfde aantal waarnemingen zowel rechts als links van de centrale waarde. Ook dat het gemiddelde en de mediaan meestal dicht bij dezelfde waarde liggen. Het gemiddelde is ongeveer nul, gemiddelde = 0,016.
- De waarnemingen met de meeste frequentie of waarschijnlijkheid liggen rond de centrale waarde. Waarnemingen met minder frequentie of waarschijnlijkheid zijn verre van de centrale waarde.