De p-waarde, uit het Engels, p-waarde, is het minimale niet-willekeurige significantieniveau waarmee we de nulhypothese (H0) kunnen verwerpen gegeven een verdelingsfunctie en een toetsstatistiek.
Met andere woorden, de p-waarde is de minimale kans gedefinieerd door de verdeling waarmee we de nulhypothese (H0) kunnen verwerpen zonder te hoeven definiëren a priori het significantieniveau voor het contrast.
Als je het je herinnert, zul je je herinneren dat het gebied onder de curve van de verdelingsfunctie een kans is. Dus vanuit dit oogpunt is de p-waarde de waarschijnlijkheid van het observeren van zo'n extreme teststatistiek om de nulhypothese waar te maken.
Domein
Aangezien de p-waarde een kans is, zal deze waarde tussen 0 en 1 liggen.
niet willekeurig
In tegenstelling tot de significantieniveaus die we meer gewend zijn te zien, zoals 1%, 5% en 10%, hangt de p-waarde af van de verdelingsfunctie die de teststatistiek heeft. Dus de niveaus van 1%, 5% en 10% worden bepaald aan het begin van het contrast. Deze selectie wordt willekeurig genoemd.
P-waarde formule
De p-waarde is geen enkele waarde zoals de kritische waarde, maar zal afhangen van de statistiek. Voor verschillende waarden van de teststatistiek zal de kritische waarde hetzelfde zijn. Aan de andere kant zal voor verschillende waarden van de teststatistiek de p-waarde ook anders zijn, omdat de p-waarde afhangt van de waarde die de teststatistiek aanneemt.
Waar,
- D, is een willekeurige variabele die een bepaalde verdeling volgt.
- d, is de waarde van de teststatistiek.
Berekening
Het is mogelijk om de p-waarde met de hand te berekenen, maar dan zou u zeer nauwkeurige distributietabellen moeten hebben, dat wil zeggen, met veel decimalen omdat de p-waarde meestal klein is. De meeste statistische programma's hebben de p-waarde al opgenomen en deze verschijnt normaal gesproken in de output van de schattingsresultaten door Ordinary Least Squares (OLS). Het lijkt misschien moeilijk te gebruiken, maar met de praktijk is het een zeer nuttig hulpmiddel.
Om de p-waarde te berekenen hebben we nodig:
- Contrast statistiek.
- De verdeling van de contraststatistiek en het kennen van de parameters ervan.
afwijzing regel
Als p-waarde < significantieniveau => H0 verwerping.
Als p-waarde > significantieniveau => Geen afwijzing H0.
Vertegenwoordiging
In het geval van een Student's t-verdeling met 2 vrijheidsgraden en een contraststatistiek gelijk aan 3, is de kans om zo'n extreme statistiek te vinden wanneer de nulhypothese (H0) waar is 4,77%.
Met andere woorden, als de nulhypothese (H0) waar zou zijn, zou een statistiek zo groot als 3 slechts 4,77% van de tijd worden waargenomen.
Waarom heet het p-waarde?
De naam van de p-waarde vindt zijn oorsprong in de definitie die verwijst naar het gebied onder de curve van de verdelingsfunctie buiten het betrouwbaarheidsinterval. Aangezien dat gebied de minimale kans is om de nulhypothese te verwerpen, verwijst de "p" van p-waarde naar de waarschijnlijkheid. En aangezien de p-waarde overeenkomt met een getal, en dus een waarde, wordt het woord "waarde" van p-waarde toegeschreven aan de numerieke figuur. In sommige boeken kunnen we "waarschijnlijkheidswaarde" vinden die verwijst naar de p-waarde. Misschien was zeggen "minimale kans om de nulhypothese te verwerpen" te lang en hield het geen mysterie in voor de studenten …