Significantieniveaus - Wat het is, definitie en concept

Inhoudsopgave:

Anonim

De significantieniveaus zijn de aanvulling op het betrouwbaarheidsinterval van een verdeling en worden gebruikt om de nulhypothese (H0) te testen in een test van statistische gevolgtrekking.

Met andere woorden, de significantieniveaus zijn de kansen die we buiten het betrouwbaarheidsinterval van een verdeling laten en helpen ons te bepalen of de teststatistiek zich in de verwerpingszone bevindt of niet.

Relatie tussen significantieniveau en betrouwbaarheidsniveau

We hebben vast allemaal wel eens iemand horen vragen welke waarde we aan de alfa van de verdeling moeten toekennen of met welk betrouwbaarheidsniveau we het interval wiskundig (1-alpha) moeten berekenen. Het antwoord is meestal altijd 1%, 5% of 10% voor de alfa of 99%, 95% en 90% voor het betrouwbaarheidsniveau.

Het is belangrijk om duidelijk te zijn over het volgende:

  • 1%, 5%, 10% = alfa => Betekenisniveaus.
  • 99%, 95%, 90% = (1-alfa) => Betrouwbaarheidsinterval.

De betrouwbaarheidsintervallen en de significantieniveaus zijn complementair omdat de som van beide het gebied van de dichtheidsfunctie is. Dan,

We weten al dat het gebied van de dichtheidsfunctie 1 is. Wiskundig kunnen we deze integraal oplossen:

Vertegenwoordiging van het significantieniveau

In dit geval is de Student's t-verdeling met 16 vrijheidsgraden gebruikt om aan te tonen welke gebieden van de functie tot de significantieniveaus behoren. De percentages (2,5%, 2,5% en 95%) komen overeen met de oppervlakte onder de dichtheidsfunctie. Omdat deze verdeling twee kanten heeft, wordt het significantieniveau gehalveerd, dus 2,5% + 2,5% = 5%. De kritische waarde van deze verdeling met 16 vrijheidsgraden en 5% als significantieniveau is 2.11991 in elke staart.

2,5% + 2,5% + 95% = 1%

Universeel

We bestempelen de significantieniveaus als universeel omdat deze niveaus bekend zijn en in alle statistische tests worden gebruikt. Het is zeer ongebruikelijk om een ​​significantieniveau van 20% of 35% te vinden, tenzij het een expliciete testconditie is.

Het is waar dat niveaus 1% en 5% populairder zijn dan niveau 10%, maar het is om nauwkeurigheidsredenen. Het is beter om 1 op 100 keer (1/100 = 0,01 = 1%) of 5 op 100 keer (5/100 = 0,05 = 5%) een resultaat te geven dan 10 op 100 keer (10/100 = 0,1 = 10%), toch?

Ook worden de significantieniveaus een percentiel genoemd, bijvoorbeeld 1% percentiel of 5% percentiel. Deze nomenclatuur wordt veel gebruikt om de Value at Risk (VaR) metriek te berekenen.

Willekeurig en niet-willekeurig

De significantieniveaus kunnen willekeurig en niet willekeurig zijn. De willekeurige zijn de waarden die we kiezen a priori (voor) het kennen van de kenmerken van het experiment. In dit geval zou dit zijn voordat de teststatistiek wordt berekend. De niet-willekeurige zijn die welke zijn verkregen uit een resultaat van het experiment. In dit geval de p-waarde, omdat deze afhangt van de waarde die door de teststatistiek wordt genomen. Beide zijn afhankelijk van de verdeling die de gegevens volgen.