Type I-fout - Wat is het, definitie en concept

Inhoudsopgave:

Anonim

Type 1-fout in statistiek wordt gedefinieerd als de verwerping van de nulhypothese wanneer deze daadwerkelijk waar is. Een type 1-fout wordt ook wel een fout-positieve of type-alfafout genoemd.

Een type 1-fout maken is in feite iets ontkennen terwijl het echt waar is. Denk bijvoorbeeld aan de situatie om te testen of een marketingcampagne op sociale netwerken de verkoop van ijs voor een bedrijf in een zomerweek verhoogt. De hypothesen zouden de volgende zijn:

H0: De verkoop stijgt niet door de zomercampagne

H1: Omzetstijging door marketingcampagne

Na evaluatie van het verkeer op de website van het bedrijf en de bezochte pagina's na de campagne, wordt het volgende gedetecteerd:

  • Stijging hoewel in het verkeer en bezoeken van 50%.
  • 200% stijging van de ijsverkoop.

Op basis van deze resultaten kan worden geconcludeerd dat de reclamecampagne vruchtbaar is geweest en een domino-effect heeft gehad op de verkoop. Laten we echter aannemen dat er in die week een hittegolf was die de temperaturen boven de 40 graden bracht.

Als we dat laatste kennen, zouden we rekening moeten houden met de factor hoge temperatuur als oorzaak van de stijging van de verkoop. Als we hier geen rekening mee houden, zouden we onze nulhypothese kunnen verwerpen als het waar is, dat wil zeggen, we zouden denken dat onze campagne een doorslaand succes was geweest, terwijl in werkelijkheid de sterke hitte de oorzaak van de stijging van de verkoop was. Als we tot deze conclusie zouden komen, zouden we de nulhypothese verwerpen terwijl deze feitelijk waar is en daarom een ​​type 1-fout begaan.

Oorzaken van type 1-fout

De type 1-fout houdt verband met de significantie van het contrast of de alfa, met de fout van de schatting van de coëfficiënten en kan optreden als gevolg van 2 typische schendingen van de uitgangspunten van een regressie. Dit zijn:

  • Voorwaardelijke heteroscedasticiteit.
  • De seriële correlatie.

Een regressie die een van de eerdere overtredingen vertoonde, zou de fout van de coëfficiënten onderschatten. Als dit gebeurt, zou onze schatting van de t-statistiek groter zijn dan de werkelijke t-statistiek. Deze grotere waarden van de t-statistiek zouden de kans vergroten dat de waarde in de afwijzingszone valt.

Laten we ons 2 situaties voorstellen.

Situatie 1 (onjuiste foutschatting)

  • Betekenis: 5%
  • Steekproefgrootte:: 300 personen.
  • Kritische waarde: 1,96
  • B1: 1,5
  • Coëfficiënt schatting fout: 0,5

T = 1,5 / 0,5 = 3

Op deze manier zou de waarde in de verwerpingszone vallen en zouden we de nulhypothese verwerpen.

Situatie 2 (juiste foutschatting)

  • Betekenis: 5%
  • Steekproefgrootte:: 300 personen.
  • Kritische waarde: 1,96
  • B1: 1,5
  • Coëfficiënt schattingsfout: 1

T = 1.5 / 1 = 1.5

Op deze manier zou de waarde in de niet-verwerpingszone vallen en zouden we de hypothese niet verwerpen.

Op basis van de vorige voorbeelden zou situatie 1 waarin de fout wordt onderschat, ertoe leiden dat we de nulhypothese verwerpen terwijl deze in feite waar is, aangezien we, zoals we in situatie 2 zien met de correct geschatte fout, de hypothese niet zouden verwerpen waar zijn.