Type I-fejl - hvad er det, definition og koncept

Indholdsfortegnelse:

Anonim

Type 1-fejl i statistik er defineret som afvisning af nulhypotesen, når den faktisk er sand. En type 1-fejl er også kendt som en falsk positiv eller type alfa-fejl.

At lave en type 1-fejl er grundlæggende at benægte noget, når det faktisk er sandt. Overvej for eksempel situationen med at teste, om en marketingkampagne udført på sociale netværk øger salget af is til en virksomhed i en sommeruge. Hypoteserne ville være følgende:

H0: Salget stiger ikke på grund af sommerkampagnen

H1: Salgsstigning på grund af marketingkampagne

Efter at have vurderet trafikken på virksomhedens websted og de besøgte sider efter kampagnen, registreres følgende:

  • Stig dog i trafik og besøg på 50%.
  • 200% stigning i salg af is.

På baggrund af disse resultater kunne det konkluderes, at reklamekampagnen har været frugtbar og har haft en banebrydende effekt, der øger salget. Lad os dog tro, at der i den uge var en varmebølge, der bragte temperaturerne over 40 grader.

Når vi kender sidstnævnte, bliver vi nødt til at tage højde for faktoren for høj temperatur som årsag til stigningen i salget. Hvis vi ikke tager dette i betragtning, kunne vi afvise vores nulhypotese, når det er sandt, dvs. vi ville tænke, at vores kampagne havde været en rungende succes, når virkeligheden årsagen til stigningen i salget var den stærke varme. Hvis vi nåede denne konklusion, ville vi afvise nulhypotesen, når den faktisk er sand, og derfor begår vi en type 1-fejl.

Årsager til type 1-fejl

Type 1-fejlen er relateret til betydningen af ​​kontrasten eller alfa med fejlen i estimeringen af ​​koefficienterne og kan forekomme på grund af 2 typiske overtrædelser af de startantagelser om en regression. Disse er:

  • Betinget heteroscedasticitet.
  • Seriekorrelationen.

En regression, der præsenterede nogen af ​​de tidligere overtrædelser, ville undervurdere koefficienternes fejl. Hvis dette sker, ville vores skøn over t-statistikken være større end den faktiske t-statistik. Disse større værdier af t-statistikken vil øge sandsynligheden for, at værdien falder i afvisningszonen.

Lad os forestille os to situationer.

Situation 1 (forkert fejloverslag)

  • Betydning: 5%
  • Prøvestørrelse: 300 mennesker.
  • Kritisk værdi: 1,96
  • B1: 1,5
  • Koefficient estimeringsfejl: 0,5

T = 1,5 / 0,5 = 3

På denne måde ville værdien falde i afvisningszonen, og vi ville afvise nulhypotesen.

Situation 2 (korrekt fejloverslag)

  • Betydning: 5%
  • Prøvestørrelse: 300 mennesker.
  • Kritisk værdi: 1,96
  • B1: 1,5
  • Koefficient estimeringsfejl: 1

T = 1,5 / 1 = 1,5

På denne måde falder værdien i ikke-afvisningszonen, og vi afviser ikke hypotesen.

Baseret på de foregående eksempler, ville situation 1, hvor fejlen undervurderes, føre os til at afvise nulhypotesen, når den faktisk er sand, da vi som i situation 2 ser med den korrekt estimerede fejl, ikke ville afvise hypotesen at være sand.