P-værdi - Hvad er det, definition og koncept

Indholdsfortegnelse:

P-værdi - Hvad er det, definition og koncept
P-værdi - Hvad er det, definition og koncept
Anonim

P-værdien, fra engelsk, p-værdi, er det mindste ikke-vilkårlige signifikansniveau, hvormed vi kan afvise nulhypotesen (H0) givet en fordelingsfunktion og en teststatistik.

Med andre ord er p-værdien den mindste sandsynlighed defineret af fordelingen, hvormed vi kan afvise nulhypotesen (H0) uden at skulle definere a priori signifikansniveauet for kontrasten.

Hvis du husker det, vil du huske, at området under kurven for fordelingsfunktionen er en sandsynlighed. Så set ud fra dette synspunkt vil p-værdien være sandsynligheden for at observere en sådan ekstrem teststatistik for, at nulhypotesen er sand.

Domæne

Da p-værdien er en sandsynlighed, vil denne værdi være mellem 0 og 1.

Ikke vilkårlig

I modsætning til de signifikansniveauer, som vi er mere vant til at se, såsom 1%, 5% og 10%, afhænger p-værdien af ​​den fordelingsfunktion, som teststatistikken har. Så niveauet på 1%, 5% og 10% bestemmes i begyndelsen af ​​kontrasten. Dette valg kaldes vilkårlig.

P-værdi formel

P-værdien er ikke en enkelt værdi som den kritiske værdi, men afhænger af statistikken. For forskellige værdier i teststatistikken vil den kritiske værdi være den samme. På den anden side, for forskellige værdier af teststatistikken, vil p-værdien også være forskellig, fordi p-værdien afhænger af den værdi, som teststatistikken tager.

Hvor,

  • D, er en tilfældig variabel, der følger en bestemt fordeling.
  • d, er værdien af ​​teststatistikken.

Beregning

Det er muligt at beregne p-værdien manuelt, men du bliver nødt til at have meget præcise fordelingstabeller, det vil sige med mange decimaler, fordi p-værdien har tendens til at være lille. De fleste statistiske programmer har allerede indarbejdet p-værdien, og den vises normalt i resultatet af estimeringsresultaterne ved ordinære mindste kvadrater (OLS). Det kan synes svært at bruge, men med praksis er det et meget nyttigt værktøj.

For at beregne p-værdien har vi brug for:

  • Kontraststatistik.
  • Fordelingen af ​​kontraststatistikken og kendskab til dens parametre.

Afvisningsregel

Hvis p-værdi < signifikansniveau => H0-afvisning.

Hvis p-værdi > signifikansniveau => Ingen afvisning H0.

Repræsentation

I tilfælde af en elevs t-fordeling med 2 frihedsgrader og en kontraststatistik lig med 3 er sandsynligheden for at finde en sådan ekstrem statistik, når nulhypotesen (H0) er sand, 4,77%.

Med andre ord, hvis nulhypotesen (H0) var sand, ville en statistik så stor som 3 kun blive observeret 4,77% af tiden.

Hvorfor kaldes det p-værdi?

Navnet på p-værdien har sin oprindelse i definitionen, der refererer til at være området under kurven for fordelingsfunktionen uden for konfidensintervallet. Da dette område er den mindste sandsynlighed for at afvise nulhypotesen, refererer "p" af p-værdi til sandsynlighed. Og da p-værdien svarer til et tal og derfor en værdi, tilskrives ordet "værdi" af p-værdi den numeriske figur. I nogle bøger kan vi finde "sandsynlighedsværdi", der henviser til p-værdien. Måske at sige "mindste sandsynlighed for at afvise nulhypotesen" var for lang og indeholdt ikke noget mysterium for de studerende …