P-værdien, fra engelsk, p-værdi, er det mindste ikke-vilkårlige signifikansniveau, hvormed vi kan afvise nulhypotesen (H0) givet en fordelingsfunktion og en teststatistik.
Med andre ord er p-værdien den mindste sandsynlighed defineret af fordelingen, hvormed vi kan afvise nulhypotesen (H0) uden at skulle definere a priori signifikansniveauet for kontrasten.
Hvis du husker det, vil du huske, at området under kurven for fordelingsfunktionen er en sandsynlighed. Så set ud fra dette synspunkt vil p-værdien være sandsynligheden for at observere en sådan ekstrem teststatistik for, at nulhypotesen er sand.
Domæne
Da p-værdien er en sandsynlighed, vil denne værdi være mellem 0 og 1.
Ikke vilkårlig
I modsætning til de signifikansniveauer, som vi er mere vant til at se, såsom 1%, 5% og 10%, afhænger p-værdien af den fordelingsfunktion, som teststatistikken har. Så niveauet på 1%, 5% og 10% bestemmes i begyndelsen af kontrasten. Dette valg kaldes vilkårlig.
P-værdi formel
P-værdien er ikke en enkelt værdi som den kritiske værdi, men afhænger af statistikken. For forskellige værdier i teststatistikken vil den kritiske værdi være den samme. På den anden side, for forskellige værdier af teststatistikken, vil p-værdien også være forskellig, fordi p-værdien afhænger af den værdi, som teststatistikken tager.
Hvor,
- D, er en tilfældig variabel, der følger en bestemt fordeling.
- d, er værdien af teststatistikken.
Beregning
Det er muligt at beregne p-værdien manuelt, men du bliver nødt til at have meget præcise fordelingstabeller, det vil sige med mange decimaler, fordi p-værdien har tendens til at være lille. De fleste statistiske programmer har allerede indarbejdet p-værdien, og den vises normalt i resultatet af estimeringsresultaterne ved ordinære mindste kvadrater (OLS). Det kan synes svært at bruge, men med praksis er det et meget nyttigt værktøj.
For at beregne p-værdien har vi brug for:
- Kontraststatistik.
- Fordelingen af kontraststatistikken og kendskab til dens parametre.
Afvisningsregel
Hvis p-værdi < signifikansniveau => H0-afvisning.
Hvis p-værdi > signifikansniveau => Ingen afvisning H0.
Repræsentation
I tilfælde af en elevs t-fordeling med 2 frihedsgrader og en kontraststatistik lig med 3 er sandsynligheden for at finde en sådan ekstrem statistik, når nulhypotesen (H0) er sand, 4,77%.
Med andre ord, hvis nulhypotesen (H0) var sand, ville en statistik så stor som 3 kun blive observeret 4,77% af tiden.
Hvorfor kaldes det p-værdi?
Navnet på p-værdien har sin oprindelse i definitionen, der refererer til at være området under kurven for fordelingsfunktionen uden for konfidensintervallet. Da dette område er den mindste sandsynlighed for at afvise nulhypotesen, refererer "p" af p-værdi til sandsynlighed. Og da p-værdien svarer til et tal og derfor en værdi, tilskrives ordet "værdi" af p-værdi den numeriske figur. I nogle bøger kan vi finde "sandsynlighedsværdi", der henviser til p-værdien. Måske at sige "mindste sandsynlighed for at afvise nulhypotesen" var for lang og indeholdt ikke noget mysterium for de studerende …