P-værdi - Hvad er det, definition og koncept

P-værdien, fra engelsk, p-værdi, er det mindste ikke-vilkårlige signifikansniveau, hvormed vi kan afvise nulhypotesen (H0) givet en fordelingsfunktion og en teststatistik.

Med andre ord er p-værdien den mindste sandsynlighed defineret af fordelingen, hvormed vi kan afvise nulhypotesen (H0) uden at skulle definere a priori signifikansniveauet for kontrasten.

Hvis du husker det, vil du huske, at området under kurven for fordelingsfunktionen er en sandsynlighed. Så set ud fra dette synspunkt vil p-værdien være sandsynligheden for at observere en sådan ekstrem teststatistik for, at nulhypotesen er sand.

Domæne

Da p-værdien er en sandsynlighed, vil denne værdi være mellem 0 og 1.

Ikke vilkårlig

I modsætning til de signifikansniveauer, som vi er mere vant til at se, såsom 1%, 5% og 10%, afhænger p-værdien af ​​den fordelingsfunktion, som teststatistikken har. Så niveauet på 1%, 5% og 10% bestemmes i begyndelsen af ​​kontrasten. Dette valg kaldes vilkårlig.

P-værdi formel

P-værdien er ikke en enkelt værdi som den kritiske værdi, men afhænger af statistikken. For forskellige værdier i teststatistikken vil den kritiske værdi være den samme. På den anden side, for forskellige værdier af teststatistikken, vil p-værdien også være forskellig, fordi p-værdien afhænger af den værdi, som teststatistikken tager.

Hvor,

  • D, er en tilfældig variabel, der følger en bestemt fordeling.
  • d, er værdien af ​​teststatistikken.

Beregning

Det er muligt at beregne p-værdien manuelt, men du bliver nødt til at have meget præcise fordelingstabeller, det vil sige med mange decimaler, fordi p-værdien har tendens til at være lille. De fleste statistiske programmer har allerede indarbejdet p-værdien, og den vises normalt i resultatet af estimeringsresultaterne ved ordinære mindste kvadrater (OLS). Det kan synes svært at bruge, men med praksis er det et meget nyttigt værktøj.

For at beregne p-værdien har vi brug for:

  • Kontraststatistik.
  • Fordelingen af ​​kontraststatistikken og kendskab til dens parametre.

Afvisningsregel

Hvis p-værdi < signifikansniveau => H0-afvisning.

Hvis p-værdi > signifikansniveau => Ingen afvisning H0.

Repræsentation

I tilfælde af en elevs t-fordeling med 2 frihedsgrader og en kontraststatistik lig med 3 er sandsynligheden for at finde en sådan ekstrem statistik, når nulhypotesen (H0) er sand, 4,77%.

Med andre ord, hvis nulhypotesen (H0) var sand, ville en statistik så stor som 3 kun blive observeret 4,77% af tiden.

Hvorfor kaldes det p-værdi?

Navnet på p-værdien har sin oprindelse i definitionen, der refererer til at være området under kurven for fordelingsfunktionen uden for konfidensintervallet. Da dette område er den mindste sandsynlighed for at afvise nulhypotesen, refererer "p" af p-værdi til sandsynlighed. Og da p-værdien svarer til et tal og derfor en værdi, tilskrives ordet "værdi" af p-værdi den numeriske figur. I nogle bøger kan vi finde "sandsynlighedsværdi", der henviser til p-værdien. Måske at sige "mindste sandsynlighed for at afvise nulhypotesen" var for lang og indeholdt ikke noget mysterium for de studerende …

Populære Indlæg

Bilindustrien og producenterne af mobile enheder vil konkurrere om kobolt

Cobalt er et mineral, der i stigende grad er til stede i vores daglige liv. Lithium-batterier i smartphones og computere har brug for at være mere holdbare. Selv elektriske bilbatterier kræver det til deres fremstilling. Det er slående, at et mineral, der tidligere blev brugt, har fået så stor betydningLæs mere…