Tillidsinterval - Hvad er det, definition og koncept

Indholdsfortegnelse:

Anonim

Et konfidensinterval er en estimeringsteknik, der anvendes i statistisk slutning, der gør det muligt at begrænse et par eller flere par værdier, inden for hvilket det ønskede punktestimat vil blive fundet (med en vis sandsynlighed).

Et konfidensinterval giver os mulighed for at beregne to værdier omkring et gennemsnit af en prøve (en øvre og en lavere). Disse værdier vil begrænse et interval inden for hvilket befolkningsparameteren med en vis sandsynlighed vil være placeret.

Konfidensinterval = gennemsnit + - fejlmargen

At kende den sande befolkning er generelt noget meget kompliceret. Overvej en befolkning på 4 millioner mennesker. Kunne vi kende de gennemsnitlige forbrugsforbrug pr. Husstand i denne befolkning? I princippet ja. Vi bliver simpelthen nødt til at undersøge alle husstande og beregne gennemsnittet. Imidlertid ville det være yderst besværligt at følge denne proces og gøre undersøgelsen ret kompliceret.

I situationer som denne er det mere muligt at vælge en statistisk stikprøve. For eksempel 500 mennesker. Og beregne middelværdien på den nævnte prøve. Selvom vi stadig ikke kender den sande befolkningsværdi, kunne vi antage, at den vil være tæt på prøveværdien. Til det betyder vi tilføjer fejlmargenen, og vi har en konfidensintervalværdi. På den anden side trækker vi denne fejlmargen fra middelværdien, og vi får en anden værdi. Mellem disse to værdier vil befolkningens gennemsnit være.

Afslutningsvis tjener konfidensintervallet ikke til at give et pointestimat af befolkningsparameteren, hvis det vil hjælpe os med at få en omtrentlig idé om, hvilken der kunne være den rigtige. Det giver os mulighed for at begrænse mellem to værdier, hvor befolkningens gennemsnit vil blive fundet.

variationskoefficientKumulativ frekvens

Faktorer, som et konfidensinterval afhænger af

Beregningen af ​​et konfidensinterval afhænger hovedsageligt af følgende faktorer:

  • Valgt prøve størrelse: Afhængig af mængden af ​​data, der er brugt til at beregne prøveværdien, vil den være mere eller mindre tæt på den sande populationsparameter.
  • Selvtillidsniveau: Det vil informere os om, i hvor stor en procentdel af tilfældene vores skøn er korrekt. De sædvanlige niveauer er 95% og 99%.
  • Fejlmargen for vores estimat: Dette kaldes alfa og informerer os om sandsynligheden for, at befolkningsværdien er uden for vores rækkevidde.
  • Det estimerede i prøven (gennemsnit, varians, forskel på gennemsnit …): Drejestatistikken til beregning af intervallet afhænger af dette.

Eksempel på konfidensinterval for middelværdien, forudsat normalitet og den kendte standardafvigelse

Den drejningsstatistik, der blev brugt til beregningen, ville være følgende:

Det resulterende interval ville være følgende:

Vi ser, hvordan vi i intervallet til venstre og højre for uligheden har henholdsvis den nedre og den øvre grænse. Derfor fortæller udtrykket os, at sandsynligheden for, at befolkningens gennemsnit ligger mellem disse værdier, er 1-alfa (konfidensniveau).

Lad os se bedre på ovenstående med en øvelse løst som et eksempel.

Du vil estimere den gennemsnitlige tid, en løber tager for at gennemføre en maraton. Til dette er 10 maratonløb blevet timet, og der er opnået et gennemsnit på 4 timer med en standardafvigelse på 33 minutter (0,55 timer). Du ønsker at opnå et 95% konfidensinterval.

For at opnå intervallet skulle vi kun erstatte dataene i intervalformlen.

Konfidensintervallet ville være den del af fordelingen, der er skyggelagt med blåt. De 2 værdier, der afgrænses af dette, ville være dem, der svarer til de 2 røde linjer. Den centrale linje, der deler fordelingen i 2, ville være den sande befolkningsværdi.

Det er vigtigt at bemærke, at i dette tilfælde, i betragtning af at densitetsfunktionen for fordelingen N (0,1) giver os den kumulative sandsynlighed (fra venstre til den kritiske værdi), er vi nødt til at finde den værdi, der efterlader os 0,975 på venstre% (dette er 1,96).