Elevs fordeling - Hvad er det, definition og koncept

Indholdsfortegnelse:

Anonim

Elevs t-distribution eller t-distribution er en teoretisk model, der bruges til at tilnærme første ordensmoment for en normalt fordelt population, når stikprøvestørrelsen er lille, og standardafvigelsen er ukendt.

Med andre ord er t-fordelingen en sandsynlighedsfordeling, der estimerer værdien af ​​gennemsnittet af en lille prøve trukket fra en population, der følger en normalfordeling, og som vi ikke kender dens standardafvigelse for.

Anbefalede artikler: frihedsgrader, frihedsgrader (eksempel) og normalfordeling.

Elevs t-fordelingsformel

Givet en kontinuerlig tilfældig variabel L siger vi, at frekvensen af ​​dens observationer kan tilnærmes tilfredsstillende til en t-fordeling med g frihedsgrader, således at:

Repræsentation af studentens t-distribution

Tæthedsfunktion af en t-fordeling med 3 frihedsgrader (df).

Som vi kan se, ser repræsentationen af ​​t-fordelingen meget ud som normalfordelingen bortset fra at normalfordelingen har bredere haler og er mere understøttet. Med andre ord skal vi tilføje flere grader af frihed til t-fordelingen, så fordelingen "vokser" og ligner mere normalfordelingen.

Specialitet

Og … Hvorfor er t-distributionen så speciel?

Fordi i modsætning til normalfordelingen, der afhænger af middelværdien og variansen, afhænger t-fordelingen kun af frihedsgraderne fra engelsk, grader af frihed (df). Med andre ord kontrollerer vi fordelingen ved at kontrollere frihedsgraderne.

Studerendes ansøgning

T-fordelingen bruges, når:

  • Vi vil estimere gennemsnittet af en normalfordelt population ud fra en lille prøve.
  • Prøvestørrelsen er mindre end 30 varer, det vil sige n <30.

Fra 30 observationer ligner t-fordelingen meget normalfordelingen, så vi bruger normalfordelingen.

  • Standardpopulationens standardafvigelse er ikke kendt og skal estimeres ud fra observationer af prøven.

Eksempel

Vi antager, at vi har 28 observationer af en tilfældig variabel G, der følger en elevs t-fordeling med 27 frihedsgrader (df).

Matematisk,

Da vi arbejder med ægte data, vil der altid være en tilnærmelsesfejl mellem dataene og distributionen. Med andre ord vil middelværdien, medianen og tilstanden ikke altid være nul (0) eller nøjagtigt den samme.

Vi repræsenterer frekvensen af ​​hver observation af variabel G ved hjælp af et histogram.

Kan den tilfældige variabel G tilnærme en t-fordeling?

Årsager til at overveje, at variablen G følger en t-fordeling:

  • Fordelingen er symmetrisk. Der er det samme antal observationer både til højre og til venstre for den centrale værdi. Også, at middelværdien og medianen har tendens til at være tæt på den samme værdi. Middelværdien er omtrent nul, middelværdi = 0,016.
  • Observationerne med mest frekvens eller sandsynlighed er omkring den centrale værdi. Observationer med mindre frekvens eller sandsynlighed er langt fra den centrale værdi.