Central Limit Theorem (TCL)

Indholdsfortegnelse:

Central Limit Theorem (TCL)
Central Limit Theorem (TCL)
Anonim

The Central Limit Theorem (TCL) er en statistisk teori, der siger, at givet en tilstrækkelig stor tilfældig stikprøve af befolkningen, vil fordelingen af ​​prøveorganet følge en normalfordeling.

Desuden fastslår TCL, at når stikprøvestørrelsen øges, vil prøve middelværdien komme tættere på befolkningens gennemsnit. Derfor kan vi ved hjælp af TCL definere fordelingen af ​​prøve middelværdien af ​​en bestemt population med en kendt varians. Så fordelingen følger en normalfordeling, hvis stikprøvestørrelsen er stor nok.

Hovedegenskaber for den centrale grænsesætning

Den centrale grænsesætning har en række meget nyttige egenskaber inden for det statistiske og sandsynlige felt. De vigtigste er:

  • Hvis prøvestørrelsen er stor nok, vil fordelingen af ​​prøveorganerne omtrent følge en normalfordeling. TCL betragter en prøve som stor, når dens størrelse er større end 30. Hvis prøven derfor er større end 30, vil prøve middelværdien have en fordelingsfunktion tæt på en normal. Og det gælder uanset hvilken form for distribution, vi arbejder med.
  • Befolkningsgennemsnittet og stikprøvernes gennemsnit vil være det samme. Det vil sige, at gennemsnittet af fordelingen af ​​alle stikprøveorganerne vil være lig med gennemsnittet af den samlede befolkning.
  • Variansen i fordelingen af ​​prøveorganet vil være σ² / n. Hvilket er variationen i populationen divideret med stikprøvestørrelsen.

At fordelingen af ​​prøveemidlet ligner en normal er enormt nyttigt. Fordi normalfordelingen er meget let at anvende til at udføre hypotesetest og konstruktion af konfidensintervaller. I statistikker, hvor en distribution er normal, er det ganske vigtigt, da mange statistikker kræver denne type distribution. Derudover tillader TCL os at slutte om befolkningens gennemsnit gennem stikprøven. Og dette er meget nyttigt, når vi på grund af manglende midler ikke kan indsamle data fra en hel befolkning.

Eksempel på den centrale grænsesætning

Lad os forestille os, at vi vil analysere det historiske gennemsnitlige afkast af S & P 500-indekset, som som vi ved har omkring 500 virksomheder inden for det. Men vi har ikke nok information til at analysere alle de 500 virksomheder i indekset. I dette tilfælde vil S & P 500's gennemsnitlige rentabilitet være befolkningens gennemsnit.

Efter TCL kan vi nu tage en prøve af disse 500 virksomheder til at udføre analysen. Den eneste begrænsning, vi har, er, at der i prøven skal være mere end 30 virksomheder for at sætningen kan opfyldes. Så lad os forestille os, at vi tilfældigt vælger 50 virksomheder fra indekset og gentager processen flere gange. De trin, der skal følges i eksemplet, er følgende:

  • Vi vælger stikprøven på ca. 50 virksomheder og opnår den gennemsnitlige rentabilitet for hele stikprøven.
  • Vi vælger løbende 50 virksomheder og opnår den gennemsnitlige rentabilitet.
  • Fordelingen af ​​alle de gennemsnitlige afkast for alle de valgte prøver tilnærmer en normalfordeling.
  • Det gennemsnitlige afkast for alle valgte prøver tilnærmer det gennemsnitlige afkast for det samlede indeks. Som det fremgår af Central Limit Theorem.

Derfor kan vi ved slutning fra det gennemsnitlige afkast af prøven nærme det gennemsnitlige afkast af indekset.