Kumulativ sandsynlighedsfordeling

Indholdsfortegnelse:

Anonim

Den kumulative sandsynlighedsfordeling (ADF) er en matematisk funktion, der afhænger af en reel tilfældig variabel og en given sandsynlighedsfordeling, der returnerer sandsynligheden for, at variablen er lig med eller mindre end en bestemt værdi.

Med andre ord er den kumulative sandsynlighedsfordeling en matematisk funktion, der bruges til at kende sandsynligheden for, at en tilfældig variabel tager værdier, der er mindre end eller lig med et bestemt tal, uanset dens fordeling.

Den kumulative sandsynlighedsfordeling kaldes også distributionsfunktion (FD) og betegnes normalt som F (x) for at skelne den fra densitetsfunktionen f (x).

Sandsynlighedsfordeling

Det er vigtigt at forstå, hvorfor ordfordelingen bruges så meget i statistikker. Ordfordelingen bruges, da dataene faktisk distribueres. Det vil sige, fra en tabel med data laves en graf for at se dens udseende. Formålet med grafen er at se, hvordan disse data fordeles gennem hele prøven. Den funktion, der vises, hvis vi repræsenterer dataene og dens frekvens, ville være densitetsfunktionen for en bestemt fordeling.

I stedet for, hvis vi vil repræsentere den kumulative sandsynlighed for dataene, bliver vi nødt til at bruge fordelingsfunktionen eller den kumulative sandsynlighedsfordeling.

Som billedet viser, kan du se, hvordan sandsynligheden fordeles (lodret akse) gennem dataene (vandret akse). Når du går igennem prøven, avancerer du også i sandsynligheden.

Dette eksempel er en prøve på 1000 emner, der starter kl. 7 og slutter kl. 17:

Det er vigtigt at huske, at sandsynligheden altid vil være en værdi mellem 0 og 1. Det er derfor logisk, at sandsynlighedsfordelingsfunktionen starter ved 0 i begyndelsen af ​​prøven og slutter ved 1 i slutningen af ​​prøven.

Ovenstående fordelingsfunktion refererer til Normalfordelingen. Andre distributioner såsom Poisson, log-normal og eksponentiel har også en lignende fordelingsfunktion.

Eksempel på fordeling af kumulativ sandsynlighed

Plot følgende sandsynligheder i følgende graf:

  1. 40%
  2. 20%
  3. 90%

Opløsning

I modsætning til sandsynlighedsdensitetsfunktionen er sandsynlighederne i fordelingsfunktionen punkter på kurven og ikke områder. Denne øvelse kunne også udføres ved at kende observationen (vandret akse) og lede efter den tilhørende sandsynlighed.