Chebyshevs ulighed - Hvad det er, definition og koncept

Chebyshevs ulighed er en sætning, der bruges i statistikker, der giver et konservativt skøn (konfidensinterval) af sandsynligheden for, at en tilfældig variabel med begrænset varians vil være i en vis afstand fra dens matematiske forventning eller dens gennemsnit.

Dets formelle udtryk er som følger:

X = estimeret værdi

µ = Matematisk forventning af den estimerede værdi

Ϭ = Standardafvigelse for den forventede værdi

k = Antal standardafvigelser

Ved at starte fra dette generelle udtryk og udvikle den del, der forbliver inden for den absolutte værdi, ville vi have følgende:

Hvis vi lægger mærke til det forrige udtryk, kan det ses, at delen til venstre ikke er mere end a konfidensinterval. Dette giver os både en nedre og en øvre grænse for den estimerede værdi. Derfor fortæller Chebyshev-uligheden os den mindste sandsynlighed for, at befolkningsparameteren er inden for et bestemt antal standardafvigelser over eller under dets gennemsnit. Eller sagt på en anden måde, det giver os sandsynligheden for, at populationsparameteren er inden for dette konfidensinterval.

Chebyshevs ulighed giver omtrentlige grænser for den anslåede værdi. På trods af at der er en vis grad af upræcision, er det en meget nyttig sætning, da den kan anvendes til en lang række tilfældige variabler uanset deres fordeling. Den eneste begrænsning for at kunne bruge denne ulighed er, at k skal være større end 1 (k> 1).

Matematisk ulighed

Eksempel på anvendelse af Chebyshevs ulighed

Antag, at vi er forvaltere af en investeringsfond. Den portefølje, vi administrerer, har et gennemsnitligt afkast på 8,14% og en standardafvigelse på 5,12%. For at vide, for eksempel, hvor stor en procentdel af vores afkast, der er mindst 3 standardafvigelser fra vores gennemsnitlige rentabilitet, anvender vi simpelthen den tidligere formel for udtryk 2.

k = 1,96

Udskiftning af værdien af ​​k: 1- (1 / (1,96 2)) = 0,739 = 73,9%

Dette betyder, at 73,9% af resultaterne er i konfidensintervallet placeret ved 1,96 standardafvigelser fra gennemsnittet.

Lad os gøre det forrige eksempel for andre værdier end k.

k = 2,46
k = 3

Udskiftning af værdien af ​​k: 1- (1 / (2,46 2)) = 0,835 = 83,5%

Udskiftning af værdien af ​​k: 1- (1 / (3 2)) = 0,889 = 88,9%

Der er 83,5% af dataene, der ligger 2,46 standardafvigelser fra gennemsnittet og 88,9% inden for 3 standardafvigelser fra gennemsnittet.

Ved hjælp af Chebyshevs ulighed er det let at udlede, at jo højere værdien af ​​K (jo større afvigelse af den estimerede værdi fra dens gennemsnit), jo større er sandsynligheden for, at den tilfældige variabel er inden for det afgrænsede interval.

KurtosisCentral grænsesætningUlighed