En upartisk estimator er en, hvis matematiske forventning falder sammen med værdien af den parameter, du vil estimere. Hvis de ikke falder sammen, siges estimatoren at have bias.
Årsagen til at lede efter en upartisk estimator er, at den parameter, vi vil estimere, er godt estimeret. Med andre ord, hvis vi vil estimere de gennemsnitlige mål pr. Kamp for en bestemt fodboldspiller, er vi nødt til at bruge en formel, der giver os en værdi så tæt som muligt på den reelle værdi.
Hvis forventningen til estimatoren ikke falder sammen med parameterens sande værdi, siges estimatoren at have en bias. Bias måles som forskellen mellem estimatorens forventningsværdi og den sande værdi. Matematisk kan det bemærkes som følger:
Fra ovenstående formel er den første og sidste del tydelig. Det vil sige, at forventningen til estimatoren er lig med parameterens sande værdi. Hvis denne ligestilling holder, er estimatoren upartisk. Den matematisk mere abstrakte midterdel forklares i næste afsnit.
Gennemsnittet af alle estimater, som estimatoren kan foretage for hver forskellige prøve, er lig med parameteren. For eksempel, hvis vi har 30 forskellige prøver, er den normale ting, at estimatoren (selvom kun lidt) i hver prøve tilbyder forskellige værdier. Hvis vi tager gennemsnittet af estimatorens 30 værdier i de 30 forskellige prøver, skal estimatoren returnere en værdi svarende til den sande værdi af parameteren.
PunktestimatSkævhedens skævhed
En upartisk estimator kan ikke altid findes til at beregne en bestemt parameter. Så vores estimator kan være partisk. At en estimator har bias betyder ikke, at den ikke er gyldig. Det betyder simpelthen, at det ikke passer så godt som statistisk, vi gerne vil have.
Når det er sagt, selvom det ikke passer så godt som vi gerne vil, har vi nogle gange ikke andet valg end at bruge en partisk estimator. Derfor er det meget vigtigt, at vi kender størrelsen af denne bias. Hvis vi ved om det, kan vi bruge disse oplysninger i konklusionerne af vores undersøgelse. Matematisk defineres bias som følger:
I ovenstående formel er bias en værdi, der ikke er nul. Hvis det var nul, ville estimatoren være upartisk.
Eksempel på en upartisk estimator
Et eksempel på en upartisk estimator findes i middelestimatoren. Denne estimator er i statistikker kendt som stikprøveværdien. Hvis vi bruger den matematiske formel, der blev beskrevet i begyndelsen, konkluderer vi, at prøve middelværdien er en upartisk estimator. Før drift skal vi tage følgende oplysninger i betragtning:
Vi betegner X med en bjælke over gennemsnittet af prøven.
Formlen for prøve middelværdien er summen af de n værdier, som vi har divideret med antallet af værdier. Hvis vi har 20 data, vil n være lig med 20. Vi bliver nødt til at tilføje værdierne for de 20 data og dele dem med 20.
Ovenstående betegnelse betyder forventning eller forventet værdi af stikprøvernes gennemsnit. I almindelighed kan vi sige, at det beregnes som middelværdien af stikprøven. Med dette i tankerne kan vi ved hjælp af de rigtige matematiske teknikker udlede følgende:
Estimatorens forventning falder sammen med 'mu', som er den sande værdi af parameteren. Det er den virkelige middelværdi. Alt er sagt, nogle grundlæggende begreber om matematik er nødvendige for at forstå den tidligere udvikling.
På samme måde kunne vi prøve at gøre det samme med estimatoren for prøvevariansen. I det følgende er S i kvadratet prøveudviklingen, og det græske bogstav sigma (som ligner bogstavet o med en pind til højre) er den reelle variation.
Forskellen fra ovenstående formel er den anden del af den første formel. Nemlig:
Vi konkluderer, at prøvevariansen som en estimator af populationsvariansen er partisk. Dens bias er lig med værdien angivet ovenfor. Det afhænger således af populationsvariansen og stikprøvestørrelsen (n). Bemærk, at hvis n (prøvestørrelse) bliver meget stor, har bias tendens til nul.
Hvis når prøven har tendens til at være meget stor, vurderer estimatoren den sande værdi af parameteren, så taler vi om en asymptotisk upartisk estimator.