En robust estimator eller en, der har egenskaben robusthed, er en, hvis gyldighed ikke ændres som et resultat af krænkelse af nogen af de startende antagelser.
Ideen med en robust estimator er at forberede sig på mulige fejl i de første antagelser. I statistik og økonomi anvendes indledende hypoteser normalt. Det vil sige antagelser, hvorunder a formulerer, at en teori kan opfyldes. For eksempel: "Under forudsætning af at Messi ikke er skadet, spiller han sit 100. spil med Barcelona."
Vi har en starthypotese og et resultat. Hypotesen er, at han ikke skader sig selv. Hvis han er skadet, vil forudsigelsen om, at han vil spille sit 100. ligakamp, ikke gå i opfyldelse. I dette tilfælde arbejder vi ikke med en robust estimator. Hvorfor? For hvis han var en robust estimator, ville det faktum, at han havde en skade, ikke bringe forudsigelsen i fare.
PunktestimatDen robuste estimator og startantagelserne
Eksemplet ovenfor er et ærligt simpelt eksempel. I statistikker er de ikke så lette eksempler, medmindre vi har grundlæggende viden. Vi vil dog forsøge at forklare den oprindelige antagelse, der normalt er brudt, når vi foretager et skøn.
Startantagelser eller indledende antagelser er almindelige i økonomi. Det er meget almindeligt, at en økonomisk model specificerer indledende antagelser. For eksempel antages det, at et marked er fuldstændig konkurrencedygtigt, ofte i mange økonomiske modeller.
I tilfælde af at antage, at vi står over for et perfekt konkurrencepræget marked, antager vi - forenklet meget - at vi alle er de samme. Vi har alle de samme penge, produkterne er de samme, og ingen kan påvirke prisen på en vare eller tjeneste.
Fra dette perspektiv, i statistikker, er den start antagelse, der skiller sig ud over alle andre, sandsynlighedsfordelingen. For at visse egenskaber ved vores estimator skal opfyldes, skal det være opfyldt, at det fænomen, der skal undersøges, fordeles efter en sandsynlighedsstruktur.
Normal fordeling
Den normale sandsynlighedsfordeling er den mest almindelige. Deraf navnet. Det kaldes så fordi det er "normalt" eller normalt. Det er meget hyppigt at se, hvordan det i mange statistiske undersøgelser er sagt: "Vi antager, at den tilfældige variabel X er normalt fordelt."
Under normalfordelingen er der nogle estimatorer, der fungerer godt. Selvfølgelig må vi spørge os selv, hvad hvis fordelingen af den tilfældige variabel X ikke er en normalfordeling? Det kan for eksempel være en hypergeometrisk fordeling.
Eksempel på robust estimator
Nu hvor vi har en lille idé, lad os tage et eksempel. Lad os forestille os, at vi vil beregne gennemsnittet af Leo Messis mål pr. Sæson. I vores undersøgelse antager vi, at sandsynlighedsfordelingen af Messis mål er en normalfordeling. Så vi bruger en estimator af middelværdien. Denne estimator har en formel. Vi anvender det, og det giver os et resultat. For eksempel 48,5 mål pr. Sæson.
Under hensyntagen til ovenstående antager vi, at vi har begået en fejl i typen af sandsynlighedsfordeling. Hvis sandsynlighedsfordelingen faktisk var en studerendes t-fordeling, ville anvendelse af den tilsvarende middelformel give os det samme resultat? For eksempel kan resultatet være 48 mål. Resultatet er ikke det samme, men vi er kommet meget tæt på. Afslutningsvis kan vi sige, at estimatoren er robust, da en fejltagelse i den oprindelige antagelse ikke ændrer resultaterne væsentligt.