Bootstrap - Hvad er det, definition og koncept
Bootstrap er en mekanisme til statistik og økonometri, der fokuserer på sampling af data inden for en tilfældig eller tilfældig prøve. Dens vigtigste anvendelse er at finde en tilnærmelse til fordelingen af den analyserede variabel.
Denne proces er også kendt i statistisk jargon som bootstrapping og er resultatet af studier inden for statistisk stikprøve af matematikeren Bradley Efron i slutningen af 1970'erne.
Bootstrap-værktøj
Hovedværdien ved at bruge bootstrap er at reducere bias inden for analysen eller med andre ord at tilnærme variansen ved at udføre tilfældig resampling af den indledende prøve og ikke af populationen. På denne måde gøres konstruktionen af statistiske modeller lettere ved at skabe tillidsintervaller og hypotesetests.
Selvom det kan virke som en meget kompleks praksis a priori, er proceduren, som bootstrapping er baseret på, simpelthen oprettelsen af et stort antal prøver, der omplacerer dataene, idet der tages som reference en indledende populationsprøve.
Denne teknik er især nyttig i situationer, hvor de tilgængelige prøver er små, eller som nævnt før, hvis fordelingen er meget skæv. I denne forstand hjælper de med at løse en lang række sandsynlighedsproblemer og anvendt statistik.
Bootstrap-funktioner
Et af de vigtigste kendetegn ved denne praksis er, at det involverer efterfølgende sampling for at opnå lukkede udtryk og løse den matematiske kompleksitet af disse operationer. Med udviklingen af computere og teknologiske værktøjer i de senere år er det blevet lettere at stole på brugen af bootstrapping til kompleks resampling.
Resamplingsteknikken giver os mulighed for at gå længere, når vi studerer dataprøver fra en bestemt population. Med andre ord giver det dig mulighed for at lave eller oprette nye antagelser ved at erstatte yderligere værdier fra prøven.
Fordele ved Bootstrap
Et positivt aspekt ved genoptagelse af bootstrap er, at det har forenklet statistiske metoder i den forstand, at det har erstattet konstruktionen af klassiske og meget komplekse matematiske modeller med beregning ved hjælp af specifik software, hvilket har forbedret deres anvendelighed eller adgang til andre felter eller studier.
Efter denne linje anses det normalt for, at denne mekanisme er meget mere åben eller tilgængelig i forhold til klassiske modeller og antagelser, hvilket gør det til et nyttigt værktøj til et stort antal matematiske problemer.
Konfidensinterval