Bias i dataindsamling

Indholdsfortegnelse:

Bias i dataindsamling
Bias i dataindsamling
Anonim

Dataindsamlingsforstyrrelse opstår, når vi fejlagtigt vælger de emner, der hører til den tilfældige prøve, der analyseres.

Vi har problemet, når dette valg gør, at den stikprøve ikke er repræsentativ for den statistiske population. Og derfor er ethvert resultat, som vi får fra prøven, partisk, og vi kunne ikke bekræfte, at det blev opfyldt i den analyserede population. Inden for denne bias kan vi differentiere forskellige typer, som vi vil forklare nedenfor.

Overlevelsesforstyrrelse

Opstår, når data ekskluderes fra analysen, fordi de ikke længere eksisterer på tidspunktet for analysen.

Med andre ord fokuserer vi kun på de data, der findes, og kasserer dem, der tidligere eksisterede i befolkningen. I praksis er der mange eksempler på denne type bias. En af dem er kun at foretage undersøgelser for en virksomheds kunder og udelukke potentielle kunder. En anden ville være at evaluere aktieindeksernes opførsel ved at eliminere de virksomheder, der var og ikke længere er i dette indeks, fra analysen.

Løsningen på denne bias er meget enkel. Gennemfør undersøgelsen med alle data, eksisterende og tidligere eksisterende.

Forudseende bias

Det sker, når en analyse udføres ved hjælp af data, der ikke er tilgængelige på tidspunktet for analysen. Et eksempel ville være at foretage en analyse af forholdet mellem prisen på en aktie og en eller anden variabel af den finansielle balance. Aktiekursen er en dynamisk variabel, hvis vi har korrekte oplysninger på tidspunktet for analysen. De variabler, der er etableret i balancen, er dog statiske, og vi bør derfor vente på offentliggørelsen af ​​regnskabet til denne analyse.

Antag, at vi vil undersøge forholdet mellem pris og egenkapital for en række virksomheder i slutningen af ​​regnskabsåret. I dette tilfælde har vi ikke data om nettoværdien, før regnskabet offentliggøres. Offentliggørelse, der normalt gives et par måneder efter udgangen af ​​regnskabsåret.

Derfor vil en løsning på denne bias være at vente på offentliggørelse af årsregnskabet. Og udfør analysen med de offentliggjorte data sammen med prisen på offentliggørelsestidspunktet.

Tidsperiode bias

Denne skævhed opstår, når den valgte periode for dataene er for kort eller for lang. Hvis den er for kort, kan analysen afspejle specifikke resultater, der kun er opfyldt i den periode. Det vil sige, de ville ikke være repræsentative i længere tid.

Forestil dig en femårig tidsramme, hvor små virksomheder har overgået store virksomheder på aktiemarkedet. Ud fra dette kunne vi drage den konklusion, at små virksomheder i fremtiden altid vil overgå de store. Men i så kort tid kan der ikke drages sådanne konklusioner. Det skyldes hovedsageligt, at situationen i længere perioder kan ændre sig. Derfor er de opnåede resultater forudindtaget til denne reducerede tidsperiode.