Kategorisk variabel - Hvad er det, definition og koncept

En kategorisk variabel er en, der tillader klassificering af en række data ved hjælp af faste værdier tilknyttet en bestemt kvalitet eller kategori.

Den kategoriske variabel klassificerer i modsætning til hoved- eller kontinuerlige variabler (som tillader numeriske beregninger) enkeltpersoner eller tilfælde. De tager normalt værdier repræsenteret af heltal, som en eller nul, men det er netop det, repræsentationer.

I eksemplet vil vi se det mere detaljeret.

Forskelle mellem kategorisk og kontinuerlig variabel

Der er nogle forskelle mellem den kategoriske variabel og den kontinuerlige eller hovedvariabel, der skal være kendt. Lad os se det mest relevante.

  • For det første bruges den kategoriske variabel til gruppering og den kontinuerlige variabel til optælling. Med andre ord tillader den første, at kategorier dannes med en række data. For eksempel køn eller antal børn. Det andet giver os numeriske oplysninger. For eksempel alder.
  • Kardinalvariablen tillader numeriske beregninger, de andre ikke. På den måde kan vi i den førstnævnte kende midlerne eller afvigelserne, mens i de andre kun nogle data, såsom tilstanden eller procentdelen af ​​kategorier.
  • De kategoriske er meget nyttige til at kende kvalitativ information, det vil sige en vis kvalitet af dataene. De kontinuerlige giver os kvantitative data, dvs. størrelser og værdier repræsenteret af tal.

Statistiske teknikker til kategoriske variabler

Lad os derefter se de statistiske teknikker, der er mest brugt i kategoriske variabler, og sammenligne dem med kontinuerlige eller kardinalvariabler.

  • Beskrivende statistik: I denne type variabler er analyserne normalt baseret på blandt andet bjælke- og procentdiagrammer. Kardinaler tillader anvendelse af analyseteknikker til at beregne positionsstatistik såsom kvantiler eller dispersionsstatistik såsom afvigelser.
  • Hypotesekontrast: I kategorien kan resultaterne ekstrapoleres ved hjælp af ikke-parametriske hypotesetests. På den anden side bruger de kontinuerlige parametriske kontraster, der også kan udledes.
  • Regressionsteknikker: I dette tilfælde anvendes blandt andet logistisk regression eller lignende. For den anden type variabler er den mest anvendte teknik lineær regression.

Eksempel på kategorisk variabel

Afslut, lad os se på et meget almindeligt eksempel inden for markedsføring. Lad os forestille os, at vi vil sælge et produkt, og vi er interesserede i at kende civilstanden.

For at gøre dette tildeler vi 1 til single, 2 til gif.webpt, 3 til fraskilt, 4 til partner og 5 til andre.

Lad os se billedet og derefter kommentere det:

I det kan vi se, at den højeste procentdel af enkeltpersoner er enlige, gif.webpt og skilt, hvor de to andre muligheder kun er 5%.

Som vi kan se, er kategoriske variabler nyttige til gruppering. Søjlediagrammet giver os mulighed for bedre at observere disse procenter, da det er lettere at sammenligne størrelsen på søjlerne.