Kategoriske variable egenskaper og eksempler

Kategoriske variable egenskaper og eksempler

De Kategorisk variabel Det er den som brukes i statistikk for å tildele en ikke-numerisk eller kvalitativ karakteristikk eller egenskap til et objekt, individ, enhet, tilstand eller prosedyre. Det er mulig å definere alle slags kategoriske variabler i henhold til hvert behov. 

Eksempler på kategoriske variabler er: farge, kjønn, blodgruppe, sivilstand, type materiale, betalingsskjema eller type bankkonto, og brukes mye daglig.

Figur 1: Farge er en kategorisk variabel. Kilde: Pixabay

Ovennevnte er variablene, men deres mulige verdier er kvalitative, det vil si om kvalitet eller karakteristikk og ikke av en numerisk måling. For eksempel mulige verdier for variabelen kjønn er: mann , hEmbra.

Når denne variabelen er lagret i et dataprogram, kan den deklareres som en tekstvariabel, og de eneste aksepterte verdiene vil bli utnevnt: Mann , Hunn.

Men den samme variabelen kjønn kan erklæres og lagres som et heltall hvis Mann er tildelt 1 allerede Hunn Verdien er tilordnet 2. Det er av denne grunn at kategoriske variabler noen ganger kalles den listede typen.

Hovedkarakteristikken for kategoriske variabler er at i motsetning til andre variabler, for eksempel kontinuerlig og diskret, er det ikke mulig å gjøre aritmetikk med dem. Imidlertid kan statistikk gjøres med dem, som det vil bli sett senere.

[TOC]

Eksempler

Legg merke til følgende eksempler på kategoriske variabler og deres mulige verdier:

-Blodtype, Verdier: A, B, AB, eller

-Sivil status, Kategoriske verdier: Enkelt (TIL), Gift (B), Enkemann (C) , Skilt (D).

-Type materiale, Kategorier eller verdier: 1 = tre, 2 = metall, 3 = plast

-Måte å betale på, Verdier eller kategorier: (1) Kontanter, (2) Debet, (3) Overføring, (4) Kreditt

Kan tjene deg: Tesla Coil: Historie, hvordan det fungerer, hva er det for

I de foregående eksemplene har et tall blitt assosiert med hver kategori på en helt vilkårlig måte. 

Det kan tenkes da at denne vilkårlige numeriske assosiasjonen gjør det tilsvarende en diskret kvantitativ variabel, Men det er ikke siden aritmetiske operasjoner ikke kan gjøres med disse tallene.

For å illustrere ideen, i variabelen Måte å betale på, Sumoperasjonen gir ingen mening:

 (1) Effektiv + (2) Debet vil aldri være ekvivalent med (3) Overføring

Klassifisering av kategoriske variabler

Klassifiseringen er basert på om de har et implisitt hierarki eller om antall mulige resultater er mer enn to eller to.

En kategorisk variabel med et enkelt mulig resultat er ikke en variabel, det er en kategorisk konstant.

Nominell kategorisk 

Når de ikke kan bli representert med et tall eller har noen bestilling. For eksempel variabelen: Type_de_material, tnominelle verdier (Tre, metall, plast), har de ingen hierarki eller orden, selv når et vilkårlig antall er tilordnet hvert svar eller kategori.

Ordinal kategorisk

Variabel: Akademisk ytelse

Nominelle verdier: Høy, middels, lav

Selv om verdiene til denne variabelen ikke er numeriske, har de en ordre eller hierarki implisitt.

Binær kategorisk

Dette er nominelle variabler med to mulige svar, for eksempel:

-Variabel: Svar

-Nominelle verdier: EKTE, Forfalskning

Merk at variabelen Svar Det innebærer ikke et hierarki og har bare to mulige resultater, så det er en binær kategorisk variabel.

Noen forfattere kaller denne typen binær variabel, Og de anser ikke det som tilhører Kategoriske variabler som er begrenset til de med mer enn tre mulige kategorier.

Statistikk med kategoriske variabler

Statistikk kan gjøres med kategoriske variabler, til tross for at de ikke er numeriske eller kvantitative variabler. For eksempel å vite den mest sannsynlige trenden eller verdien av en kategorisk variabel den er tatt Mote.

Det kan tjene deg: Astroclymics: Historie, hvilke studier, grener

Mote Det er i dette tilfellet det mest gjentatte resultatet eller verdien av en kategorisk variabel. I kategoriske variabler er det ikke mulig å beregne verken gjennomsnittet eller medianen.

Gjennomsnittet kan ikke beregnes fordi det ikke kan gjøres aritmetikk med kategoriske variabler. Verken medianen, fordi de kvantitative eller kategoriske variablene ikke har en ordre eller hierarki, så det er ikke mulig å bestemme en sentral verdi.

Grafisk representasjon av kategoriske variabler

Gitt en viss kategorisk variabel, kan du finne frekvensen eller antall ganger et resultat av den variabelen gjentas. Hvis dette gjøres for hvert resultat, kan en frekvensgraf gjøres avhengig av hver kategori eller resultat.

Her er noen eksempler på hvordan kategoriske variabler kan representeres grafisk.

Løste øvelser

Oppgave 1

Et selskap har data fra 170 ansatte. En av variablene som er i disse postene er: Sivil status. Denne variabelen har fire mulige kategorier eller verdier:

Enkelt (TIL), Gift (B), Enkemann (C) , Skilt (D).

Selv om det er en ikke-nummervariabel, er det mulig å vite hvor mange av de totale postene som er i en viss kategori og være representert i form av et søylediagram, som vist i følgende figur:

Figur 2. Representasjon av resultatene av en kategorisk variabel. Kilde: Selvlaget

Eksempel 2

En skobutikk har en oversikt over salget. Blant variablene som håndterer postene deres er skofargen for hver modell. Variabelen: 

Color_zapato_modelo_aw3

Den er kategorisk og har fem mulige kategorier eller verdier. For hver kategori av den variabelen er antall salg totalt og prosentandelen av det samme er etablert. Resultatene presenteres i grafen over følgende figur:

Kan tjene deg: elektriske egenskaper til materialer Figur 3. Kategorisk variabel farge _ Zapato. På denne variable mote er hvit. Kilde: Selvlaget.

Det kan sies at fra AW3 -skododellen som er av mote, Den mest solgte er Hvit, fulgt tett av Svart

Det kan også sies at 70% sannsynlighet den neste skoen som selges av denne modellen vil være Hvit enten Svart.

Denne informasjonen kan være nyttig for butikken når du bestiller, eller kan til og med bruke rabatter på de minst solgte fargene for overflødig lager.

Eksempel 3

For en viss populasjon av blodgivere ønsker vi å representere antall mennesker som tilhører en viss blodgruppe. En grafisk måte å visualisere resultatene på er gjennom et piktogram, som er i bakgrunnen en tabell.

I den første kolonnen er variabelen representert Blodtype og dets mulige resultater eller kategorier. Den andre kolonnen har representasjonen på en ikonisk eller billedlig måte for antall mennesker i hver kategori. I vårt eksempel brukes en rød dråpe som et ikon, som hver representerer 10 personer.

Figur 4. Pictogram. Kilde: Selvlaget

Referanser

  1. Khan Academy. Analysere kategoriske data. Gjenopprettet fra: Khanacademy.org
  2. Universformler. Kvalitativ variabel. Hentet fra: Univesformulas.com
  3. Minitab. Som er kategoriske, diskrete og kontinuerlige variabler. Gjenopprettet fra: støtte.Minitab.com
  4. Excel tutorial. Karakterisering av variabler. Gjenopprettet fra: Hjelp.Xlslat.com.
  5. Wikipedia. Statistisk variabel. Gjenopprettet fra Wikipedia.com
  6. Wikipedia. Kategorisk variabel. Gjenopprettet fra Wikipedia.com
  7. Wikipedia. Variabel kategorisk. Gjenopprettet fra Wikipedia.com