- Példák
- A kategorikus változók osztályozása
- Névleges kategóriák
- Ordinal kategorikus
- Bináris kategóriák
- Statisztika kategorikus változókkal
- A kategorikus változók grafikus ábrázolása
- Megoldott gyakorlatok
- 1. Feladat
- 2. példa
- 3. példa
- Irodalom
A kategorikus változót a statisztikában használják nem numerikus vagy kvalitatív tulajdonság vagy tulajdonság hozzárendelésére valamilyen objektumhoz, egyénhez, entitáshoz, feltételhez vagy eljáráshoz. Lehetőség van mindenféle kategorikus változó meghatározására az igények szerint.
Példák a kategorikus változókra: szín, nem, vércsoport, családi állapot, anyag típusa, fizetési mód vagy bankszámla típusa, és ezeket napi rendszerességgel használják.

1. ábra: A szín egy kategorikus változó. Forrás: pixabay
A fenti változók, de lehetséges értékeik minőségi, vagyis minőségi vagy jellemzői, és nem számszerű mérés. Például a változó nem lehetséges lehetséges értékei: férfi, h embra.
Amikor ezt a változót egy számítógépes programban tárolják, akkor szöveges változóként deklarálható, és az egyetlen elfogadott érték a következő: Male, Female.
Ugyanakkor ugyanaz a változó nem lehet deklarálható és egészként tárolható, ha a Férfi 1-es, a Nő pedig 2-es értéket kap. Ez az oka annak, hogy a kategorikus változókat néha felsorolt típusnak nevezik.
A kategorikus változók fő jellemzője, hogy más változóktól eltérően, mint például a folytonos és a diszkrét változók, nem lehet számtani elvégezni velük. A statisztikák azonban velük is elvégezhetők, amint később kiderül.
Példák
Vegye figyelembe a kategorikus változók alábbi példáit és azok lehetséges értékeit:
- Group_Sanguíneo, Értéktartomány: A, B, AB, O
- Civil_Status, kategorikus értékek: Egyedülálló (A), házas (B), özvegy (C), elvált (D).
- Tipo_de_Material, kategóriák vagy értékek: 1 = fa, 2 = fém, 3 = műanyag
-Fizetés formája, értékpapírok vagy kategóriák: (1) készpénz, (2) terhelés, (3) átutalás, (4) hitel
Az előző példákban egy-egy számot teljesen tetszőleges módon társítottak az egyes kategóriákhoz.
Ezután azt gondolhatnánk, hogy ez az önkényes numerikus asszociáció egyenértékűvé teszi egy diszkrét kvantitatív változóval, de nem az, mivel ezekkel a számokkal számtani műveleteket nem lehet elvégezni.
Az ötlet szemléltetése érdekében a Form_of_Payment változóban az összegműveletnek nincs értelme:
(1) Készpénz + (2) A terhelés soha nem lesz egyenlő (3) Átutalás
A kategorikus változók osztályozása
A rangsorolás azon alapul, hogy van-e implicit hierarchiájuk, vagy sem, vagy a lehetséges eredmények száma kettőnél több vagy kettő.
A kategorikus változó, amelynek csak egy lehetséges kimenetele van, nem változó, hanem kategorikus állandó.
Névleges kategóriák
Ha nem lehet számmal ábrázolni, vagy bármilyen sorrend van. Például a Type_of_Material változónak névleges értékei vannak (fa, fém, műanyag), nincsenek hierarchiájuk vagy sorrendük, még akkor sem, ha tetszőleges számot adnak az egyes válaszokhoz vagy kategóriákhoz.
Ordinal kategorikus
Változó: Akadémiai teljesítmény
Névleges értékek: magas, közepes, alacsony
Bár ennek a változónak az értékei nem numerikusak, implicit sorrendjük vagy hierarchiájuk van.
Bináris kategóriák
Ezek névleges változók, amelyek két lehetséges választ tartalmaznak, például:
-Változatos: Válasz
-Nominális értékek: Igaz, hamis
Vegye figyelembe, hogy a Response változónak nincs implicit hierarchiája, és csak két lehetséges kimenetele van, tehát bináris kategorikus változó.
Egyes szerzők ezt a típust bináris változónak nevezik, és úgy vélik, hogy nem tartozik olyan kategorikus változókhoz, amelyek csak három lehetséges kategóriánál korlátozódnak.
Statisztika kategorikus változókkal
A statisztikákat kategorikus változókkal lehet elvégezni, annak ellenére, hogy nem numerikus vagy mennyiségi változók. Például egy kategorikus változó trendjének vagy legvalószínűbb értékének megismeréséhez az üzemmódot választják.
Ebben az esetben a mód a kategorikus változó leginkább ismétlődő eredménye vagy értéke. A kategorikus változók esetében nem lehet kiszámítani sem az átlagot, sem a mediánt.
Az átlagot nem lehet kiszámítani, mert nem végezhet aritmetikát kategorikus változókkal. A medián sem, mivel a kvantitatív vagy kategorikus változóknak nincs rendje vagy hierarchiája, tehát nem lehet meghatározni egy központi értéket.
A kategorikus változók grafikus ábrázolása
Bizonyos kategorikus változó megadásával megtalálható annak a gyakorisága vagy hányszor az adott változó eredménye. Ha ezt minden eredményre megteszik, akkor elkészíthetjük az egyes kategóriákhoz vagy eredményekhez tartozó gyakoriság grafikonját.
Íme néhány példa arra, hogyan lehet a kategorikus változókat grafikusan ábrázolni.
Megoldott gyakorlatok
1. Feladat
Egy vállalat 170 alkalmazott adatait nyilvántartja. Az egyik változó, amely ezekben a rekordokban található: Estado_Civil. Ennek a változónak négy kategóriája vagy lehetséges értéke van:
Egyedülálló (A), Házas (B), Özvegy (C), Elvált (D).
Noha nem numerikus változó, meg lehet tudni, hogy az összes rekord közül hány tartozik egy adott kategóriába, és oszlopdiagramon keresztül ábrázolható, ahogy az a következő ábrán látható:

2. ábra: Egy kategorikus változó eredményeinek ábrázolása. Forrás: saját készítésű
2. példa
Egy cipőüzlet nyomon követi értékesítéseit. A rekordokat kezelő változók között szerepel az egyes modellek cipőszíne. A változó:
Color_Shoe_Model_AW3
Kategória típusú, és öt kategóriával vagy lehetséges értékkel rendelkezik. A változó mindegyik kategóriájához az eladások számát összesítik, és meghatározzák azok százalékos arányát. Az eredményeket a következő ábra grafikonja mutatja be:

3. ábra. Színes _Shoe kategorikus változó. Ebben a változóban az üzemmód fehér. Forrás: saját készítésű.
Elmondhatjuk akkor, hogy a divatos AW3 cipőmodellek közül a leggyakrabban a White, a Black pedig szorosan követi.
Azt is elmondhatjuk, hogy 70% -os valószínűséggel a következő cipő, amelyet e modelltől kapnak, fehér vagy fekete lesz.
Ez az információ hasznos lehet az üzlet számára új megrendelések benyújtásakor, vagy akár a legkevésbé eladott színekre kedvezményeket is alkalmazhat a túlzott készlet miatt.
3. példa
A véradók egy bizonyos populációja esetében meg akarja reprezentálni egy bizonyos vércsoporthoz tartozó emberek számát. Az eredmények megjelenítésének grafikus módja egy piktogram, amely az asztal alján található.
Az első oszlop a group_sanguíneo változót és annak lehetséges eredményeit vagy kategóriáit mutatja be. A második oszlop ikononként vagy képi formában ábrázolja az egyes kategóriákban szereplő emberek számát. Példánkban egy piros cseppet használunk ikonként, amelyek mindegyike 10 embert képvisel.

4. ábra Piktogram. Forrás: saját készítésű
Irodalom
- Khan Akadémia. Kategória adatok elemzése. Helyreállítva: khanacademy.org
- Univerzum képletek. Minőségi változó. Helyreállítva: univesoformulas.com
- Minitab. Melyek kategorikus, diszkrét és folyamatos változók. Helyreállítva: support.minitab.com
- Excel bemutató. A változók jellemzése. Helyreállítva: help.xlslat.com.
- Wikipedia. Statisztikai változó. Helyreállítva a wikipedia.com webhelyről
- Wikipedia. Kategória változó. Helyreállítva a wikipedia.com webhelyről
- Wikipedia. Kategória változó. Helyreállítva a wikipedia.com webhelyről
