- A homoszkedaszticitás fontossága
- Homoszkedaszticitás versus heteroskedaszticitás
- Homoszkedaszticitás tesztek
- Szabványosított változók
- A homoszkedaszticitás nem grafikus vizsgálata
- Irodalom
A homoszkedaszticitás egy prediktív statisztikai modellben akkor fordul elő, ha egy vagy több megfigyelés összes adatcsoportja, a variancia (vagy független) mintázat a magyarázó változókhoz viszonyítva változatlan marad.
A regressziós modell lehet homoszkedasztikus vagy sem, ebben az esetben a heteroszkedaszticitásról beszélünk.

1. ábra. Öt adatkészlet és a halmaz regressziós illesztése. A várható értékhez viszonyított variancia minden csoportban azonos. (Upav-biblioteca.org)
Számos független változó statisztikai regressziós modelljét homoszkedasztikusnak hívják, csak akkor, ha a becsült változó hibája (vagy a függő változó szórása) egyforma marad a magyarázó vagy független változók különféle értékcsoportjaira.
Az 1. ábra öt adatcsoportjában kiszámoltuk az egyes csoportok varianciáját a regresszióval becsült érték vonatkozásában, így minden csoportban azonosak. Feltételezzük továbbá, hogy az adatok a normál eloszlást követik.
Grafikai szinten ez azt jelenti, hogy a pontok egyenlően vannak szétszórva vagy szétszórva a regressziós illeszkedés által megjósolt érték körül, és hogy a regressziós modell azonos hibával és érvényességgel rendelkezik a magyarázó változó tartományában.
A homoszkedaszticitás fontossága
A homoszkedaszticitás fontosságának szemléltetése érdekében a prediktív statisztikákban szembe kell állni az ellenkező jelenséggel, a heteroszkedaszticitással.
Homoszkedaszticitás versus heteroskedaszticitás
Az 1. ábra esetében, amelyben homoszedaszticitás van, igaz, hogy:
Var ((y1-Y1); X1) ≈ Var ((y2-Y2); X2) ≈ …… Var ((y4-Y4); X4)
Ahol Var ((yi-Yi); Xi) képviseli a varianciát, az (xi, yi) pár az i csoport adatait képviseli, míg Yi a csoport Xi átlagértékének regressziójával becsült érték. Az i csoporthoz tartozó n adatok szórását a következőképpen kell kiszámítani:
Var ((yi-Yi); Xi) = ∑j (yij - Yi) ^ 2 / n
Éppen ellenkezőleg, ha heteroszkedaszticitás fordul elő, a regressziós modell nem érvényes annak a teljes régiónak, amelyben azt kiszámították. A 2. ábra példát mutat erre a helyzetre.

2. ábra: A heteroszkedasztikát mutató adatcsoport. (Saját kidolgozás)
A 2. ábra három adatcsoportot és a halmaz illesztését mutatja lineáris regresszióval. Meg kell jegyezni, hogy a második és a harmadik csoportban az adatok szélesebben vannak szétszórva, mint az első csoportban. A 2. ábrán látható grafikon az egyes csoportok átlagértékét és hibaszáma ± σ értékét mutatja, az egyes adatcsoportok σ szórása mellett. Emlékeztetni kell arra, hogy a σ szórás a variancia négyzetgyöke.
Nyilvánvaló, hogy heteroszkedaszticitás esetén a regressziós becslési hiba megváltozik a magyarázó vagy független változó értéktartományában, és azokban az intervallumokban, ahol ez a hiba nagyon nagy, a regressziós becslés megbízhatatlan vagy nem alkalmazható.
A regressziós modellben a hibákat vagy maradványokat (és -Y) egyenlő szórású (σ ^ 2) értékkel kell elosztani a független változó értéktartományában. Ez az oka annak, hogy egy jó (lineáris vagy nemlineáris) regressziós modellnek meg kell felelnie a homoszkedasztikus tesztnek.
Homoszkedaszticitás tesztek
A 3. ábrán látható pontok megfelelnek egy tanulmánynak, amely a házak árainak (dollárban) összefüggését keresi a méret vagy a terület négyzetméterben kifejezett függvényében.
Az első tesztelésre kerülő modell a lineáris regresszió. Mindenekelőtt meg kell jegyezni, hogy az illesztés R ^ 2 meghatározási együtthatója meglehetősen magas (91%), tehát azt lehet feltételezni, hogy az illesztés kielégítő.
Két régiót azonban világosan meg lehet különböztetni a kiigazítási grafikontól. Az egyik, a jobb oldalon egy oválisan bezárt, teljesíti a homoszkedaszticitást, míg a bal oldali régió nem rendelkezik homoszkedaszticitással.
Ez azt jelenti, hogy a regressziós modell előrejelzése megfelelő és megbízható az 1800 m ^ 2 és 4800 m ^ 2 közötti tartományban, de ezen a téren kívül nagyon nem megfelelő. A heteroszkedasztikus zónában nemcsak a hiba nagyon nagy, hanem az adatok más irányt mutatnak, mint amit a lineáris regressziós modell javasol.

3. ábra. A lakásárak és a terület prediktív modellje lineáris regresszióval, a homoszkedaszticitás és a heteroszkedaszticitás zónáit mutatva. (Saját kidolgozás)
Az adatok szórt gráfja a homoszkedaszticitásuk legegyszerűbb és legszembetűnőbb tesztje, azonban olyan esetekben, amikor ez nem olyan nyilvánvaló, mint a 3. ábrán bemutatott példában, a kiegészítő változókat tartalmazó grafikonokat kell igénybe venni.
Szabványosított változók
Annak érdekében, hogy elválaszthassuk azokat a területeket, ahol teljesül a homoszkedaszticitás, és ahol nem, a ZRes és ZPred szabványosított változókat vezetjük be:
ZRes = Abs (y - Y) / σ
ZPred = Y / σ
Meg kell jegyezni, hogy ezek a változók az alkalmazott regressziós modelltől függenek, mivel Y a regresszió előrejelzésének értéke. Az alábbiakban látható a ZRes vs ZPred szórási diagram ugyanazon a példánál:

4. ábra. Meg kell jegyezni, hogy a homoszkedaszticitási zónában a ZRes egységes és kicsi marad a predikciós régióban (Saját kidolgozás).
A 4. ábrán a standardizált változókkal ábrázolt grafikonon a területet, ahol a maradék hiba kicsi és egységes, egyértelműen el kell választani attól a területtől, ahol nem. Az első zónában a homoszkedaszticitás teljesül, míg a régióban, ahol a maradék hiba erősen változó és nagy, a heteroszkedaszticitás teljesül.
A regressziós korrekciót a 3. ábra ugyanazon adatcsoportjára alkalmazzuk, ebben az esetben a korrekció nemlineáris, mivel az alkalmazott modell tartalmaz egy potenciális funkciót. Az eredményt a következő ábra mutatja:

5. ábra. A homoszkedaszticitás és a heteroszkedaszticitás új zónái az adatokban, amelyek illeszkednek a nemlineáris regressziós modellhez. (Saját kidolgozás).
Az 5. ábrán látható grafikonon egyértelműen meg kell jelölni a homoszketikus és heteroszkedasztikus területeket. Azt is meg kell jegyezni, hogy ezek a területek felcserélõdtek azokhoz képest, amelyeket a lineáris illesztési modellben alakítottak ki.
Az 5. ábra grafikonján egyértelmű, hogy még akkor is, ha meglehetősen magas az illesztési együttható (93,5%), a modell nem felel meg a magyarázó változó teljes intervallumának, mivel az értékekre vonatkozó adatok nagyobb, mint 2000 m ^ 2 heteroszkedaszticitást mutat.
A homoszkedaszticitás nem grafikus vizsgálata
Az egyik nem grafikus teszt, amelyet leginkább annak ellenőrzésére használtak, hogy teljesül-e a homoszkedaszticitás, a Breusch-Pagan teszt.
A teszt nem minden részletét adjuk meg ebben a cikkben, de annak alapvető jellemzőit és lépéseit nagyjából körvonalazzuk:
- Az regressziós modellt alkalmazzuk az n adatra, és ennek varianciáját kiszámoljuk a σ ^ 2 = ∑j (yj - Y) ^ 2 / n modell által becsült értékhez viszonyítva.
- Új változót határozunk meg ε = ((yj - Y) ^ 2) / (σ ^ 2)
- Ugyanezt a regressziós modellt alkalmazzuk az új változóra, és kiszámoljuk annak új regressziós paramétereit.
- Meghatározzuk a Chi négyzet kritikus értékét (χ ^ 2), ez az ε változóban az új maradék négyzetek összegének fele.
- A Chi négyzet eloszlási táblázatot figyelembe véve a szignifikancia szintjét (általában 5%) és a szabadság fokát (a regressziós változók száma mínusz az egység) a táblázat x tengelyén, a a tábla.
- A 3. lépésben kapott kritikus értéket összehasonlítjuk a táblázatban található értékkel (χ ^ 2).
- Ha a kritikus érték a táblázat alatt van, akkor nulla hipotézisünk van: van homoszkedaszticitás
- Ha a kritikus érték meghaladja a táblázat értékét, akkor alternatív hipotézisünk van: nincs homoszkedaszticitás.
A statisztikai szoftvercsomagok többsége, mint például: SPSS, MiniTab, R, Python Pandas, SAS, StatGraphic és még sok más, magában foglalja a Breusch-Pagan homoszkedasztikus tesztet. Egy másik teszt a variancia egységességének igazolására a Levene-teszt.
Irodalom
- Box, vadász és vadász. (1988) Statisztikák kutatók számára. Megfordítottam a szerkesztõket.
- Johnston, J (1989). Ökonometria módszerek, Vicens -Vives szerkesztők.
- Murillo és González (2000). Ökonometria kézikönyv. A Las Palmas de Gran Canaria Egyetem. Helyreállítva: ulpgc.es.
- Wikipedia. Homoszkedaszticitás. Helyreállítva: es.wikipedia.com
- Wikipedia. Homoszkedaszticitás. Helyreállítva: en.wikipedia.com
