- Hogyan lehet kiszámítani a korrelációs együtthatót?
- Kovariancia és variancia
- Szemléltető eset
- Kovariancia Sxy
- A szórás Sx
- Szabványos szórás Sy
- R korrelációs együttható
- Értelmezés
- Lineáris regresszió
- Példa
- Irodalom
A statisztikai korrelációs együttható olyan mutató, amely megmutatja két X és Y kvantitatív változó hajlamát arra, hogy közöttük lineáris vagy arányos kapcsolat legyen.
Általában az X és Y változópárok ugyanazon populáció két jellemzője. Például X lehet egy személy magassága és Y súlya.

1. ábra. Korrelációs együttható négy adatpárra (X, Y). Forrás: F. Zapata.
Ebben az esetben a korrelációs együttható azt jelzi, hogy van-e tendencia egy adott populációban a magasság és a tömeg közötti arányos kapcsolat felé.
Pearson lineáris korrelációs koefficiense r kisbetűvel van jelölve, minimális és maximális értéke pedig -1 és +1.
Az r = +1 érték azt jelzi, hogy az (X, Y) párok halmaza tökéletesen illeszkedik, és amikor X növekszik, Y ugyanolyan arányban növekszik. Másrészt, ha történt, hogy r = -1, akkor a párok halmaza is tökéletesen igazodik, de ebben az esetben, ha X növekszik, Y ugyanolyan arányban csökken.

2. ábra. A lineáris korrelációs együttható különböző értékei. Forrás: Wikimedia Commons.
Másrészt az r = 0 érték azt jelzi, hogy az X és Y változók között nincs lineáris korreláció. Míg r = +0,8 érték azt jelzi, hogy az (X, Y) párok hajlamosak az egyik oldalán csoportosulni, és egy másik vonal.
Az r korrelációs együttható kiszámítására szolgáló képlet a következő:

Hogyan lehet kiszámítani a korrelációs együtthatót?
A lineáris korrelációs együttható egy statisztikai mennyiség, amelyet beépítenek a tudományos számológépekbe, a legtöbb táblázatba és a statisztikai programokba.
Kényelmes azonban tudni, hogy hogyan alkalmazza azt a képletet, amely azt definiálja, és ehhez egy kis adatsoron elvégzett részletes számítás kerül bemutatásra.
És ahogy az előző szakaszban elmondták, a korrelációs együttható az Sxy kovariancia, elosztva az X változók S és az Y változó Sx szórásainak szorzatával.
Kovariancia és variancia
A Sxy kovariancia:
Sxy = / (N-1)
Ahol az összeg 1-től N adatpárig terjed (Xi, Yi).
Az X változó standard eltérése a Xi adatkészlet szórásának négyzetgyöke, i-vel 1-től N-ig:
Sx = √
Hasonlóképpen, az Y változó szórása a Yi adatkészlet szórásának négyzetgyöke, i-vel 1-től N-ig:
Sy = √
Szemléltető eset
Annak érdekében, hogy részletesen megmutassuk, hogyan kell kiszámítani a korrelációs együtthatót, a következő négy adatpárt vesszük
(X, Y): {(1, 1); (2. 3); (3, 6) és (4, 7)}.
Először kiszámoljuk X és Y számtani átlagát az alábbiak szerint:
Ezután kiszámítják a fennmaradó paramétereket:
Kovariancia Sxy
Sxy = / (4-1)
Sxy = / (3) = 10,5 / 3 = 3,5
A szórás Sx
Sx = √ = √ = 1,29
Szabványos szórás Sy
Sx = √ =
√ = 2,75
R korrelációs együttható
r = 3,5 / (1,29 * 2,75) = 0,98
Értelmezés
Az előző eset adatsorában erőteljes lineáris összefüggést figyeltünk meg az X és Y változók között, ami egyaránt megjelenik a szórási diagramban (az 1. ábrán látható) és a korrelációs együtthatóban, amely egy érték nagyon közel áll az egységhez.
Amennyiben a korrelációs együttható közelebb van 1-hez vagy -1-hez, annál értelmesebb az adatok sorba illesztése, a lineáris regresszió eredménye.
Lineáris regresszió
A lineáris regressziós vonalat a legkisebb négyzetek módszerével kapjuk. amelyben a regressziós vonal paramétereit az N adatok becsült Y értéke és Yi közötti különbség négyzetének összegének minimalizálásával nyerik.
Másrészt az y = a + bx regressziós vonal a és b paraméterei, amelyeket a legkisebb négyzetek módszerével kaptak, a következők:
* b = Sxy / (Sx 2) a lejtőn
* a =
Emlékezzünk arra, hogy Sxy a fent definiált kovariancia, és Sx 2 a fent definiált szórás szórása vagy négyzete.
Példa
A korrelációs együtthatót annak meghatározására használják, hogy két változó között van-e lineáris korreláció. Ez akkor alkalmazandó, ha a vizsgált változók mennyiségi jellegűek, továbbá feltételezzük, hogy normál típusú eloszlást követnek.
Az alábbiakban bemutatunk egy szemléltető példát: az elhízás mértékének mértéke a testtömeg-index, amelyet úgy kapunk, hogy az ember súlyát kilogrammban elosztjuk négyzetméter mértékegységük négyzetméretével.
Szeretné tudni, hogy van-e szoros kapcsolat a testtömeg-index és a vérben a HDL-koleszterin koncentrációja között, millimól literben mérve. Ebből a célból tanulmányt készítettek 533 embertől, amelyet a következő grafikon foglal össze: minden pont egy személy adatait ábrázolja.

3. ábra: A BMI és a HDL koleszterin vizsgálata 533 betegnél. Forrás: Aragóni Egészségtudományi Intézet (IACS).
A grafikon gondos megfigyelése azt mutatja, hogy van egy bizonyos (nem nagyon markáns) lineáris trend a HDL koleszterin koncentráció és a testtömeg index között. Ennek a trendnek a kvantitatív mértéke a korrelációs együttható, amely ebben az esetben r = -0,276.
Irodalom
- González C. Általános statisztikák. Helyreállítva: tarwi.lamolina.edu.pe
- IIER. Aragóni Egészségtudományi Intézet. Helyreállítva: ics-aragon.com
- Salazar C. és Castillo S. A statisztika alapelvei. (2018). Helyreállítva: dspace.uce.edu.ec
- Superprof. Korrelációs együttható. Helyreállítva: superprof.es
- USAC. Leíró statisztikai kézikönyv. (2011). Helyreállítva: statistika.ingenieria.usac.edu.gt
- Wikipedia. Pearson korrelációs együtthatója. Helyreállítva: es.wikipedia.com.
