- A probléma ismertetése a Mann-Whitney U teszt során
- Minőségi változók és mennyiségi változók
- Normál eset
- Eset nem normális tendenciával
- Párosított vagy páratlan minták
- A Mann Whitney U teszt jellemzői
- Mann - Whitney formula
- A teszt alkalmazásának lépései
- Gyakorlati alkalmazás példa
- - 1. lépés
- - 2. lépés
- A régió
- B. régió
- 3. lépés
- 4. lépés
- Összehasonlítási kritériumok
- Online számológépek a Mann - Whitney U teszthez
- Irodalom
A Mann - Whitney U tesztet két független minta összehasonlítására alkalmazzák, ha kevés adat áll rendelkezésre, vagy nem követik a normál eloszlást. Ilyen módon nem paraméteres tesztnek tekintik, ellentétben a homológ Student-teszttel, amelyet akkor alkalmaznak, ha a minta elég nagy, és követi a normál eloszlást.
Frank Wilcoxon először 1945-ben javasolta az azonos méretű mintákra, de két évvel később kiterjesztették Henry Mann és DR Whitney különböző méretű mintákra.

1. ábra. A Mann-Whitney U tesztet alkalmazzák a független minták összehasonlítására. Forrás: Pixabay.
A tesztet gyakran alkalmazzák annak ellenőrzésére, hogy van-e kapcsolat a kvalitatív és a mennyiségi változó között.
Példa erre egy példa a hipertóniás betegek sorozatának kiállítása és két csoport kivonása, akikből egy hónapon keresztül rögzítik a napi vérnyomás-adatokat.
Az A kezelést az egyik csoportra, a B kezelést a másikra alkalmazzák, ahol a vérnyomás a kvantitatív változó, a kezelés típusa pedig a kvalitatív.
Szeretnénk tudni, hogy a mért értékek medián és nem átlaga statisztikailag azonos vagy eltérő-e, annak megállapításához, hogy van-e különbség a két kezelés között. A válasz megszerzéséhez a Wilcoxon statisztikát vagy a Mann - Whitney U tesztet kell alkalmazni.
A probléma ismertetése a Mann-Whitney U teszt során
Egy másik példa, amelyben a teszt alkalmazható:
Tegyük fel, hogy szeretné tudni, hogy az üdítőitalok fogyasztása jelentősen eltér-e az ország két régiójában.
Az egyiket A régiónak, a másik B régiónak nevezik. A hetente elfogyasztott liternek két mintában kell nyilvántartást vezetni: az egyik az A régióban tíz ember, a másik a B régióban öt ember.
Az adatok a következők:
-A. Régió: 16., 11., 14., 21., 18., 34., 22., 7., 12., 12.
- B régió: 12,14, 11, 30, 10
A következő kérdés merül fel:
Minőségi változók és mennyiségi változók
- X minőségi változó: Régió
- Y mennyiségi változó: üdítőitalok fogyasztása
Ha az elfogyasztott liter mennyisége mindkét régióban azonos, akkor arra a következtetésre juthatunk, hogy a két változó között nincs függés. Ennek módja a két régió átlagának vagy mediánjának összehasonlítása.
Normál eset
Ha az adatok normál eloszlást követnek, két hipotézist javasolunk: a null H0 és az alternatív H1 az átlagok összehasonlítása révén:
- H0: nincs különbség a két régió átlaga között.
- H1: mindkét régió átlagai különböznek.
Eset nem normális tendenciával
Éppen ellenkezőleg, ha az adatok nem követik a normál eloszlást, vagy a minta egyszerűen túl kicsi ahhoz, hogy megismerje, az átlag összehasonlítása helyett a két régió mediánját hasonlítják össze.
- H0: nincs különbség a két régió mediánja között.
- H1: mindkét régió mediánja különbözik.
Ha a mediánok egybeesnek, akkor a nulla hipotézis teljesül: nincs kapcsolat az üdítőitalok fogyasztása és a régió között.
És ha fordítva történik, akkor az alternatív hipotézis igaz: van kapcsolat a fogyasztás és a régió között.
Ezekben az esetekben jelzik a Mann - Whitney U tesztet.
Párosított vagy páratlan minták
A Mann Whitney U teszt alkalmazásának eldöntésekor a következő fontos kérdés az, hogy mindkét mintában az adatok száma megegyezik-e, vagyis azok par-értékűek.
Ha a két minta párosul, akkor az eredeti Wilcoxon verzió lesz érvényes. De ha nem, mint például a példában, akkor a módosított Wilcoxon tesztet kell alkalmazni, amely pontosan a Mann Whitney U teszt.
A Mann Whitney U teszt jellemzői
A Mann - Whitney U teszt nem parametrikus teszt, olyan mintákra alkalmazható, amelyek nem követik a normál eloszlást vagy kevés adatot tartalmaznak. A következő jellemzőkkel rendelkezik:
1.- Hasonlítsa össze a mediánokat
2.- Megrendelt sorokon működik
3.- Kevésbé erőteljes, azaz a hatalom a nullhipotézis elutasításának valószínűsége, amikor valójában hamis.
Ezeket a jellemzőket figyelembe véve a Mann - Whitney U tesztet akkor alkalmazzák, ha:
-Az adatok függetlenek
-Nem követik a normál eloszlást
-A H0 nullhipotézist akkor lehet elfogadni, ha a két minta mediánja egybeesik: Ma = Mb
-A H1 alternatív hipotézist akkor lehet elfogadni, ha a két minta mediánjai különböznek: Ma ≠ Mb
Mann - Whitney formula
Az U változó a Mann - Whitney tesztben használt kontrasztstatisztika, és meghatározása a következő:
Ez azt jelenti, hogy U az Ua és Ub közötti, az egyes csoportokra alkalmazott értékek közül a legkisebb. Példánkban az egyes régiókra vonatkozna: A vagy B.
Az Ua és Ub változókat a következő képlettel kell meghatározni és kiszámítani:
Ua = Na Nb + Na (Na +1) / 2 - Ra
Ub = Na Nb + Nb (Nb +1) / 2 - Rb
Az Na és Nb értékek itt az A és B régióknak megfelelő minták méretét jelentik, és a részükben Ra és Rb az alábbiakban meghatározott rangösszegek.
A teszt alkalmazásának lépései
1.- Rendezzük a két minta értékeit.
2. - Rendeljen rangot az egyes értékekhez.
3.- Javítsa ki az adatok meglévő kapcsolatait (ismételt értékek).
4. Számítsa ki Ra = az A minta sorainak összegét.
5.- Találja meg Rb = a B minta sorainak összegét.
6.- Az előző szakaszban megadott képletek alapján határozza meg az Ua és Ub értéket.
7. Hasonlítsa össze az Ua és Ub értékeket, és a kettő közül a kettő közül a kettőt kell hozzárendelni a kísérleti U statisztikához (azaz az adatokhoz), amelyet összehasonlítanak az elméleti vagy a normál U statisztikával.
Gyakorlati alkalmazás példa
Most már alkalmazzuk a fentiekben felsorolt üdítőitalok problémáját:
A régió: 16, 11, 14, 21, 18, 34, 22, 7, 12, 12
B régió: 12,14, 11, 30, 10
Attól függően, hogy mindkét minta átlaga statisztikailag azonos vagy eltér, a nullhipotézist elfogadják vagy elutasítják: nincs kapcsolat az Y és X változó között, azaz az üdítőitalok fogyasztása nem függ a régiótól:
H0: Ma = Mb
H1: Ma ≠ Mb

2. ábra Az üdítőital-fogyasztás adatai az A és a B. régióban. Forrás: F. Zapata.
- 1. lépés
Az adatokat a két mintára együttesen rendezzük, az értékeket a legalacsonyabbtól a legmagasabbig rendezve:

Vegye figyelembe, hogy a 11 érték kétszer jelenik meg (mindegyik mintában egyszer). Eredetileg 3-as és 4-es pozícióval rendelkezik, de ahhoz, hogy ne becsüljék be vagy alábecsüljék az egyiket vagy a másikt, az átlagértéket választják a tartománynak, azaz 3,5-nek.
Hasonló módon folytatjuk a 12. értéket, amelyet háromszor megismételünk az 5., 6. és 7. tartományban.
Nos, a 12 értékhez a 6 = (5 + 6 + 7) / 3 átlagtartományt hozzárendeljük. Ugyanez vonatkozik a 14-ös értékre, amelynek ligatúrája (mindkét mintában megjelenik) a 8. és a 9. helyzetben, és ez az átlagos tartomány: 8.5 = (8 + 9) / 2.
- 2. lépés
Ezután az A és B régió adatait ismét elválasztják, de a hozzájuk tartozó tartományokat most egy másik sorba rendelik:
A régió

B. régió

Az Ra és Rb tartományt a második sor elemeinek összegéből kapjuk meg minden egyes esetre vagy régióra.
3. lépés
A megfelelő Ua és Ub értékeket kiszámítják:
Ua = 10 × 5 + 10 (10 + 1) / 2 - 86 = 19
Ub = 10 × 5 + 5 (5 + 1) / 2 -34 = 31
Kísérleti érték U = min (19, 31) = 19
4. lépés
Feltételezzük, hogy az elméleti U az N normális eloszlását követi, a paramétereket kizárólag a minták mérete adja meg:
N ((na⋅nb) / 2, √)
A kísérletileg kapott U változó és az elméleti U összehasonlításához meg kell változtatni a változót. Az U kísérleti változótól a standardizált értékére, amelyet Z-nek hívunk, átmozdulunk annak érdekében, hogy összehasonlítást lehessen végezni a szabványosított normál eloszláséval.
A változó változása a következő:
Z = (U - na.nb / 2) / √
Meg kell jegyezni, hogy a változó megváltoztatásához az U elméleti eloszlásának paramétereit használtam, majd az új Z változót, amely hibrid az elméleti U és a kísérleti U között, ellentétben vetjük egy N szabványosított normál eloszlással (0,1).).
Összehasonlítási kritériumok
Ha Z ≤ Zα ⇒, akkor a H0 nullhipotézist elfogadják
Ha Z> Zα ⇒, akkor utasítsa el a H0 nullhipotézist
A standardizált Zα kritikus értékek a szükséges megbízhatósági szinttől függenek, például: α = 0,95 = 95% konfidenciaszintre, amely a leggyakoribb, amikor a Zα = 1,96 kritikus értéket kapják.
Az itt látható adatok:
Z = (U - nincs nb / 2) / √ = -0,73
Amely az 1.96 kritikus érték alatt van.
Tehát a végkövetkeztetés az, hogy a H0 nullhipotézist elfogadták:
Online számológépek a Mann - Whitney U teszthez
Vannak speciális programok a statisztikai számításokhoz, ide értve az SPSS-t és a MINITAB-ot is, de ezek a programok fizetőek, és használata nem mindig könnyű. Ennek oka az, hogy annyi lehetőséget kínálnak, hogy gyakorlatilag felhasználásukat a statisztikák szakértői számára tartják fenn.
Szerencsére számos nagyon pontos, ingyenes és könnyen használható online program létezik, amelyek többek között lehetővé teszik a Mann-Whitney U teszt futtatását.
Ezek a programok a következők:
-Social Science Statistics (socscistatistics.com), amely kiegyensúlyozott vagy párosított minták esetén egyaránt rendelkezik Mann-Whitney U-teszttel és Wilcoxon-teszttel.
-AI Therapy Statistics (ai-therapy.com), amely a leíró statisztikák szokásos tesztjeivel rendelkezik.
-Statisztikus a használata (fizika.csbsju.edu/stats), amely az egyik legrégebbi, így annak felülete idősebbnek tűnik, bár ennek ellenére nagyon hatékony ingyenes program.
Irodalom
- Dietrichson. Kvantitatív módszerek: rangségi teszt. Helyreállítva: bookdown.org
- Marín J P. SPSS Útmutató: Elemzés és eljárások nem parametrikus tesztekben. Helyreállítva: halweb.uc3m.es
- USAL MOOC. Nem paraméteres tesztek: Mann-Whitney U. Helyreállítva: youtube.com
- Wikipedia. Mann-Whitney U teszt. Helyreállítva: es.wikipedia.com
- XLSTAT. Segítség Központ. Mann - Whitney teszt oktatóprogram Excelben. Helyreállítva: help.xlsat.com
