- Előnyök és hátrányok
- A tartomány hátrányai, mint a diszperzió mértéke
- Intervartilis tartomány, kvartilek és kidolgozott példa
- - A kvartilek kiszámítása
- Első kvartilis
- Második kvartilis vagy medián
- Harmadik kvartilis
- Működő példa
- Megoldás
- B. Megoldás
- C. Megoldás
- Irodalom
A tartomány, az amplitúdó vagy az amplitúdó statisztikában a minta vagy a populáció adatsorának maximális értéke és minimális értéke közötti különbség (kivonás). Ha a tartományt R betű képviseli, és az adatokat x jelöli, akkor a tartomány képlete egyszerűen:
R = x max - x perc
Ahol x max az adatok maximális értéke, és x min a minimum.
1. ábra: Az elmúlt két évszázad Cádiz lakosságának megfelelő adattartomány. Forrás: Wikimedia Commons.
A koncepció nagyon hasznos, mivel egyszerűen eloszlatja a szórást az adatok variabilitásának gyors felmérése céljából, mivel jelzi az intervallum meghosszabbítását vagy hosszát, ahol ezek megtalálhatók.
Tegyük fel például, hogy egy egyetemen mérik a 25 férfi elsőéves mérnöki hallgató csoportjának egy magasságát. A csoport legmagasabb tanulója 1,93 m, a legrövidebb 1,67 m. Ezek a mintaadatok szélsőséges értékei, ezért útjuk a következő:
R = 1,93 - 1,67 m = 0,26 m vagy 26 cm.
Az ebbe a csoportba tartozó hallgatók magassága ezen a tartományon oszlik meg.
Előnyök és hátrányok
A tartomány a korábban elmondottaknak megfelelően az adatok eloszlásának mértéke. Egy kis tartomány azt jelzi, hogy az adatok többé-kevésbé szorosak, és a szóródás alacsony. Másrészt, egy nagyobb tartomány azt jelzi, hogy az adatok szélesebb körben eloszlanak.
A tartomány kiszámításának előnyei nyilvánvalóak: nagyon könnyű és gyors megtalálást kínál, mivel egyszerű különbség.
Ugyanazok az egységek vannak, mint az adatok, amelyekkel működik, és a koncepció nagyon könnyen értelmezhető bármely megfigyelő számára.
A mérnöki hallgatók magasságának példáján, ha a távolság 5 cm lenne, azt mondhatnánk, hogy a hallgatók mindegyike nagyjából azonos méretű. De 26 cm-es távolsággal azonnal feltételezzük, hogy a mintában vannak minden középmagasságú diákok. Ez a feltételezés mindig helyes?
A tartomány hátrányai, mint a diszperzió mértéke
Ha alaposan megvizsgáljuk, akkor előfordulhat, hogy a 25 mérnöki hallgatóból álló mintánkban csak egyikük 1,93-ot mér, a fennmaradó 24-nek 1,67 m-es magassága van.
És mégis, a távolság változatlan, bár az ellenkezője teljesen lehetséges: hogy a többség magassága 1,90 m körüli, és csak egy 1,67 m.
Mindkét esetben az adatok megoszlása meglehetősen eltérő.
A tartománynak a diszperzió mértékének hátrányai azért vannak, mert csak szélsőséges értékeket használ, és minden más figyelmen kívül hagyja. Mivel az információ nagy része elveszik, fogalma sincs arról, hogy a minta adatai hogyan oszlanak meg.
Egy másik fontos jellemző, hogy a minta tartománya soha nem csökken. Ha további információt adunk hozzá, vagyis több adatot veszünk figyelembe, akkor a tartomány növekszik vagy változatlan marad.
És mindenesetre csak akkor hasznos, ha kisméretű mintákkal dolgoznak, kizárólag a nagy mintákban való diszpergálás mérésére nem ajánlott.
Azt kell tennie, hogy kiegészíti azt a többi diszperziós mérték kiszámításával, amely figyelembe veszi a teljes adatok által szolgáltatott információkat: interkvartilis tartomány, szórás, szórás és variációs együttható.
Intervartilis tartomány, kvartilek és kidolgozott példa
Rájöttünk, hogy a tartomány gyengülése, mint a diszperzió mértéke, az az, hogy csak az adat eloszlás szélsőséges értékeit használja ki, a többieket kihagyva.
Ennek a kellemetlenségnek az elkerülése érdekében kvartileket használnak: három értéket, amelyet pozíciómérő néven ismertek.
A nem csoportosított adatokat négy részre osztják (más széles körben alkalmazott helyzetmérő tényezők a decilek és a százalékok). Ezek a jellemzői:
-Az első kvartilis Q 1 az adatok értéke, amely szerint mindegyik 25% -a kevesebb, mint Q 1.
-A második negyedbe Q 2 jelentése a medián az eloszlás, ami azt jelenti, hogy a fele (50%) az adatok kisebb, mint ez az érték.
-Végül, a harmadik kvartilis Q 3 azt mutatja, hogy 75% -a az adatok kevesebb, mint Q 3.
Ezután, az interkvartilis tartomány vagy interkvartilis tartomány van meghatározva, mint a különbség a harmadik kvartilis Q 3 és az első kvartilis Q 1 az adatok:
Interkvartilis tartomány = R Q = Q 3 - Q 1
Ilyen módon az R Q tartomány értékét nem befolyásolja annyira a szélsőséges értékek. Ezért tanácsos ezt használni, ha ferde eloszlásokkal foglalkozik, például a fent leírt nagyon magas vagy nagyon rövid hallgatókkal.
- A kvartilek kiszámítása
Számos módja van számításuknak, itt javasolunk egyet, de mindenképpen meg kell tudni az "N o " rendszámot, amely az a hely, amelyet az adott kvartilis elfoglal az eloszlásban.
Vagyis ha például az 1. Q-nek megfelelő kifejezés az eloszlás második, harmadik vagy negyedik és így tovább.
Első kvartilis
N vagy (Q 1) = (n + 1) / 4
Második kvartilis vagy medián
N vagy (Q 2) = (n + 1) / 2
Harmadik kvartilis
N vagy (Q 3) = 3 (N + 1) / 4
Ahol N az adatok száma.
A medián az az érték, amely jobbra van az eloszlás közepén. Ha az adatok száma páratlan, akkor nem nehéz megtalálni, de ha páros, akkor a két központi értéket átlagoljuk, hogy egysé váljanak.
A rendelési szám kiszámítása után a három szabály egyikét követi:
-Ha nincsenek tizedesjegyek, akkor megkeresésre kerülnek a disztribúcióban feltüntetett adatok, és ez lesz a keresett kvartilis.
-Ha a rendelési szám félúton van kettő között, akkor az egész rész által jelzett adatok átlagolása a következő adatokkal történik, és az eredmény a megfelelő kvartilis.
-Egyéb esetben a legközelebbi egész számra kerekíti, és ez lesz a kvartilis pozíciója.
Működő példa
0 és 20 közötti skálán egy 16 matematikai hallgatóból álló csoport félévvizsga során a következő pontokat (pontokat) szerezte:
16, 10, 12, 8, 9, 15, 18, 20, 9, 11, 1, 13, 17, 9, 10, 14
Megtalálja:
a) Az adatok tartománya vagy tartománya.
b) A Q 1 és Q 3 kvartilis értékei
c) Az interkvartilis tartomány.
2. ábra. A matematikai teszt pontszáma nagyon változatos? Forrás: Pixabay.
Megoldás
Az útvonal megkereséséhez az első lépés az, hogy az adatokat növekvő vagy csökkenő sorrendben rendezzük. Például növekvő sorrendben:
1, 8, 9, 9, 9, 10, 10, 11, 12, 13, 14, 15, 16, 17, 18, 20
Az elején megadott képlet segítségével: R = x max - x min
R = 20 - 1 pont = 19 pont.
Az eredmény szerint ezeknek a besorolásoknak nagy a szóródása.
B. Megoldás
N = 16
N vagy (Q 1) = (n + 1) / 4 = (16 + 1) / 4 = 17/4 = 4,25
Ez egy szám tizedesjegyekkel, amelynek egész része 4. Ezután megyünk az eloszláshoz, keressük az adatokat, amelyek a negyedik helyet foglalják el, és értéküket átlagolják az ötödik pozíció értékéhez. Mivel mindkettő 9, az átlag szintén 9, és így:
Q 1 = 9
Most megismételjük az eljárást a 3. kérdés megtalálásához:
N vagy (Q 3) = 3 (N + 1) / 4 = 3 (16 +1) / 4 = 12,75
Megint egy tizedes, de mivel nem félúton van, akkor 13-ig kell kerekíteni. A keresett kvartilis a tizenharmadik helyet foglalja el és a következő:
Q 3 = 16
C. Megoldás
R Q = Q 3 - Q 1 = 16 - 9 = 7 pont.
Amely, amint láthatjuk, sokkal kisebb, mint az a) szakaszban kiszámított adattartomány, mert a minimális pontszám 1 pont volt, az a többi értéknél sokkal távolabbi érték.
Irodalom
- Berenson, M. 1985. Vezetési és közgazdasági statisztika. Interamericana SA
- Canavos, G. 1988. Valószínűség és statisztika: Alkalmazások és módszerek. McGraw Hill.
- Devore, J. 2012. Valószínűség és statisztika a mérnöki és tudományos ismeretek számára. 8.. Kiadás. Cengage.
- Példák a kvartilekre. Helyreállítva: matematicas10.net.
- Levin, R. 1988. Statisztikák az adminisztrátorok számára. 2.. Kiadás. Prentice Hall.
- Walpole, R. 2007. Valószínűség és statisztika a mérnöki és tudományos ismeretek számára. Pearson.