- A minta mérete
- 1. eset: a populáció mérete ismeretlen
- Bizalmi szintek és a hozzájuk tartozó Z értékek
- 2. eset: A populáció mérete ismert
- Példák
- Felmérések és kérdőívek
- QA
- Előny
- hátrányok
- A feladat megoldódott
- Megoldás
- Irodalom
A véletlenszerű mintavétel segítségével választhatunk ki statisztikailag reprezentatív mintát egy adott populációból. Az az elv, amely szerint a mintában minden elemnek azonos valószínűséggel kell kiválasztani.
A döntetlen egy példa a véletlenszerű mintavételre, amelyben a résztvevő populáció minden tagja egy-egy számot kap. A sorsolás nyereményeinek (mintának) megfelelő számok kiválasztásához véletlenszerű technikát alkalmazunk, például kinyerjük a postafiókból az azonos kártyákra írt számokat.
1. ábra. Véletlenszerű mintavétel esetén a mintát véletlenszerűen vonják ki a populációból, valamilyen technikával, amely biztosítja, hogy minden elem azonos valószínűséggel válasszon. Forrás: netquest.com.
Véletlenszerű mintavétel során elengedhetetlen a mintavétel megfelelő kiválasztása, mivel a populáció nem reprezentatív mintája téves következtetéseket vonhat le a statisztikai ingadozások miatt.
A minta mérete
Képletek vannak a minta megfelelő méretének meghatározására. A legfontosabb szempont, amelyet figyelembe kell venni, hogy a populáció mérete ismert-e vagy sem. Nézzük meg a képleteket a minta méretének meghatározására:
1. eset: a populáció mérete ismeretlen
Ha az N populáció mérete ismeretlen, kiválaszthat egy megfelelő n méretű mintát annak meghatározására, hogy egy bizonyos hipotézis igaz vagy hamis.
Ehhez a következő képletet kell használni:
Ahol:
-p annak a valószínűsége, hogy a hipotézis igaz.
-q annak a valószínűsége, hogy nem, ezért q = 1 - p.
-E a relatív hibamargó, például az 5% -os hiba E = 0,05 eltéréssel rendelkezik.
-Z a tanulmány által megkövetelt bizalom szintjéhez kapcsolódik.
Egy szabványosított (vagy normalizált) normál eloszlásban a 90% -os konfidenciaszint Z = 1,645, mivel annak valószínűsége, hogy az eredmény -1 645 és + 1,645σ között van, 90%, ahol σ a szórás.
Bizalmi szintek és a hozzájuk tartozó Z értékek
Az 1–50% -os konfidenciaszint megfelel Z = 0,675-nek.
2.- 68,3% -os konfidenciaszint felel meg Z = 1-nek.
A 3–90% -os konfidenciaszint Z = 1,645-vel egyenértékű.
4.- 95% -os konfidenciaszint megfelel Z = 1.96-nak
5–95,5% -os konfidenciaszint felel meg Z = 2-nek.
A 6–99,7% -os konfidenciaszint Z = 3-nak felel meg.
Példa erre a képletre egy olyan tanulmányban, amely a tengerparton található kavicsok átlagos tömegét határozza meg.
Nyilvánvalóan nem lehetséges az összes kavicsot megvizsgálni és megmérni a tengerparton, ezért tanácsos a mintát minél véletlenszerűbben és a megfelelő számú elemmel kivonni.
2. ábra. A tengerparton található kavicsok jellemzőinek tanulmányozásához véletlenszerű mintát kell választani, reprezentatív számmal. (Forrás: pixabay)
2. eset: A populáció mérete ismert
Ha egy bizonyos populációt (vagy univerzumot) alkotó elemek N száma ismert, ha egyszerű véletlenszerű mintavétel útján válasszuk ki az n méretű statisztikailag szignifikáns mintát, akkor ez a következő képlet:
Ahol:
-Z a megbízhatósági szinthez tartozó együttható.
-p a hipotézis sikerének valószínűsége.
-q a kudarc valószínűsége a hipotézisben, p + q = 1.
-N a teljes népesség mérete.
-E a vizsgálati eredmény relatív hibája.
Példák
A minták kivonásának módszere nagyban függ a végrehajtandó vizsgálat típusától. Ezért a véletlenszerű mintavételhez végtelen számú alkalmazás van:
Felmérések és kérdőívek
Például telefonos felmérések során a konzultálni kívánt embereket egy véletlenszám-generátorral választják meg, amely a vizsgált régióra alkalmazható.
Ha kérdőívet szeretne alkalmazni egy nagyvállalat alkalmazottaira, akkor igénybe veheti a válaszadókat a munkavállalói szám vagy személyi igazolvány száma alapján.
Az említett számot is véletlenszerűen kell kiválasztani, például egy véletlenszám-generátor használatával.
3. ábra. A kérdőív a résztvevők véletlenszerű kiválasztásával alkalmazható. Forrás: Pixabay.
QA
Abban az esetben, ha a vizsgálat egy gép által gyártott alkatrészre vonatkozik, az alkatrészeket véletlenszerűen kell kiválasztani, de a napi különböző időpontokban, vagy más napokon vagy hetekben gyártott tételekből.
Előny
Egyszerű véletlenszerű mintavétel:
- Lehetővé teszi a statisztikai vizsgálat költségeinek csökkentését, mivel nem szükséges a teljes populációt tanulmányozni statisztikailag megbízható eredmények elérése érdekében, a kívánt konfidenciaszintekkel és a vizsgálatban megkövetelt hibaszinttel.
- Kerülje az elfogultságot: mivel a vizsgált elemek kiválasztása teljesen véletlenszerű, a tanulmány hűen tükrözi a populáció jellemzőit, bár annak csak egy részét vizsgálták.
hátrányok
- A módszer nem megfelelő azokban az esetekben, amikor meg akarja tudni a preferenciákat különböző csoportokban vagy népességrétegekben.
Ebben az esetben ajánlatos korábban meghatározni azokat a csoportokat vagy szegmenseket, amelyeken a vizsgálatot elvégzik. Miután a rétegeket vagy csoportokat meghatározták, akkor ha mindegyik számára célszerű véletlenszerű mintavételt alkalmazni.
- Nagyon valószínűtlen, hogy információkat szerezzenek a kisebbségi ágazatokról, amelyek jellemzőit néha meg kell ismerni.
Például, ha egy drága termékkel kapcsolatos kampány kérdése, meg kell ismerni a leggazdagabb kisebbségi ágazatok preferenciáit.
A feladat megoldódott
Meg akarjuk tanulmányozni a népesség preferenciáját egy bizonyos kóla ital mellett, de ebben a populációban még nincs korábbi tanulmány, amelynek mérete ismeretlen.
Másrészt a mintának reprezentatívnak kell lennie, és legalább 90% -os megbízhatósági szintet kell tartalmaznia, és a következtetések százalékos hibájának 2% -nak kell lennie.
-Hogyan lehet meghatározni a minta n méretét?
-Milyen lenne a minta mérete, ha a hibahatár 5% -ra rugalmasabb lesz?
Megoldás
Mivel a populáció mérete ismeretlen, a fenti képletet kell használni a minta méretének meghatározására:
n = (Z 2 p q) / (E 2)
Feltételezzük, hogy az üdítőital márkájának preferenciája (p) ugyanolyan valószínűséggel bír, mint a nem preferencia (q), tehát p = q = 0,5.
Másrészt, mivel a vizsgálat eredményének százalékos hibának kevesebbnek kell lennie, mint 2%, akkor az E relatív hiba 0,02 lesz.
Végül, egy Z érték = 1645, 90% -os konfidenciaszintet eredményez.
Összefoglalva, a következő értékek vannak:
Z = 1,645
p = 0,5
q = 0,5
E = 0,02
Ezekkel az adatokkal kiszámítják a minimális mintát:
n = (1,645 2 0,5 0,5) / (0,02 2) = 1691,3
Ez azt jelenti, hogy a szükséges hibahatárral és a választott megbízhatósági szintű vizsgálatban legalább 1692 egyéni válaszadó mintájának kell lennie, amelyet egyszerű véletlenszerű mintavétel alapján választanak meg.
Ha a hibahatár 2% -ról 5% -ra változik, akkor az új mintaméret:
n = (1,645 2 0,5 0,5) / (0,05 2) = 271
Amely lényegesen alacsonyabb az egyének száma. Összegezve, a minta mérete nagyon érzékeny a vizsgálatban a kívánt hibahatárra.
Irodalom
- Berenson, M. 1985. Gazdálkodási és közgazdasági statisztikák, fogalmak és alkalmazások. Editorial Interamericana.
- Statisztika. Véletlenszerű mintavétel. Forrás: encyclopediaeconomica.com.
- Statisztika. Mintavétel. Helyreállítva: Estadistica.mat.uson.mx.
- Feltárható. Véletlenszerű mintavétel. Helyreállítva: explorable.com.
- Moore, D. 2005. Alkalmazott alapstatisztikák. 2.. Kiadás.
- Netquest. Véletlenszerű mintavétel. Helyreállítva: netquest.com.
- Wikipedia. Statisztikai mintavétel. Helyreállítva: en.wikipedia.org