- A szabadság fokai
- Mechanikus esetben
- Véletlen értékek halmazában
- Példák
- Variáció és a szabadság mértéke
- A Chi tér eloszlásában
- A hipotézis tesztben (a példa megoldódott)
- Irodalom
A statisztikai szabadság foka egy véletlenszerű vektor független összetevőinek száma. Ha a vektornak n alkotóeleme van, és vannak p lineáris egyenletek, amelyek összekapcsolják az összetevőket, akkor a szabadság foka np.
A szabadságfokok fogalma megjelenik az elméleti mechanikában is, ahol ezek nagyjából megegyeznek a tér méretével, ahol a részecske mozog, mínusz a kötések száma.

1. ábra Az inga két dimenzióban mozog, de csak egy fokú szabadsággal rendelkezik, mivel kénytelen mozogni egy L sugárú ívben. Forrás: F. Zapata.
Ez a cikk a statisztikákra alkalmazott szabadságfokok fogalmát tárgyalja, de a mechanikus példát geometriai formában könnyebben lehet megjeleníteni.
A szabadság fokai
Attól függően, hogy milyen körülmények között alkalmazzák a szabadságot, a szabadságfokok számának módja változhat, de az alapötlet mindig ugyanaz: a teljes méretek kevesebb korlátozással.
Mechanikus esetben
Vegyük egy oszlophoz kötött lengő részecskét (inga), amely a függőleges xy síkban mozog (2 dimenzió). A részecskét azonban a húr hosszának megfelelő sugár kerületén kényszeríteni kell mozgatni.
Mivel a részecske csak ezen a görbén tud mozogni, a szabadságfokok száma 1. Ez látható az 1. ábrán.
A szabadságfokok számának kiszámításának módja az, ha figyelembe vesszük a méretek számának és a korlátozások számának különbségét:
szabadságfokok: = 2 (méretek) - 1 (ligatúra) = 1
Egy másik magyarázat, amely lehetővé teszi számunkra, hogy elérjük az eredményt, a következő:
- Tudjuk, hogy a két dimenzióban levő helyzetet a koordináták pontja (x, y) jelöli.
- De mivel a pontnak meg kell felelnie a kerület egyenletének (x 2 + y 2 = L 2) az x változó adott értékére, az y változót az említett egyenlet vagy korlátozás határozza meg.
Ilyen módon a változók közül csak az egyik független, és a rendszernek egy (1) szabadságfok van.
Véletlen értékek halmazában
Hogy bemutassuk, mit jelent a koncepció, tegyük fel a vektorot
x = (x 1, x 2,…, x n)
Az n normál eloszlású véletlenszerű érték mintáját ábrázolja. Ebben az esetben az x véletlenszerű vektornak n független komponense van, ezért azt mondják, hogy x szabadságfokúak.
Konstruáljuk most a maradék r vektorát
r = (x 1 -
Ahol
Tehát az összeg
(x 1 -
Ez egy olyan egyenlet, amely korlátozást (vagy kötést) képvisel a maradékanyagok r vektorának elemeiben, mivel ha az r vektor n-1 komponensei ismertek, akkor a restrikciós egyenlet meghatározza az ismeretlen komponenst.
Ezért az n dimenzió r vektore a korlátozással:
∑ (x i -
(N - 1) szabadságfokozattal rendelkezik.
Ismét alkalmazzák, hogy a szabadságfokok számát a következőképpen kell kiszámítani:
szabadságfok: = n (méretek) - 1 (korlátozások) = n-1
Példák
Variáció és a szabadság mértéke
Az s 2 szórás az n adat mintáján szereplő eltérések (vagy maradványok) négyzetének átlaga:
s 2 = (r • r) / (n-1)
ahol r a maradékvektor r = (x1 -
s 2 = ∑ (x i -
Mindenesetre meg kell jegyezni, hogy a maradványok négyzetének átlagának kiszámításakor azt el kell osztani (n-1) -vel, nem pedig n-vel, mivel az előző szakaszban foglaltak szerint az r vektor szabad szabadságának száma (n-1).
Ha a variancia kiszámításához azt n-el osztják az (n-1) helyett, akkor az eredmény torzítással jár, amely nagyon fontos, ha n értéke kevesebb, mint 50.
Az irodalomban a varianciaképlet az n osztóval is megjelenik (n-1) helyett, amikor a populáció varianciájára vonatkozik.
De a maradványok véletlen változójának, az r vektor által képviselt halmazának, bár n dimenzióval rendelkezik, csak (n-1) szabadságfok van. Ha azonban az adatok száma elég nagy (n> 500), akkor mindkét képlet ugyanahhoz az eredményhez konvergál.
A számológépek és a táblázatok biztosítják a variancia változatát és a szórást (amely a variancia négyzetgyöke).
Javaslatunk, tekintettel az itt bemutatott elemzésre, mindig el kell választania az (n-1) verziót, amikor a varianciát vagy a szórást kiszámítani kell, az elferdített eredmények elkerülése érdekében.
A Chi tér eloszlásában
Néhány valószínűség-eloszlás a folyamatos véletlen változóban a szabadság fokának nevezett paramétertől függ, ez a helyzet a Chi négyzet eloszlásban (χ 2).
Ennek a paraméternek a neve pontosan abból a véletlenszerű vektorból származik, amelyre ez az eloszlás vonatkozik.
Tegyük fel, hogy g populációnk van, amelyekből n méretű mintákat veszünk:
X 1 = (x1 1, x1 2,…..x1 n)
X2 = (x2 1, x2 2,…..x2 n)
….
X j = (xj 1, xj 2,…..xj n)
….
Xg = (xg 1, xg 2,…..xg n)
Egy j populáció, amely átlagos
A zj i szabványosított vagy normalizált változó meghatározása a következő:
zj i = (xj i -
És a Zj vektort így definiáljuk:
Zj = (zj 1, zj 2,…, zj i,…, zj n), és követi az N (0,1) szabványosított normál eloszlást.
Tehát a változó:
Q = ((z1 1 ^ 2 + z2 1 ^ 2 +…. + Zg 1 ^ 2),…., (Z1 n ^ 2 + z2 n ^ 2 +…. + Zg n ^ 2))
követi a χ 2 (g) eloszlást, az úgynevezett chi-négyzet eloszlást g szabadságfokkal.
A hipotézis tesztben (a példa megoldódott)
Ha egy hipotézist tesztelni kíván egy véletlenszerű adathalmaz alapján, akkor a Chi-négyzet teszt alkalmazásához tudnia kell a g szabadságfokok számát.

2. ábra. Van-e kapcsolat a jégkrém és az aromák preferenciája és az ügyfél neme között? Forrás: F. Zapata.
Példaként elemezzük a csokoládé vagy eper fagylalt preferenciáira összegyűjtött adatokat egy adott fagylalt szalonban a férfiak és a nők körében. A férfiak és a nők eper vagy csokoládé kiválasztásának gyakoriságát a 2. ábra foglalja össze.
Először kiszámolják a várható gyakorisági táblázatokat, amelyeket elkészítünk úgy, hogy a sorok összességét megszorozzuk az oszlopok teljes számával, elosztva az összes adattal. Az eredményt a következő ábra mutatja:

3. ábra: A várható frekvenciák kiszámítása a megfigyelt frekvenciák alapján (kék értékek a 2. ábrán). Forrás: F. Zapata.
Ezután a Chi négyzetet (az adatokból) kiszámítjuk a következő képlet alapján:
χ 2 = ∑ (F o - F e) 2 / F e
Ahol F o a megfigyelt frekvencia (2. ábra) és F e a várt frekvencia (3. ábra). Az összegzés az összes soron és oszlopon megy át, amelyek példánkban négy kifejezést adnak.
A műveletek elvégzése után kapsz:
χ 2 = 0,2043.
Most össze kell hasonlítani az elméleti Chi négyzettel, amely a g szabadságfokok számától függ.
Esetünkben ezt a számot a következőképpen határozzuk meg:
g = (# sor - 1) (# oszlop - 1) = (2 - 1) (2 - 1) = 1 * 1 = 1.
Kiderült, hogy ebben a példában g szabadságfokok száma 1.
Ha ellenőrizni kívánja vagy el kívánja utasítani a nullhipotézist (H0: nincs korreláció a TASTE és a GENDER között) 1% -os szignifikanciaszinttel, akkor az elméleti Chi-négyzetértéket g = 1 szabadságfokkal kell kiszámítani.
Azt az értéket keresik, amely a halmozott frekvenciát (1 - 0,01) = 0,99, azaz 99%. Ez az érték (amelyet a táblázatokból be lehet szerezni) 6 636.
Mivel az elméleti Chi meghaladja a kiszámított értéket, akkor a nullhipotézist igazoljuk.
Más szavakkal, az összegyűjtött adatokkal nem figyelhető meg kapcsolat a TASTE és a GENDER változók között.
Irodalom
- Minitab. Milyen szabadságfokok vannak? Helyreállítva: support.minitab.com.
- Moore, David. (2009) Alapvető alkalmazott statisztikák. Antoni Bosch szerkesztő.
- Leigh, Jennifer. Hogyan lehet kiszámítani a szabadság fokát statisztikai modellekben? Helyreállítva: geniolandia.com
- Wikipedia. Szabadságfok (statisztika). Helyreállítva: es.wikipedia.com
- Wikipedia. (Fizikai) szabadságfok. Helyreállítva: es.wikipedia.com
