Népesség vs. minta szórása
A statisztikákban számos mutatót használnak egy olyan adatkészlet leírására, amely megfelel annak központi tendenciájának, szétszóródásának és ferdességének. A szórás az egyik leggyakoribb mérési módszer az adatok eloszlására az adatkészlet közepétől.
Gyakorlati nehézségek miatt nem lehetséges a teljes népességből származó adatok felhasználása egy hipotézis tesztelésekor. Ezért a mintákból származó adatértékeket alkalmazzuk a populációra vonatkozó következtetések levonására. Ilyen helyzetben ezeket becsléseknek nevezzük, mivel becslik a populáció paraméter értékeit.
Rendkívül fontos, hogy az elfogulatlan becsléseket vonjuk le. A becslést elfogulatlannak mondják, ha a becslés várt értéke megegyezik a populációs paraméterrel. Például a minta átlagot használjuk elfogulatlan becslésként a populációs átlag számára. (Matematikailag kimutatható, hogy a minta átlagának várható értéke megegyezik a populáció átlagával). A populációs szórás becslése esetén a minta szórása is elfogulatlan becslés.
Mi a népesség szórása??
Ha figyelembe lehet venni az egész népesség adatait (például népszámlálás esetén), akkor kiszámítható a népesség szórása. A populáció szórásának kiszámításához először kiszámítják az adatértékek eltérését a populáció átlagától. A szórások négyzetközépének négyzetgyökerét (középérték) a populáció szórásaként nevezzük.
A 10 tanulóból álló osztályban könnyen összegyűjthetők a hallgatókkal kapcsolatos adatok. Ha egy hipotézist tesztelnek ezen a hallgatói populáción, akkor nincs szükség mintaértékek alkalmazására. Például a tíz hallgató súlyát (kilogrammban) 70, 62, 65, 72, 80, 70, 63, 72, 77 és 79-re mértük. Ezután a tíz ember átlagos tömege (kilogrammban) (70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79) / 10, ami 71 (kilogrammban). Ez a népesség átlaga.
A lakosság szórásának kiszámításához kiszámoljuk az eltéréseket az átlagtól. Az átlagtól való eltérés (70 - 71) = -1, (62 - 71) = -9, (65 - 71) = -6, (72 - 71) = 1, (80 - 71) = 9, (70 - 71) = -1, (63 - 71) = -8, (72 - 71) = 1, (77 - 71) = 6 és (79 - 71) = 8. Az eltérés négyzeteinek összege ( -1)2 + (-9)2 + (-6)2 + 12 + 92 + (-1)2 + (-8)2 + 12 + 62 + 82 = 366. A népesség szórása √ (366/10) = 6,05 (kilogrammban). 71 az osztály tanulóinak átlagos átlagos tömege, a 6.05 pedig a tömeg pontos szórása a 71-től.
Mi a minta szórása??
Amikor a mintából (n méretű) adatokat használnak a populáció paramétereinek becslésére, kiszámítják a minta szórását. Először kiszámítják az adatértékek eltérését a minta átlagától. Mivel a középérték helyett a populációs átlagot használják (ami ismeretlen), a kvadratikus átlagot nem helyénvaló figyelembe venni. A minta átlag felhasználásának kompenzálása érdekében az eltérések négyzetének összegét n helyett (n-1) osztjuk el. Ennek a minta szórása a négyzetgyöke. Matematikai szimbólumokban S = √ ∑ (xén-x)2 / (n-1), ahol S a minta szórása, ẍ a minta átlaga és xénaz adatpontok.
Tegyük fel, hogy az előző példában a lakosság az egész iskola tanulói. Akkor az osztály csak minta lesz. Ha ezt a mintát használják a becsléshez, akkor a minta szórása √ (366/9) = 6,38 (kilogrammban), mivel a 366-at osztottuk 9 helyett 10 helyett (a minta mérete). Figyelembe kell venni, hogy nem garantált, hogy ez a pontos népességi szórásérték. Ez csupán egy becslés erre.
Mi a különbség a populáció szórása és a minta szórása között?? • A populáció szórása a pontos paraméterérték, amellyel mérik a szórást a középpontból, míg a minta szórása elfogulatlan becslés. • A lakosság szórását akkor számítják ki, ha a populáció minden egyes adata ismert. Egyébként kiszámolják a minta szórását. • A populáció szórását σ = √ ∑ (xi-µ) adja meg2/ n ahol µ a populáció átlaga és n a populáció mérete, de a minta szórását S = √ ∑ (xi-ẍ) adja meg2 / (n-1), ahol ẍ a minta átlaga és n a minta mérete.
|