Eltérés vs. standard eltérés
Eltérés vs. standard eltérés
A leíró és következtetési statisztikákban több mutatót használnak arra, hogy leírják az adatkészletet, amely megfelel annak központi tendenciájának, szétszóródásának és ferdességének. Statisztikai szempontból ezeket általában becsléseknek nevezik, mivel becslik a populáció paraméter értékeit.
A diszperzió az adat eloszlásának mértéke az adatkészlet közepén. A szórás az egyik leggyakrabban alkalmazott diszperziós mérték. A szórás kiszámításakor az egyes adatpontok átlagtól való eltéréseit figyelembe veszik. Ezért azt lehet állítani, hogy a szórás és az átlag szinte elegendő képet ad az adatkészletről.
Vegye figyelembe a következő adatkészletet. A 10 ember súlyát (kilogrammban) 70, 62, 65, 72, 80, 70, 63, 72, 77 és 79-re mértük. Ekkor a tíz ember átlagos tömege (kilogrammban) 71 (kilogrammban) ).
Mi az eltérés??
A statisztikákban az eltérés azt az összeget jelenti, amelyben egy adatpont különbözik egy rögzített értéktől, például az átlagtól. Általában legyen k fix érték és x1,x2,… , xn jelöl egy adatkészletet. Ezután x eltérésej k-től (xj- k).
Például a fenti adatkészletben a megfelelő eltérések az átlagtól (70 - 71) = -1, (62 - 71) = -9, (65 - 71) = -6, (72 - 71) = 1, (80 - 71) = 9, (70 - 71) = -1, (63 - 71) = -8, (72 - 71) = 1, (77 - 71) = 6 és (79 - 71) = 8.
Mi az a szórás??
Ha az egész népesség adatait figyelembe lehet venni (például népszámlálás esetén), akkor kiszámítható a népesség szórása. A populáció szórásának kiszámításához először kiszámítják az adatértékek eltérését a populáció átlagától. A szórások négyzetközépének négyzetgyökerét (középérték) a populáció szórásaként nevezzük. Szimbólumokban σ = √ ∑ (xén-μ)2 / n ahol µ a populáció átlaga és n a populáció mérete.
Ha egy mintából (n méretű) adatokat használnak a populáció paramétereinek becslésére, kiszámítják a minta szórását. Először kiszámítják az adatértékek eltérését a minta átlagától. Mivel a középérték helyett a populációs átlagot használják (ami ismeretlen), a kvadratikus átlagot nem helyénvaló figyelembe venni. A minta középértékének kompenzálása érdekében az eltérések négyzetének összegét n helyett (n-1) osztjuk el. Ennek a minta szórása a négyzetgyöke. Matematikai szimbólumokban S = √ ∑ (xén-x)2 / (n-1), ahol S a minta szórása, ẍ a minta átlaga és xi az adatpontok.
Az előző adatkészletben a szórási négyzetek összege (-1)2 + (-9)2 + (-6)2 + 12 + 92 + (-1)2 + (-8)2 + 12 + 62 + 82 = 366. Így a népesség szórása √ (366/10) = 6,05 (kilogrammban). (Feltételezve, hogy a vizsgált lakosság azon 10 emberből áll, akiktől az adatokat vették).
Mi a különbség az eltérés és a szórás között?? • A szórás statisztikai index és becslés, de az eltérés nem. • A szórás az adatcsoport egy középpontban való szétszóródásának mértéke, míg az eltérés arra az összegre vonatkozik, amelyben egy adatpont különbözik a rögzített értéktől. |