Szabvány eltérés vs. átlag
A leíró és következtetési statisztikákban több mutatót használnak arra, hogy leírják az adatkészletet, amely megfelel annak központi tendenciájának, szétszóródásának és ferdességének. Statisztikai szempontból ezeket általában becsléseknek nevezik, mivel becslik a populáció paraméter értékeit.
A központi tendencia az értékek eloszlásának központját jelöli és lokalizálja. Az átlag, a mód és a medián a leggyakrabban használt mutatók az adatkészlet központi tendenciájának leírására. A diszperzió az adatok eloszlásának mennyisége az eloszlás központjától. A távolság és a szórás a leggyakrabban alkalmazott diszperziós mérték. Pearson ferdesség koefficienseit használjuk az adatok eloszlásának ferdességének leírására. A ferdesség itt arra utal, hogy az adatkészlet szimmetrikus-e a központhoz képest, és ha nem, akkor milyen ferde.
Mi az átlag??
Az átlag a központi tendencia leggyakrabban használt mutatója. Egy adatkészlethez az átlagot úgy számítják ki, hogy az összes adat értékét összeveszik, majd elosztják az adatok számával. Például 10 ember súlyát (kilogrammban) 70, 62, 65, 72, 80, 70, 63, 72, 77 és 79-re mértük. Ekkor a tíz ember átlagos tömege (kilogrammban) az alábbiak szerint számítva. A súlyok összege 70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79 = 710. Átlag = (összeg) / (az adatok száma) = 710/10 = 71 (kilogrammban).
Mint ebben a példában, az adatkészlet átlagértéke nem lehet a készlet adatpontja, hanem egy adott adatkészletre egyedi. Az Mean egységei megegyeznek az eredeti adatokkal. Ezért megjelölhető ugyanazon a tengelyen, mint az adatok, és összehasonlításokhoz használható. Ezenkívül az adatkészlet átlagára vonatkozóan nincs jel korlátozás. Lehet negatív, nulla vagy pozitív, mivel az adathalmaz összege lehet negatív, nulla vagy pozitív.
Mi az a szórás??
A szórás a leggyakrabban alkalmazott szórásmutató. A szórás kiszámításához először kiszámítják az adatértékek eltérését az átlagtól. Az eltérések gyökér négyzetátlagát standard eltérésnek nevezzük.
Az előző példában az átlagtól való eltérések a következők: (70 - 71) = -1, (62-71) = -9, (65-71) = -6, (72-71) = 1, (80- 71) = 9, (70-71) = -1, (63-71) = -8, (72-71) = 1, (77-71) = 6 és (79-71) = 8. A a szórás négyzete (-1) 2+ (-9)2+ (-6)2+ 12+92+ (-1)2+ (-8)2+ 12+ 62 + 82 = 366. A szórás √ (366/10) = 6,05 (kilogrammban). Ebből arra lehet következtetni, hogy az adatok többsége 71 ± 6,05 intervallumban van, feltéve, hogy az adatkészlet nincs nagy mértékben ferde, és valóban így van ebben a példában.
Mivel a szórás ugyanazokkal az egységekkel rendelkezik, mint az eredeti adatok, ez megmutatja, hogy az adatok mennyiben térnek el a központtól; minél nagyobb a szórás, annál nagyobb a diszperzió. Ezenkívül a szórás nem negatív érték, függetlenül az adatkészletben szereplő adatok jellegétől.
Mi a különbség a szórás és az átlag között?? • A szórás a szétszóródás mértékét jelenti a központtól, míg az átlag az adatkészlet középpontjának helyét méri. • A szórás mindig nemnegatív érték, de az átlag bármilyen valós értéket felvehet.
|