Átlagos vs. medián vs. mód
Az átlag, a medián és a mód az elsődleges a központi tendencia mérései a leíró statisztikákban használják. Teljesen különböznek egymástól, és azok az esetek, amikor az adatok összegzésére használják őket, szintén eltérőek.
Átlagos
A számtani átlag az adatértékek összege osztva az adatértékek számával, azaz.
Ha az adatok egy mintaterületből származnak, akkor azt minta átlagnak (), amely a minta leíró statisztikája. Habár ez a minta leggyakrabban használt leíró mértéke, nem megbízható statisztika. Nagyon érzékeny a kiugró értékekre és az oszcillációkra.
Például vegye figyelembe egy adott város polgárainak átlagos jövedelmét. Mivel az összes adatot összegezik, majd felosztják, egy rendkívül gazdag ember jövedelme jelentősen befolyásolja az átlagot. Ezért az átlagértékek nem mindig képviselik az adatokat jól.
Ezenkívül váltakozó jel esetén az elemen áthaladó áram periodikusan változik a pozitív iránytól negatív irányig és fordítva. Ha figyelembe vesszük az elemen áthaladó átlagos áramot egyetlen időszakban, akkor 0 értéket ad, ami azt jelenti, hogy egyetlen áram sem haladt át az elemen, ami nyilvánvalóan nem igaz. Ezért ebben az esetben is a számtani középérték nem jó mérőszám.
A számtani középérték jó mutató, ha az adatok egyenletesen vannak elosztva. Normál eloszlás esetén az átlag egyenlő az üzemmóddal és a mediánnal. Ugyancsak rendelkezik a legkisebb maradékértékkel, ha a gyökér átlag négyzet hibáját vesszük figyelembe; ezért a legjobb leíró intézkedés, amikor egy adatkészletet egyetlen számmal kell ábrázolni.
Középső
A középső adatpont értékeit az összes adat növekvő sorrendbe rendezése után az adatállomány mediánjaként határozzuk meg. A medián a 2. kvartilis, 5. decilis és az 50. percentilis.
• Ha a megfigyelések száma (adatpontok) páratlan, akkor a medián a megfigyelés pontosan a rendezett lista közepén..
• Ha a megfigyelések (adatpontok) száma egyenlő, akkor a medián a rendezett listában szereplő két középső megfigyelés átlaga.
A medián két csoportra osztja a megfigyelést; vagyis az értékek egy csoportja (50%) magasabb, és egy csoport (50%) értékének alacsonyabb, mint a medián. A mediánokat kifejezetten ferde eloszlásokban használják, és az adatok meglehetősen jobbak, mint a számtani átlag.
Mód
Az üzemmód a leggyakrabban előforduló szám egy megfigyeléscsoportban. Az adatkészlet módját úgy számítják ki, hogy megtalálják az egyes elemek frekvenciáját a készletben.
• Ha egyetlen érték sem fordul elő egyszer, akkor az adatkészletnek nincs üzemmódja.
• Egyébként minden olyan érték, amely a legnagyobb frekvenciával fordul elő, az adatkészlet üzemmódja.
Egynél több üzemmód létezhet; ezért a mode nem egy adathalmaz egyedi statisztikája. Egységes eloszlásban van egy mód. A diszkrét valószínűség-eloszlás módja az a pont, ahol a valószínűségi tömegfüggvény eléri a legmagasabb pontot. A fenti értelmezések alapján ezt mondhatjuk globális maximumok üzemmódok.
Fontolja meg mindhárom intézkedés alkalmazását az alábbi adatkészletre.
ADATOK: 1, 1, 2, 3, 5, 5, 5, 5, 6, 6, 8, 8, 9, 9, 9, 9, 9, 10, 10, 10, 14, 14, 15, 15 , 15
Átlag = (1+ 1+ 2+ 3+ 5+ 5+ 5+ 5+ 6+ 6+ 8+ 8+ 9+ 9+ 9+ 9+ 9+ 10+ 10+ 10+ 14+ 14+ 15+ 15+ 15+ 15 ) / 25 = 8,12
Medián = 9 (13. elem)
Üzemmód = 9 (9 = 5 frekvencia)
Mi a különbség az átlag, a medián és a mód között??
• A számtani átlag az értékek (megfigyelések) összege osztva a megfigyelések számával. Ez nem robusztus statisztika, és nagymértékben függ a figyelembe vett eloszlás normál eloszlási természetétől. Egyetlen külső érték jelentősen eltolódhat az átlagban, ami viszonylag félrevezető értékeket ad. A fogalom kiterjeszthető geometriai középértékre, harmonikus középre, súlyozott átlagra és így tovább.
• A medián a megfigyelések halmazának középső értéke, és a kiugró értékek viszonylag kevésbé befolyásolják. Jó becslést adhat, mivel összefoglaló statisztika nagyon ferde esetekben.
• Az adatkészlet leggyakoribb megfigyelési értékei az üzemmód. Ha az eloszlás pozitív, ferdén van, a mód balra a medián fekszik, és ha negatív módon ferde, akkor a mód jobb medián fekszik.
• Ha pozitívan ferde, akkor az átlag a mediánhoz igaz; ha negatívan ferde, akkor a medián bal oldalán van.
• Normál eloszlásban mind a három, az átlag, a mód és a medián egyenlő.