Mind a variancia, mind a szórás a leggyakrabban használt kifejezés a valószínűségi elméletben és a statisztikában az adathalmaz körüli eloszlás mértékének jobb leírására. Mindkettő numerikus méréseket ad az adatkészlet átlag körüli eloszlására. Az átlag egyszerűen az adatkészletben szereplő értékek tartományának aritmetikai átlaga, míg a variancia azt méri, hogy a számok mennyire vannak szétszórva az átlag körül, azaz a négyzettől való átlagtól való eltérések átlaga. A szórás a mértéke az adott adatkészlet értékeinek szétszóródásának mértékének kiszámításához. Ez egyszerűen a variancia négyzetgyöke. Noha sokan ellentétben állnak a két matematikai fogalommal, a szóban forgó fogalmak jobb megértése érdekében a szórás és a szórás elfogulatlan összehasonlítását mutatjuk be..
A varianciát egyszerűen az értékek aritmetikai átlaguk körül történő változékonyságának mérésére határozzák meg. Egyszerűen fogalmazva, a variancia az átlagos négyzetbeli eltérés, míg az átlag az adott adatkészlet összes értékének átlaga. A változó varianciájának jelölése:σ2”(Kisbetűs szigma) vagy a szigma négyzet. Ezt úgy számítják, hogy kivonják az átlagot egy adott adatkészlet minden egyes értékéből, és különbségeket osztanak egymással, hogy pozitív értékeket kapjanak, és négyzetük összegét végül elosztják az értékek számával..
Ha M = átlag, x = az adatkészletben szereplő egyes értékek és n = az adatkészletben szereplő értékek száma, akkor
σ2 = ∑ (x - M)2/ n
A szórást egyszerűen úgy definiálják, mint egy adott adatkészletben az értékeknek az átlagnál való szétszóródásának mértékét. Az adatok átlag körüli eloszlását méri, a variancia négyzetgyökével számolva. A normál eltérést a görög sigma levél szimbolizálja.σ”, Mint a kisbetűs szigma. A szórást ugyanabban az egységben fejezik ki, mint az átlagértéket, amely nem feltétlenül fordul elő variancia esetén. Elsősorban eszközként használják a kereskedelmi és befektetési stratégiákban.
Ha M = átlag, x = értékek az adatkészletben, és n = az értékek száma, akkor,
σ = √∑ (x - M)2/ n
A variancia egyszerűen azt jelenti, hogy a számok mekkora távolságra oszlanak meg egy adott adatkészletben az átlagos értéküktől. A statisztikákban a variancia a számok számtani középük körül való variabilitásának mértéke. Ez egy numerikus érték, amely számszerűsíti azt az átlagos mértéket, amelyen az adatkészlet értékei különböznek az átlagtól. A szórás viszont egy adathalmaz értékének az átlagtól való szétszóródásának mértéke. A statisztikai elméletben általános kifejezés a központi tendencia kiszámítására.
A szórás csak az adathalmaz szétszóródását méri. Technikai szempontból a variáció az adatkészletben szereplő értékek átlagos négyzetkülönbsége az átlagtól. Ezt úgy számítják ki, hogy először levonják a különbséget a halmaz és az átlag között, és a különbséget eloszlatják, hogy az értékeket pozitívvá tegyék, és végül kiszámolják a négyzetek átlagát a variancia megjelenítéséhez. A szórás egyszerűen csak az adatok középérték körüli eloszlását méri, és a variancia négyzetgyökének egyszerű kiszámításával számolható ki. A szórás értéke mindig nem negatív érték.
A varianciát és a szórást az átlag körül számolják. A varianciát a „S2”És a szórás - a variancia négyzetgyökét„S”. Például az 5., 7., 3. és 7. adatkészletben az összesen 22 lenne, amelyet tovább osztnánk az adatpontok számával (ebben az esetben 4), így az átlag (M) 5,5 lenne. . Itt M = 5,5 és az (n) adatpont száma = 4.
A szórást a következőképpen kell kiszámítani:
S2 = (5–5,5)2 + (7–5,5)2 + (3–5,5)2 + (7–5,5)2 / 4
= 0,25 + 2,25 + 6,25 + 2,25 / 4
= 11/4 = 2,75
A szórást a variancia négyzetgyöke alapján kell kiszámítani.
S = √2,75 = 1,658
A szórás az összes értéket adatkészletben egyesíti a szóródás mértékének számszerűsítéséhez. Tehát minél nagyobb a szórás, annál nagyobb a variáció, ami nagyobb rést eredményez az adatkészlet értékei között. A varianciát elsősorban a statisztikai valószínűség eloszláshoz használják, hogy a volatilitást az átlagtól mérjék, és a volatilitás a kockázatelemzés egyik mércéje, amely segítheti a befektetőket a befektetési portfóliók kockázatának meghatározásában. Ez az eszközallokáció egyik kulcsfontosságú aspektusa. A szórás viszont széles körben alkalmazható, például a pénzügyi szektorban, a piaci és a biztonsági volatilitás mérésére..
Mind a variancia, mind a szórás a leggyakoribb matematikai fogalmak, amelyeket a statisztikában és a valószínűségi elméletben használnak, mint a szórás mértékét. A szórás azt jelenti, hogy az értékek milyen mértékben oszlanak meg egy adott adathalmazban a számtani középértékektől, míg a szórás az értékek átlaghoz viszonyított eloszlásának mértéke. A varianciát az egyes értékek átlagos négyzetbeli eltérése alapján számolják az adatkészletben szereplő átlagtól, míg a szórás csak a variancia négyzetgyöke. A szórást az átlaggal megegyező mértékegységben kell mérni, míg a szórást az átlag négyzet mértékegységében kell mérni. Mindkettőt különböző célokra használják. A variancia inkább egy matematikai kifejezéshez hasonlít, míg a szórást elsősorban az adatok variabilitásának leírására használják.