Variancia vs Kovariancia
A variancia és a kovariancia a statisztikában alkalmazott két mérőszám. A variancia az adatok szórásának mértéke, a kovariancia pedig a két véletlenszerű változó változásának fokát jelzi együtt. A variancia inkább egy intuitív fogalom, de a kovarianciát matematikailag határozza meg, nem az, aki eleinte intuitív.
További információ a Variance-ről
A variancia az adatok eloszlásának mértéke az eloszlás középértéke alapján. Megmondja, hogy az adatpontok milyen távolságra vannak az eloszlás átlagától. Ez a valószínűség-eloszlás egyik elsődleges leírója és az eloszlás egyik pillanata. Ezenkívül a variancia a populáció paramétere, és a populációból származó minta szórása becslésként szolgál a populáció varianciájára. Egy szempontból ez a szórás négyzetének felel meg.
Egyértelmű nyelven leírható az egyes adatpontok közötti távolság és az eloszlás középértékének négyzetének átlagaként. A variancia kiszámításához az alábbi képletet kell használni.
Var (X) = E [(X-μ)2 ] egy lakosság számára, és
Var (X) = E [(X-~x)2 ] egy mintához
Ez tovább egyszerűsíthető, ha Var (X) = E [X2 ]-(VOLT])2.
A varianciának van néhány aláírási tulajdonsága, és gyakran használják a statisztikákban a használat egyszerűbbé tétele érdekében. A variancia nem negatív, mert a távolságok négyzete. A variancia tartománya azonban nem korlátozott, és az adott eloszlástól függ. Egy állandó véletlen változó szórása nulla, és a szórás egy helyparaméterhez képest nem változik.
További információ a Covariance-ről
A statisztikai elméletben a kovariancia azt jelenti, hogy mekkora mértékben változik két véletlen változó együtt. Más szóval, a kovariancia a két véletlenszerű változó közötti korreláció erősségének mértéke. Ugyancsak két véletlenszerű változó variancia fogalmának általánosításának tekinthető.
Két véletlen változó X és Y kovarianciája, amelyek a véges második impulzussal együtt oszlanak el, σ néven ismert.XY= E [(X-E [X]) (Y-E [Y])]. Ebből a variancia a kovariancia különleges eseteként tekinthető, ahol két változó azonos. Cov (X, X) = Var (X)
A kovariancia normalizálásával a lineáris korrelációs együtthatót vagy a Pearson-féle korrelációs együtthatót kaphatjuk, amelyet ρ = E [(X-E [X]) (Y-E [Y])] / (σx σY ) = (Cov (X, Y)) / (σx σY)
Grafikailag az adatpárok közötti kovariancia úgy tekinthető, mint a téglalap területe, az adatpontokkal az ellenkező csúcsokon. Értelmezhető a két adatpont közötti távolság nagyságának mértékeként. Tekintettel a téglalapokra az egész népességre, az összes adatpontnak megfelelő téglalapok átfedése tekinthető az elválasztás erősségének; a két változó varianciája. A kovariancia két dimenzióban van, két változó miatt, de ha egyszerűsítjük azt egy változónak, akkor az egyvariáció varianciáját adja meg, mivel az egy dimenzióban történő elválasztás.
Mi a különbség a variancia és a kovariancia között??
• A variancia a populáció terjedésének / eloszlásának mértéke, míg a kovarianciát két véletlenszerű variáció vagy a korreláció erősségének mértékének tekintik..
• A variancia a kovariancia különleges esete.
• A variancia és a kovariancia az adatértékek nagyságától függ, és nem hasonlíthatók össze; ezért normalizálva vannak. A kovarianciát normalizáljuk a korrelációs együtthatóra (a két véletlenszerű változó szórásainak szorzatával osztva) és a varianciát a szórásra normalizáljuk (a négyzetgyök figyelembevételével).