Regresszió vs korreláció
A statisztikákban fontos a véletlenszerű változók közötti kapcsolat meghatározása. Ez lehetőséget ad arra, hogy előrejelzéseket tegyen az egyik változóról a többihez viszonyítva. A regressziós elemzést és a korrelációt alkalmazzák az időjárás-előrejelzésekben, a pénzügyi piaci magatartásban, a fizikai kapcsolatok létrehozásában kísérletekkel és sokkal több valós forgatókönyvben..
Mi a regresszió??
A regresszió egy statisztikai módszer, amellyel meghatározzák a két változó közötti kapcsolatot. Az adatok gyűjtésekor gyakran lehetnek olyan változók, amelyek másoktól függenek. A változók közötti pontos kapcsolat csak a regressziós módszerekkel állapítható meg. Ennek a kapcsolatnak a meghatározása segít megérteni és megjósolni az egyik változó viselkedését a másikhoz.
A regressziós elemzés leggyakoribb alkalmazása a függő változó értékének becslése egy adott értékre vagy a független változók értéktartományára. Például a regresszió segítségével véletlenszerű mintából gyűjtött adatok alapján megállapíthatjuk az árucikk ára és a fogyasztás közötti kapcsolatot. A regressziós elemzés eredménye egy adatkészlet regressziós függvénye, amely egy olyan matematikai modell, amely a legjobban illeszkedik a rendelkezésre álló adatokhoz. Ezt könnyen egy szórt grafikon ábrázolhatja. Grafikailag a regresszió egyenértékű az adási adatkészlethez legjobban illeszkedő görbe megtalálásával. A görbe függvénye a regressziós függvény. A matematikai modell felhasználásával meg lehet becsülni egy áru igényét egy adott árra.
Ezért a regressziós elemzést széles körben használják a predikcióban és az előrejelzésben. Arra is használják, hogy kapcsolatot létesítsenek a kísérleti adatokban, a fizika, a kémia, valamint számos természettudomány és műszaki tudományterület területén. Ha a kapcsolat vagy a regressziós függvény egy lineáris függvény, akkor a folyamatot lineáris regressziónak nevezzük. A szórási grafikonon egyenesként ábrázolható. Ha a függvény nem a paraméterek lineáris kombinációja, akkor a regresszió nemlineáris.
Mi a korreláció??
A korreláció a két változó közötti kapcsolat erősségének mértéke. A korrelációs együttható számszerűsíti az egyik változó változásának mértékét a másik változó változása alapján. A statisztikákban a korreláció a függőség fogalmához kapcsolódik, amely két változó közötti statisztikai kapcsolat.
A Pearsons korrelációs együtthatója, vagy csak az r korrelációs együttható -1 és 1 közötti érték (-1≤r≤ + 1). Ez a leggyakrabban alkalmazott korrelációs együttható, és csak a változók közötti lineáris kapcsolatra érvényes. Ha r = 0, nem létezik kapcsolat, és ha r≥0, akkor a kapcsolat közvetlenül arányos; vagyis az egyik változó értéke a másik növekedésével növekszik. Ha r≤0, akkor a kapcsolat fordítottan arányos; azaz az egyik változó csökken, a másik növekedésével.
A linearitási feltétel miatt az r korrelációs együttható felhasználható a változók közötti lineáris kapcsolat meglétére is.
Mi a különbség a regresszió és a korreláció között??
A regresszió adja a két véletlenszerű változó közötti kapcsolat formáját, a korreláció pedig a kapcsolat erősségének mértékét.
A regressziós elemzés olyan regressziós függvényt hoz létre, amely elősegíti az eredmények extrapolálását és előrejelzését, míg a korreláció csak információt nyújthat arról, hogy milyen irányba változhat..
A pontosabb lineáris regressziós modelleket az elemzés adja meg, ha a korrelációs együttható magasabb. (| R | ≥0.8)