Mind a korreláció, mind a regresszió statisztikai eszközök, amelyek két vagy több változóval foglalkoznak. Bár mindkettő ugyanazon tárgyra vonatkozik, vannak különbségek a kettő között. A kettő közötti különbségeket az alábbiakban ismertetjük.
A két vagy több változóval való korreláció kifejezés azt jelzi, hogy a változók valamilyen módon kapcsolódnak egymáshoz. A korrelációs elemzés meghatározza, hogy létezik-e kapcsolat két változó között, és a kapcsolat erősségét. Ha két x (független) és y (függő) változó összekapcsolódik úgy, hogy a független változó nagyságának változását a függő változó nagyságának változása kíséri, akkor a két változót korrelálják.
A korreláció lehet lineáris vagy nemlineáris. A lineáris korreláció az, amelyben a változók annyira összefüggenek, hogy az egyik változó értékében bekövetkező változás következetesen megváltoztatja a másik változó értékét. Lineáris korrelációban a függő és független változók adott értékeivel kapcsolatos szétszórt pontok egy nem vízszintes egyenes köré csoportosulnak, bár egy vízszintes egyenes azt is jelzi, hogy a változók között lineáris kapcsolat van, ha egy egyenes képes összekapcsolni a a változók.
A regressziós analízis viszont a meglévő adatokat használja a változók matematikai kapcsolatának meghatározására, amely felhasználható a függő változó értékének a független változó bármely értékéhez viszonyított értékének meghatározására..
A korreláció a társulás erősségének vagy a kapcsolat intenzitásának mérésével foglalkozik, ahol a regresszió a függő változó értékének a független változó ismert értékéhez viszonyított előrejelzésével kapcsolatos. Ez a következő képletekkel magyarázható.
Az x és y közötti korrelációs együtthatót vagy együttható korrelációt (r) a következő képlettel lehet meghatározni;
r = kovariancia (x, y) /σx.σy, cov (x, y) = Σxy / n - (Σx / n) (Σy / n), σx és σy az x és y szórás, és - 1 < r 0, then correlation coefficient between x and y = correlation coefficient between u and v.
Az r korrelációs együttható tiszta szám és független a mértékegységtől. Tehát, ha x egy adott régióban élő emberek magassága (hüvelyk) és y egy tömege (font), akkor r nem hüvelykben, sem fontban, hanem egyszerűen egy szám.
A regressziós egyenletet a következő képlettel lehet meghatározni:
Az y regressziós egyenlete x-en (az y becslésének meghatározásához) y - y '= byx (x-x‾), a byx-ot y y regressziós együtthatójának nevezik x-en. X regressziós egyenlete y-n (az x becslésének meghatározásához) x - x '= bxy (y-y‾), bxy-nak x y regressziós együtthatója van.
A korrelációs elemzés nem feltételezi, hogy egyik változó függ más változótól, és nem próbálja meg kideríteni a kettő közötti kapcsolatot. Egyszerűen megbecsüli a változók közötti asszociáció mértékét. Más szavakkal, a korrelációs elemzés a változók kölcsönös függőségét vizsgálja. A regressziós elemzés viszont leírja a függő változó vagy válaszváltozó függését a független vagy magyarázó változó (k) tól. A regressziós elemzés feltételezi, hogy egyértelmű okozati összefüggés van a magyarázó és a válaszváltozó között, és nem veszi figyelembe, hogy az okozati összefüggés pozitív vagy negatív. A korrelációhoz mind a függő, mind a független változók értékei véletlenszerűek, de a független változók regressziós értékeinek nem kell, hogy legyenek véletlenszerűek.
1. A korrelációs elemzés két változó közötti kölcsönös függőség vizsgálata. A regressziós elemzés matematikai képletet ad a függő változó értékének meghatározásához a független változó (k) értékéhez viszonyítva.
2. A korrelációs együttható független a származási helytől és a skálától, de a regressziós együttható nem így van.
A korrelációhoz mindkét változó értékének véletlenszerűnek kell lennie, de a regressziós együttható esetében ez nem így van.
1. Das, N. G., (1998), Statistics Methods, Calcutta
2. Korreláció és regresszió, elérhető a www.le.ac.uk/bl/gat/virtualfc/stats/regression oldalon
3. Regresszió és korreláció, elérhető a www.abyss.uoregon.edu oldalon