Lineáris vs logisztikus regresszió
A statisztikai elemzés során fontos azonosítani a tanulmányban érintett változók közötti kapcsolatokat. Előfordulhat, hogy maga az elemzés kizárólagos célja. Az egyik erős eszköz a kapcsolat létezésének megállapításához és a kapcsolat azonosításához a regressziós elemzés.
A regressziós elemzés legegyszerűbb formája a lineáris regresszió, ahol a változók közötti kapcsolat lineáris kapcsolat. Statisztikai szempontból felvázolja a magyarázó és a válaszváltozó közötti kapcsolatot. Például a regresszió segítségével véletlenszerű mintából gyűjtött adatok alapján megállapíthatjuk az árucikk ára és a fogyasztás közötti kapcsolatot. A regressziós elemzés az adatkészlet regressziós függvényét hozza létre, amely egy olyan matematikai modell, amely a rendelkezésre álló adatokhoz legjobban illeszkedik. Ezt könnyen egy szórt grafikon ábrázolhatja. A grafikus regresszió egyenértékű az adott adatkészlethez legjobban illeszkedő görbe megtalálásával. A görbe függvénye a regressziós függvény. A matematikai modell felhasználásával egy árucikk felhasználása megjósolható egy adott árra.
Ezért a regressziós elemzést széles körben használják a predikcióban és az előrejelzésben. Arra is használják, hogy kapcsolatba hozzák a kísérleti adatokat, a fizika, a kémia területén, valamint számos természettudomány és műszaki tudományág területén. Ha a kapcsolat vagy a regressziós függvény egy lineáris függvény, akkor a folyamatot lineáris regressziónak nevezzük. A szórási grafikonon egyenesként ábrázolható. Ha a függvény nem a paraméterek lineáris kombinációja, akkor a regresszió nemlineáris.
A logisztikus regresszió összehasonlítható a többváltozós regresszióval, és modellt hoz létre, amely megmagyarázza a több prediktornak a válaszváltozóra gyakorolt hatását. A logisztikus regresszióban azonban a végeredmény-változónak kategorikusnak kell lennie (általában osztva; azaz elérhető eredmények párja, például halál vagy túlélés, bár a speciális technikák lehetővé teszik a kategorizáltabb információk modellezését). A folyamatos kimeneti változót kategorikus változóvá lehet alakítani, amelyet a logisztikai regresszióhoz kell használni; a folyamatos változók ilyen módon történő összeomlása azonban általában nem javasolt, mert csökkenti a pontosságot.
A lineáris regresszióval ellentétben az átlag felé a logisztikai regresszió prediktív változóit nem kell arra kényszeríteni, hogy lineárisan összekapcsolódjanak, általános eloszlásúak legyenek, vagy hogy minden klaszterben egyenlő varianciával rendelkezzenek. Ennek eredményeként a prediktor és az eredményváltozók közötti kapcsolat valószínűleg nem lineáris függvény.
Mi a különbség a logisztikai és a lineáris regresszió között??
• Lineáris regresszió esetén feltételezzük, hogy a magyarázó változó és a válaszváltozó között lineáris kapcsolat van, és a modellt kielégítő paramétereket elemzéssel határozzuk meg, hogy pontos összefüggést kapjunk.
• A lineáris regressziót kvantitatív változókra hajtjuk végre, és az így kapott függvény kvantitatív.
• A logisztikus regresszió során a felhasznált adatok lehetnek kategorikusak vagy mennyiségi jellegűek, de az eredmény mindig kategorikus.