A besorolás és a predikció az adatbányászathoz kapcsolódó két kifejezés. Az adatok szinte minden szervezet számára fontosak a profit növelése és a piac megértése szempontjából. A sima adatoknak nincs sok értéke. Ezért az adatokat feldolgozni kell, hogy hasznos információkat szerezzenek. Az adatbányászat az a technológia, amely kivonja az információkat nagy mennyiségű adatból. Segít az adatok átfogó megértésében. Az adatbányászat egyes alkalmazásai a piacelemzés, a termelés ellenőrzése és a csalások felderítése. Az osztályozás és a predikció két fogalom, amely az adatbányászathoz kapcsolódik. Ez a cikk az osztályozás és a predikció közötti különbséget tárgyalja. Az osztályozás az új megfigyelés kategóriájának vagy osztálycímkéjének azonosításának folyamata, amelyhez tartozik. Az előrejelzés a hiányzó vagy nem elérhető numerikus adatok azonosításának folyamata egy új megfigyeléshez. Ez a kulcs különbség a osztályozás és predikció. Az előrejelzés nem érinti az osztálycímkét, mint az osztályozásban.
1. Áttekintés és a legfontosabb különbség
2. Mi az osztályozás?
3. Mi az előrejelzés?
4. A osztályozás és a jóslat közötti hasonlóságok
5. Összehasonlítás - Osztályozás vs. Jóslás táblázatos formában
6. Összegzés
A besorolás az új megfigyelés kategóriájának vagy osztálycímkéjének azonosítása. Először: egy adatsort használunk edzési adatokként. A bemeneti adatok halmazát és a megfelelő kimeneteket az algoritmus kapja meg. Tehát az edzési adatkészlet tartalmazza a bemeneti adatokat és a hozzájuk tartozó osztálycímkéket. Az oktatási adatkészlet felhasználásával az algoritmus modellt vagy osztályozót hoz létre. A származtatott modell lehet döntési fa, matematikai képlet vagy egy neurális hálózat. A besorolás során, ha címkén kívüli adatokat adnak a modellnek, meg kell találnia azt az osztályt, amelyhez tartozik. A modellhez továbbított új adatok a teszt adatkészlet.
Az osztályozás egy rekord osztályozásának folyamata. A besorolás egy egyszerű példája annak ellenőrzése, hogy esik-e vagy sem. A válasz lehet igen vagy nem. Tehát van egy bizonyos számú választás. Időnként kettőnél több osztály is osztályozható. Ezt nevezik többosztályú osztályozás. A valós életben a banknak elemeznie kell, hogy kockázatot jelent-e hitel nyújtása egy adott ügyfél számára. Ebben a példában egy modellt készítünk a kategorikus címke megtalálására. A címkék kockázatosak vagy biztonságosak.
Az adatok elemzésének másik folyamata a predikció. Arra szolgál, hogy numerikus kimenetet keressen. Ugyanaz, mint a besorolásban, az edzési adatkészlet tartalmazza a bemeneteket és a hozzájuk tartozó numerikus kimeneti értékeket. A képzési adatkészlet szerint az algoritmus a modellt vagy egy prediktort deríti le. Az új adatok megadásakor a modellnek numerikus kimenetet kell találnia. A besorolástól eltérően, ez a módszer nem rendelkezik osztálycímkével. A modell előrejelzi a folyamatos értékű függvényt vagy a rendezett értéket.
A regressziót általában a predikcióhoz használják. A ház előrejelzése a tények függvényében, például a szobák számától, az összterületről stb. Ad példát a becsléshez. Előfordulhat, hogy egy vállalat megtalálja az ügyfél által az eladás során elköltött összeget. Ez szintén példa a jóslatokra.
Osztályozás vs predikció | |
Az osztályozás annak meghatározása, hogy mely kategóriához tartozik egy új megfigyelés egy olyan megfigyelési adatkészlet alapján, amely megfigyeléseket tartalmaz, amelyek kategóriájának tagsága ismert. | Az előrejelzés a hiányzó vagy nem elérhető numerikus adatok azonosításának folyamata egy új megfigyeléshez. |
Pontosság | |
A besorolás során a pontosság az osztálycímke helyes megtalálásától függ. | A predikcióban a pontosság attól függ, hogy egy adott prediktor mennyire tudja kitalálni az új adatok predikált attribútumának értékét. |
Modell | |
A kategorikus címkék megtalálásához modell vagy osztályozó készül. | Olyan modellt vagy előrejelzőt kell készíteni, amely előrejelzi a folyamatos értékű függvényt vagy a rendezett értéket. |
A modell szinonimái | |
Az osztályozásban a modell osztályozóként is ismert. | Az előrejelzés során a modell prediktorként is ismert. |
Jelentős információk kinyerése hatalmas adatkészletből adatbányászatnak nevezzük. Ez a cikk két elemzési módszert tárgyal az adatbányászatban, mint például az osztályozás és a predikció. A sebesség, méretezhetőség és robusztusság jelentős tényezők a besorolási és előrejelzési módszerekben. Az osztályozás az új megfigyelés kategóriájának vagy osztálycímkéjének azonosításának folyamata, amelyhez tartozik. Az előrejelzés a hiányzó vagy nem elérhető numerikus adatok azonosításának folyamata egy új megfigyeléshez. Ez a különbség a besorolás és a predikció között.
1.Point, oktatóanyagok. “Adatbányászási osztályozás és előrejelzés”, oktatópontok, 2018. január 8. Elérhető itt
2. „Statisztikai besorolás”. Wikipedia, Wikimedia Alapítvány, 2018. március 6.. Itt érhető el
1. '2729773', a GDJ (Public Domain) által pixabay-n keresztül