A felügyelt tanulás és a felügyelet nélküli tanulás a gépi tanulás két alapfogalma. A felügyelt tanulás egy olyan gépi tanulási feladat, amelynek célja egy olyan funkció megtanulása, amely a bemenetet egy kimenethez rendeli a példa bemeneti-kimeneti párok alapján. A felügyelet nélküli tanulás az a gépi tanulási feladat, amely arra következtet, hogy a rejtett szerkezetet jelöletlen adatok alapján leírja a függvény. Az kulcs különbség a felügyelt és nem felügyelt gépi tanulás között ez a felügyelt tanulás jelölt adatokat használ, míg a felügyelet nélküli tanulás nem jelölt adatokat használ.
A gépi tanulás egy olyan terület a számítástechnikában, amely lehetővé teszi a számítógépes rendszer számára, hogy kifejezetten programozva legyen az adatokból. Ez lehetővé teszi az adatok elemzését és a minták előrejelzését. A gépi tanulásnak számos alkalmazása van. Néhány ezek közül az arcfelismerés, a gesztusfelismerés és a beszédfelismerés. Különböző algoritmusok léteznek a gépi tanulással kapcsolatban. Néhány ezek közül a regresszió, osztályozás és csoportosulás. A gépi tanuláson alapuló alkalmazások fejlesztésének leggyakoribb programozási nyelvei az R és a Python. Más nyelvek, például Java, C ++ és Matlab szintén használhatók.
1. Áttekintés és a legfontosabb különbség
2. Mi a felügyelt tanulás?
3. Mi a felügyelet nélküli tanulás?
4. A felügyelt és a felügyelet nélküli gépi tanulás hasonlóságai
5. Összehasonlítás egymással - felügyelt vs nem felügyelt gépi tanulás táblázatos formában
6. Összegzés
Gépi tanuláson alapuló rendszerekben a modell algoritmus szerint működik. A felügyelt tanulás során a modell felügyelete alatt áll. Először a modell képzéséhez van szükség. A megszerzett ismeretekkel meg tudja jósolni a válaszokat a jövőbeli példányokra. A modell képzése egy címkézett adatkészlettel történik. Ha a mintához nem tartozó adatokat ad a rendszernek, akkor meg tudja jósolni az eredményt. Az alábbiakban egy kis kivonatot találtunk a népszerű IRIS adatkészletből.
A fenti táblázat szerint a Sepal hosszt, a Sepal szélességet, a Patel hosszt, a Patel szélességet és a fajokat attribútumoknak nevezzük. Az oszlopok jellemzőkként ismertek. Az egyik sor az összes attribútum adatait tartalmazza. Ezért egy sort megfigyelésnek hívunk. Az adatok lehetnek numerikusak vagy kategorikusak. A modell megfigyeléseit a megfelelő fajnévvel kell megadni. Új megfigyelés esetén a modellnek meg kell jósolnia a faj típusát, amelyhez tartozik.
A felügyelt tanulásban vannak osztályozási és regressziós algoritmusok. Az osztályozás a címkézett adatok osztályozásának folyamata. A modell határokat hozott létre, amelyek elválasztják az adatkategóriákat. Amikor új adatokat szolgáltatnak a modellnek, akkor kategorizálható annak alapján, hogy hol van a pont. A K-Legközelebbi Szomszédok (KNN) egy osztályozási modell. A k értéktől függően döntenek a kategóriáról. Például, ha k értéke 5, ha egy adott adatpont közel van az A kategóriába tartozó nyolc adatponthoz és a B kategóriába hat adatponthoz, akkor az adatpontot A kategóriába sorolják.
A regresszió a korábbi adatok tendenciájának előrejelzése az új adatok kimenetelének előrejelzésére. Regresszióban a kimenet egy vagy több folyamatos változóból állhat. Az előrejelzés egy sor segítségével történik, amely a legtöbb adatpontot lefedi. A legegyszerűbb regressziós modell egy lineáris regresszió. Gyors és nem igényel olyan paramétereket, mint például a KNN. Ha az adatok parabolikus tendenciát mutatnak, akkor a lineáris regressziós modell nem megfelelő.
Ez néhány példa a felügyelt tanulási algoritmusokra. Általában véve a felügyelt tanulási módszerek eredményei pontosabbak és megbízhatóbbak, mivel a bemeneti adatok jól ismertek és címkézve vannak. Ezért a gépnek csak a rejtett mintákat kell elemeznie.
Felügyelet nélküli tanulás esetén a modellt nem felügyelik. A modell önmagában dolgozik az eredmények előrejelzésekor. Gépi tanulási algoritmusokat használ a következtetés levonására a fel nem jelölt adatokról. Általában a nem felügyelt tanulási algoritmusok nehezebbek, mint a felügyelt tanulási algoritmusok, mivel kevés információ van. A klaszterezés a felügyelet nélküli tanulás egyik típusa. Használható az ismeretlen adatok algoritmusok segítségével történő csoportosítására. A k-átlag és a sűrűség-alapú csoportosítás két klaszterezési algoritmus.
k-közép algoritmus, a k centridot véletlenszerűen helyezi el az egyes fürtökre. Ezután minden adatpontot hozzá kell rendelni a legközelebbi központhoz. Az euklideszi távolságot kiszámítják az adatpont és a centrid közötti távolságot. Az adatpontok csoportokba vannak besorolva. A k-centrid pozícióit újra kiszámítják. Az új centroid pozíciót a csoport összes pontjának átlaga határozza meg. Mindegyik adatpontot a legközelebbi központhoz rendelik. Ez a folyamat addig ismétlődik, amíg a centridok már nem változnak. A k-mean egy gyors fürtözési algoritmus, de a fürtözési pontok nincs megadva. Ezenkívül a klasztermodellek nagy különbségeket mutatnak a klaszterpontok inicializálása alapján.
Egy másik klaszterezési algoritmus Sűrűség alapú klaszterezés. Sűrűség alapú, zajszintű térbeli csoportosítási alkalmazásokként is ismertek. Úgy működik, hogy egy klasztert a sűrűséghez kapcsolt pontok maximális halmazaként határoz meg. Két paraméter a sűrűség alapú klaszterezéshez. Ezek Ɛ (epsilon) és minimális pontok. A the a környék legnagyobb sugara. A minimális pontok a fürt meghatározásához szükséges minimális pontszám a to környéken. Ez néhány példa a klaszterezésre, amely a felügyelet nélküli tanulásba esik.
Általában a felügyelet nélküli tanulási algoritmusok eredményei nem sokkal pontosak és megbízhatóak, mivel a gépnek meg kell határoznia és meg kell jelölnie a bemeneti adatokat, mielőtt meghatározná a rejtett mintákat és funkciókat..
Felügyelt vagy nem felügyelt gépi tanulás | |
A felügyelt tanulás olyan gépi tanulási feladat, amely olyan funkció megtanulását célozza meg, amely egy bemenetet egy kimenetre sorol be példaként a bemeneti-kimeneti párok alapján. | A felügyelet nélküli tanulás az a gépi tanulási feladat, amely arra következtet, hogy egy függvény leírja a rejtett struktúrát a jelöletlen adatokból. |
Fő funkciók | |
A felügyelt tanulás során a modell a jelölt bemeneti adatok alapján megjósolja az eredményt. | Felügyelet nélküli tanulás során a modell előrejelzi az eredményt címkézett adatok nélkül, önmagában azonosítva a mintákat. |
Az eredmények pontossága | |
A felügyelt tanulási módszerek eredményei pontosabbak és megbízhatóbbak. | A nem felügyelt tanulási módszerek eredményei nem sokkal pontosak és megbízhatóak. |
Fő algoritmusok | |
A felügyelt tanulás regressziójára és osztályozására algoritmusok léteznek. | Vannak algoritmusok a klaszterezésre a felügyelet nélküli tanulásban. |
A felügyelt tanulás és a felügyelet nélküli tanulás a gépi tanulás két típusa. A felügyelt tanulás olyan gépi tanulási feladat, amely olyan funkció megtanulását célozza meg, amely egy bemenetet egy kimenetre sorol be példaként a bemeneti-kimeneti párok alapján. A felügyelet nélküli tanulás az a gépi tanulási feladat, amely arra következtet, hogy egy függvény leírja a rejtett struktúrát a jelöletlen adatokból. A felügyelt és nem felügyelt gépi tanulás közötti különbség az, hogy a felügyelt tanulás címkézett adatokat használ, míg a felügyelet nélküli hajlás nem címkézett adatokat használ..
1.TheBigDataUniversity. Gépi tanulás - Felügyelt VS felügyelet nélküli tanulás, kognitív osztály, 2017. március 13. Elérhető itt
2. „Felügyelet nélküli tanulás”. Wikipedia, Wikimedia Alapítvány, 2018. március 20.. Itt érhető el
3. „Felügyelt tanulás”. Wikipedia, Wikimedia Alapítvány, 2018. március 15. Itt érhető el
1. '2729781', a GDJ (Public Domain) által pixabay-n keresztül