A mély és a megerősítő tanulás egyaránt kapcsolódik a mesterséges intelligencia (AI) számítási teljesítményéhez. Ezek önálló gépi tanulási funkciók, amelyek előkészítik a számítógépek számára a saját elveik megteremtését a megoldások kidolgozásában. Ez a kétféle tanulás több programban is létezhet. A mély tanulás általában az aktuális adatokat használja, míg a megerősítéses tanulás a próba és hiba módszert használja az előrejelzések kiszámításához. A következő megbeszélések tovább foglalkoznak ilyen különbségekkel.
A mély tanulást mély strukturált tanulásnak vagy hierarchikus tanulásnak is nevezik. Ezt először 1986-ban Rina Dechter, informatikai professzor vezette be. A jelenlegi információkat felhasználja az algoritmusok oktatására vonatkozó releváns minták keresésére, amelyek nélkülözhetetlenek az adatok előrejelzésében. Ez a rendszer különböző szintű mesterséges ideghálózatokat használ, hasonlóan az emberi agy idegrendszeréhez. Komplex linkek segítségével az algoritmus képes több millió információ feldolgozására és zóna beépítésére egy konkrétabb előrejelzésnél.
Ez a fajta tanulás akkor alkalmazható, amikor a fejlesztők azt akarják, hogy egy szoftver észrevegye a színes ibolyát a különféle képeken. A programot ezután számos kép táplálja (tehát „mély” tanulás) lila színekkel és anélkül. Fürtözésen keresztül a program képes lesz azonosítani a mintákat és megtanulja, mikor kell színt lilaként megjelölni. A mély tanulást különféle felismerési programokban alkalmazzák, mint például a képanalízis és az előrejelzési feladatok, például az idősor-előrejelzések.
A megerősítő tanulás általában kiszámítja az előrejelzéseket próba és hiba útján. A madárinfluenza szempontjából története szempontjából az 1980-as évek végén fejlesztették ki; az állatokon végzett kísérletek eredményein, az optimális szabályozás fogalmain és az időbeli különbség módszerein alapult. A felügyelt és felügyelet nélküli tanulás mellett a megerősítés a gépi tanulás egyik alapvető paradigmája. Amint a neve is sugallja, az algoritmust jutalmakkal képzik.
Például, az AI-t úgy fejlesztették ki, hogy egy bizonyos mobil játékban emberekkel játsszon. Minden alkalommal, amikor az AI elveszik, az algoritmust felülvizsgálják annak pontszámának maximalizálása érdekében. Így egy ilyen technika megtanulja a hibáit. Számos ciklus után az AI fejlődött és jobbá vált az emberi szereplők verésében. A megerősítéses tanulást különféle csúcstechnológiákban alkalmazzák, mint például a robotika, a szövegbányászat és az egészségügy fejlesztése.
A mély tanulás képes a cél viselkedését végrehajtani a meglévő adatok elemzésével és a megtanult új információkba történő felhasználásával. Másrészt a megerősítéses tanulás megváltoztathatja válaszát a folyamatos visszajelzés adaptálásával.
A mély tanulás a már létező adatokkal működik, mivel elengedhetetlen az algoritmus képzéséhez. Ami az erősítő tanulást illeti, ez feltáró jellegű, és jelenlegi adatkészlet nélkül is fejleszthető, mivel próba és hiba útján tanul..
A mély tanulást a kép- és beszédfelismerés, a mély hálózati előképzés és a méretcsökkentési feladatok során alkalmazzák. Összehasonlításképpen: a megerősítéses tanulást a külső ingerekkel való optimális irányítással való kölcsönhatásban használják, például a robotikában, a lift ütemezésében, a telekommunikációban, a számítógépes játékokban és az egészségügyi AI-ben..
A mély tanulást hierarchikus tanulásnak vagy mély strukturált tanulásnak is nevezik, míg a megerősítő tanulásnak nincsenek más széles körben ismert kifejezések.
A mély tanulás egyike a számos gépi tanulási módszernek. Másrészt a megerősítéses tanulás a gépi tanulás területe; ez a három alapvető paradigma egyike.
A mély tanuláshoz képest a megerősítő tanulás közelebb áll az emberi agy képességeihez, mivel az ilyen intelligencia visszajelzéssel javítható. A mély tanulás elsősorban az elismerésre irányul, és kevésbé kapcsolódik az interakcióhoz.
A mélytanulást először Rina Dechter 1986-ban vezette be, miközben a megerősítő tanulást az 1980-as évek végén fejlesztették ki az állatokon végzett kísérletek, az optimális ellenőrzés és az időbeli különbség módszerei alapján.