Recurrent Neural Network • RNN • Ismétlődő neurális hálózat

Mi az ismétlődő neurális hálózat?

Az ismétlődő neurális hálózat (RNN) egyfajta neurális hálózat, amelyet adatszekvenciák kezelésére terveztek. Ellentétben a hagyományos neurális hálózattal, amely azt feltételezte, hogy minden bemenet független egymástól, az RNN képes fenntartani egyfajta „memóriát”, így kiválóan alkalmas olyan feladatokra, mint a nyelvi modellezés és a gépi fordítás.

Az RNN-ek általában egy sor rejtett rétegből készülnek, amelyek mindegyike neuronként ismert egységeket tartalmaz. Egy bemeneti szekvencia feldolgozása során az első rejtett réteg neuronjai külön-külön kapnak a bemenetből.

Ezután ezt az információt továbbítják a második rejtett réteg neuronjainak, és így tovább, amíg a végső kimenet meg nem készül. Ez a korábbi bemenetek felhasználásának képessége adja az RNN-ek teljesítményét. Az RNN betanítása azonban nehéz lehet az eltűnő gradiens probléma miatt. Ez akkor fordul elő, ha a gradiens jel túl gyenge lesz ahhoz, hogy visszaterjedjen a hálózaton, ami megnehezíti a hálózat számára a hibajelekből való tanulást.

Mindazonáltal a mély tanulás terén elért közelmúltbeli fejlemények azt mutatták, hogy az RNN-ek különféle feladatok során képesek a legkorszerűbb eredményeket produkálni.

Az ismétlődő neurális hálózat (RNN) a mesterséges neurális hálózat olyan típusa, ahol a csomópontok közötti kapcsolatok irányított gráfot alkotnak egy időbeli sorozat mentén. Ez lehetővé teszi, hogy időbeli dinamikus viselkedést mutasson.

Az előrecsatolt neurális hálózatokkal ellentétben az RNN-ek belső állapotukat (memóriájukat) használhatják a bemeneti szekvenciák feldolgozására. Így alkalmazhatók olyan feladatokra, mint a szegmentálatlan, összekapcsolt kézírás-felismerés vagy beszédfelismerés.

Az RNN-eket az 1980-as években hozták létre, és eredetileg konnekcionista időbeli osztályozási (CTC) modelleknek nevezték őket. Az első működő RNN-t Jürgen Schmidhuber tette közzé 1991-ben. Számos különböző típusú RNN-t hoztak létre, beleértve a hosszú rövid távú memória (LSTM) hálózatokat és a GRU hálózatokat. Az RNN-ek számos feladathoz használhatók, beleértve a gépi fordítást, a képfeliratozást és a szövegosztályozást.

Érdeklődés az idő múlásával visszatérő neurális hálózatok iránt.

ismétlődő neurális hálózat (RNN)

ELI5: Magyarázd el az ismétlődő neurális hálózatokat úgy, mintha egy 5 évesnek magyaráznád!

Képzelje el, hogy van egy speciális agya, az úgynevezett Recurrent Neural Network (RNN). Ez az agy különbözik a normál agytól, mert képes emlékezni a múltbeli dolgokra, és felhasználni ezeket az információkat arra, hogy megértse, mi történik most.

Tegyük fel, hogy építőkockákkal játszol, és van egy barátod, aki szeret veled játszani. Minden alkalommal, amikor új blokkot ad hozzá, a barátja elmondja a blokk színét. De itt van a klassz rész: a barátod azt is elmondja, hogy milyen színt adott a korábban hozzáadott blokknak!

Ezzel az információval a speciális agyad elkezdi megérteni a mintákat. Emlékszik a hozzáadott blokkok színeire, és meg tudja jósolni a következő blokk színét az előzőek alapján. Tehát, ha volt egy kék, majd egy piros blokk, az agya azt sejtheti, hogy a következő blokk sárga lesz, mert emlékszik arra, hogy a minta kék-piros-sárga volt.

Az RNN hasonlóan működik. Van egy memóriája, amely segít emlékezni a múlt információira. Egyesével veszi fel az adatokat, például a szavakat vagy a számokat, ugyanúgy, mint egyenként a blokkokat. És minden lépésben az aktuális bemenetet és a múltból emlékezett információkat használja fel arra, hogy előrejelzéseket készítsen vagy megértse az adatok jelentését.

Ez a fajta agy nagyon hasznos, ha olyan dolgokkal foglalkozik, amelyek idővel történnek, mint például egy mondat jelentésének megértése vagy a mondat következő szavának megjóslása. Hasznos lehet olyan feladatoknál is, mint például a nyelvek fordítása vagy a kézírás felismerése, mert képes megjegyezni a szövegkörnyezetet, és azt jobb előrejelzések készítésére használja.

Tehát, akárcsak Ön és barátja a blokkokkal játszva, az ismétlődő neurális hálózatnak is van egy speciális memóriája, amely segít megérteni a sorozatban megtörtént dolgokat, és a sorozat alapján előrejelzéseket készíteni.

Ezek Is Érdekes Cikkek…

Mi az a TensorFlow?

Mi az a TensorFlow?A TensorFlow egy nyílt forráskódú szoftverkönyvtár adatelemzéshez és gépi tanuláshoz. A Google...