Bevezetés a neurális hálózatok világába 1. rész

Az utóbbi években a mesterséges intelligencia szinte mindenhol ott van: felismeri az arcunkat a telefon kamerájában, lefordítja a szövegeket idegen nyelvekről, sőt, képes képeket rajzolni és történeteket írni. Ezeknek a látványos fejlesztéseknek az egyik motorja a neurális hálózat.

De mi az a neurális hálózat valójában? És mi köze van az agyunkhoz?

Egy kis analógia

Képzeljünk el egy apró döntéshozót: egy „neuron” egyetlen bemenetet figyel (pl. hőmérséklet), és egy egyszerű szabály alapján eldönti, hogy „igen” vagy „nem” választ adjon. Ha sok ilyen apró döntéshozót összekapcsolunk, akkor képesek lesznek együtt bonyolultabb problémákat megoldani. Ez az alapgondolat áll a mesterséges neurális hálózatok mögött.

Mi az a mesterséges neuron?

A mesterséges neuron az emberi agy idegsejtjeinek (neuronjainak) leegyszerűsített matematikai modellje.

A biológiai neuron bemeneteket kap más sejtektől, feldolgozza az információt, majd eldönti, továbbadja-e a jelet.

Hasonlóképp, egy mesterséges neuron is:

több bemeneti értéket kap,
ezeket megszorozza súlyokkal, amelyek meghatározzák, mennyire fontos az adott bemenet,
hozzáad egy bias értéket, ami egyfajta „alapbeállítás” vagy eltolás,
majd az eredményt egy aktivációs függvény segítségével átalakítja, és tovább küldi a következő neuronoknak.

Röviden: a súlyok mondják meg, hogy mit mennyire vegyen komolyan a neuron, a bias pedig segít finomhangolni a döntést.

Miért fontosak a neurális hálózatok?

Képfelismerés: amikor a Facebook automatikusan megjelöli, ki van a képen.
Fordítás: amikor a Google Translate egész mondatokat fordít le, nem csak szavakat.
Beszélgető robotok (chatbotok): amikor egy weboldalon megjelenik egy virtuális ügyfélszolgálati asszisztens.

Mindezt azért tudják, mert a neurális hálózatok rendkívül jók abban, hogy mintákat ismerjenek fel adatokban.

Miről lesz szó a sorozatban?

Ebben a cikksorozatban lépésről lépésre megpróbálom bemutatni:

Mi az a mesterséges neuron, és hogyan írhatjuk le Pythonban.
Hogyan épül fel egy egyszerű hálózat több neuronból.
Mit jelent a veszteségfüggvény, és miért fontos.
Hogyan tanul egy hálózat? (backpropagation)
Hogyan használjuk őket valós problémákra.

A cikkekben törekszem a közérthető fogalmazásra, megpróbálom kerülni a nagyon száraz, technikai szöveget és a bonyolult matematikai formulákat. A működés mögötti matematikáról csak annyit fogok írni, amennyi a megértéshez feltétlenül szükséges.

A sorozatban az alapoktól kezdve le fogok programozni egy egyszerű neurális hálózatot annak minden funkciójával. Erre a Python nyelvet fogom használni.

Felmerülhet a kérdés, hogy mi értelme van nulláról leprogramozni egy neurális hálózatot, amikor használatra kész keretrendszerek vannak, ahol pár soros programmal bármilyen hálózat összeállítható? Nos, szerintem azért, mert izgalmas egy kicsit benézni a „kulisszák mögé” és megérteni, hogyan működnek a dolgok. És mert jó mulatság!

Következő rész

A következő cikkben közelebbről is megnézzük, hogyan működik pontosan egy mesterséges neuron, és elkészítjük az első Python-kódot, ami a gyakorlatban is bemutatja ezt.