12. fejezet - Hibrid-neurális rendszerek

Láttuk, hogy a neurális hálózatok olyan rendszerek, melyek tudásukat, képességüket mintákból történő tanulással nyerik. A neurális hálózatok kialakításánál ezért alapvető fontosságú, hogy egy megoldandó problémáról megfelelő mennyiségű és minőségű ismeret adatok (mintapontok) formájában álljon rendelkezésünkre. Egy konkrét feladat kapcsán azonban a mintapontokon kívül szinte mindig van további ismeretünk is a megoldandó feladatról. Az a priori ismeret felhasználása alapvetően fontos a feladat megoldása szempontjából. Az a priori ismeret segít a megfelelő hálóstruktúra meghatározásában, de döntő szerepe lehet a megfelelő tanítókészlet, a tanító adatbázis kialakításánál is. Ennek alapján dönthetjük el, hogy egy feladatról mely rendelkezésre álló vagy megszerezhető jellemzők, mérési adatok alapján célszerű a neuronhálót megkonstruálni.

Az a priori ismeret a mintapontok által reprezentált leképezésről is adhat járulékos információt. Mint láttuk, a mintákból való tanulás rosszul definiált feladat, így bármilyen, a mintákon túl rendelkezésre álló ismeret felhasználása jobb megoldás elérését segítheti. Különösen fontos az a priori információ felhasználása, ha viszonylag kevés mintapont áll a rendelkezésünkre, valamint ha a mintapontok bizonytalan tudást képviselnek − pl. a mintapontokat jelentős zaj terheli −, vagy ha a mintapontok nem kellően fedik le a problémateret.

A járulékos ismeret különböző formában állhat rendelkezésünkre. Így birtokában lehetünk a megoldandó problémára vonatkozó bizonyos matematikai összefüggéseknek, vagy ismerhetünk a bemeneti és a kimeneti adatok kapcsolatát jellemző bizonyos szabályokat stb. Ilyen a priori ismeret lehet pl. hogy egy regressziós problémánál a bemenetek és a kimenetek között monoton kapcsolatnak kell fennállnia, esetleg tudunk valamit a bemenetek és a kimenetek közötti kapcsolat trendjéről, vagy ismerünk valamit a leképezés komplexitásáról vagy simaságáról. Hasonlóan, egy osztályozós feladatnál rendelkezésünkre állhat olyan a priori ismeret, hogy a minták bizonyos transzformációira (pl. eltolás, forgatás, tükrözés, esetleg adott korlátok közötti nagyítás, kicsinyítés stb.) az osztályozásnak invariánsnak kell lennie. Olyan a priori ismeretünk is lehet, amely korlátozza, hogy milyen tartományban vehetnek fel értékeket az együttesen előforduló bemeneti és/vagy kimeneti adatok.

A neuronhálók egyik „hiányossága” – legyen a háló bármilyen típusú is –, hogy közvetlenül csak mintapontok formájában meglévő ismereteket tudnak hasznosítani. Olyan módszerekre van tehát szükségünk, melyek lehetővé teszik más reprezentációjú tudás felhasználását is. Ez két úton érhető el: vagy lehetőségünk van arra, hogy a járulékos ismeretet közvetlenül felhasználjuk a neuronhálók konstrukciójában, vagy közvetve hasznosítjuk azáltal, hogy a meglévő minták kiegészítésére további, „virtuális” mintákat generálunk.

A közvetlen felhasználásnál a járulékos tudás hozzásegíthet a megfelelő háló architektúra, esetleg a háló méret minél pontosabb megválasztásához, vagy elősegítheti a háló-paraméterek kezdeti értékeinek jobb meghatározását, nagyságrendekkel megkönnyítve ezzel a megfelelő neuronhálós megoldás elérését. Egyes esetekben a megvalósítandó leképezésre vonatkozó formális összefüggések közvetlenül a tanuló eljárásba építhetők be.

A közvetett felhasználásnál a meglévő mintákból a járulékos információk felhasználásával generálunk további mintákat, melyek a megoldandó feladatot a problématér olyan tartományain is reprezentálni fogják, melyekre az eredetileg rendelkezésünkre álló minták nem adnak információt.

A neuronhálók másik „hiányossága”, hogy ugyan a mintapontokból kinyerik a tudást, és így egy feladatot akár kiválóan meg is tudnak oldani, a megoldás értelmezésében nem segítenek. A neuronháló alapjában véve egy fekete doboz, ami a minták által képviselt kapcsolatokat közelíti, és bármilyen jó választ is ad egy bemenetre, a válaszhoz nem nyújt indoklást. Ez a hiányossága számos alkalmazási területen nehezíti vagy akár meg is gátolja a felhasználást. Egy orvosi diagnosztikai vagy döntéstámogató rendszerben például hiába ad egy neuronháló adott bemenetekre (tünetek) jó választ (diagnózis), indoklás, magyarázat nélkül nehéz elfogadni a háló válaszát. A hálóknak ez a hiányossága egyes, pl. biztonságkritikus alkalmazásoknál jelentős hátrány más tanuló rendszerekkel (pl. döntési fák) szemben.

Fontos ezért, hogy a neuronhálók képesek legyenek különböző reprezentációjú ismeret hasznosítására, a hálók konstrukciójánál ne csak a mintapontokat tudjuk felhasználni, továbbá, hogy egy megtanított hálóban „meglévő” tudás szimbolikus formában is kinyerhető legyen és, ezáltal a válaszokhoz magyarázatot is tudjunk rendelni.

Az olyan rendszerek, melyek a minták által képviselt ismeret mellett más reprezentációjú tudást is képesek felhasználni, kezelni, illetve melyekből a tudás szimbolikus formában is kinyerhető a hibrid-neurális rendszerek (hybrid-neural systems) [Wer00]. A hibrid-neurális rendszerek a hibrid intelligens rendszerek nagyobb családjához tartoznak. Hibrid intelligens rendszereknek nevezzük azokat a rendszereket, melyek a mesterséges intelligencia különféle eszközeit, megközelítéseit együttesen alkalmazzák. Hibrid intelligens eszközöknek szokás nevezni a lágy számítástechnika (soft computing) különböző (fuzzy, neurális, genetikus) megközelítéseit együttesen alkalmazó eszközöket is. A hibrid-neurális rendszerekben a neuronhálók szerepe meghatározó, de nem kizárólagos. Ezek a rendszerek tehát a megfelelő képességüket döntően továbbra is mintapontokból tanulás útján nyerik, de konstrukciójukban a járulékos a priori információ is jelentős szerepet kap. Azt is mondhatjuk, hogy egyes hibrid-neurális rendszerek a különböző ismeret-reprezentációk közötti konverzióra is képesek.

A következőkben a hibrid-neurális rendszerekhez tartozó két főbb területtel foglalkozunk röviden. Az első területen belül előbb az a priori információ virtuális minták generálásán keresztül történő felhasználásának fontosabb kérdéseit tekintjük át, majd arra adunk példát, hogy a járulékos információ hogyan építhető be magába a tanító eljárásba. A második terület a minták alapján történő tanuló rendszerek és a magyarázat alapú rendszerek ötvözésének egy viszonylag kiforrott eredményével foglalkozik. A tudás alapú neuronháló (knowledge based artificial neural network, KBANN) a megoldandó problémáról szabályok formájában rendelkezésünkre álló tudást a kiinduló neuronháló (MLP) létrehozásához használja fel, majd az így kialakított háló módosítása, pontosítása történik meg a hagyományoshoz hasonló tanuló eljárás során. A KBANN fontos jellemzője, hogy nemcsak lehetőséget ad szimbolikus formában meglévő ismeretek felhasználására, hanem azt is biztosítja, hogy a megtanított végleges hálóból szabályok formájában kinyerjük a tudást. Az a priori információ egy további hasznosítási lehetőségével, nevezetesen azzal, hogy a rendelkezésre álló jellemzők, megfigyelések közül milyen szempontok alapján válasszuk ki a neurális megoldás létrehozásánál felhasználandókat, a következő, 13. fejezetben fogunk kitérni.