10. fejezet - Nemellenőrzött tanulású hálózatok
A tanulással foglalkozó 2. fejezetben láttuk, hogy a nemellenőrzött tanulás (vagy felügyelet nélküli, tanító nélküli tanulás)legfontosabb jellemzője, hogy nem áll rendelkezésünkre kívánt válasz, a tanítás során nincs tanító. A kívánt válasz hiánya miatt a nemellenőrzött tanítású hálózatok konstrukciója és alkalmazási területei jelentősen különböznek az ellenőrzött tanítású hálóknál látottaktól. Mivel nincs kívánt válaszunk, meghatározott be-kimeneti leképezés megvalósítása nem lehet cél. További lényeges különbség, hogy a nemellenőrzött tanítású hálók jelentős része lineáris háló, tehát az alkalmazott processzáló elemek egyszerű súlyozott összegzést végeznek.
A nemellenőrzött tanítású hálók főbb alkalmazási területei:
-
a bemenetre kerülő minták közötti hasonlóság megállapítása,
-
a bemeneti mintatérben csoportok, klaszterek kialakítása,
-
adattömörítés, főkomponens analízis,
független komponensek meghatározása.
A hasonlóság megállapítása, ill. csoportok kialakítása egymáshoz szorosan kapcsolódó képességek. Ezen képességek teszik lehetővé, hogy a nemellenőrzött tanítású hálók is − legalább közvetve − alkalmazhatók osztályozási, felismerési feladatok megoldására. Szemben azonban az ellenőrzött tanítású hálókkal, itt nem ismerjük előre a megkülönböztetendő osztályok számát, tehát nemcsak a bemeneti minták adott osztályba sorolása a feladat, hanem maguknak az osztályoknak a kialakítása is. Valójában tehát nem is osztályozási, hanem klaszterezési feladatot oldunk meg. Ezzel kapcsolatban két alapvető feltételezést kell tennünk; az első, hogy egy klasztert tágabb értelemben úgy definiálunk, mint azon minták összességét, amelyek hasonló jellemzőkkel rendelkeznek, a másik, hogy a hálózat képes kell legyen a teljes bemeneti mintakészlet hasonló jellemzőinek azonosítására. A klaszterezésre alkalmas nemellenőrzött tanítású hálók tipikus példája a Kohonen háló.
Az adattömörítés során az adatok olyan reprezentációját keressük, amely lehetővé teszi, hogy adatainkat kevesebb paraméterrel írjuk le, vagyis az adattömörítés azt jelenti, hogy a többdimenziós adatok egy (esetenként sokkal) kisebb dimenziós térben is reprezentálhatók. Ennek során azt is megengedjük, hogy az új reprezentáció csak közelítőleg írja le az adatokat, tehát az ábrázolás során valamekkora hibát is megengedünk. Az új reprezentációra való áttérés az adatok valamilyen transzformációját igényli. A főkomponens analízis (principal component analysis, PCA) hálózatok olyan − általában lineáris − transzformációt végeznek, amely lehetővé teszi, hogy közelítő ábrázolásnál a tömörített leírás hibája átlagos négyzetes értelemben minimális legyen.
Adattömörítést azonban nemcsak a PCA hálózatok végeznek, hiszen a klaszterek kialakítása szintén felfogható adattömörítésnek. Ekkor ugyanis egy adott klaszterbe tartozó összes adat a klaszter azonosításával megadható. Minthogy egy klaszter általában több adatot tartalmaz, az ezek közötti megkülönböztetésre a klaszter-azonosító nem képes, ez a reprezentáció is információvesztéssel, hibával jár.
A független komponens analízis (independent component analysis, ICA) komplex jelek összetevőkre történő bontására szolgál. A független komponens analízis során olyan összetevőket keresünk, melyek egy adott feladat szempontjából önálló jelentéssel rendelkezhetnek, de amelyeket közvetlenül nem tudunk megfigyelni.
A felügyelet nélküli tanulás a tanulás egyik leginkább elemi formája; olyan adatelemzés, amikor azt próbáljuk felderíteni, hogy az adataink egyáltalán hordoznak-e valamilyen információt. Ha igen, akkor azt valamilyen módon meg akarjuk „ragadni”, az adatokból ki akarjuk nyerni. Ezért a nemellenőrzött tanulást egyfajta adatbányászatnak is tekinthetjük.
A fejezet célja, hogy összefoglalja a felügyelet nélküli tanulási eljárások főbb jellemzőit, valamint azokat a hálóarchitektúrákat, melyek fontos gyakorlati feladatok megoldását teszik lehetővé. A nemellenőrzött tanuló eljárások többsége a Hebb szabályon alapul. A Hebb szabály alapú tanulásegyes hálózatoknál kiegészül a versengő tanulással, ezért elsőként e két tanulási szabállyal foglalkozunk.