2.2. Nemellenőrzőtt tanulás

Ellenőrzött tanulásnála tanuló eljárás céljának megfogalmazása természetes módon adódott: a tanulással olyan rendszert kívántunk kialakítani, amely valamilyen előre meghatározott viselkedést mutat, vagy egy ilyen viselkedést legalább közelít. Mindezt felcímkézett tanítópontok alapján tettük, ahol a címke a bemenethez tartozó kívánt válasz volt.

Nemellenőrzött tanításnál címkézetlen tanítópontjaink vannak, így egy előírt viselkedés megtanulása fel sem merül. A hálózatnak a bemenetei és a kimenetei alapján, de kívánt válaszok ismerete nélkül kell valamilyen viselkedést kialakítania; a környezetből azonban nincs közvetlen visszajelzés, ami a hálózat viselkedésének a helyességére utalna. Azt a kérdést kell tehát feltennünk, hogy ilyen esetben lehet-e egyáltalán értelmes célt megfogalmazni, amit tanulással, a mintákban meglévő ismeret kinyerésével érhetünk el. Mivel csak a címkézetlen minták állnak rendelkezésünkre, mást nem tehetünk, minthogy a mintákat elemezzük. Azt vizsgáljuk, hogy a mintáink mennyiben hasonlítanak egymáshoz, vagy milyen mértékben különböznek egymástól; a mintapontok terében vannak-e olyan tartományok, ahol a mintáink sűrűsödnek, lehet-e a mintatérben csoportokat, klasztereket találni, stb.

A nemellenőrzött tanulás a mintákból való tanulásnak talán még az ellenőrzött tanulásnál is elemibb formája; olyan adatelemzés, amikor azt próbáljuk felderíteni, hogy az adataink egyáltalán hordoznak-e valamilyen információt. Ha igen, akkor azt valamilyen módon meg akarjuk „ragadni”, az adatokból ki akarjuk nyerni. Azt is mondhatjuk, hogy a nemellenőrzött tanulás egyfajta adatbányászat.

Tipikus nemellenőrzött tanulási feladat a sűrűségfüggvénybecslés vagy a klaszterezés. Nemellenőrzött tanulási feladatként megfogalmazható az is, hogy sokdimenziós adattérben vannak-e kitüntetett „irányok”, melyek az adatok reprezentálásánál elsődlegesen fontosak, míg más irányok szerepe kisebb, esetleg elhanyagolható. Az ilyen típusú feladatok az adatok hatékony közelítő reprezentációjára is irányulhatnak.

A nemellenőrzött tanulási eljárásokat sokszor adatelőkészítésre, az adatok előfeldolgozására használjuk, mielőtt egy ellenőrzött tanulással megoldható feladatot oldanánk meg. Ilyenkor a nemellenőrzött tanulás bizonyos, a későbbi feldolgozást elősegítő lényeges információ kiemelésére, lényegkiemelésre, jellemzőkinyerésre (feature extraction) szolgál.

Számos esetben a nemellenőrzött tanulási eljárásoknál is megfogalmazhatók kritériumfüggvények, így a nemellenőrzött tanulás is interpretálható olyan feladatként − pl. szélsőérték-keresési feladatként −, ahol valamilyen kritérium kielégítése a cél. Nemellenőrzött tanulásnál az alkalmazott kritériumfüggvények leggyakrabban az adatok eloszlásával, az adatok egymáshoz viszonyított elhelyezkedésével, az adatkomponensek közötti korrelációval kapcsolatosak, de itt is megfogalmazhatók négyzetes kritériumfüggvények. Ilyen eset például, ha az adatok hatékony, átlagos négyzetes értelemben vett közelítő reprezentációja a cél.

A nemellenőrzött tanulásnál a kritériumfüggvények sokszor információelméleti fogalmakhoz kapcsolódnak. Így kritériumként szerepelhet az entrópia (olyan adatreprezentációt keresünk, ahol az entrópia valamilyen extremális értéket vesz fel), a kölcsönös információ (az adatok statisztikai függetlenségét szeretnénk biztosítani) vagy a Kullback-Leibler divergencia (olyan tanuló eljárásnál, ahol két sűrűségfüggvény hasonlósága alapján történik a tanulás).

Számos, a nemellenőrzött tanulású hálóknál alkalmazott kritériumfüggvényt az egyes hálók tárgyalásánál (10. fejezet) fogunk bemutatni.

Mesterséges Intelligencia Elektronikus Almanach

Elsődleges linkek

2.2. Nemellenőrzőtt tanulás