2.2. Jó viselkedés: a racionalitás koncepciója

Egy racionális ágens (rational agent) olyan, amely helyesen cselekszik – elméletileg megfogalmazva az ágensfüggvény táblázatában minden bejegyzés helyesen van kitöltve. Helyesen cselekedni nyilvánvalóan jobb, mint helytelenül, de mit is jelent helyesen cselekedni? Első közelítésben azt mondjuk, hogy a helyes cselekedet az, amely az ágenst a legsikeresebbé teszi. Tehát szükségünk lesz egy módszerre, amivel a sikeresség mérhető. A környezetnek, valamint az ágens érzékelőinek és beavatkozóinak leírásával együtt ez az ágens feladatát teljes mértékben specifikálja. Ezáltal precízebben definiálhatjuk, mit is jelent racionálisnak lenni.

2.2.1. Teljesítménymértékek

A teljesítménymérték (performance measure) testesíti meg az ágens sikerességének kritériumát. Ha egy ágenst elhelyezünk a környezetében, akkor cselekvések sorozatával válaszol az érzékeléseire. A cselekvések sorozatának hatására a környezet állapotok sorozatán halad végig. Ha ez a sorozat kívánatos, akkor az ágens jól teljesített. Nyilvánvalóan nincs egyetlen olyan rögzített mérték, amely minden ágens számára megfelelő lenne. Megkérdezhetjük az ágens szubjektív véleményét, hogy mennyire érzi magát elégedettnek a saját teljesítményével, de egyes ágensek képtelenek lesznek válaszolni, míg mások becsapják magukat.[20] Ezért valamilyen objektív teljesítménymértékhez fogunk ragaszkodni, tipikusan egy olyanhoz, amit az ágens tervezője határozott meg.

Fontos

Példaként tekintsünk az előző részben megismert porszívó ágenst. Teljesítménymértékként javasolhatjuk az egy nyolcórás műszakban feltakarított por mennyiségét. Egy racionális ágenssel, természetesen, az ember azt kapja, amit kér. Azaz a racionális ágens azzal maximalizálhatja ezt a teljesítménymértéket, hogy feltakarítás után kiönti a szemetet, majd újra feltakarítja és így tovább. Egy finomított mérték a tiszta padló elérését díjazná. Például minden tiszta négyzet egy pontot érhet minden időlépésben (talán valamilyen levonással figyelembe véve az elfogyasztott elektromos energiát, illetve a keltett zaj mennyiségét is). Általános szabályként megfogalmazható, hogy a teljesítménymértéket jobb aszerint megállapítani, hogy mit akarunk elérni a környezetben, mint aszerint, hogy miképp kellene az ágensnek viselkednie.

A teljesítménymérték kiválasztása nem mindig könnyű. Például a „tiszta padló” előző paragrafusbeli fogalma a tisztaság időátlagán alapul. Még ugyanaz az átlagos tisztaság is elérhető két különböző ágenssel, az egyik közepes aktivitással dolgozik állandóan, míg a másik energikusan rövid ideig, aztán hosszú szüneteket tart. Hogy melyik a javasolt módszer, az látszólag a házvezetés tudományának kérdése, valójában egy mély filozófiai kérdés, messzibe mutató következményekkel. Mi a jobb: a túlzások vakmerő világa vagy a biztonságos, de unalmas létezés? Mi a jobb: egy gazdaság, ahol mindenki egyformán mérsékelten szegény, vagy egy másik, ahol vannak nagyon gazdagok és nagyon szegények? Ezen kérdések megválaszolását házi feladatként bízzuk a szorgalmas olvasóra.

2.2.2. Racionalitás

Négy dolgon múlik az, hogy egy adott pillanatban mi racionális. Ezek:

  • A siker fokát mérő teljesítménymérték.

  • Az ágens eddigi tudása a környezetről.

  • A cselekvések, amiket az ágens képes végrehajtani.

  • Az ágens érzékelési sorozata az adott pillanatig.

Fontos

Ez elvezet a racionális ágens (rational agent) definíciójához:

Az ideális racionális ágens minden egyes észlelési sorozathoz a benne található tények és a beépített tudása alapján minden elvárható dolgot megtesz a teljesítménymérték maximalizálásáért.

Vizsgáljuk meg az egyszerű porszívóágenst, amelyik megtisztítja a négyzetet, ha az koszos, és átmegy a szomszédos négyzetbe, ha nem az! Az ágensfüggvényt táblázatosan a 2.3. ábra adja meg. Ez egy racionális ágens? Attól függ! Először is, meg kell mondanunk mi a teljesítménymérték, mit tudunk a környezetről, és milyen érzékelői és beavatkozói vannak az ágensnek. Tegyük fel a következőket:

  • A teljesítménymérték egy ponttal jutalmaz minden tiszta négyzetet minden időpillanatban egy 1000 időpillanatból álló „élettartam” alatt.

  • A környezet „geográfiája” a priori ismert (2.2. ábra), de a piszok eloszlása és az ágens kezdeti pozíciója nem. A tiszta négyzetek tiszták maradnak, a felszívás pedig megtisztítja az aktuális négyzetet. A Balra és Jobbra cselekvések balra és jobbra mozgatják az ágenst, kivéve ha ezzel kikerülne a környezetből, mely esetben az ágens nem mozdul.

  • A következő cselekvések léteznek: Balra, Jobbra, Szív és Semmittevés (azaz nem tesz semmit sem).

  • Az ágens helyesen észleli jelenlegi helyzetét és azt, hogy van-e ott kosz.

Azt állítjuk, hogy ezen feltételek mellett az ágens igenis racionális: a várható teljesítménye legalább annyira jó, mint bármely más ágensé. A 2.4. feladatban azt kérjük majd, hogy ezt az állítást bizonyítsa be.

Könnyen belátható, hogy ugyanez az ágens más körülmények között irracionális lenne. Például ha minden koszt feltakarított, akkor szükségtelenül oszcillálni fog ide-oda; ha a teljesítménymérték tartalmaz egy büntetőpontot minden balra vagy jobbra történő mozgásért, akkor az ágens egészen gyengén teljesít. Egy jobb ágens abban az esetben, ha meggyőződött arról, hogy az összes négyzet tiszta, nem csinálna semmit. Ha a tiszta négyzetek ismét koszossá válhatnak, az ágensnek időnként ellenőriznie kellene őket, és kitakarítania, ha szükséges. Ha a környezet geográfiája ismeretlen, az ágensnek fel kell térképeznie ahelyett, hogy az A és B négyzetekhez köti magát. A 2.4. feladatban azt kérjük majd, hogy tervezzen ezekre az esetekre ágenseket.

2.2.3. Mindentudás, tanulás és autonómia

Ügyelnünk kell a racionalitás és a mindentudás (omniscience) különválasztására. Egy mindentudó ágens tudja cselekedetei valódi kimenetelét, és ennek megfelelően cselekedhet, de a gyakorlatban a mindentudás lehetetlen. Vegyük a következő példát: egy nap a Nagykörúton sétálok és egy régi barátomat látom az út túloldalán közeledni. Az úton nincs forgalom, és ráérek, így – racionális lévén – elindulok a másik oldalra. Mindeközben 5000 kilométer magasan egy utasszállító repülőgép raktárajtaja leesik,[21] és mielőtt még átérnék az út túloldalára, rám esik és kilapít. Irracionális voltam, amikor át akartam kelni az úton? Valószínűtlen, hogy a gyászjelentésem így fog szólni: „egy idióta megpróbált keresztülmenni az utcán”.

Ez a példa azt mutatja, hogy a racionalitás nem azonos a tökéletességgel. A racionalitás az elvárt teljesítményt maximalizálja, míg a tökéletesség a tényleges teljesítményt. Az, hogy elállunk az ágensekkel szemben támasztott tökéletesség követelményétől, nem csak a velük szembeni méltányosság kérdése. Az a helyzet, hogy ha azt a cselekvést várjuk el egy ágenstől, ami a megtörténte után a legjobbnak bizonyul, akkor lehetetlen lesz egy ilyen ágens megalkotása – hacsak nem javítjuk a kristálygömbök vagy az időgépek teljesítményét.

Ezek alapján a racionalitás definíciónk nem követel mindentudást, hiszen a racionális választás csak az adott pillanatig felépített érzékelési sorozattól függ. Azt is biztosítanunk kell, hogy tudtunk nélkül se engedjük meg az ágensnek, hogy tudatosan unintelligens cselekvésbe kezdjen. Például ha egy ágens nem néz körül mindkét irányban, mielőtt egy forgalmas utat keresztez, akkor az érzékelési sorozata nem fogja neki megmondani, hogy egy hatalmas kamion közeledik nagy sebességgel. Azt mondja-e a racionalitás definíciónk, hogy ebben az esetben rendben átkelhet az úton? Egyáltalán nem! Először is, az útkeresztezés nem lenne racionális ezen információszegény észlelési sorozat mellett: az átkelés szétnézés nélkül túlságosan rizikós. Másodszor, egy ideális racionális ágensnek a „szétnézés” cselekvést kellene választania az útra lépés előtt, mivel ez segíti a teljesítmény maximalizálásában. A hasznos információk beszerzése érdekében véghezvitt – általában információgyűjtésnek (information gathering) hívott – cselekedetek a racionalitás fontos részét jelentik, részletesebben a 16. fejezetben lesz szó róluk. Az információgyűjtés másik példáját a felfedezés (exploration) szolgáltatja, amit egy porszívóágensnek egy ismeretlen környezetben meg kell tennie.

Definíciónk nemcsak azt követeli meg a racionális ágenstől, hogy információt gyűjtsön, hanem azt is, hogy amennyit csak lehet tanuljon (learn) a megfigyeléseiből. Az ágens kezdeti konfigurációja valamilyen előzetes tudást tükrözhet a környezetről, de ahogy az ágens tapasztalatot szerez, ez a tudás módosulhat és átértékelődhet. Vannak szélsőséges esetek, amikor a környezet a priori teljesen ismert. Ilyen esetekben az ágensnek nem kell érzékelnie vagy tanulnia, egyszerűen csak helyesen cselekszik. Természetesen az ilyen ágensek nagyon sérülékenyek. Vegyük például az egyszerű ganajtúró bogarat. Miután kiásta a fészkét és elhelyezte a tojásait, a közeli halomból egy ganajlabdát készít, hogy elzárja a fészek bejáratát. Ha útközben a labdát eltávolítjuk a fogói közül, a bogár folytatja útját, és a nem létező labdával is eljátssza a fészek lezárását, miközben észre sem veszi, hogy a labda hiányzik. Az evolúció beépített egy feltételezést a bogár viselkedésébe, és amikor ez megsérül, sikertelen viselkedés lesz az eredménye. Kicsit intelligensebb a szöcskeölő darázs. A nőstény ás egy lyukat, keres és megcsíp egy hernyót, elcipeli a lyukhoz, bemegy a lyukba megnézni, hogy minden rendben van-e, majd bevonszolja a hernyót és lerakja a tojásait. A hernyó szolgál a tojások kikelése után táplálékul. Eddig jó, de ha egy rovarkutató pár centiméterrel odébb rakja a hernyót, miközben a darázs a lyukat ellenőrzi, az visszalép a hernyó odacipelése fázishoz, és a tervét változtatás nélkül folytatja onnan, akár tucatnyi hernyóelmozdító közbelépés után is. A darázs képtelen megtanulni, hogy öröklött terve hibás, így nem fogja megváltoztatni.

A sikeres ágensek három különböző periódusra bontják az ágensfüggvény kiszámításának feladatát: amikor az ágenst tervezik, a számítás egy részét tervezőik végzik; amikor megfontolja a következő cselekvését, az ágens további számításokat végez; és amikor tanul a tapasztalataiból, még további számításokat végez annak eldöntésére, hogy hogyan módosítsa a viselkedését.

Fontos

Addig a szintig, míg az ágens a tervezői által beépített tudásra épít és nem saját megfigyeléseire, azt mondjuk, hogy az ágens nem autonóm (autonom). Egy racionális ágensnek autonómnak kell lennie – mindent, amit csak megtanulhat, meg kell tanulnia ahhoz, hogy a hiányos vagy hibás előzetes tudását kompenzálja. Például az a porszívóágens, amelyik megtanulja előrelátni, hogy hol és mikor tűnik fel további szemét, jobban fog dolgozni, mint amelyik nem. Praktikus okból ritkán kell teljes autonómiát biztosítani már a kezdetektől: amikor egy ágensnek nincs tapasztalata, vagy csak kevés van, akkor véletlenszerűen kellene cselekednie, hacsak a tervezője nem ad valamilyen segítséget. Így, mint ahogy az evolúció ellátja az állatokat elegendő beépített reflexszel a túléléshez addig, míg saját maguk is megtanulják mindazt, ami a túléléshez szükséges, a mesterséges intelligens ágensek kezdő tudással és tanulási képességgel való ellátása is ésszerű lenne. Miután elegendő tapasztalatot szerzett a környezetéről, a racionális ágens viselkedése gyakorlatilag függetlenné válhat a beépített előzetes tudásától. Ily módon a tanulás alkalmazásával olyan ágens tervezhető, amely sokféle környezetben is sikeres lesz.



[20] Az emberi ágensekre különösen jellemző a „savanyú a szőlő” effektus – azaz hogy nem is akarják igazán azt, amit nem sikerült megkapniuk, mint például: „Nos, sebaj, nem is akartam annyira azt a buta Nobel-díjat”.

[21] Lásd N. Henderson: Sürgősen új ajtózárakat a Boeing 747 jumbo jetek számára. Washington Post, 1989. augusztus 24.