16.1. Meggyőződések és kívánságok összekapcsolása bizonytalanság esetén

Arnauld francia filozófus az 1662-ben írt Port-Royal Logic c. művében azt írta, hogy

Annak megítéléséhez, hogy valaki elérje a jót, és elkerülje a gonoszt, nemcsak a jót és a gonoszt kell önmagában megfontolni, hanem annak valószínűségét is, hogy ezek megtörténnek-e vagy sem; és azt az arányt kell megnézni, amely ezek együtteséhez tartozik.

A kortárs tudományos szövegek inkább hasznosságról beszélnek, mint jóról és gonoszról, de az elvek ugyanazok. Az ágens preferenciáit a világ állapotai között egy hasznosságfüggvény (utility function) adja meg, ami az egyes állapotok kívánatosságának kifejezésére minden állapothoz egyetlen számot rendel. A hasznosságokat a cselekedetek következményeinek a valószínűségével kombinálva kapjuk az egyes cselekedetekhez tartozó várható hasznosságot.

Egy S állapotnak a döntést meghozó ágens szempontja szerinti hasznosságára az U(S) jelölést fogjuk használni. Mostani vizsgálódásunknál az állapotokat a világ teljes pillanatfelvételeinek fogjuk tekinteni, hasonlóan a 10. fejezetben szereplő szituációkhoz (situations). Bár ez egyszerűsíti a kezdeti fejtegetésünket, a hasznosság definiálása minden egyes állapotra külön-külön elég nehézkessé válhat. A 16.4. alfejezetben látni fogjuk, hogy az állapotok hogyan bonthatók fel bizonyos körülmények között a hasznosság hozzárendelése érdekében.

Egy nemdeterminisztikus A cselekvésnek az Eredményi(A) állapotok a lehetséges következményei, ahol az i index a különböző következményeken fut végig. Az A végrehajtása előtt az ágens egy P(Eredményi(A)|Tesz(A), E) valószínűséget rendel minden egyes következményhez, ahol az E az ágens által a világról elérhető tényeket jelöli, és a Tesz(A) egy állítás, hogy az A cselekvés végrehajtódik a jelenlegi állapotban. Ekkor a következő formulával kiszámíthatjuk a cselekvés EU(A|E) várható hasznosságát (expected utility) adott tények esetén:

A maximális várható hasznosság (MVH) (maximum expected utility, MEU) elve azt mondja ki, hogy egy racionális ágensnek azt a cselekvést kell választania, ami maximalizálja az ágens várható hasznosságát. Ha cselekvések egy legjobb sorozatát szeretnénk kiválasztani ennek az egyenletnek a felhasználásával, akkor az összes lehetséges cselekvéssorozatot számba kellene venni, és a legjobbat kiválasztani, ami hosszú sorozatok esetén nyilvánvalóan nem lehetséges. Ezért ez a fejezet egyszerű döntésekre (általában egyetlen cselekvésre vonatkozó döntésekre) koncentrál, és a következő fejezet mutat be új technikákat cselekvéssorozatok hatékony kezelésére.

Bizonyos értelemben az MVH-elv felfogható a teljes MI meghatározásának. Hiszen egy intelligens ágensnek mindössze annyit kell tennie, hogy kiszámítja a különféle mennyiségeket, maximalizálja a hasznosságot a cselekvései felett, és kész. Ám ez nem jelenti, hogy ezzel a definícióval az MI problémaköre meg lenne oldva!

Ámbár az MVH-elv bármely döntési helyzet esetén meghatározza a helyes cselekvést, a szükséges számítások lehetnek kivitelezhetetlenek, és néha maga a probléma megfogalmazása is bonyolult. A világ kezdeti állapotának ismerete érzékelést, tanulást, tudásreprezentációt és következtetést igényel. A P(Eredményi(A)|Tesz(A), E) kiszámítása a világ teljes okozati modelljét igényli, és – ahogyan azt a 14. fejezetben láttuk – NP-teljes számítást a valószínűségi hálózatokban. Az egyes állapotok U(Eredményi(A)) hasznosságának a kiszámítása gyakran keresést vagy tervezést igényel, mivel az ágens nem tudja, hogy egy állapot mennyire jó addig, ameddig nem tudja, hogy hova is kerülhet ebből az állapotból. Így a döntéselmélet nem csodaszer, ami megoldja az MI-problémát. Másrészről azonban, ez egy olyan keretet ad, amelyben áttekinthető egy MI-rendszer összes részének a beilleszkedése.

Fontos

Az MVH-elv egyértelműen kapcsolódik a 2. fejezetben felvetett teljesítménymértékek elképzeléshez. Az alapötlet nagyon egyszerű. Tekintsük azokat a lehetséges környezeteket, amelyek érzékeléssel és memóriával rendelkező ágenseket tesznek lehetővé, és gondoljuk át azt, hogy milyen lehetséges ágenseket tudnánk tervezni. Ha egy ágens maximalizálja a hasznosságfüggvényét, és az helyesen tükrözi a teljesítmény mértékét, amivel a viselkedését megítélik, akkor ez a lehető legmagasabb teljesítménypontszámot éri el, ha a hasznosságot azon lehetséges környezetek felett átlagoljuk, amelyekbe az ágens kerülhet. Ez az alapvető igazolása az MVH-elvnek. Bár az állítás tautológiának tűnhet, valójában nagyon fontos átmenetet jelent a racionalitás globális, külső kritériumaitól – a múltbeli környezetek felett vett teljesítménytől – egy lokális, belső kritériumig, ami a következő állapotra vonatkozó hasznosságfüggvény maximalizálását jelenti.

Ebben a fejezetben csak az egyszeri vagy egylépéses döntésekkel (one-shot decisions) foglalkozunk, bár a 2. fejezet a teljesítménymértékeket a múltbeli környezetek felett definiálja, amelyek általában számos döntést tartalmaznak. A következő fejezetben, ami a szekvenciális döntésekkel (sequential decisions) foglalkozik, megmutatjuk, hogy ez a két nézet hogyan békíthető össze.