17.7. Működési mód tervezés

Az előző alfejezetben azt a kérdést próbáltuk megválaszolni, hogy „Ha adott egy játék, mi a racionális stratégia?” Ebben az alfejezetben azt kérdezzük, hogy „Ha az ágensek racionálisak, milyen játékot tervezzünk?” Pontosabban, egy olyan játékot szeretnénk tervezni, aminek a megoldása az egyes ágensek által követett saját racionális stratégiáik együttese, és ez egy globális hasznosságfüggvény maximálását eredményezi. Ezt a problémát működési mód tervezésnek (mechanism design) nevezik, vagy néha inverz játékelméletnek (inverse game theory). A működési mód tervezés a közgazdaság-tudományok és a politikai tudományok a lényege. Ágensek együttesénél ez annak lehetőségét hordozza magában, hogy játékelméleti működési módokat használva ügyes rendszereket hozunk létre korlátoltabb rendszerek együtteséből – még nem együttműködő rendszerekből is –, nagyon hasonlóan ahhoz, ahogy emberek csoportjai olyan célokat tudnak elérni, amik messze túl vannak az egyéni lehetőségeken.

A működési mód tervezés példái között olcsó repülőjegyek elárverezése, TCP-csomagok számítógépek közötti továbbításához megfelelő útvonal keresése, szigorló orvosok kórházakhoz rendelése, illetve annak eldöntése szerepel, hogy robotfocisták hogyan működjenek együtt a csapattársaikkal. A működési mód tervezés az 1990-es évektől lépett ki az az egyetemek falai közül, amikor számos ország, a műsorszóró frekvenciasávok elárverezésének a problémájával szembesülve, dollárszázmilliókat vesztett a lehetséges bevételeiből a gyenge működési mód tervezés eredményeképpen. Formálisan a működési mód (mechanism) tartalmaz (1) egy nyelvet az ágensek által választható megengedett stratégiák (potenciálisan végtelen) halmazának a leírására és (2) egy G kimeneteli szabályt, ami a jutalmakat határozza meg az ágenseknek megengedett stratégiák egy adott stratégiaprofilja esetén.

Első ránézésre a működési mód tervezés problémája triviálisnak tűnik. Tegyük fel, hogy az U globális hasznosságfüggvény dekomponálódik egyéni U_i ágens hasznosságfüggvények valamely halmazára úgy, hogy U = Σ_iU_i. Ekkor mondhatnánk azt, hogy ha mindegyik ágens maximálja a saját hasznosságát, ez biztosan a globális hasznosság automatikusan maximálásához fog vezetni. (Például a kapitalizmus egyszeregye szerint, ha egy társadalomban mindenki megpróbál gazdagodni, a társadalom összgazdagsága növekedni fog.) Sajnos ez nem működik. Az egyes ágensek cselekvései befolyásolhatják a többi ágens jólétét oly módon, hogy a globális hasznosság csökken. Erre példa a közlegelő tragédiája (tragedy of commons), amely helyzetben az egyéni gazdálkodók az összes lábasjószágukat ingyen legeltetik a város közlegelőjén, ezért a közlegelő tönkremegy, és az összes gazdálkodó nagy veszteséget szenved el. Mindegyik gazdálkodó egyénileg racionálisan cselekedett, azzal érvelve, hogy a közlegelő ingyenes, és azzal, hogy bár a közlegelő használata a tönkremeneteléhez vezet, a használatának a mellőzése ezt nem befolyásolja (hiszen mások úgyis használnák). Hasonló érvelések alkalmazhatók a szennyező anyagok kibocsátása esetén a légkör és az óceánok használatára is.

Az ilyen problémák szabványos megközelítése a működési mód tervezésben az, hogy a köztulajdon használatáért mindegyik ágensnél költséget számítunk fel. Általánosabban, azt kell biztosítanunk, hogy minden külsőség (externalities) – olyan globális hasznosságot befolyásoló tényező, amely az egyéni ágensek tranzakcióiban nincsenek elismerve – különállóan nevesítve megjelenjen. Ebben a nehéz a helyes árak megállapítása. Ennek a megközelítésnek a végletes formája egy olyan működési mód megalkotását jelenti, amelyben mindegyik ágenstől valójában a globális hasznosság maximálását követeljük meg. Ez megoldhatatlanul nehéz feladat az ágens számára, aki sem megbecsülni nem tudja a világ jelenlegi állapotát, sem megfigyelni a cselekvéseinek az összes többi ágensre gyakorolt hatását. A működési mód tervezés ezért olyan működésmódok megtalálására összpontosít, amelyeknél az egyes ágensek döntési problémája könnyen megoldható.

Gondoljuk át először az árveréseket. Az árverés a legáltalánosabb formájában egy működésmód bizonyos áruknak egy ajánlattevő csoport tagjai számára történő eladására. Az árajánlatok, a stratégiák és a kimenetel meghatározza, hogy ki kapja az árukat és mennyit fizet. A mesterséges intelligencában például az árverések akkor jelennek meg, amikor ágensek egy csoportja eldönti, hogy együttműködjenek-e egy közös terven. Hunsberger és Grosz megmutatta, hogy ez hatékonyan elérhető árveréssel, amiben az ágensek ajánlatokat tesznek a közös tervbeli szerepükre (Hunsberger és Grosz, 2000). Egyelőre olyan árveréseket tekintünk át, amelyekben (1) egyetlen áru van, (2) mindegyik ajánlattevőnek van egy v_i hasznosságértéke az árura, és (3) ezek az értékek csak az ajánlattevő számára ismertek. Az ajánlattevők megteszik a b_i ajánlataikat, és a legmagasabb ajánlat nyeri el az árukat, de a működésmód határozza meg, hogyan tehetők meg az ajánlatok, és mi a győztes által fizetendő ár (ami nem szükségszerűen b_i). Az árverések legismertebb típusa az angol árverés (English auction), amelyben az árverező mindaddig növeli az áruk árát, amíg csak egyetlen ajánlattevő marad, ellenőrizve közben, hogy vajon az ajánlattevők érdekeltek-e még. Ennek a működésmódnak az a tulajdonsága, hogy a legnagyobb v_i értékkel bíró ajánlattevő nyeri el az árukat b_m + d áron, ahol b_m a legmagasabb ajánlat az összes többi játékos között, és d az árverező növekménye az ajánlatok között.^[179] Az angol árverésnél az ajánlattevőknek egyszerű domináns stratégiájuk van: addig tegyünk árajánlatokat, ameddig a jelenlegi költség a személyes érték alatt van. Emlékezzünk arra, hogy a „domináns” azt jelenti, hogy a stratégia minden más stratégia ellen működik. Ez viszont azt jelenti, hogy egy játékos a többi stratégiától függetlenül választhatja ezt. Ezért a játékosoknak nem kell időt és energiát vesztegetniük a többi játékos stratégiáján való elmélkedéssel. Egy működésmódot stratégiamentesnek (strategy-proof) nevezünk, ha a játékosoknak van domináns stratégiája, ami magában foglalja a valódi indítékok felfedését is.

Az angol árverés hátrányos tulajdonsága a nagy kommunikációs költség, így vagy egy szobában kell az árverésnek lezajlania, vagy az összes ajánlattevőnek nagysebességű, biztonságos kommunikációs csatornával kell rendelkeznie. Egy kevesebb kommunikációt igényő alternatív működésmód a zárt ajánlatú árverés (sealed bid auction). Ebben minden ajánlattevő egyetlen ajánlatot tesz, és ezt közli az árverezővel, és a legnagyobb ajánlat győz. Ennek a működésmódnak az esetében az a stratégia, aminek az árajánlata a valódi érték, már nem domináns. Ha valakinek az értéke v_i, és az elvárása szerint az összes többi játékos maximális ajánlata b_m lesz, akkor az árajánlatának a v_i és b_m + ε közül az alacsonyabbnak kell lennie. A zárt ajánlatú árverés két hátránya, hogy előrdulhat, hogy a legnagyobb v_i értékkel bíró játékos nem kapja meg az árukat, illetve az, hogy a játékosoknak fáradozniuk kell a többi játékos stratégiáján való elmélkedéssel.

A zárt ajánlatú árverés szabályainak kis változtatásával adódik a zárt ajánlatú második áras árverés (sealed bid second-price auction), ami Vickrey-árverés (Vickrey auction) néven is ismert.^[180] Az ilyen árveréseknél a győztes a második legmagasabb ajánlati árat fizeti a saját árajánlatának a kifizetése helyett. Ez az egyszerű módosítás teljesen kiküszöböli a szabványos (avagy első áras, first-price) zárt ajánlatú árverésnél szükséges összetett mérlegeléseket, mivel ekkor a domináns stratégia saját értékű árajánlat. Ennek belátásához vegyük észre, hogy bármely játékos tekintheti az árverést egy kétszemélyes játéknak, figyelmen kívül hagyva az összes játékost, kivéve önmagát és a többi játékos közül a legmagasabb árajánlatot tevőt. Az i. játékos hasznossága a saját b_i ajánlata, a v_i értéke és a többi játékos legjobb b_m ajánlata szempontjából

Annak belátásához, hogy a b_i=v_i domináns stratégia, vegyük észre, hogy amikor (v_i – b_m) pozitív, akkor bármelyik ajánlat optimális, ami megnyeri az árverést, és v_i megtétele nevezetesen megnyeri az árverést. Másrészt, amikor (v_i – b_m) negatív, akkor bármelyik ajánlat optimális, ami elveszti az árverést, és v_i megtétele nevezetesen elveszti az árverést. Így a v_i árajánlat optimális az összes lehetséges b_mértékre, és valójában ez csak a v_i árajánlatra teljesül. Az egyszerűsége miatt, továbbá mind az árverező, mind az ajánlattevő számára jelentkező minimális számítási igénye miatt a Vickrey-árverést széles körben használják elosztott MI-rendszerek létrehozásában.

Most gondoljuk át az internet forgalomirányítási problémáját. A játékosok a kapcsolódási háló gráfjában az élekhez tartoznak. Minden játékos ismeri egy üzenet küldésének a költségét a saját élén át; ha nincs küldendő üzenet, akkor a költség 0. A cél az, hogy egy üzenet számára megtaláljuk a legolcsóbb utat a kiindulástól a célig, ahol a teljes út költsége az egyes élek költségének az összege. A 4. fejezet számos algoritmust ad az élköltségek ismeretében a legrövidebb út kiszámítására, így minden, amit tennünk kell, az, hogy az egyes ágenseket rávegyük, hogy jelentsék a valódi c_i költségüket. Sajnos, ha csupán megkérdezzük az ágenseket, akkor magas költséget fog jelenteni, hogy arra bátorítson, küldjük át az üzenetet máshol. Ki kell fejlesztenünk egy stratégiamentes működési módot. Egy ilyen működési mód, ha minden játékosnak fizetünk egy p_ijutalmat, ami a legrövidebb, az i-edik élet nem tartalmazó út hossza mínusz a legrövidebb út (keresési algoritmus által kiszámolt) hossza, ahol az i-edik él költségét 0-nak tételezzük fel.

p_i= Hossz(út c_i= ∞-nél) – Hossz(út c_i= 0-nál)

Megmutatható, hogy e mellett a működési mód mellett a domináns stratégia mindegyik játékosnak a c_i őszinte jelentése, illetve, hogy ennek megtétele a legolcsóbb utat fogja eredményezni. E kívánatos tulajdonság ellenére az itt vázolt működésmódot a gyakorlatban nem használják a nagy kommunikációs és központi számítási költség miatt. A működési mód tervezőnek kommunikálnia kell az összes n játékossal, és aztán egy optimalizációs problémát kell megoldania. Ez megérheti, ha a költségek eloszlanának sok üzenet felett, de valós hálózatokban a c_i költségek folyamatosan változnának a forgalom torlódása, a gépek üzemképtelenné válása és belépése miatt. Eddig teljesen kielégítő megoldást még nem fejlesztettek ki.

^[179] Valójában van egy kis esélye, hogy a legnagyobb v_i értékkel bíró játékosnak nem sikerül megszereznie az árukat abban az esetben, amikor b_m< v_i< b_m+ d. Annak az esélyét, hogy ez megtörténjen, tetszőlegesen kicsivé lehet tenni a d növekmény csökkentésével.

^[180] William Vickreyről elnevezve, aki az 1996-os közgazdasági Nobel-díj kitüntetettje.

Mesterséges Intelligencia Elektronikus Almanach

Elsődleges linkek

17.7. Működési mód tervezés