16.2. A hasznosságelmélet alapjai

Ránézésre az MVH-elv ésszerű módszernek látszik döntések meghozatalára, de az nem világos, hogy vajon ez-e az egyetlen lehetőség. Végül is, a hasznosság átlagának maximálása miért is lenne olyan különleges? Miért nem maximalizáljuk a lehetséges hasznosságok köbeinek összegét, vagy miért nem minimalizáljuk a lehetséges veszteségek maximumát? Hasonlóan, miért nem cselekedhet az ágens racionálisan, ha csupán az állapotok közötti preferenciáit rögzítené, és nem rendelne hozzájuk numerikus értéket? Végül, egyáltalán miért kell léteznie egy megkövetelt tulajdonságokkal rendelkező hasznosságfüggvénynek? Talán egy racionális ágensnek olyan bonyolult a preferenciarendszere, hogy azt nem lehet ilyen egyszerűen az egyes állapotokhoz rendelt valós számokkal kifejezni.

16.2.1. Megkötések a racionális preferenciákra

Ezek a kérdések megválaszolhatók, ha leírjuk a preferenciákra vonatkozó azon megkötéseket, amelyekkel egy racionális ágensnek rendelkeznie kell, majd ezután megmutatjuk, hogy az MVH-elv ezekből a megkötésekből levezethető. Az ágens preferenciáit a következő jelöléssel írjuk le:

AB A preferált B-hez képest

AB az ágens egyformán preferálja A-t és B-t

AB az ágens A-t preferálja B-hez képest, vagy egyformán preferálja A-t és B-t

Természetesen tisztázni kell, hogy mit is jelölhet A és B. Ha az ágens cselekvései determinisztikusak, akkor A és B tipikusan a cselekvések konkrét, teljesen specifikált eredményállapotai. Az általánosabb, nemdeterminisztikus esetben A és B szerencsejátékok (lotteries). Egy szerencsejáték alapvetően egy valószínűségi eloszlás az aktuális következmények halmaza felett (melyek a szerencsejáték „díjai”). Az L szerencsejátékot a C1, …, Cn következményekkel, amelyek p1, …, pn valószínűségekkel következhetnek be, a következőképpen jelöljük:

L = [p1, C1; p2, C2; … pn, Cn]

16.1. ábra - (a) A cserék egy teljes ciklusa, bemutatva, hogy a nemtranzitív ABCA preferenciák irracionális viselkedést eredményeznek. (b) A felbonthatósági axióma.
(a) A cserék egy teljes ciklusa, bemutatva, hogy a nemtranzitív A ≻ B ≻ C ≻ A preferenciák irracionális viselkedést eredményeznek. (b) A felbonthatósági axióma.

(Az egyetlen következménnyel rendelkező szerencsejáték A-val vagy [1, A]-val jelölhető.) Általában egy szerencsejáték bármely következménye lehet egy atomi állapot vagy egy másik szerencsejáték. Az elsődleges kérdés a hasznosságelmélet számára annak megértése, ahogyan az összetett szerencsejátékok közötti preferenciák viszonyulnak ezen szerencsejátékokat meghatározó állapotok közötti preferenciákhoz.

Ennek eléréséhez ésszerű megkötéseket írunk elő a preferenciarelációkra, hasonlóan ahhoz, ahogyan racionális kényszereket vártunk el a meggyőződés mértékeivel kapcsolatban a valószínűség axiómáinak a származtatásánál a 13. fejezetben. Egy ésszerű megkötés, hogy a preferenciák tranzitívak (transitive) legyenek: azaz ha A B és B C, akkor elvárhatjuk, hogy A C. A tranzitivitás indoklásaként megmutatjuk, hogy egy ágens, amelynek a preferenciái nem tranzitívak, irracionálisan viselkedne. Tételezzük például fel, hogy egy ágens preferenciái nem tranzitívak: ABC A, ahol A, B és C áruk, amik szabadon cserélhetők. Ha az ágensnél jelenleg A van, akkor felkínálhatjuk C-t cserébe A-ért és egy kis pénzért. Ha az ágens jobban szereti C-t, akkor hajlandó lesz pénzt is áldozni C megszerzésére. Ezután felkínálhatjuk B-t C-ért, még több pénzt begyűjtve, és végül elcseréljük B-t A-ért. Ezzel visszaértünk a kezdeti állapotba, azt leszámítva, hogy az ágensnek kevesebb a pénze (16.1. (a) ábra). Ezt a ciklust addig folytathatjuk, ameddig az ágens összes pénze el nem fogy. Indokoltnak látszik azt állítani, hogy az ágens ebben a helyzetben nem cselekedett racionálisan.

A következő hat megkötést a hasznosságelmélet axiómáinak szokás tekinteni. Ezek a preferenciákra és a szerencsejátékokra vonatkozó legnyilvánvalóbb szemantikai megkötéseket határozzák meg.

  • Sorrendezhetőség (orderability). Bármely két állapot esetén az ágensnek vagy preferálnia kell az egyiket a másikkal szemben, vagy egyformán preferáltnak kell minősítenie mindkettőt. Azaz az ágens nem kerülheti el a döntést. Ahogyan az 13.3.1. szakasz - A valószínűségi axiómák használata részben tárgyaltuk, egy fogadás visszautasítása az idő folyásának a felfüggesztéséhez hasonló.

(A B) ⋁ (B A) ⋁ (A B)

  • Tranzitivitás (transitivity). Bármely három állapot esetén, ha az ágens preferálja A-t B-vel szemben, és B-t C-vel szemben, akkor az ágensnek preferálnia kell A-t is C-vel szemben.

(AB) ⋀ (BC) ⇒ (AC)

  • Folytonosság (continuity). Ha valamely B állapot A és C között helyezkedik el a preferenciák szempontjából, akkor létezik egy p valószínűség, amely mellett a racionális ágens számára közömbössé válik, hogy a biztos B-t kapja, vagy egy olyan szerencsejátékot, amiben p valószínűséggel A, 1 – p valószínűséggel pedig C nyerhető.

ABC ⇒ ∃p [p, A; 1 – p, C] ∼ B

  • Helyettesíthetőség (substitutability). Ha egy ágens az A és B szerencsejátékot egyformán preferálja, akkor az ágens két összetettebb szerencsejátékot is egyformán preferál, amelyek csak abban különböznek, hogy az egyikben A B-re van cserélve. Ez a szerencsejátékokbeli valószínűségektől és más kimenetektől függetlenül igaz.

A B ⇒ [p, A; 1 – p, C] ∼ [p, B; 1 – p, C]

  • Monotonitás (monotonicity). Tételezzük fel, hogy két szerencsejátéknak ugyanaz a két kimenetele van, A és B. Ha az ágens A-t preferálja B-vel szemben, akkor az ágensnek azt a szerencsejátékot kell preferálnia, ami nagyobb valószínűséggel eredményezi A-t (és fordítva is).

AB ⇒ (pq ⇔ [p, A; 1 – p, B] ≿ [q, A; 1 – q, B]

  • Felbonthatóság (Decomposability): Összetett szerencsejátékok egyszerűbbekre bonthatók a valószínűség-számítás szabályai szerint. Ezt „a hazárdjáték unalmas” szabálynak nevezték el, mivel ez azt mondja ki, hogy két egymást követő szerencsejátékot össze lehet olvasztani egyetlen ekvivalens szerencsejátékba, ahogyan azt a 16.1. ábra mutatja.[165]

[p, A; 1 – p, [q, B; 1 – q, C]] ∼ [p, A; (1 – p)q, B; (1 – p)(1 – q), C]

16.2.2. És aztán jött a hasznosság

Vegyük észre, hogy a hasznosságelmélet axiómái nem mondanak semmit a hasznosságról. Kizárólag a preferenciákról szólnak. Azaz a racionális ágens alapvető tulajdonságainak a preferenciákat tételezzük fel. A hasznosságfüggvény létezése a hasznosság- axiómákból következik:

  1. A hasznosság elv (utility principle)

Ha az ágens preferenciái eleget tesznek a hasznosság axiómáinak, akkor létezik egy, az állapotokon értelmezett U valós értékű függvény, mellyel U(A) > U(B) akkor és csak akkor, ha A preferált B-vel szemben, és U(A) = U(B) akkor és csak akkor, ha az ágens számára A és B egyformán preferált.

U(A) > U(B) ⇔ A B

U(A) = U(B) ⇔ AB

  1. A maximális várható hasznosság elve (maximum Expected Utility principle)

Egy szerencsejáték hasznossága az egyes kimenetelek valószínűségeivel szorzott kimenetelhasznosságok összege.

Más szóval, amint a lehetséges kimeneteli állapotoknak a valószínűségei és hasznosságai specifikáltak, az ezeket tartalmazó összetett szerencsejáték hasznossága teljesen meghatározott. Mivel egy nemdeterminisztikus cselekmény kimenetele egy szerencsejáték, ez egy MVH-alapú döntési szabályt jelent a (16.1) egyenlet szerint.

Fontos megjegyezni, hogy a hasznosságfüggvény léte, ami leírja az ágens preferenciáit, nem jelenti azt szükségszerűen, hogy az ágens explicit módon maximalizál egy hasznosságfüggvényt a mérlegelései során. Amint azt a 2. fejezetben megmutattuk, racionális viselkedés számos módon előállítható, némelyik sokkal hatékonyabb, mint a hasznosság maximalizálásának explicit elvégzése. Az ágens preferenciáinak megfigyelésével azonban lehetségessé válik a hasznosságfüggvény megkonstruálása, ami az ágens elérni szándékozott céljait reprezentálja.



[165] A hazárdjáték élvezetét ekkor úgy modellezhetjük, hogy belefoglalhatjuk a hazárdjátékjátszás eseményeit az állapotleírásokba; például a „10 dollár és hazárdjátékjátszás” preferált lehet a „10 dollár hazárdjátékjátszás nélkül”-lel szemben.