16.6. Az információ értéke

Fontos

Az előző elemzésben feltételeztük, hogy minden lényeges információ, de legalábbis minden elérhető információ az ágens rendelkezésére áll. Gyakorlatban ez aligha történhet meg. A döntéshozatal egyik legfontosabb része, hogy tudjuk, milyen kérdést kell feltenni. Például az orvos nem várhatja el, hogy rendelkezésére álljon minden lehetséges diagnosztikai teszt és kérdés eredménye, amikor a páciens először belép a rendelőbe.[169] A tesztek gyakran költségesek és néha veszélyesek (mind közvetlenül, mind az általuk okozott késedelmek miatt). A fontosságuk két tényezőn múlik: egyrészt azon, hogy jelentősen jobb kezelés válik-e lehetővé a teszteredmények alapján, másrészt a különböző teszteredmények valószínűségén.

Ez az alfejezet az információérték-elmélettel (information value theory) foglalkozik, ami lehetővé teszi az ágens számára annak kiválasztását, hogy milyen információt szerezzen meg. Az információ megszerzése érzékelési cselekvésekkel (sensing action) történik, ahogy a 12. fejezetben leírtuk. Mivel az ágens hasznosságfüggvénye ritkán vonatkozik az ágens belső állapotaira, jóllehet az érzékelési cselekvés célja a belső állapot megváltoztatása, ezért az érzékelési cselekvéseket az ágens ezt követő műveleteire gyakorolt hatása alapján kell kiértékelnünk. Az információérték-elmélet ezért a többlépcsős döntéshozatal egy speciális fajtája.

16.6.1. Egy egyszerű példa

Tételezzük fel, hogy egy olajtársaság egy tengeri fúróhely létesítésére szeretne jogokat vásárolni, n darab megkülönböztethetetlen terület közül választva. Tételezzük továbbá fel, hogy kizárólag csak az egyik terület tartalmaz olajat C dollár értékben, és hogy a területek ára C/n dollár. Ha a társaság kockázatsemleges, akkor közömbös lesz számára, hogy vásárol-e területet, vagy sem.

Most tételezzük fel, hogy a szeizmológusok felkínálják a 3-as számú területre vonatkozó kutatásaik eredményét a társaságnak, ami világosan megmutatja, hogy a terület tartalmaz-e olajat, vagy sem. Mennyit legyen hajlandó fizetni a társaság ezért az információért? E kérdés megválaszolásának az a módja, hogy megvizsgáljuk, hogy mit tenne a társaság, ha meglenne az információja:

  • 1/n valószínűséggel a 3-as terület felmérése azt fogja mutatni, hogy a terület tartalmaz olajat. Ebben az esetben a társaság megvásárolja a 3-as területet C/n dollárért, és nyeresége C C/n = (n 1)C/n dollár lesz.

  • (n – 1) /n valószínűséggel a felmérés azt fogja mutatni, hogy a terület nem tartalmaz olajat, amely esetben a társaság egy másik területet vásárol meg. Ekkor az olajterület eltalálásának a valószínűsége a többi mező között 1/n-ről 1/ (n – 1)-re változik, így a társaság várható nyeresége C/ (n – 1) – C/n = C/n(n – 1) dollár lesz.

Most már kiszámíthatjuk a várható nyereséget, ha ismerjük a kutatás eredményét:

Tehát a társaságnak hajlandónak kell lennie, hogy akár C/n dollárt fizessen a szeizmológusnak az információért: az információ annyit ér, mint maga a terület.

Az információ értéke abból a tényből származik, hogy az információval valaki az aktuális helyzetben sokkal alkalmasabb cselekedeteket tud megválasztani. Az információval lehetségessé válik a helyzetek megkülönböztetése, ezzel szemben az információ nélkül a lehetséges helyzetek feletti átlagot nézve kell cselekedni. Általánosan fogalmazva, az információ értékét a várható értékek különbsége definiálja az információ megszerzése előtt és után.

16.6.2. Egy általános képlet

Az információ értékére egyszerű általános formulát adni. Rendszerint feltesszük, hogy pontos bizonyítékaink vannak egyes Ej valószínűségi változók értékeiről, így a teljes információ értéke (value of perfect information) (TIÉ) elnevezést használjuk.[170] Legyen az ágens jelenlegi tudása E. Ekkor az α pillanatnyi legjobb cselekvés értékét a következő definiálja:

és a legjobb cselekvés értéke (az Ej új bizonyíték megszerzése után)

De Ej egy valószínűségi változó, aminek az értéke jelenleg nem ismert, így átlagolnunk kell az összes lehetséges ejk értékre, amelyeket Ej értékeként az Ej-re vonatkozó jelenlegi hiedelmünket felhasználva megkaphatunk. Az Ej megszerzésének értékét a következőképpen definiáljuk:

A formula megértése érdekében gondoljuk át azt az egyszerű esetet, mikor csak két cselekvés, A1 és A2 közül lehet választani. A cselekvések jelenleg várható hasznosságai U1 és U2. Az Ej információ új várható hasznosságokat, -et és -t fog eredményezni a cselekvésekre, de Ej megszerzése előtt már ismerjük a függetlennek feltételezett és lehetséges értékeinek valószínűség-eloszlásait.

Tegyük fel, hogy A1 és A2 két különböző utat jelent a hegyeken keresztül, téli időben. A1 egy kényelmes, egyenes autópálya egy alacsony hágón át, míg A2 egy tekervényes földút a csúcson keresztül. Csak ezt az információt ismerve A1 egyértelműen előnyben részesíthető, mivel elég valószínű, hogy a második utat lavinák zárják le, miközben az első úton valószínűleg nincsenek torlódások. U1 ezért egyértelműen nagyobb, mint U2. Az utak aktuális állapotáról Ej műholdjelentéseket kaphatunk, melyek és új várható értékeket adnak az átkelőkre vonatkozóan. A várható hasznosságértékek eloszlását a 16.7. (a) ábra mutatja. Nyilvánvalóan ebben az esetben a költségek miatt nem éri meg a műholdas jelentéseket kikérni, mivel nagyon valószínűtlen, hogy ezek a jelentések a terv megváltozását eredményeznék. A tervek változatlansága mellett azonban az információnak nincs értéke.

Most tételezzük fel, hogy két, kissé eltérő hosszúságú kanyargós földút közül választunk, és súlyosan sérült utasokat viszünk. Ekkor bár lehet, hogy U1 és U2 elég közel esnek egymáshoz, az és széles tartományon belül vehetnek fel értékeket. Jelentős esélye van annak, hogy a második út tiszta lesz, míg az első le lesz zárva, és ebben az esetben a hasznosságok különbsége nagyon nagy lesz. A TIÉ formula azt jelzi, hogy a műholdjelentéseket megéri kikérni. Ezt a helyzetet a 16.7. (b) ábra mutatja.

16.7. ábra - Három általános eset az információ értékére. Az (a) esetben A1 majdnem teljes bizonyossággal jobb marad A2-höz képest, így az információ nem szükséges. A (b) esetben a választás nem egyértelmű, és az információ döntő fontosságú. A (c) esetben a választás bizonytalan, de igazából nem számít, így az információ is kevésbé értékes.
Három általános eset az információ értékére. Az (a) esetben A1 majdnem teljes bizonyossággal jobb marad A2-höz képest, így az információ nem szükséges. A (b) esetben a választás nem egyértelmű, és az információ döntő fontosságú. A (c) esetben a választás bizonytalan, de igazából nem számít, így az információ is kevésbé értékes.

Tételezzük most azt fel, hogy nyári időben választunk a két földút közül, amikor a lavinák igen valószínűtlenek. Ebben az esetben a műholdjelentések azt mutathatják, hogy az egyik útvonal látványosabb, mint a másik, a virágzó hegyi rétek miatt, vagy talán csak nedvesebb az arra kanyargó patakok miatt. Ekkor igen valószínű, hogy ha megkapjuk ezt az információt, megváltoztatjuk a tervünket. Azonban ebben az esetben, a különbség a két út között még mindig igen kicsi, így nem foglalkozunk a jelentések megszerzésével. Ezt a helyzetet a 16.7. (c) ábra mutatja.

Fontos

Összegzésül azt mondhatjuk, hogy az információnak annyiban van értéke, amennyire valószínű, hogy a terv megváltozását okozza, és amennyire az új terv jelentősen jobb lesz, mint a régi.

16.6.3. Az információ értékének tulajdonságai

Érdekes kérdés, hogy lehetséges-e az, hogy az információ káros – lehet-e az információnak negatív várható értéke? Az a megérzésünk, hogy ez lehetetlen. Végül is legrosszabb esetben az információ egyszerűen figyelmen kívül hagyható, és úgy tehetünk, mintha soha nem kaptuk volna meg. Ezt igazolja a következő tétel, ami bármely döntéselméleti ágensre alkalmazható. Az információ értéke nem negatív:

j, E TIÉE(Ej) ≥ 0

A tétel közvetlenül következik a TIÉ definíciójából, a bizonyítást gyakorló feladatként az olvasóra bízzuk (16.12. feladat). Fontos emlékezni arra, hogy a TIÉ a jelenlegi információs állapottól függ, ezért szerepel ez az alsó indexben. Ez megváltozhat, amint több információt szerzünk. Szélsőséges esetben nulla is lehet, ha a kérdéses változó értéke már ismert. Így a TIÉ nem additív. Azaz

TIÉE(Ej, Ek) ≠ TIÉE(Ej) + TIÉE(Ek) (általánosságban)

Azonban a TIÉ sorrendfüggetlen, aminek intuitíve nyilvánvalónak kell lennie. Azaz,

A sorrendfüggetlenség megkülönbözteti az érzékelési és a hagyományos cselekvéseket, és egyszerűsíti egy érzékelési cselekvéssorozat értékének a kiszámítását.

16.6.4. Egy információgyűjtő ágens megvalósítása

Egy értelmes ágensnek a felhasználóhoz ésszerű sorrendben kell kérdéseket intéznie, nem szabad lényegtelen kérdéseket feltennie, az információ fontosságát a költségéhez kell viszonyítania, és a megfelelő ponton abba kell hagynia a kérdezősködést. Mindezen képességek elérhetők az információérték használatának a segítségével.

A 16.8. ábra egy olyan ágens teljes vázát mutatja, ami mielőtt cselekedne, képes intelligensen információkat gyűjteni. Időlegesen tételezzük fel, hogy minden megfigyelhető Ej tényváltozóhoz létezik egy hozzárendelt költség, Költség(Ej), ami a bizonyíték tesztek, tanácsadók, kérdések és bármi egyéb módszer segítségével történő megszerzésének a költsége. Az ágens a legértékesebb információt kéri el, a költségeket is figyelembe véve. Feltételezzük, hogy a Kérés(Ej) cselekvés eredménye az, hogy a következő érzékelés az Ej értéket szolgáltatja. Ha nincs olyan megfigyelés, ami megérné a költségét, az ágens egy nem információgyűjtő cselekvést választ ki.

16.8. ábra - Egy egyszerű információgyűjtő ágens váza. Az ágens folyamatosan a legnagyobb információértékű megfigyelést választja, mindaddig, amíg a következő megfigyelés költsége kisebb, mint a várható haszna.
Egy egyszerű információgyűjtő ágens váza. Az ágens folyamatosan a legnagyobb információértékű megfigyelést választja, mindaddig, amíg a következő megfigyelés költsége kisebb, mint a várható haszna.

Az itt megadott ágens az információgyűjtés úgynevezett rövidlátó (myopic) formáját valósítja meg. Ez azért van, mert az ágens a TIÉ formulát rövidlátó módon használja, azaz úgy számítja ki az információ értékét, mintha csak egyetlen tényváltozót szerezne meg. Ha nincsen olyan tényváltozó, ami sokat segítene, lehet, hogy a rövidlátó ágens kapkodó módon belekezd egy cselekvésbe, pedig jobb lett volna előbb lekérdezni két vagy három változót, és csak aztán cselekedni. A rövidlátó szabályozás ugyanazon a heurisztikán alapul, mint a mohó keresés, és a gyakorlatban gyakran jól működik. (Például kimutatták, hogy diagnosztikai tesztek kiválasztásában jobb a teljesítménye, mint az orvosszakértőknek.) Azonban egy teljesen racionális információgyűjtő ágensnek végig kell gondolnia az összes lehetséges információkérés-szekvenciát, ami egy külső akcióban végződik, és ezeknek a kéréseknek az összes lehetséges kimenetelét. Mivel a második kérés értéke függ az első kérés kimenetelétől, az ágensnek fel kell derítenie a feltételes tervek terét, amint azt a 12. fejezetben leírtuk.



[169] Az Egyesült Államokban az egyetlen kérdés, amit ez előtt mindig megkérdeznek, hogy a páciensnek van-e biztosítása.

[170] Egy X változóra vonatkozó nem teljes információt modellezhetünk egy Y változóról szóló teljes információval, ahol az Y változó valószínűségi kapcsolatban van X-szel. Erre ad példát a 16.11. feladat.