16.6. Az információ értéke

Fontos

Az előző elemzésben feltételeztük, hogy minden lényeges információ, de legalábbis minden elérhető információ az ágens rendelkezésére áll. Gyakorlatban ez aligha történhet meg. A döntéshozatal egyik legfontosabb része, hogy tudjuk, milyen kérdést kell feltenni. Például az orvos nem várhatja el, hogy rendelkezésére álljon minden lehetséges diagnosztikai teszt és kérdés eredménye, amikor a páciens először belép a rendelőbe.^[169] A tesztek gyakran költségesek és néha veszélyesek (mind közvetlenül, mind az általuk okozott késedelmek miatt). A fontosságuk két tényezőn múlik: egyrészt azon, hogy jelentősen jobb kezelés válik-e lehetővé a teszteredmények alapján, másrészt a különböző teszteredmények valószínűségén.

Ez az alfejezet az információérték-elmélettel (information value theory) foglalkozik, ami lehetővé teszi az ágens számára annak kiválasztását, hogy milyen információt szerezzen meg. Az információ megszerzése érzékelési cselekvésekkel (sensing action) történik, ahogy a 12. fejezetben leírtuk. Mivel az ágens hasznosságfüggvénye ritkán vonatkozik az ágens belső állapotaira, jóllehet az érzékelési cselekvés célja a belső állapot megváltoztatása, ezért az érzékelési cselekvéseket az ágens ezt követő műveleteire gyakorolt hatása alapján kell kiértékelnünk. Az információérték-elmélet ezért a többlépcsős döntéshozatal egy speciális fajtája.

16.6.1. Egy egyszerű példa

Tételezzük fel, hogy egy olajtársaság egy tengeri fúróhely létesítésére szeretne jogokat vásárolni, n darab megkülönböztethetetlen terület közül választva. Tételezzük továbbá fel, hogy kizárólag csak az egyik terület tartalmaz olajat C dollár értékben, és hogy a területek ára C/n dollár. Ha a társaság kockázatsemleges, akkor közömbös lesz számára, hogy vásárol-e területet, vagy sem.

Most tételezzük fel, hogy a szeizmológusok felkínálják a 3-as számú területre vonatkozó kutatásaik eredményét a társaságnak, ami világosan megmutatja, hogy a terület tartalmaz-e olajat, vagy sem. Mennyit legyen hajlandó fizetni a társaság ezért az információért? E kérdés megválaszolásának az a módja, hogy megvizsgáljuk, hogy mit tenne a társaság, ha meglenne az információja:

1/n valószínűséggel a 3-as terület felmérése azt fogja mutatni, hogy a terület tartalmaz olajat. Ebben az esetben a társaság megvásárolja a 3-as területet C/n dollárért, és nyeresége C – C/n = (n – 1)C/n dollár lesz.
(n – 1) /n valószínűséggel a felmérés azt fogja mutatni, hogy a terület nem tartalmaz olajat, amely esetben a társaság egy másik területet vásárol meg. Ekkor az olajterület eltalálásának a valószínűsége a többi mező között 1/n-ről 1/ (n – 1)-re változik, így a társaság várható nyeresége C/ (n – 1) – C/n = C/n(n – 1) dollár lesz.

Most már kiszámíthatjuk a várható nyereséget, ha ismerjük a kutatás eredményét:

Tehát a társaságnak hajlandónak kell lennie, hogy akár C/n dollárt fizessen a szeizmológusnak az információért: az információ annyit ér, mint maga a terület.

Az információ értéke abból a tényből származik, hogy az információval valaki az aktuális helyzetben sokkal alkalmasabb cselekedeteket tud megválasztani. Az információval lehetségessé válik a helyzetek megkülönböztetése, ezzel szemben az információ nélkül a lehetséges helyzetek feletti átlagot nézve kell cselekedni. Általánosan fogalmazva, az információ értékét a várható értékek különbsége definiálja az információ megszerzése előtt és után.

16.6.2. Egy általános képlet

Az információ értékére egyszerű általános formulát adni. Rendszerint feltesszük, hogy pontos bizonyítékaink vannak egyes E_jvalószínűségi változók értékeiről, így a teljes információ értéke (value of perfect information) (TIÉ) elnevezést használjuk.^[170] Legyen az ágens jelenlegi tudása E. Ekkor az α pillanatnyi legjobb cselekvés értékét a következő definiálja:

és a legjobb cselekvés értéke (az E_j új bizonyíték megszerzése után)

De E_j egy valószínűségi változó, aminek az értéke jelenleg nem ismert, így átlagolnunk kell az összes lehetséges e_jk értékre, amelyeket E_j értékeként az E_j-re vonatkozó jelenlegi hiedelmünket felhasználva megkaphatunk. Az E_j megszerzésének értékét a következőképpen definiáljuk:

A formula megértése érdekében gondoljuk át azt az egyszerű esetet, mikor csak két cselekvés, A₁ és A₂ közül lehet választani. A cselekvések jelenleg várható hasznosságai U₁ és U₂. Az E_j információ új várható hasznosságokat, -et és -t fog eredményezni a cselekvésekre, de E_jmegszerzése előtt már ismerjük a függetlennek feltételezett és lehetséges értékeinek valószínűség-eloszlásait.

Tegyük fel, hogy A₁ és A₂ két különböző utat jelent a hegyeken keresztül, téli időben. A₁ egy kényelmes, egyenes autópálya egy alacsony hágón át, míg A₂ egy tekervényes földút a csúcson keresztül. Csak ezt az információt ismerve A₁ egyértelműen előnyben részesíthető, mivel elég valószínű, hogy a második utat lavinák zárják le, miközben az első úton valószínűleg nincsenek torlódások. U₁ ezért egyértelműen nagyobb, mint U₂. Az utak aktuális állapotáról E_jműholdjelentéseket kaphatunk, melyek és új várható értékeket adnak az átkelőkre vonatkozóan. A várható hasznosságértékek eloszlását a 16.7. (a) ábra mutatja. Nyilvánvalóan ebben az esetben a költségek miatt nem éri meg a műholdas jelentéseket kikérni, mivel nagyon valószínűtlen, hogy ezek a jelentések a terv megváltozását eredményeznék. A tervek változatlansága mellett azonban az információnak nincs értéke.

Most tételezzük fel, hogy két, kissé eltérő hosszúságú kanyargós földút közül választunk, és súlyosan sérült utasokat viszünk. Ekkor bár lehet, hogy U₁ és U₂ elég közel esnek egymáshoz, az és széles tartományon belül vehetnek fel értékeket. Jelentős esélye van annak, hogy a második út tiszta lesz, míg az első le lesz zárva, és ebben az esetben a hasznosságok különbsége nagyon nagy lesz. A TIÉ formula azt jelzi, hogy a műholdjelentéseket megéri kikérni. Ezt a helyzetet a 16.7. (b) ábra mutatja.

16.7. ábra - Három általános eset az információ értékére. Az (a) esetben A₁ majdnem teljes bizonyossággal jobb marad A₂-höz képest, így az információ nem szükséges. A (b) esetben a választás nem egyértelmű, és az információ döntő fontosságú. A (c) esetben a választás bizonytalan, de igazából nem számít, így az információ is kevésbé értékes.

Három általános eset az információ értékére. Az (a) esetben A1 majdnem teljes bizonyossággal jobb marad A2-höz képest, így az információ nem szükséges. A (b) esetben a választás nem egyértelmű, és az információ döntő fontosságú. A (c) esetben a választás bizonytalan, de igazából nem számít, így az információ is kevésbé értékes.

Tételezzük most azt fel, hogy nyári időben választunk a két földút közül, amikor a lavinák igen valószínűtlenek. Ebben az esetben a műholdjelentések azt mutathatják, hogy az egyik útvonal látványosabb, mint a másik, a virágzó hegyi rétek miatt, vagy talán csak nedvesebb az arra kanyargó patakok miatt. Ekkor igen valószínű, hogy ha megkapjuk ezt az információt, megváltoztatjuk a tervünket. Azonban ebben az esetben, a különbség a két út között még mindig igen kicsi, így nem foglalkozunk a jelentések megszerzésével. Ezt a helyzetet a 16.7. (c) ábra mutatja.

Fontos

Összegzésül azt mondhatjuk, hogy az információnak annyiban van értéke, amennyire valószínű, hogy a terv megváltozását okozza, és amennyire az új terv jelentősen jobb lesz, mint a régi.

16.6.3. Az információ értékének tulajdonságai

Érdekes kérdés, hogy lehetséges-e az, hogy az információ káros – lehet-e az információnak negatív várható értéke? Az a megérzésünk, hogy ez lehetetlen. Végül is legrosszabb esetben az információ egyszerűen figyelmen kívül hagyható, és úgy tehetünk, mintha soha nem kaptuk volna meg. Ezt igazolja a következő tétel, ami bármely döntéselméleti ágensre alkalmazható. Az információ értéke nem negatív:

∀j, E TIÉ_E(E_j) ≥ 0

A tétel közvetlenül következik a TIÉ definíciójából, a bizonyítást gyakorló feladatként az olvasóra bízzuk (16.12. feladat). Fontos emlékezni arra, hogy a TIÉ a jelenlegi információs állapottól függ, ezért szerepel ez az alsó indexben. Ez megváltozhat, amint több információt szerzünk. Szélsőséges esetben nulla is lehet, ha a kérdéses változó értéke már ismert. Így a TIÉ nem additív. Azaz

TIÉ_E(E_j, E_k) ≠ TIÉ_E(E_j) + TIÉ_E(E_k) (általánosságban)

Azonban a TIÉ sorrendfüggetlen, aminek intuitíve nyilvánvalónak kell lennie. Azaz,

A sorrendfüggetlenség megkülönbözteti az érzékelési és a hagyományos cselekvéseket, és egyszerűsíti egy érzékelési cselekvéssorozat értékének a kiszámítását.

16.6.4. Egy információgyűjtő ágens megvalósítása

Egy értelmes ágensnek a felhasználóhoz ésszerű sorrendben kell kérdéseket intéznie, nem szabad lényegtelen kérdéseket feltennie, az információ fontosságát a költségéhez kell viszonyítania, és a megfelelő ponton abba kell hagynia a kérdezősködést. Mindezen képességek elérhetők az információérték használatának a segítségével.

A 16.8. ábra egy olyan ágens teljes vázát mutatja, ami mielőtt cselekedne, képes intelligensen információkat gyűjteni. Időlegesen tételezzük fel, hogy minden megfigyelhető E_j tényváltozóhoz létezik egy hozzárendelt költség, Költség(E_j), ami a bizonyíték tesztek, tanácsadók, kérdések és bármi egyéb módszer segítségével történő megszerzésének a költsége. Az ágens a legértékesebb információt kéri el, a költségeket is figyelembe véve. Feltételezzük, hogy a Kérés(E_j) cselekvés eredménye az, hogy a következő érzékelés az E_j értéket szolgáltatja. Ha nincs olyan megfigyelés, ami megérné a költségét, az ágens egy nem információgyűjtő cselekvést választ ki.

16.8. ábra - Egy egyszerű információgyűjtő ágens váza. Az ágens folyamatosan a legnagyobb információértékű megfigyelést választja, mindaddig, amíg a következő megfigyelés költsége kisebb, mint a várható haszna.

Egy egyszerű információgyűjtő ágens váza. Az ágens folyamatosan a legnagyobb információértékű megfigyelést választja, mindaddig, amíg a következő megfigyelés költsége kisebb, mint a várható haszna.

Az itt megadott ágens az információgyűjtés úgynevezett rövidlátó (myopic) formáját valósítja meg. Ez azért van, mert az ágens a TIÉ formulát rövidlátó módon használja, azaz úgy számítja ki az információ értékét, mintha csak egyetlen tényváltozót szerezne meg. Ha nincsen olyan tényváltozó, ami sokat segítene, lehet, hogy a rövidlátó ágens kapkodó módon belekezd egy cselekvésbe, pedig jobb lett volna előbb lekérdezni két vagy három változót, és csak aztán cselekedni. A rövidlátó szabályozás ugyanazon a heurisztikán alapul, mint a mohó keresés, és a gyakorlatban gyakran jól működik. (Például kimutatták, hogy diagnosztikai tesztek kiválasztásában jobb a teljesítménye, mint az orvosszakértőknek.) Azonban egy teljesen racionális információgyűjtő ágensnek végig kell gondolnia az összes lehetséges információkérés-szekvenciát, ami egy külső akcióban végződik, és ezeknek a kéréseknek az összes lehetséges kimenetelét. Mivel a második kérés értéke függ az első kérés kimenetelétől, az ágensnek fel kell derítenie a feltételes tervek terét, amint azt a 12. fejezetben leírtuk.

^[169] Az Egyesült Államokban az egyetlen kérdés, amit ez előtt mindig megkérdeznek, hogy a páciensnek van-e biztosítása.

^[170] Egy X változóra vonatkozó nem teljes információt modellezhetünk egy Y változóról szóló teljes információval, ahol az Y változó valószínűségi kapcsolatban van X-szel. Erre ad példát a 16.11. feladat.

Mesterséges Intelligencia Elektronikus Almanach

Elsődleges linkek

16.6. Az információ értéke

Fontos

16.6.1. Egy egyszerű példa

16.6.2. Egy általános képlet

Fontos

16.6.3. Az információ értékének tulajdonságai

16.6.4. Egy információgyűjtő ágens megvalósítása