13.3. Valószínűségi axiómák

Az eddigiekben az állításokra, az a priori, valamint a feltételes valószínűségi kijelentésekre vonatkozó szintaxist definiáltunk. A továbbiakban meg kell fogalmaznunk a valószínűségi kijelentések valamilyen szemantikáját is. Ezt azokkal az alapvető axiómákkal kezdjük, amelyek a valószínűségi skálát és annak végpontjait határozzák meg:

  1. Minden valószínűség 0 és 1 közé esik. Bármely a kijelentésre

0 ≤ P(a) ≤ 1

  1. A biztosan igaz (azaz érvényes) állítások valószínűsége 1, a biztosan hamis (azaz kielégíthetetlen) állításoké pedig 0.

P(igaz) = 1 P(hamis) = 0

Ezután egy olyan axiómára van szükségünk, amely a logikailag összefüggő állításokat kapcsolja össze. A legegyszerűbb, ha a diszjunkcióra vonatkozó valószínűséget az alábbiak szerint definiáljuk:

  1. A diszjunkció valószínűsége

P(ab) = P(a) + P(b) – P(ab)

Ez utóbbi szabályt könnyű megjegyezni arról, hogy azok az esetek, ahol a igaz és azok az esetek, ahol b igaz, együtt természetesen lefedik azokat az eseteket, ahol ab igaz; ugyanakkor a két halmazba eső eseteket összeadva kétszer számoljuk azokat, amelyek a halmazok közös részébe esnek, így ki kell vonnunk P(ab)-t.

Ezt a három axiómát gyakran nevezik Kolmogorov-axiómáknak (Kolmogorov’s axioms) az orosz matematikus Andrei Kolmogorov emlékére, akinek a nevéhez fűződik az ezen alapaxiómákból kiinduló valószínűség-elmélet felépítése. Vegyük észre, hogy az axiómák csak az a priori valószínűségekkel, és nem a feltételes valószínűségekkel foglalkoznak; ennek oka, hogy az utóbbiakat már a korábbiakban definiáltuk a (13.1) egyenlet szerint.

Fontos

Honnan származnak a valószínűségek?

Vég nélküli viták folytak a valószínűségi számok forrása és értelme körül. A frekvencionistab(frequentist) álláspont szerint ezek az értékek csak kísérletekből származhatnak: ha 100 ember vizsgálata során az derül ki, hogy 10-nek szuvas a foga, akkor azt mondhatjuk, hogy a szuvas fog valószínűsége körülbelül 0,1. E szemlélet szerint az az állítás, miszerint „a lyuk valószínűsége 0,1” azt jelenti, hogy ha végtelen sok mintát megvizsgálnánk, határértékét tekintve 0,1 lenne annak a résznek a hányada, ahol ezt tapasztalnánk. Tetszőleges, de véges számú minta esetén pedig megbecsülhetjük a valós arányt, valamint kiszámíthatjuk azt is, hogy várhatóan mekkora lesz a becslésünk pontossága.

Az objektivista (objectivist) megközelítés szerint a valószínűségek inkább az univerzum valóságos jellemzőinek tekinthetők – ahol egy jellemző a dolgok hajlama bizonyos típusú viselkedésre –, mint egy megfigyelő meggyőződési foka leírásának. Például az, hogy egy nem hamis pénzdarab feldobásánál 0,5-es valószínűséggel fej jön ki, magának a pénzdarabnak a hajlandósága. E szemlélet szerint a frekvencionista mérések ezen hajlandóságok megfigyelésére tett kísérletek. A legtöbb fizikus egyetért abban, hogy a kvantumjelenségek valójában valószínűségiek, de makroszkopikus szinten – például a pénzfeldobásnál – a bizonytalanság a kezdeti feltételek elhanyagolása miatt lép fel, ami látszólag nem konzisztens a hajlandóságalapú szemlélettel.

A szubjektivista (subjectivist) szemlélet szerint a valószínűségek inkább az ágens meggyőződésének jellemzésére szolgálnak, és nincs külső fizikai jelentőségük. E szerint az orvos vagy az elemző aszerint találhatja ki a számokat, hogy mondhassa véleményem szerint a lyuk valószínűsége 0,1 körül várható. Kifejlesztettek olyan további, még megbízhatóbb módszereket is – mint például az 13.3.1. szakasz - A valószínűségi axiómák használata részben részletezett fogadási rendszereket –, amelyekkel az emberek valószínűség-hozzárendelését szerették volna kiismerni. A vonatkoztatási osztály (reference class) probléma jól illusztrálja a szubjektivitás jelenlétét. Képzeljünk el egy frekvencionista orvost, aki meg akarja állapítani annak az esélyeit, hogy egy páciens egy bizonyos betegségben szenved. Ehhez az orvos más, de fontos szempontokból (kor, tünet, esetleg nem tekintetében) azonos betegeket akar figyelembe venni, majd megnézni közöttük az ilyen betegségben szenvedők arányát. Azonban, ha az orvos mindent figyelembe vesz, amit ismer a beteggel kapcsolatban – a grammra pontos testsúlyát, a haja színét, az anyja leánykori nevét stb. – arra az eredményre fog jutni, hogy nincs még egy olyan ember, aki pontosan megegyezne a beteggel, és így nincs olyan vonatkoztatási osztály sem, amelyről kísérleti eredményeket lehetne gyűjteni. Mindez nyugtalanító kérdése a tudományfilozófiának.

Laplace közömbösségi elve (principle of indifference) (Laplace, 1816) szerint a tény tekintetében szintaktikailag „szimmetrikus” állításokhoz azonos valószínűséget kell rendelni. Erre vonatkozóan történtek különböző finomítási javaslatok, amelyek Carnap és más filozófusok azon törekvéseiben csúcsosodtak ki, hogy egy olyan precíz induktív logikát (inductive logic) fejlesszenek ki, amely képes bármely állítás helyes valószínűségét tetszőleges megfigyelések alapján meghatározni. Jelenlegi felfogásunk szerint nem létezik különálló induktív logika; inkább úgy gondoljuk, hogy minden ilyen logika egy szubjektív a priori valószínűségi eloszláson alapszik, amelynek hatása a megfigyelések számának növekedésével csökken.

13.3.1. A valószínűségi axiómák használata

A valószínűségi axiómákból nagyon sok hasznos tény vezethető le. Például a tagadásra vonatkozó jól ismert szabály következik, ha ¬a-val helyettesítjük b-t a harmadik axiómában:

P(a ∨ ¬a) = P(a) + P(¬a) – P(a ∧ ¬a) (a 3. axiómából, b = ¬a helyettesítéssel)

P(igaz) = P(a) + Pa) – P(hamis) (logikai ekvivalencia alapján)

1 = P(a) + Pa) (a 2. axiómából)

Pa) = 1 –P(a) (algebrai műveletekkel)

A következtetés harmadik sora önmagában is hasznos tény és kiterjeszthető a Boole-típusú logikai esetből az általános diszkrét esetre. Legyen 〈d1, …, dn〉 a D diszkrét változó értelmezési tartománya. Könnyű megmutatni (13.2. feladat), hogy

Azaz, egyetlen változó tetszőleges valószínűségi eloszlása összegzésének 1-et kell adnia.[138] Igaz az is, hogy változók tetszőleges halmazának bármely együttes valószínűségi eloszlását összegezve, eredményül szintén 1-et kapunk: ennek belátására elegendő egyetlen többdimenziós, az eredeti változók értelmezési tartományai Descartes-szorzataként létrehozott tartomány felett értelmezett változót létrehoznunk.

Fontos

Emlékezzünk, hogy bármely a állítás egyenértékű minden olyan elemi esemény diszjunkciójával, ahol a igaz; nevezzük az események ezen halmazát e(a)-nak. Emlékezzünk arra is, hogy az elemi események egymást kölcsönösen kizárják, így a 2. axióma szerint az ilyen események konjunkciója nulla. Következésképpen a 3. axiómából a következő egyszerű összefüggésre juthatunk: Egy állítás valószínűsége megegyezik azon elemi események valószínűségeinek összegével, ahol az állítás igaz, azaz

Ez az egyenlet egyszerű módszert kínál bármilyen állítás valószínűségének meghatározására, ha adott az összes elemi esemény valószínűségét meghatározó teljes együttes valószínűség-eloszlás (lásd 13.4. alfejezet). A következő alfejezetekben a valószínűségek kezelésének további szabályait fogjuk származtatni. Mindenekelőtt azonban az axiómák megalapozottságát vizsgáljuk meg.

13.3.2. Ami a valószínűségi axiómákat indokolja

A valószínűségi axiómák tekinthetők az ágens által elhihető valószínűségi hiedelmek korlátainak. Ez valamennyire hasonlít a logikai esethez, amikor például egy logikai ágens nem hihet egyszerre A-ban, B-ben és ¬(AB)-ben. De van itt egy további bonyodalom is. A logikai esetben az együttes bekövetkezés definíciójának jelentése szerint a fenti állítások közül legalább egynek hamisnak kell lennie a valóságban, vagyis egy ágens számára ésszerűtlen mindháromban hinni. A valószínűségeket tekintve azonban a kijelentések nem közvetlenül a valóságra vonatkoznak, hanem az ágens saját ismereteire. Akkor miért nem hihet egy ágens a meggyőződések következő – a harmadik axiómát egyértelműen megsértő valószínűség-hozzárendelések – halmazában?

P(a) = 0,4 P(ab) = 0,0

P(b) = 0,3 P(ab) = 0,8 (13.3)

Az effajta kérdés évtizedekig vita tárgya volt azok között, akik a valószínűségek használatát tartották egyedül jogosnak a meggyőződési mértékek kifejezésére, és azok között, akik más megközelítési módokat javasoltak. Itt most egy olyan érvelést mutatunk be a valószínűségi axiómákkal kapcsolatban, amelyet először Bruno de Finetti fejtett ki 1931-ben.

De Finetti érvelésének kulcsa a meggyőződési fok és a cselekvések közötti összefüggés. A gondolat lényege, hogy ha egy ágensnek van valamilyen szintű meggyőződése egy a állítással kapcsolatban, akkor képesnek kell lennie olyan téteket megadni, amelyek mellett mindegy, hogy az a állításra, vagy ellene fogad. Képzeljük el úgy, mint egy játszmát két ágens között: az 1. ágens szerint az én hiedelmem az a eseményben 0,4. A 2. ágens ezután szabadon dönthet, hogy a mellett vagy ellen fogad akkora téttel, amely a nyilatkozott hiedelemfokkal konzisztens. Vagyis a 2. ágens választhatja azt, hogy arra fogad, hogy a esemény bekövetkezik, 4 dollárt téve az 1. ágens 6 dollárjával szemben, vagy tehet 6 dollárt az 1. ágens 4 dollárja ellenében arra fogadva, hogy a nem fog bekövetkezni.[139] Ha egy ágens meggyőződésében nem tükröződik pontosan a világ ismerete, akkor számíthatunk arra, hogy hosszú távon veszíteni fog a szemben álló ágenssel szemben, akinek a hiedelmei pontosabb képet mutatnak a világ állapotáról.

Fontos

De Finetti ennél sokkal erősebb állítást is bizonyított: ha az 1. ágens olyan meggyőződési mértékekben hisz, amelyek megsértik a valószínűség-számítás axiómáit, akkor létezik olyan stratégia a 2. ágens számára, amely biztosítja, hogy az 1. ágens minden alkalommal veszíteni fog. Tehát ha elfogadjuk, hogy egy ágensnek a valószínűségeknek megfelelően kell feltennie a pénzét, akkor azt is el kell fogadnunk, hogy ésszerűtlen olyan meggyőződéseket vallani, amelyek megsértik a valószínűségi axiómákat.

Azt gondolhatjuk, hogy ez a fogadósdi nagyon körmönfont. Mi van például, ha valaki megtagadja, hogy fogadjon? Elrontja-e ez az egész érvelést? Minderre az a válasz, hogy a fogadásos játék elvont modellje annak a döntési helyzetnek, amelyben minden ágens minden pillanatban elkerülhetetlenül részt vesz. Minden cselekvés (beleértve a tétlenséget is) egyfajta fogadás, és a következmény tekinthető a fogadás nyereményének. Épp úgy nem utasíthatjuk vissza a fogadást, mint ahogy nem állíthatjuk meg az idő múlását.

Nem mutatjuk be de Finetti elméletének bizonyítását, de mutatunk rá egy példát. Tegyük fel, hogy az 1. ágens meggyőződése megfelel a (13.3) egyenletnek. A 13.2. ábra azt mutatja, hogy ha a 2. ágens azt választja, hogy 4 dollárt tesz a-ra, 3 dollárt b-re és 2 dollárt ¬(ab)-re, akkor az 1. ágens mindig veszíteni fog, függetlenül attól, hogy a vagy b fog bekövetkezni.

13.2. ábra - Mivel az 1. ágens meggyőződése nem következetes, ezért a 2. ágens tud úgy téteket tenni, amely a és b kimenetelétől függetlenül biztosítja, hogy az 1. ágens veszítsen
Mivel az 1. ágens meggyőződése nem következetes, ezért a 2. ágens tud úgy téteket tenni, amely a és b kimenetelétől függetlenül biztosítja, hogy az 1. ágens veszítsen

Más, erősen filozofikus érveléseket is előterjesztettek a valószínűségek használata mellett, amelyek közül a legnevezetesebb Cox és Carnap nevéhez fűződik (Cox, 1946; Carnap, 1950). Lévén a világ olyan, amilyen, a gyakorlati példák sokszor minden bizonyítéknál erősebbek. Így a valószínűség-számításon alapuló következtető rendszerek sikere minden érvelésnél hatékonyabb volt a hitetlenek megtérítésében. A következőkben azt vizsgáljuk meg, hogy az axiómák hogyan használhatók a következtetésben.



[138] Folytonos változóknál az összegzést integrállal kell helyettesíteni:

[139] Érvelhetünk azzal, hogy az ágens döntését a bankviszonyok fogják meghatározni, azaz 1 dollár elvesztése nincs kiegyensúlyozva 1 dollár azonos valószínűség mellett való megnyerésével. Kellően kicsire választva azonban a tétet, ez a probléma elkerülhető. Savage (Savage, 1954) analízise az egész problémát elkerüli.