13.5. Függetlenség
Bővítsük ki a 13.3. ábrán látható teljes együttes valószínűségi eloszlást egy negyedik, Időjárás változóval. Ezzel a teljes együttes valószínűségi eloszlás P(Fogfájás, Beakadás, Lyuk, Időjárás) lesz 32 bejegyzéssel (mivel az Időjárás változónak négy értéke lehet). A teljes eloszlás a 13.3. ábrán mutatott táblázat négy „példányát” – minden egyes időjárástípusra egyet – fogja magában foglalni. Természetes kérdésnek tűnik, hogy vajon ezeknek a táblázatpéldányoknak mi az egymáshoz és az eredeti háromváltozós táblához való viszonyuk? Hogyan függ össze például a P(fogfájás, beakadás, lyuk, Időjárás = felhős) a P(fogfájás, beakadás, lyuk)-kal?
A megválaszolás egyik lehetséges módja a szorzatszabály alkalmazása:
P(fogfájás, beakadás, lyuk, Időjárás = felhős) = P(Időjárás = felhős|fogfájás, beakadás, lyuk)P(fogfájás, beakadás, lyuk)
Amennyiben eltekintünk az isteni hatalommal bíró páciensektől, nem gondolhatjuk komolyan, hogy valakinek a fogászati problémái befolyásolják az időjárást. Ezért ésszerűnek tűnik a következő kijelentés:
P(Időjárás = felhős∣fogfájás, beakadás, lyuk) = P(Időjárás = felhős) (13.7)
Ebből a következőre következtethetünk:
P(fogfájás, beakadás, lyuk, Időjárás = felhős) = P(Időjárás = felhős)P(fogfájás, beakadás, lyuk)
Hasonló egyenlet írható fel a P(Fogfájás, Beakadás, Lyuk, Időjárás) eloszlás minden egyes bejegyzéséhez. Az általános egyenletet pedig a következőképpen írhatjuk fel:
P(Fogfájás, Beakadás, Lyuk, Időjárás) = P(Fogfájás, Beakadás, Lyuk)P(Időjárás)
Ebből következően a négyváltozós, 32 elemes táblázat létrehozható egy 8 és egy 4 elemes táblázatból. A dekompozíció sematikus vázlatát a 13.5. (a) ábra mutatja.
Azt a tulajdonságot, ami alapján a (13.7) egyenletet felírtuk függetlenségnek (más szóval marginális függetlenségnek vagy abszolút függetlenségnek) (independence, marginal independence, absolute independence) nevezzük. Esetünkben az időjárás független bárkinek a fogászati problémáitól. Az a és b állítások függetlensége felírható:
P(a∣b) = P(a) vagy P(b∣a) = P(b) vagy P(a ∧ b) = P(a)P(b) (13.8)
A fenti képletek egymással ekvivalensek (13.7. feladat). Az X és Y változók közötti függetlenség a következőképpen fejezhető ki (még egyszer felhívjuk a figyelmet, hogy ezek ekvivalensek):
P(X∣Y) = P(X) vagy P(Y∣X) = P(Y) vagy P(X, Y) = P(X)P(Y)
A függetlenségi állítások általában a tartománnyal kapcsolatos ismereteken alapulnak. Mint korábban láthattuk, ezek jelentősen lecsökkenthetik a teljes együttes eloszlás meghatározásához szükséges információ mennyiségét. Ha a változók teljes halmaza szétbontható független részhalmazokra, akkor a teljes együttes eloszlás felbontható ezen részhalmazok felett értelmezett, egymástól független együttes eloszlásokra. Például n független pénzfeldobás eredményének együttes eloszlása P(C1, …, Cn) felírható n egyváltozós P(Ci) eloszlás szorzataként. Még kézzelfoghatóbban: a fogászat és a meteorológia függetlensége jó dolog, különben a fogászati gyakorlat mély meteorológiai ismereteket igényelne, és fordítva.
Amennyiben rendelkezésre állnak, akkor a függetlenségi állítások segíthetnek lecsökkenteni a tartományleírások méretét, valamint a következtetési feladat bonyolultságát. Sajnos azonban a változók teljes halmazait csak nagyon ritkán lehet függetlenség alapján egyértelműen szétválasztani. A függetlenség nem lesz igaz az olyan esetekben, amikor bármilyen, akár indirekt kapcsolat is, de fennáll két változó között. Ezen kívül, a független részhalmazok mérete is lehet egészen nagy – például a fogászat problémaköre egymással összefüggő betegségek tucatjait és tünetek százait takarhatja. Az ilyen típusú problémák kezelésére a függetlenség közvetlen kimondásánál kifinomultabb módszerekre lesz szükségünk.