2.3. A statisztikus tanuláselmélet alapjai

2.3.1. Az általánosítási hibakorlátra adható becslés felhasználása (BME)

A feladat célkitűzése:

A feladat célja annak bemutatása, hogy miért fontos ismerni a szükséges mintaszám és az általánosítási hiba közti minél pontosabb összefüggést.

A feladat leírása:

Kétosztályos (bináris) osztályozási feladatot oldunk meg. 9 paramétert mérünk minden példán, és a véletlen módon kiválasztott, mért és minősített (ismert osztálybasorolású) minták alapján egy egyetlen lineáris neuronból és küszöbfüggvényből álló „neuronhálót” (perceptront) tanítunk, mert sejtjük, hogy ilyennel a feladat megoldható, és egyszerűen kezelhető. A tanítás végén 100%-os pontosságot értünk el az 5 000 tanítómintán.

Az osztályozót el tudjuk adni 1000 euróért, de vállalnunk kell, hogy ha nem teljesít legalább 99,5% pontosságot, akkor 100 000 euró kártérítést fizetünk. A biztonság kedvéért feltételezzük (bár ez nem igaz), hogy a szükséges mintaszámra vonatkozó korlátot pontos becslésnek vehetjük, várhatóan nyereséges lesz-e az üzlet? (A becslést pontos értéknek elfogadva a biztonság irányába tévedünk, legtöbbször nem is keveset, mert a becslés gyakran túlzó.)

MEGOLDÁS:

Ha a siker valószínűsége p, és ez esetben Ny nyereségünk van, míg ellenkező esetben V veszteségünk, akkor a várható nyereség VárhatóNyereség=pNy(1p)V MathType@MTEF@5@5@+=feaagCart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr4rNCHbGeaGqiVCI8FfYJH8YrFfeuY=Hhbbf9v8qqaqFr0xc9pk0xbba9q8WqFfeaY=biLkVcLq=JHqpepeea0=as0Fb9pgeaYRXxe9vr0=vr0=vqpWqaaeaabiGaciaacaqabeaadaqaaqaaaOqaaiaadAfacaWGHdGaamOCaiaadIgacaWGHbGaamiDaiaadopacaWGobGaamyEaiaadwgacaWGYbGaamyzaiaadohacaWGPdGaam4zaiabg2da9iaadchacqGHflY1caWGobGaamyEaiabgkHiTiaacIcacaaIXaGaeyOeI0IaamiCaiaacMcacqGHflY1caWGwbaaaa@5371@ .

Itt nem használható a Russel-Norvig könyvben (772. oldal) megismert gondolatmenettel felállított korlát, mert a hipotézistér mérete végtelen. (A neuron súlyai folytonosak.) Ebben a megközelítésben a komplexitást az VC dimenziójával fogjuk meg. Tudjuk, hogy a d=9 dimenziós térben felvett sík (amellyel osztályozni fogunk) VC dimenziója h = d+1=10.

R( w ) R emp (w)+ ε(h) 2 1+ 4 R emp (w) ε(h) MathType@MTEF@5@5@+=feaagCart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr4rNCHbGeaGqiVCI8FfYJH8YrFfeuY=Hhbbf9v8qqaqFr0xc9pk0xbba9q8WqFfeaY=biLkVcLq=JHqpepeea0=as0Fb9pgeaYRXxe9vr0=vr0=vqpWqaaeaabiGaciaacaqabeaadaqaaqaaaOqaaiaahkfadaqadaqaaiaahEhaaiaawIcacaGLPaaacqGHKjYOcaWHsbWaaSbaaSqaaiaahwgacaWHTbGaaCiCaaqabaGccaGGOaGaaC4DaiaacMcacqGHRaWkdaWcaaqaaiabew7aLjaacIcacaWGObGaaiykaaqaaiaaikdaaaWaaOaaaeaacaaIXaGaey4kaSYaaSaaaeaacaaI0aGaeyyXICTaaCOuamaaBaaaleaacaWHLbGaaCyBaiaahchaaeqaaOGaaiikaiaahEhacaGGPaaabaGaeqyTduMaaiikaiaadIgacaGGPaaaaaWcbeaaaaa@55E8@

ε(h)=4 ln(2 L h +1)ln( η 4 ) L/h MathType@MTEF@5@5@+=feaagCart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr4rNCHbGeaGqiVCI8FfYJH8YrFfeuY=Hhbbf9v8qqaqFr0xc9pk0xbba9q8WqFfeaY=biLkVcLq=JHqpepeea0=as0Fb9pgeaYRXxe9vr0=vr0=vqpWqaaeaabiGaciaacaqabeaadaqaaqaaaOqaaiabew7aLjaacIcacaWGObGaaiykaiabg2da9iaaisdacqGHflY1daWcaaqaaiGacYgacaGGUbGaaiikaiaaikdadaWcaaqaaiaadYeaaeaacaWGObaaaiabgUcaRiaaigdacaGGPaGaeyOeI0IaciiBaiaac6gacaGGOaWaaSaaaeaacqaH3oaAaeaacaaI0aaaaiaacMcaaeaacaWGmbGaai4laiaadIgaaaaaaa@4E6D@

Itt azt tudjuk, hogy a mintaszám: L=5 000; a VC dimenzió: h=10; Remp(w)=0 (mivel a pontosság 100%).

Kétféle módon is megkísérelhetjük a feladat megoldását. Az egyik, hogy meghatározzuk, milyen biztonsággal tudjuk biztosítani a kívánt pontosságot (99,5% a megengedhető hiba, tehát a kívánt pontosság R(w)=0,05) – ez összefüggésünkben az η MathType@MTEF@5@5@+=feaagCart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8srps0lbbf9q8WrFfeuY=Hhbbf9v8qqaqFr0xc9pk0xbba9q8WqFfea0=yr0RYxir=Jbba9q8aq0=yq=He9q8qqQ8frFve9Fve9Ff0dmeaabaqaciGacaGaaeqabaqabeaadaaakeaacqaH3oaAaaa@3366@ paraméter meghatározását jelenti. Ez egy nemlineáris egyenlet megoldását igényelné, válasszuk inkább a másik utat.

A másik lehetőség, hogy megvizsgáljuk mi a siker megkívánt bizonyossága, tehát η MathType@MTEF@5@5@+=feaagCart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8srps0lbbf9q8WrFfeuY=Hhbbf9v8qqaqFr0xc9pk0xbba9q8WqFfea0=yr0RYxir=Jbba9q8aq0=yq=He9q8qqQ8frFve9Fve9Ff0dmeaabaqaciGacaGaaeqabaqabeaadaaakeaacqaH3oaAaaa@3366@ -ból indulunk ki, és megvizsgáljuk, hogy mekkora hibát tudunk ezzel a bizonyossággal garantálni. Az adott nyereség/veszteség viszonyok mellett a nyereségesség határhelyzetéből (a nulla várható nyereségből)

ηVeszteség+(1η)Nyereség=0 MathType@MTEF@5@5@+=feaagCart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr4rNCHbGeaGqiVCI8FfYJH8YrFfeuY=Hhbbf9v8qqaqFr0xc9pk0xbba9q8WqFfeaY=biLkVcLq=JHqpepeea0=as0Fb9pgeaYRXxe9vr0=vr0=vqpWqaaeaabiGaciaacaqabeaadaqaaqaaaOqaaiabeE7aOjabgwSixlaadAfacaWGLbGaam4CaiaadQhacaWG0bGaamyzaiaadohacaWGPdGaam4zaiabgUcaRiaacIcacaaIXaGaeyOeI0Iaeq4TdGMaaiykaiabgwSixlaad6eacaWG5bGaamyzaiaadkhacaWGLbGaam4CaiaadMoacaWGNbGaeyypa0JaaGimaaaa@5457@ .

Ebből az egyenletből határozható meg a szükséges η MathType@MTEF@5@5@+=feaagCart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8srps0lbbf9q8WrFfeuY=Hhbbf9v8qqaqFr0xc9pk0xbba9q8WqFfea0=yr0RYxir=Jbba9q8aq0=yq=He9q8qqQ8frFve9Fve9Ff0dmeaabaqaciGacaGaaeqabaqabeaadaaakeaacqaH3oaAaaa@3366@ . Tehát

99000η+1000(1η)=0 MathType@MTEF@5@5@+=feaagCart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8srps0lbbf9q8WrFfeuY=Hhbbf9v8qqaqFr0xc9pk0xbba9q8WqFfea0=yr0RYxir=Jbba9q8aq0=yq=He9q8qqQ8frFve9Fve9Ff0dmeaabaqaciGacaGaaeqabaqabeaadaaakeaacqGHsislcaaI5aGaaGyoaiaaicdacaaIWaGaaGimaiabgwSixlabeE7aOjabgUcaRiaaigdacaaIWaGaaGimaiaaicdacqGHflY1caGGOaGaaGymaiabgkHiTiabeE7aOjaacMcacqGH9aqpcaaIWaaaaa@46D2@ ,

aminek megoldása: η=0,01 MathType@MTEF@5@5@+=feaagCart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8srps0lbbf9q8WrFfeuY=Hhbbf9v8qqaqFr0xc9pk0xbba9q8WqFfea0=yr0RYxir=Jbba9q8aq0=yq=He9q8qqQ8frFve9Fve9Ff0dmeaabaqaciGacaGaaeqabaqabeaadaaakeaacqaH3oaAcqGH9aqpcaaIWaGaaiilaiaaicdacaaIXaaaaa@374B@ (a szükséges bizonyosság 0,99, azaz 99%). Az ehhez tartozó ε MathType@MTEF@5@5@+=feaagCart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8srps0lbbf9q8WrFfeuY=Hhbbf9v8qqaqFr0xc9pk0xbba9q8WqFfea0=yr0RYxir=Jbba9q8aq0=yq=He9q8qqQ8frFve9Fve9Ff0dmeaabaqaciGacaGaaeqabaqabeaadaaakeaacqaH1oqzaaa@3361@ érték:

ε=4 ln(2 5000 10 +1)ln( 0,01 4 ) 5000/10 =0,1032 MathType@MTEF@5@5@+=feaagCart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr4rNCHbGeaGqiVCI8FfYJH8YrFfeuY=Hhbbf9v8qqaqFr0xc9pk0xbba9q8WqFfeaY=biLkVcLq=JHqpepeea0=as0Fb9pgeaYRXxe9vr0=vr0=vqpWqaaeaabiGaciaacaqabeaadaqaaqaaaOqaaiabew7aLjabg2da9iaaisdacqGHflY1daWcaaqaaiGacYgacaGGUbGaaiikaiaaikdadaWcaaqaaiaaiwdacaaIWaGaaGimaiaaicdaaeaacaaIXaGaaGimaaaacqGHRaWkcaaIXaGaaiykaiabgkHiTiGacYgacaGGUbGaaiikamaalaaabaGaaGimaiaacYcacaaIWaGaaGymaaqaaiaaisdaaaGaaiykaaqaaiaaiwdacaaIWaGaaGimaiaaicdacaGGVaGaaGymaiaaicdaaaGaeyypa0JaaCimaiaahYcacaaIXaGaaGimaiaaiodacaaIYaaaaa@5804@

Az ehhez tartozó általánosítási hiba (a korlátot pontos értéknek véve):

R( w )= R emp (w)+ ε(h) 2 1+ 4 R emp (w) ε(h) =0+ 0.1032 2 1=0,0516 MathType@MTEF@5@5@+=feaagCart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr4rNCHbGeaGqiVCI8FfYJH8YrFfeuY=Hhbbf9v8qqaqFr0xc9pk0xbba9q8WqFfeaY=biLkVcLq=JHqpepeea0=as0Fb9pgeaYRXxe9vr0=vr0=vqpWqaaeaabiGaciaacaqabeaadaqaaqaaaOqaaiaahkfadaqadaqaaiaahEhaaiaawIcacaGLPaaacqGH9aqpcaWHsbWaaSbaaSqaaiaahwgacaWHTbGaaCiCaaqabaGccaGGOaGaaC4DaiaacMcacqGHRaWkdaWcaaqaaiabew7aLjaacIcacaWGObGaaiykaaqaaiaaikdaaaWaaOaaaeaacaaIXaGaey4kaSYaaSaaaeaacaaI0aGaeyyXICTaaCOuamaaBaaaleaacaWHLbGaaCyBaiaahchaaeqaaOGaaiikaiaahEhacaGGPaaabaGaeqyTduMaaiikaiaadIgacaGGPaaaaaWcbeaakiabg2da9iaaicdacqGHRaWkdaWcaaqaaiaaicdacaGGUaGaaGymaiaaicdacaaIZaGaaGOmaaqaaiaaikdaaaGaeyyXICTaaGymaiabg2da9iaaicdacaGGSaGaaGimaiaaiwdacaaIXaGaaGOnaaaa@6574@

Ez 5,16% hibát jelent, tehát a kívánt sikerességi valószínűséggel csak kb. 94,8% pontosságot tudunk garantálni.

Tehát a 99,5% pontosságot nem tudjuk a kívánt megbízhatósággal garantálni, ha a képletünk pontos vagy közel pontos, akkor az üzlet – ezekkel a feltételekkel, és ezzel az eszközzel – várhatóan veszteséges lesz.

Szerző: Pataki Béla, BME