Kétosztályos (bináris) osztályozási feladatot oldunk meg. 9 paramétert mérünk minden példán, és a véletlen módon kiválasztott, mért és minősített (ismert osztálybasorolású) minták alapján egy egyetlen lineáris neuronból és küszöbfüggvényből álló „neuronhálót” (perceptront) tanítunk, mert sejtjük, hogy ilyennel a feladat megoldható, és egyszerűen kezelhető. A tanítás végén 100%-os pontosságot értünk el az 5 000 tanítómintán.
Az osztályozót el tudjuk adni 1000 euróért, de vállalnunk kell, hogy ha nem teljesít legalább 99,5% pontosságot, akkor 100 000 euró kártérítést fizetünk. A biztonság kedvéért feltételezzük (bár ez nem igaz), hogy a szükséges mintaszámra vonatkozó korlátot pontos becslésnek vehetjük, várhatóan nyereséges lesz-e az üzlet? (A becslést pontos értéknek elfogadva a biztonság irányába tévedünk, legtöbbször nem is keveset, mert a becslés gyakran túlzó.)
MEGOLDÁS:
Ha a siker valószínűsége p, és ez esetben Ny nyereségünk van, míg ellenkező esetben V veszteségünk, akkor a várható nyereség
.
Itt nem használható a Russel-Norvig könyvben (772. oldal) megismert gondolatmenettel felállított korlát, mert a hipotézistér mérete végtelen. (A neuron súlyai folytonosak.) Ebben a megközelítésben a komplexitást az VC dimenziójával fogjuk meg. Tudjuk, hogy a d=9 dimenziós térben felvett sík (amellyel osztályozni fogunk) VC dimenziója h = d+1=10.
Itt azt tudjuk, hogy a mintaszám: L=5 000; a VC dimenzió: h=10; Remp(w)=0 (mivel a pontosság 100%).
Kétféle módon is megkísérelhetjük a feladat megoldását. Az egyik, hogy meghatározzuk, milyen biztonsággal tudjuk biztosítani a kívánt pontosságot (99,5% a megengedhető hiba, tehát a kívánt pontosság R(w)=0,05) – ez összefüggésünkben az
paraméter meghatározását jelenti. Ez egy nemlineáris egyenlet megoldását igényelné, válasszuk inkább a másik utat.
A másik lehetőség, hogy megvizsgáljuk mi a siker megkívánt bizonyossága, tehát
-ból indulunk ki, és megvizsgáljuk, hogy mekkora hibát tudunk ezzel a bizonyossággal garantálni. Az adott nyereség/veszteség viszonyok mellett a nyereségesség határhelyzetéből (a nulla várható nyereségből)
.
Ebből az egyenletből határozható meg a szükséges
. Tehát
,
aminek megoldása:
(a szükséges bizonyosság 0,99, azaz 99%). Az ehhez tartozó
érték:
Az ehhez tartozó általánosítási hiba (a korlátot pontos értéknek véve):
Ez 5,16% hibát jelent, tehát a kívánt sikerességi valószínűséggel csak kb. 94,8% pontosságot tudunk garantálni.
Tehát a 99,5% pontosságot nem tudjuk a kívánt megbízhatósággal garantálni, ha a képletünk pontos vagy közel pontos, akkor az üzlet – ezekkel a feltételekkel, és ezzel az eszközzel – várhatóan veszteséges lesz.
Szerző: Pataki Béla, BME