4.2. Az MLP tanítása, a hibavisszaterjesztéses algoritmus

A hibavisszaterjesztéses algoritmusta 4.1 ábrán látható MLP architektúra segítségével fogjuk származtatni. Az algoritmus egy pillanatnyi gradiensen alapuló iteratív tanuló eljárás, melynek származtatásánál az elemi neuron tanításánál alkalmazott utat fogjuk követni. Minthogy iteratív eljárásról van szó, az egyes súlyok, illetve súlyvektorok lépésenkénti módosító összefüggéseit írjuk fel. A már bevezetett jelöléseken túl k szolgál a diszkrét lépésindex jelölésére. Így w i (l) ( k ) MathType@MTEF@5@5@+=feaagCart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr4rNCHbGeaGqipu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=xfr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaGaaC4DamaaDaaaleaacaWGPbaabaGaaiikaiaadYgacaGGPaaaaOWaaeWaaeaacaWGRbaacaGLOaGaayzkaaaaaa@3CBC@ az l-edik réteg, i-edik processzáló elemének a k-adik időpillanatban érvényes súlyvektorát, w ij (l) ( k ) MathType@MTEF@5@5@+=feaagCart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr4rNCHbGeaGqipu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=xfr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaGaam4DamaaDaaaleaacaWGPbGaamOAaaqaaiaacIcacaWGSbGaaiykaaaakmaabmaabaGaam4AaaGaayjkaiaawMcaaaaa@3DA7@ pedig értelemszerűen ugyanezen súlyvektornak a j-edik komponensét jelöli.

A hálózat tanítását két (aktív) rétegű hálózaton mutatjuk be, de az eredmények természetes módon kiterjeszthetők tetszőleges rétegszámra is.

Először írjuk fel a háló kimeneti négyzetes hibáját a k-adik lépésben.

ε 2 (k)= ε 1 2 (k)+ ε 2 2 (k)= ( y 1 (k) d 1 (k) ) 2 + ( y 2 (k) d 2 (k) ) 2 MathType@MTEF@5@5@+=feaagCart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr4rNCHbGeaGqipu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=xfr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaGaeqyTdu2aaWbaaSqabeaacaaIYaaaaOGaaeikaiaadUgacaqGPaGaeyypa0JaeqyTdu2aa0baaSqaaiaaigdaaeaacaaIYaaaaOGaaeikaiaadUgacaqGPaGaey4kaSIaeqyTdu2aa0baaSqaaiaaikdaaeaacaaIYaaaaOGaaeikaiaadUgacaqGPaGaeyypa0ZaaeWaaeaacaWG5bWaaSbaaSqaaiaaigdaaeqaaOGaaeikaiaadUgacaqGPaGaeyOeI0IaamizamaaBaaaleaacaaIXaaabeaakiaabIcacaWGRbGaaeykaaGaayjkaiaawMcaamaaCaaaleqabaGaaGOmaaaakiabgUcaRmaabmaabaGaamyEamaaBaaaleaacaaIYaaabeaakiaabIcacaWGRbGaaeykaiabgkHiTiaadsgadaWgaaWcbaGaaGOmaaqabaGccaqGOaGaam4AaiaabMcaaiaawIcacaGLPaaadaahaaWcbeqaaiaaikdaaaaaaa@6136@ . (4.2)

A súlymódosításhoz a megfelelő súlyok szerinti pillanatnyi deriváltakat

ij (l) (k)= ε 2 (k) w ij (l) (k) MathType@MTEF@5@5@+=feaagCart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr4rNCHbGeaGqipu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=xfr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaGaey4bIe9aa0baaSqaaiaadMgacaWGQbaabaGaaeikaiaadYgacaqGPaaaaOGaaeikaiaadUgacaqGPaGaeyypa0ZaaSaaaeaacqGHciITcqaH1oqzdaahaaWcbeqaaiaayIW7caaIYaaaaOGaaeikaiaadUgacaqGPaaabaGaeyOaIyRaam4DamaaDaaaleaacaWGPbGaamOAaaqaaiaayIW7caqGOaGaamiBaiaabMcaaaGccaqGOaGaam4AaiaabMcaaaaaaa@5181@ (4.3)

illetve a súlyvektorok szerinti pillanatnyi gradienseket

i (l) (k)= ε 2 (k) w i (l) (k) MathType@MTEF@5@5@+=feaagCart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr4rNCHbGeaGqipu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=xfr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaacceGae83bIe9aa0baaSqaaiaadMgaaeaacaqGOaGaamiBaiaabMcaaaGccaqGOaGaam4AaiaabMcacqGH9aqpdaWcaaqaaiabgkGi2kabew7aLnaaCaaaleqabaGaaGjcVlaaikdaaaGccaqGOaGaam4AaiaabMcaaeaacqGHciITcaWH3bWaa0baaSqaaiaadMgaaeaacaaMi8UaaeikaiaadYgacaqGPaaaaOGaaeikaiaadUgacaqGPaaaaaaa@4FAB@ (4.4)

kell kiszámítani. A továbbiakban a (k) lépésindexet csak ott fogjuk jelölni, ahol ez az érthetőség miatt szükséges.

A kimeneti rétegnél (l=L=2) a pillanatnyi derivált (gradiens) megegyezik a szigmoid nemlinearitással rendelkező elemi neuronnál meghatározott deriválttal (gradienssel), hiszen a kimeneti réteg processzáló elemeinek működése semmiben sem tér el az egyetlen, szigmoid kimeneti nemlinearitással rendelkező PE működésétől.

ε 2 w ij (2) =2 ε i sg m ( s i (2) ) x j ( 2 ) =2 δ i ( 2 ) x j ( 2 ) MathType@MTEF@5@5@+=feaagCart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr4rNCHbGeaGqipu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=xfr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaWaaSaaaeaacqGHciITcqaH1oqzdaahaaWcbeqaaiaaikdaaaaakeaacqGHciITcaaMc8Uaam4DamaaDaaaleaacaaMi8UaamyAaiaadQgaaeaacaaMi8UaaeikaiaaikdacaqGPaaaaaaakiabg2da9iabgkHiTiaaikdacqaH1oqzdaWgaaWcbaGaamyAaaqabaGccaqGZbGaae4zaiqab2gagaqbamaabmaabaGaam4CamaaDaaaleaacaWGPbaabaGaaeikaiaaikdacaqGPaaaaaGccaGLOaGaayzkaaGaaGjcVlaayIW7caaMi8UaamiEamaaDaaaleaacaWGQbaabaWaaeWaaeaacaaIYaaacaGLOaGaayzkaaaaaOGaeyypa0JaeyOeI0IaaGOmaiabes7aKnaaDaaaleaacaWGPbaabaWaaeWaaeaacaaIYaaacaGLOaGaayzkaaaaaOGaamiEamaaDaaaleaacaWGQbaabaWaaeWaaeaacaaIYaaacaGLOaGaayzkaaaaaaaa@6860@ , (4.5)

illetve vektoros formában írva:

ε 2 w i (2) =2 ε i sg m ( s i ( 2 ) ) x ( 2 ) =2 δ i (2) x (2) MathType@MTEF@5@5@+=feaagCart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr4rNCHbGeaGqipu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=xfr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaWaaSaaaeaacqGHciITcqaH1oqzdaahaaWcbeqaaiaayIW7caaIYaaaaaGcbaGaeyOaIyRaaC4DamaaDaaaleaacaWGPbaabaGaaeikaiaaikdacaqGPaaaaaaakiabg2da9iabgkHiTiaaikdacqaH1oqzdaWgaaWcbaGaamyAaaqabaGccaqGZbGaae4zaiqab2gagaqbamaabmaabaGaam4CamaaDaaaleaacaWGPbaabaWaaeWaaeaacaaIYaaacaGLOaGaayzkaaaaaaGccaGLOaGaayzkaaGaaGjcVlaayIW7caaMi8UaaCiEamaaCaaaleqabaWaaeWaaeaacaaIYaaacaGLOaGaayzkaaaaaOGaeyypa0JaeyOeI0IaaGOmaiabes7aKnaaDaaaleaacaWGPbaabaGaaGjcVlaabIcacaaIYaGaaeykaaaakiaahIhadaahaaWcbeqaaiaabIcacaaIYaGaaeykaaaaaaa@63E2@ (4.6)

A súlymódosítás tehát

w i ( 2 ) ( k+1 )= w i ( 2 ) ( k )+2μ ε i ( k )sg m ( s i ( 2 ) (k) ) x ( 2 ) ( k )= w i ( 2 ) ( k )+2μ δ i ( 2 ) ( k ) x ( 2 ) ( k ) MathType@MTEF@5@5@+=feaagCart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr4rNCHbGeaGqipu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=xfr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaGaaC4DamaaDaaaleaacaWGPbaabaWaaeWaaeaacaaIYaaacaGLOaGaayzkaaaaaOWaaeWaaeaacaWGRbGaey4kaSIaaGymaaGaayjkaiaawMcaaiabg2da9iaahEhadaqhaaWcbaGaamyAaaqaamaabmaabaGaaGOmaaGaayjkaiaawMcaaaaakmaabmaabaGaam4AaaGaayjkaiaawMcaaiabgUcaRiaaikdacqaH8oqBcqaH1oqzdaWgaaWcbaGaamyAaaqabaGcdaqadaqaaiaadUgaaiaawIcacaGLPaaacaaMi8UaaGjcVlaabohacaqGNbGabeyBayaafaWaaeWaaeaacaWGZbWaa0baaSqaaiaadMgaaeaadaqadaqaaiaaikdaaiaawIcacaGLPaaaaaGccaqGOaGaam4AaiaabMcaaiaawIcacaGLPaaacaaMi8UaaGjcVlaahIhadaqhaaWcbaaabaWaaeWaaeaacaaIYaaacaGLOaGaayzkaaaaaOWaaeWaaeaacaWGRbaacaGLOaGaayzkaaGaeyypa0JaaC4DamaaDaaaleaacaWGPbaabaWaaeWaaeaacaaIYaaacaGLOaGaayzkaaaaaOWaaeWaaeaacaWGRbaacaGLOaGaayzkaaGaey4kaSIaaGOmaiabeY7aTjabes7aKnaaDaaaleaacaaMi8UaamyAaaqaaiaayIW7caaMi8+aaeWaaeaacaaIYaaacaGLOaGaayzkaaaaaOWaaeWaaeaacaWGRbaacaGLOaGaayzkaaGaaGjcVlaayIW7caWH4bWaa0baaSqaaaqaamaabmaabaGaaGOmaaGaayjkaiaawMcaaaaakmaabmaabaGaam4AaaGaayjkaiaawMcaaaaa@86AD@ (4.7)

A rejtett réteg processzáló elemeinél a fenti összefüggések közvetlenül nem alkalmazhatók, mivel nem ismerjük az egyes processzáló elemek kimenetén fellépő hibát. A lánc-szabály alkalmazásával azonban a deriváltakat itt is meg tudjuk határozni, hiszen a rejtett réteg processzáló elemeinek súlytényezői befolyásolják ezen processzáló elemek lineáris (s) és nemlineáris (y) kimeneteit, továbbá ezen kimeneteken keresztül a későbbi rétegek kimeneteit is. Tehát a parciális deriváltak lépésenként számíthatók.

ε 2 w ij (1) = ε 2 s i (1) s i (1) w ij (1) = ( ε 1 2 + ε 2 2 ) s i (1) s i (1) w ij (1) = ε 1 2 s i (1) s i (1) w ij (1) + ε 2 2 s i (1) s i (1) w ij (1) =2 ε 1 ε 1 s i (1) s i (1) w ij (1) +2 ε 2 ε 1 s i (1) s i (1) w ij (1) MathType@MTEF@5@5@+=feaagCart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr4rNCHbGeaGqipu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=xfr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGceaqabeaadaWcaaqaaiabgkGi2kabew7aLnaaCaaaleqabaGaaGjcVlaaikdaaaaakeaacqGHciITcaWG3bWaa0baaSqaaiaadMgacaWGQbaabaGaaeikaiaaigdacaqGPaaaaaaakiabg2da9maalaaabaGaeyOaIyRaeqyTdu2aaWbaaSqabeaacaaIYaaaaaGcbaGaeyOaIyRaam4CamaaDaaaleaacaWGPbaabaGaaeikaiaaigdacaqGPaaaaaaakmaalaaabaGaeyOaIyRaam4CamaaDaaaleaacaWGPbaabaGaaeikaiaaigdacaqGPaaaaaGcbaGaeyOaIyRaam4DamaaDaaaleaacaWGPbGaamOAaaqaaiaabIcacaaIXaGaaeykaaaaaaGccqGH9aqpdaWcaaqaaiabgkGi2oaabmaabaGaeqyTdu2aa0baaSqaaiaaigdaaeaacaaIYaaaaOGaey4kaSIaeqyTdu2aa0baaSqaaiaaikdaaeaacaaIYaaaaaGccaGLOaGaayzkaaaabaGaeyOaIyRaam4CamaaDaaaleaacaWGPbaabaGaaeikaiaaigdacaqGPaaaaaaakmaalaaabaGaeyOaIyRaam4CamaaDaaaleaacaWGPbaabaGaaeikaiaaigdacaqGPaaaaaGcbaGaeyOaIyRaam4DamaaDaaaleaacaWGPbGaamOAaaqaaiaabIcacaaIXaGaaeykaaaaaaGccqGH9aqpdaWcaaqaaiabgkGi2kabew7aLnaaDaaaleaacaaIXaaabaGaaGOmaaaaaOqaaiabgkGi2kaadohadaqhaaWcbaGaamyAaaqaaiaabIcacaaIXaGaaeykaaaaaaGcdaWcaaqaaiabgkGi2kaadohadaqhaaWcbaGaamyAaaqaaiaabIcacaaIXaGaaeykaaaaaOqaaiabgkGi2kaadEhadaqhaaWcbaGaamyAaiaadQgaaeaacaqGOaGaaGymaiaabMcaaaaaaOGaey4kaSYaaSaaaeaacqGHciITcqaH1oqzdaqhaaWcbaGaaGOmaaqaaiaaikdaaaaakeaacqGHciITcaWGZbWaa0baaSqaaiaadMgaaeaacaqGOaGaaGymaiaabMcaaaaaaOWaaSaaaeaacqGHciITcaWGZbWaa0baaSqaaiaadMgaaeaacaqGOaGaaGymaiaabMcaaaaakeaacqGHciITcaWG3bWaa0baaSqaaiaadMgacaWGQbaabaGaaeikaiaaigdacaqGPaaaaaaaaOqaaiaayIW7caaMi8UaaGjcVlabg2da9iaaikdacqaH1oqzdaWgaaWcbaGaaGjcVlaaigdaaeqaaOWaaSaaaeaacqGHciITcqaH1oqzdaqhaaWcbaGaaGymaaqaaaaaaOqaaiabgkGi2kaadohadaqhaaWcbaGaamyAaaqaaiaabIcacaaIXaGaaeykaaaaaaGcdaWcaaqaaiabgkGi2kaadohadaqhaaWcbaGaamyAaaqaaiaabIcacaaIXaGaaeykaaaaaOqaaiabgkGi2kaadEhadaqhaaWcbaGaamyAaiaadQgaaeaacaqGOaGaaGymaiaabMcaaaaaaOGaey4kaSIaaGOmaiabew7aLnaaBaaaleaacaaIYaaabeaakmaalaaabaGaeyOaIyRaeqyTdu2aa0baaSqaaiaaigdaaeaaaaaakeaacqGHciITcaWGZbWaa0baaSqaaiaadMgaaeaacaqGOaGaaGymaiaabMcaaaaaaOWaaSaaaeaacqGHciITcaWGZbWaa0baaSqaaiaadMgaaeaacaqGOaGaaGymaiaabMcaaaaakeaacqGHciITcaWG3bWaa0baaSqaaiaadMgacaWGQbaabaGaaeikaiaaigdacaqGPaaaaaaaaaaa@DFA0@ (4.8)

Ismét a lánc-szabályt alkalmazva a hibakomponensek parciális deriváltjai meghatározhatók.

ε 1 MathType@MTEF@5@5@+=feaagCart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr4rNCHbGeaGqipu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=xfr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaGaeqyTdu2aaSbaaSqaaiaaigdaaeqaaaaa@3862@ -re bemutatva:

ε 1 s i (1) = ε 1 s 1 (2) s 1 (2) y i (1) y i (1) s i (1) =sg m ( s 1 ( 2 ) ) w 1i ( 2 ) sg m ( s i ( 1 ) ) MathType@MTEF@5@5@+=feaagCart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr4rNCHbGeaGqipu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=xfr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaWaaSaaaeaacqGHciITcqaH1oqzdaqhaaWcbaGaaGymaaqaaaaaaOqaaiabgkGi2kaadohadaqhaaWcbaGaamyAaaqaaiaabIcacaaIXaGaaeykaaaaaaGccqGH9aqpdaWcaaqaaiabgkGi2kabew7aLnaaDaaaleaacaaIXaaabaaaaaGcbaGaeyOaIyRaam4CamaaDaaaleaacaaIXaaabaGaaeikaiaaikdacaqGPaaaaaaakmaalaaabaGaeyOaIyRaam4CamaaDaaaleaacaaIXaaabaGaaeikaiaaikdacaqGPaaaaaGcbaGaeyOaIyRaamyEamaaDaaaleaacaWGPbaabaGaaeikaiaaigdacaqGPaaaaaaakmaalaaabaGaeyOaIyRaamyEamaaDaaaleaacaWGPbaabaGaaeikaiaaigdacaqGPaaaaaGcbaGaeyOaIyRaam4CamaaDaaaleaacaWGPbaabaGaaeikaiaaigdacaqGPaaaaaaakiabg2da9iabgkHiTGqaaiaa=nhacaWFNbGab8xBayaafaWaaeWaaeaacaWGZbWaa0baaSqaaiaaigdaaeaadaqadaqaaiaaikdaaiaawIcacaGLPaaaaaaakiaawIcacaGLPaaacaaMi8UaaGjcVlaadEhadaqhaaWcbaGaaGymaiaadMgaaeaadaqadaqaaiaaikdaaiaawIcacaGLPaaaaaGccaWFZbGaa83zaiqa=1gagaqbamaabmaabaGaam4CamaaDaaaleaacaWGPbaabaWaaeWaaeaacaaIXaaacaGLOaGaayzkaaaaaaGccaGLOaGaayzkaaaaaa@7BCB@ , (4.9)

majd az ε 2 MathType@MTEF@5@5@+=feaagCart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr4rNCHbGeaGqipu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=xfr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaGaeqyTdu2aaSbaaSqaaiaaikdaaeqaaaaa@3863@ -re hasonlóan nyerhető deriváltat felhasználva a gradiens a következőre adódik:

ε 2 w ij ( 1 ) =2 ε 1 sg m ( s 1 (2) ) w 1i ( 2 ) sg m ( s i (1) ) s i (1) w ij ( 1 ) 2 ε 2 sg m ( s 2 (2) ) w 2i (2) sg m ( s i (1) ) s i (1) w ij ( 1 ) =( 2 δ 1 ( 2 ) w 1i ( 2 ) +2 δ 2 ( 2 ) w 2i ( 2 ) )sg m ( s i (1) ) x j ( 1 ) =2 δ i ( 1 ) x j ( 1 ) , MathType@MTEF@5@5@+=feaagCart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr4rNCHbGeaGqkLspw0le9v8qqaqFD0xXdHaVhbbf9v8qqaqFr0xc9pk0xbba9q8WqFfea0=yr0RYxir=Jbba9q8aq0=yq=He9q8qqQ8frFve9Fve9Ff0dmeaabaqaciGacaGaaeqabaWaaeaaeaaakqaabeqaamaalaaabaGaeyOaIyRaeqyTdu2aaWbaaSqabeaacaaIYaaaaaGcbaGaeyOaIyRaaGPaVlaadEhadaqhaaWcbaGaamyAaiaadQgaaeaadaqadaqaaiaaigdaaiaawIcacaGLPaaaaaaaaOGaeyypa0JaeyOeI0IaaGOmaiabew7aLnaaBaaaleaacaaIXaaabeaakiaayIW7caqGZbGaae4zaiqab2gagaqbaiaayIW7daqadaqaaiaadohadaqhaaWcbaGaaGymaaqaaiaabIcacaaIYaGaaeykaaaaaOGaayjkaiaawMcaaiaayIW7caaMi8Uaam4DamaaDaaaleaacaaIXaGaamyAaaqaamaabmaabaGaaGOmaaGaayjkaiaawMcaaaaakiaayIW7caqGZbGaae4zaiqab2gagaqbaiaayIW7daqadaqaaiaadohadaqhaaWcbaGaamyAaaqaaiaabIcacaaIXaGaaeykaaaaaOGaayjkaiaawMcaaiaayIW7caaMi8+aaSaaaeaacqGHciITcaWGZbWaa0baaSqaaiaadMgaaeaacaqGOaGaaGymaiaabMcaaaaakeaacqGHciITcaaMc8Uaam4DamaaDaaaleaacaWGPbGaamOAaaqaamaabmaabaGaaGymaaGaayjkaiaawMcaaaaaaaGccqGHsislcaaIYaGaeqyTdu2aaSbaaSqaaiaaikdaaeqaaOGaaGjcVlaabohacaqGNbGabeyBayaafaGaaGjcVpaabmaabaGaam4CamaaDaaaleaacaaIYaaabaGaaeikaiaaikdacaqGPaaaaaGccaGLOaGaayzkaaGaaGjcVlaayIW7caWG3bWaa0baaSqaaiaaikdacaWGPbaabaGaaiikaiaaikdacaGGPaaaaOGaaGjcVlaabohacaqGNbGabeyBayaafaGaaGjcVpaabmaabaGaam4CamaaDaaaleaacaWGPbaabaGaaeikaiaaigdacaqGPaaaaaGccaGLOaGaayzkaaGaaGjcVlaayIW7daWcaaqaaiabgkGi2kaadohadaqhaaWcbaGaamyAaaqaaiaabIcacaaIXaGaaeykaaaaaOqaaiabgkGi2kaaykW7caWG3bWaa0baaSqaaiaadMgacaWGQbaabaWaaeWaaeaacaaIXaaacaGLOaGaayzkaaaaaaaaaOqaaiaayIW7caaMi8UaaGjcVlaayIW7caaMi8UaaGjcVlaayIW7caaMi8UaaGjcVlaayIW7caaMi8UaaGjcVlabg2da9iabgkHiTmaabmaabaGaaGOmaiabes7aKnaaDaaaleaacaaIXaaabaWaaeWaaeaacaaIYaaacaGLOaGaayzkaaaaaOGaam4DamaaDaaaleaacaaIXaGaamyAaaqaamaabmaabaGaaGOmaaGaayjkaiaawMcaaaaakiabgUcaRiaaikdacqaH0oazdaqhaaWcbaGaaGOmaaqaamaabmaabaGaaGOmaaGaayjkaiaawMcaaaaakiaadEhadaqhaaWcbaGaaGOmaiaadMgaaeaadaqadaqaaiaaikdaaiaawIcacaGLPaaaaaaakiaawIcacaGLPaaacaaMi8UaaGjcVlaayIW7caaMi8Uaae4CaiaabEgaceqGTbGbauaacaaMi8UaaGjcVlaayIW7daqadaqaaiaadohadaqhaaWcbaGaamyAaaqaaiaabIcacaaIXaGaaeykaaaaaOGaayjkaiaawMcaaiaayIW7caaMi8UaamiEamaaDaaaleaacaWGQbaabaWaaeWaaeaacaaIXaaacaGLOaGaayzkaaaaaOGaeyypa0JaeyOeI0IaaGOmaiaayIW7cqaH0oazdaqhaaWcbaGaamyAaaqaamaabmaabaGaaGymaaGaayjkaiaawMcaaaaakiaadIhadaqhaaWcbaGaamOAaaqaamaabmaabaGaaGymaaGaayjkaiaawMcaaaaakiaacYcaaaaa@058C@ (4.10)

és így a súlymódosítás

w i ( 1 ) ( k+1 )= w i ( 1 ) ( k )+2μ( δ 1 ( 2 ) ( k ) w 1i ( 2 ) ( k )+ δ 2 ( 2 ) ( k ) w 2i ( 2 ) ( k ) )sg m ( s i ( 1 ) ( k ) ) x ( 1 ) ( k ) = w i ( 1 ) ( k )+2μ δ i ( 1 ) ( k ) x ( 1 ) ( k ), MathType@MTEF@5@5@+=feaagCart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr4rNCHbGeaGqkLspw0le9v8qqaqFD0xXdHaVhbbf9v8qqaqFr0xc9pk0xbba9q8WqFfea0=yr0RYxir=Jbba9q8aq0=yq=He9q8qqQ8frFve9Fve9Ff0dmeaabaqaciGacaGaaeqabaWaaeaaeaaakqaabeqaaiaahEhadaqhaaWcbaGaamyAaaqaamaabmaabaGaaGymaaGaayjkaiaawMcaaaaakmaabmaabaGaam4AaiabgUcaRiaaigdaaiaawIcacaGLPaaacqGH9aqpcaWH3bWaa0baaSqaaiaadMgaaeaadaqadaqaaiaaigdaaiaawIcacaGLPaaaaaGcdaqadaqaaiaadUgaaiaawIcacaGLPaaacqGHRaWkcaaIYaGaeqiVd02aaeWaaeaacqaH0oazdaqhaaWcbaGaaGymaaqaamaabmaabaGaaGOmaaGaayjkaiaawMcaaaaakmaabmaabaGaam4AaaGaayjkaiaawMcaaiaadEhadaqhaaWcbaGaaGymaiaadMgaaeaadaqadaqaaiaaikdaaiaawIcacaGLPaaaaaGcdaqadaqaaiaadUgaaiaawIcacaGLPaaacqGHRaWkcqaH0oazdaqhaaWcbaGaaGOmaaqaamaabmaabaGaaGOmaaGaayjkaiaawMcaaaaakmaabmaabaGaam4AaaGaayjkaiaawMcaaiaadEhadaqhaaWcbaGaaGOmaiaadMgaaeaadaqadaqaaiaaikdaaiaawIcacaGLPaaaaaGcdaqadaqaaiaadUgaaiaawIcacaGLPaaaaiaawIcacaGLPaaacaaMi8UaaGPaVJqaaiaa=nhacaWFNbGab8xBayaafaWaaeWaaeaacaWGZbWaa0baaSqaaiaadMgaaeaadaqadaqaaiaaigdaaiaawIcacaGLPaaaaaGcdaqadaqaaiaadUgaaiaawIcacaGLPaaaaiaawIcacaGLPaaacaaMi8UaaGjcVlaahIhadaqhaaWcbaaabaWaaeWaaeaacaaIXaaacaGLOaGaayzkaaaaaOWaaeWaaeaacaWGRbaacaGLOaGaayzkaaaabaGaaGjcVlaayIW7caaMi8UaaGjcVlaayIW7caaMi8UaaGjcVlaayIW7caaMi8UaaGjcVlaayIW7caaMi8UaaGjcVlaayIW7caaMi8UaaGjcVlaayIW7caaMi8UaaGjcVlaayIW7caaMi8UaaGjcVlaayIW7caaMi8UaaGjcVlaayIW7caaMi8UaaGjcVlabg2da9iaahEhadaqhaaWcbaGaamyAaaqaamaabmaabaGaaGymaaGaayjkaiaawMcaaaaakmaabmaabaGaam4AaaGaayjkaiaawMcaaiabgUcaRiaaikdacqaH8oqBcqaH0oazdaqhaaWcbaGaamyAaaqaamaabmaabaGaaGymaaGaayjkaiaawMcaaaaakmaabmaabaGaam4AaaGaayjkaiaawMcaaiaahIhadaqhaaWcbaaabaWaaeWaaeaacaaIXaaacaGLOaGaayzkaaaaaOWaaeWaaeaacaWGRbaacaGLOaGaayzkaaGaaiilaaaaaa@C972@ (4.11)

ahol

δ i ( 1 ) =( δ 1 ( 2 ) w 1i ( 2 ) + δ 2 ( 2 ) w 2i ( 2 ) )sg m ( s i ( 1 ) ) MathType@MTEF@5@5@+=feaagCart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr4rNCHbGeaGqipu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=xfr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaGaeqiTdq2aa0baaSqaaiaadMgaaeaacaaMi8+aaeWaaeaacaaIXaaacaGLOaGaayzkaaaaaOGaeyypa0ZaaeWaaeaacqaH0oazdaqhaaWcbaGaaGymaaqaaiaayIW7daqadaqaaiaaikdaaiaawIcacaGLPaaaaaGccaWG3bWaa0baaSqaaiaaigdacaWGPbaabaWaaeWaaeaacaaIYaaacaGLOaGaayzkaaaaaOGaey4kaSIaeqiTdq2aa0baaSqaaiaaikdaaeaacaaMi8+aaeWaaeaacaaIYaaacaGLOaGaayzkaaaaaOGaam4DamaaDaaaleaacaaIYaGaamyAaaqaamaabmaabaGaaGOmaaGaayjkaiaawMcaaaaaaOGaayjkaiaawMcaaiaayIW7caaMi8UaaGjcVJqaaiaa=nhacaWFNbGab8xBayaafaWaaeWaaeaacaWGZbWaa0baaSqaaiaadMgaaeaadaqadaqaaiaaigdaaiaawIcacaGLPaaaaaaakiaawIcacaGLPaaaaaa@647E@ (4.12)

az ún. "visszaterjesztett hiba". A súlymódosítás tehát itt is az LMS algoritmussal formailag megegyező eljárással történik, a hiba helyén azonban súlyozott, "visszaterjesztett hiba" szerepel. A súlyozó együtthatók megegyeznek az adott hálózat-részben az előrecsatolásnál szereplő súlytényezőkkel. A súlymódosítás ennek alapján tetszőleges rejtett rétegre megadható:

w i ( l ) ( k+1 )= w i ( l ) ( k )+2μ( r=1 N l+1 δ r ( l+1 ) ( k ) w ri ( l+1 ) ( k ) )sg m ( s i ( l ) ( k ) ) x ( l ) ( k ) = w i ( l ) ( k )+2μ δ i ( l ) ( k ) x ( l ) ( k ) MathType@MTEF@5@5@+=feaagCart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr4rNCHbGeaGqkLspw0le9v8qqaqFD0xXdHaVhbbf9v8qqaqFr0xc9pk0xbba9q8WqFfea0=yr0RYxir=Jbba9q8aq0=yq=He9q8qqQ8frFve9Fve9Ff0dmeaabaqaciGacaGaaeqabaWaaeaaeaaakqaabeqaaiaahEhadaqhaaWcbaGaamyAaaqaamaabmaabaGaamiBaaGaayjkaiaawMcaaaaakmaabmaabaGaam4AaiabgUcaRiaaigdaaiaawIcacaGLPaaacqGH9aqpcaWH3bWaa0baaSqaaiaadMgaaeaadaqadaqaaiaadYgaaiaawIcacaGLPaaaaaGcdaqadaqaaiaadUgaaiaawIcacaGLPaaacqGHRaWkcaaIYaGaeqiVd02aaeWaaeaadaaeWbqaaiabes7aKnaaDaaaleaacaWGYbaabaGaaGjcVpaabmaabaGaamiBaiabgUcaRiaaigdaaiaawIcacaGLPaaaaaGcdaqadaqaaiaadUgaaiaawIcacaGLPaaacaWG3bWaa0baaSqaaiaadkhacaWGPbaabaWaaeWaaeaacaWGSbGaey4kaSIaaGymaaGaayjkaiaawMcaaaaakmaabmaabaGaam4AaaGaayjkaiaawMcaaaWcbaGaamOCaiabg2da9iaaigdaaeaacaWGobWaaSbaaWqaaiaadYgacqGHRaWkcaaIXaaabeaaa0GaeyyeIuoaaOGaayjkaiaawMcaaiaayIW7caaMi8UaaGjcVJqaaiaa=nhacaWFNbGab8xBayaafaWaaeWaaeaacaWGZbWaa0baaSqaaiaadMgaaeaadaqadaqaaiaadYgaaiaawIcacaGLPaaaaaGcdaqadaqaaiaadUgaaiaawIcacaGLPaaaaiaawIcacaGLPaaacaaMi8UaaGjcVlaahIhadaqhaaWcbaaabaWaaeWaaeaacaWGSbaacaGLOaGaayzkaaaaaOWaaeWaaeaacaWGRbaacaGLOaGaayzkaaaabaGaaGjcVlaayIW7caaMi8UaaGjcVlaayIW7caaMi8UaaGjcVlaayIW7caaMi8UaaGjcVlaayIW7caaMi8UaaGjcVlaayIW7caaMi8UaaGjcVlaayIW7caaMi8UaaGjcVlaayIW7cqGH9aqpcaWH3bWaa0baaSqaaiaadMgaaeaadaqadaqaaiaadYgaaiaawIcacaGLPaaaaaGcdaqadaqaaiaadUgaaiaawIcacaGLPaaacqGHRaWkcaaIYaGaeqiVd0MaeqiTdq2aa0baaSqaaiaadMgaaeaadaqadaqaaiaadYgaaiaawIcacaGLPaaaaaGcdaqadaqaaiaadUgaaiaawIcacaGLPaaacaWH4bWaa0baaSqaaaqaamaabmaabaGaamiBaaGaayjkaiaawMcaaaaakmaabmaabaGaam4AaaGaayjkaiaawMcaaaaaaa@BDB7@ (4.13)

ahol a "visszaterjesztett hiba":

δ i ( l ) ( k )=( r=1 N l+1 δ r ( l+1 ) ( k ) w ri ( l+1 ) ( k ) )sg m ( s i ( l ) ( k ) ) MathType@MTEF@5@5@+=feaagCart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr4rNCHbGeaGqipu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=xfr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaGaaGjcVlabes7aKnaaDaaaleaacaWGPbaabaWaaeWaaeaacaWGSbaacaGLOaGaayzkaaaaaOWaaeWaaeaacaWGRbaacaGLOaGaayzkaaGaeyypa0ZaaeWaaeaadaaeWbqaaiabes7aKnaaDaaaleaacaWGYbaabaWaaeWaaeaacaWGSbGaey4kaSIaaGymaaGaayjkaiaawMcaaaaakmaabmaabaGaam4AaaGaayjkaiaawMcaaiaadEhadaqhaaWcbaGaamOCaiaadMgaaeaadaqadaqaaiaadYgacqGHRaWkcaaIXaaacaGLOaGaayzkaaaaaOWaaeWaaeaacaWGRbaacaGLOaGaayzkaaaaleaacaWGYbGaeyypa0JaaGymaaqaaiaad6eadaWgaaadbaGaamiBaiabgUcaRiaaigdaaeqaaaqdcqGHris5aaGccaGLOaGaayzkaaacbaGaa83Caiaa=DgaceWFTbGbauaadaqadaqaaiaadohadaqhaaWcbaGaamyAaaqaamaabmaabaGaamiBaaGaayjkaiaawMcaaaaakmaabmaabaGaam4AaaGaayjkaiaawMcaaaGaayjkaiaawMcaaiaayIW7aaa@6A57@ (4.14)

és N l+1 MathType@MTEF@5@5@+=feaagCart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr4rNCHbGeaGqipu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=xfr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaGaamOtamaaBaaaleaacaWGSbGaey4kaSIaaGymaaqabaaaaa@3961@ az (l+1)-edik réteg bemeneteinek száma.

Ha az l-edik réteg összes processzáló elemének súlyvektorait egy, az (1.6.) összefüggésben definiált W ( l ) MathType@MTEF@5@5@+=feaagCart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr4rNCHbGeaGqipu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=xfr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaGaaC4vamaaCaaaleqabaWaaeWaaeaacaWGSbaacaGLOaGaayzkaaaaaaaa@395B@ mátrixba fogjuk össze, ahol tehát a mátrix i-edik sora az i-edik processzáló elem súlyvektora, akkor az l-edik réteg összes súlyvektorának módosítása tömören az alábbi formában adható meg:

W ( l ) ( k+1 )= W ( l ) ( k )+2μ δ ( l ) x ( l ) T ( k ) MathType@MTEF@5@5@+=feaagCart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr4rNCHbGeaGqkLspw0le9v8qqaqFD0xXdHaVhbbf9v8qqaqFr0xc9pk0xbba9q8WqFfea0=yr0RYxir=Jbba9q8aq0=yq=He9q8qqQ8frFve9Fve9Ff0dmeaabaqaciGacaGaaeqabaWaaeaaeaaakeaacaWHxbWaa0baaSqaaaqaamaabmaabaGaamiBaaGaayjkaiaawMcaaaaakmaabmaabaGaam4AaiabgUcaRiaaigdaaiaawIcacaGLPaaacqGH9aqpcaWHxbWaa0baaSqaaaqaamaabmaabaGaamiBaaGaayjkaiaawMcaaaaakmaabmaabaGaam4AaaGaayjkaiaawMcaaiabgUcaRiaaikdacqaH8oqBcaaMi8UaaGjcVlaayIW7caWH0oWaaWbaaSqabeaadaqadaqaaiaadYgaaiaawIcacaGLPaaaaaGccaWH4bWaaWbaaSqabeaadaqadaqaaiaadYgaaiaawIcacaGLPaaaaaGcdaahaaWcbeqaaiaadsfaaaGcdaqadaqaaiaadUgaaiaawIcacaGLPaaaaaa@5A96@ . (4.15)

Itt δ ( l ) MathType@MTEF@5@5@+=feaagCart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr4rNCHbGeaGqipu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=xfr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaGaaCiTdmaaCaaaleqabaWaaeWaaeaacaWGSbaacaGLOaGaayzkaaaaaaaa@39BB@ a (4.14) összefüggéssel megadott δ i ( l ) MathType@MTEF@5@5@+=feaagCart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLnhiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr4rNCHbGeaGqipu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=xfr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaGaeqiTdq2aa0baaSqaaiaadMgaaeaacaaMi8UaaGjcVlaayIW7daqadaqaaiaadYgaaiaawIcacaGLPaaaaaaaaa@3FC1@ visszaterjesztett "hibákból" képezett oszlopvektor. A súlymódosítást is tükröző hálózatarchitektúra két aktív rétegű hálózatnál a 4.2 ábrán látható. (Az ábrán a kimeneti nemlinearitást jelölő sgm helyett az általánosabb f(.) jelölés szerepel.)

Az előbbiekben bemutattuk a hibavisszaterjesztéses hálózat alapvető felépítését, működését. Az 1. fejezet approximációval foglalkozó részei pedig annak matematikai hátterét foglalták össze, hogy egy többrétegű, előrecsatolt hálózat egyáltalán milyen képességekkel rendelkezik. A hálózatok elvi alapjainak ismerete azonban még nem elegendő ahhoz, hogy e hálózatokat hatékonyan alkalmazni is tudjuk különböző gyakorlati feladatok megoldására. A következőkben azokkal a kérdésekkel foglalkozunk, melyek az elvi háttér birtokában most már azt is biztosítják, hogy a hálót hatékonyan tudjuk alkalmazni gyakorlati feladatok megoldására.

4.2. ábra - Az MLP tanítása back-propagation algoritmussal
Az MLP tanítása back-propagation algoritmussal