前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的神經(jīng)網(wǎng)絡(luò)主題范文,僅供參考,歡迎閱讀并收藏。
摘要:
高軌衛(wèi)星是我國衛(wèi)星導(dǎo)航系統(tǒng)的重要組成部分。提升該類衛(wèi)星的軌道預(yù)報精度有利于用戶定位精度的提高。提出了一種改進(jìn)高軌衛(wèi)星軌道預(yù)報精度的新方法。該方法避開了精化動力學(xué)模型的困難,嘗試從軌道預(yù)報誤差的規(guī)律中尋找突破。利用神經(jīng)網(wǎng)絡(luò)作為建立預(yù)報模型的工具,將某歷史時刻的軌道預(yù)報誤差作為訓(xùn)練樣本,利用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型補(bǔ)償當(dāng)前時刻的預(yù)報軌道以提高軌道預(yù)報精度。對影響神經(jīng)網(wǎng)絡(luò)模型補(bǔ)償效果的各因素進(jìn)行了詳細(xì)分析,制定了適應(yīng)于高軌衛(wèi)星短期、中期和長期預(yù)報的神經(jīng)網(wǎng)絡(luò)最優(yōu)模型。利用實測數(shù)據(jù)進(jìn)行了試驗分析,結(jié)果表明:預(yù)報8,15及30d應(yīng)選擇的訓(xùn)練步長分別為10,20及25min;軌道預(yù)報8~30d時,訓(xùn)練噪聲均選取0.01。神經(jīng)網(wǎng)絡(luò)模型有效地改進(jìn)了高軌衛(wèi)星的軌道預(yù)報精度,預(yù)報4~30d,軌道精度提高幅度為34.67%~82.37%不等。
關(guān)鍵詞:
神經(jīng)網(wǎng)絡(luò);軌道預(yù)報;訓(xùn)練噪聲;訓(xùn)練步長;地球靜止軌道衛(wèi)星;傾斜地球同步軌道衛(wèi)星
高軌衛(wèi)星在我國的航天系統(tǒng)中應(yīng)用十分廣泛。特別是我國的衛(wèi)星導(dǎo)航系統(tǒng)BDS(Beidousystem),其主要包括GEO衛(wèi)星和IGSO衛(wèi)星。導(dǎo)航衛(wèi)星星歷的精度是定位精度的基礎(chǔ),而廣播星歷本身便是軌道預(yù)報的結(jié)果。預(yù)報精度問題是制約BDS衛(wèi)星導(dǎo)航系統(tǒng)服務(wù)性能的關(guān)鍵因素,因此有必要對導(dǎo)航系統(tǒng)中的高軌衛(wèi)星軌道預(yù)報精度展開研究[1]。改進(jìn)軌道預(yù)報精度的一種方法是建立更加精準(zhǔn)的動力學(xué)模型[2 ̄3]。然而由于該方法需要長期精密軌道數(shù)據(jù)的支撐,周期長、難度大。改進(jìn)軌道預(yù)報精度的另一種方法可以從軌道預(yù)報誤差的規(guī)律中尋找突破[4]。神經(jīng)網(wǎng)絡(luò)作為一種新興的建模工具,特點在于處理高維性、非線性的問題時不需要準(zhǔn)確知道輸出輸入函數(shù)的結(jié)構(gòu)參數(shù)。只要通過訓(xùn)練來掌握它們之間的內(nèi)在關(guān)系,在輸入訓(xùn)練集以外的數(shù)據(jù)時,神經(jīng)網(wǎng)絡(luò)可以獲得它們之間正確的映射關(guān)系。該方法的優(yōu)勢在于不確定性系統(tǒng)的控制和預(yù)測。目前在軌道預(yù)報中使用神經(jīng)網(wǎng)絡(luò)工具的相關(guān)研究較少,文獻(xiàn)[5]根據(jù)GPS衛(wèi)星星歷的相關(guān)周期特性,以時間系列預(yù)報作為基礎(chǔ),利用神經(jīng)網(wǎng)絡(luò)建立預(yù)報模型。在沒有任何動力學(xué)模型的情況下得到了精度為數(shù)百米(1周)的預(yù)報結(jié)果。但是由于將衛(wèi)星位置量直接作為神經(jīng)網(wǎng)絡(luò)的輸出,神經(jīng)網(wǎng)絡(luò)算法的狀態(tài)量動態(tài)范圍大,限制了預(yù)報精度的提高。文獻(xiàn)[6]利用GPS衛(wèi)星精密星歷已知的優(yōu)勢,將神經(jīng)網(wǎng)絡(luò)與動力學(xué)模型相結(jié)合組成混合預(yù)報模型,改進(jìn)GPS導(dǎo)航衛(wèi)星的中長期預(yù)報。該方法可以在一定程度上改進(jìn)軌道預(yù)報精度,但不是每次改進(jìn)均能成功,存在改進(jìn)失效的情況。針對高軌衛(wèi)星的高精度軌道預(yù)報這一難題展開研究。以神經(jīng)網(wǎng)絡(luò)作為建立預(yù)報模型的工具,在動力學(xué)模型基礎(chǔ)上建立神經(jīng)網(wǎng)絡(luò)模型,通過對歷史時刻預(yù)報誤差的學(xué)習(xí)及訓(xùn)練,掌握其變化規(guī)律,再用于補(bǔ)償和改進(jìn)當(dāng)前時刻的預(yù)報軌道,以達(dá)到提高預(yù)報精度的目的。針對神經(jīng)網(wǎng)絡(luò)訓(xùn)練及補(bǔ)償特性,分析了不同因素對神經(jīng)網(wǎng)絡(luò)模型性能的影響?;诖酥贫硕?、中、長期軌道預(yù)報的最優(yōu)模型,最后利用不同類型衛(wèi)星進(jìn)行了試驗分析。
1基于BP神經(jīng)網(wǎng)絡(luò)的軌道預(yù)報算法
BP神經(jīng)網(wǎng)絡(luò)是一種多層網(wǎng)絡(luò)的“逆推”學(xué)習(xí)算法[7 ̄9]。利用神經(jīng)網(wǎng)絡(luò)進(jìn)行軌道預(yù)報分為訓(xùn)練和補(bǔ)償兩個階段。在訓(xùn)練階段,采用拼接方法得到一條長時間的精密軌道,用于衡量動力學(xué)模型預(yù)報誤差及神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練誤差。針對拼接處小量級的跳躍現(xiàn)象,采用Robust ̄loess數(shù)值濾波方法進(jìn)行軌道預(yù)報誤差平滑[10]。由于預(yù)報軌道和預(yù)報誤差為訓(xùn)練樣本,故需要對兩者的特性進(jìn)行分析。同時神經(jīng)網(wǎng)絡(luò)模型參數(shù)在一定程度上影響神經(jīng)網(wǎng)絡(luò)的訓(xùn)練效果,因此有必要對影響神經(jīng)網(wǎng)絡(luò)模型的一些關(guān)鍵因素進(jìn)行分析,以確定最優(yōu)的神經(jīng)網(wǎng)絡(luò)模型。在補(bǔ)償階段,將當(dāng)前時刻的預(yù)報軌道X(T)和V(T)作為神經(jīng)網(wǎng)絡(luò)模型的輸入;將利用函數(shù)f(X,V)計算得到神經(jīng)網(wǎng)絡(luò)模型的輸出作為當(dāng)前時刻預(yù)報軌道的補(bǔ)償值ΔXNN(T),將改進(jìn)后的預(yù)報軌道X(T)和V(T)作為最終軌道輸出。在神經(jīng)網(wǎng)絡(luò)具體應(yīng)用中,為了提高網(wǎng)絡(luò)性能以完成預(yù)定任務(wù),需要認(rèn)真考慮訓(xùn)練集預(yù)處理、網(wǎng)絡(luò)結(jié)構(gòu)設(shè)定以及訓(xùn)練算法等內(nèi)容。網(wǎng)絡(luò)的性能主要表現(xiàn)在訓(xùn)練效率及泛化能力。泛化能力是指辨識訓(xùn)練樣本中所隱藏的規(guī)律并且當(dāng)被輸入樣本以外數(shù)據(jù)時,網(wǎng)絡(luò)能正確地反應(yīng)這種規(guī)律的能力。關(guān)于網(wǎng)絡(luò)泛化能力的相關(guān)討論及改進(jìn)措施,已有文獻(xiàn)進(jìn)行了比較詳實的總結(jié)。這里涉及到的方法主要包括下列3個方面:一是處理訓(xùn)練樣本的方法[11],將神經(jīng)網(wǎng)絡(luò)的訓(xùn)練樣本進(jìn)行歸一化處理,使其在[-1,1]變化,以提高神經(jīng)網(wǎng)絡(luò)的性能;二是訓(xùn)練步長的選??;三是增加隨機(jī)噪聲[12 ̄13]。
2不同因素對神經(jīng)網(wǎng)絡(luò)模型性能的影響
分別針對預(yù)報軌道和預(yù)報誤差特征、訓(xùn)練步長的選擇、訓(xùn)練噪聲的大小對神經(jīng)網(wǎng)絡(luò)模型性能的影響進(jìn)行討論。
2.1預(yù)報軌道和預(yù)報誤差的特征分析
2.1.1中長期預(yù)報軌道和預(yù)報誤差特征將短期軌道預(yù)報弧長定位為1~13d,中期軌道預(yù)報弧長為14~27d,長期軌道預(yù)報弧長大于27d。以某初始時刻的預(yù)報誤差作為訓(xùn)練樣本訓(xùn)練得到的神經(jīng)網(wǎng)絡(luò)可以對其他初始時刻的預(yù)報軌道提供補(bǔ)償,但前提是兩個初始時刻的預(yù)報誤差數(shù)值大小及波形圖要相近。對GEO衛(wèi)星的預(yù)報誤差進(jìn)行時間序列分析,結(jié)果可以看出,預(yù)報誤差最大值呈現(xiàn)以14d為周期的變化規(guī)律;IGSO衛(wèi)星具有相同的特征。文中選取的訓(xùn)練弧長與當(dāng)前時刻的軌道預(yù)報弧長相等。對于中長期軌道預(yù)報可以采用以下方案:假設(shè)預(yù)報弧長為md(14n≤m≤14(n+1),n≥1),用當(dāng)前時刻起14(n+1)d之前那天的預(yù)報誤差和預(yù)報軌道作為訓(xùn)練樣本,訓(xùn)練弧長為md,訓(xùn)練得到神經(jīng)網(wǎng)絡(luò)模型。采用神經(jīng)網(wǎng)絡(luò)模型計算得到的補(bǔ)償誤差波形對當(dāng)前的預(yù)報誤差進(jìn)行補(bǔ)償。對于短期預(yù)報,由于預(yù)報弧長小于14d,其軌道預(yù)報方案中還考慮了預(yù)報誤差波形的最佳匹配。即充分結(jié)合預(yù)報誤差和預(yù)報軌道的動力學(xué)特性,建立了一個訓(xùn)練樣本集。根據(jù)當(dāng)前時刻的預(yù)報誤差波形變化特征在樣本集中搜索最佳訓(xùn)練樣本,實現(xiàn)兩者波形變化的最優(yōu)匹配,從而實現(xiàn)最優(yōu)的補(bǔ)償效果。在中長期預(yù)報中未采用波形匹配算法的主要原因是,需要兼顧工程應(yīng)用中的實時性,波形匹配耗時較長。
2.1.2短期預(yù)報中的波形匹配算法航天器是一個受攝動力系統(tǒng),其初值不穩(wěn)定性使得利用不同初始軌道得到的預(yù)報軌道和預(yù)報誤差的特性均不同。這就導(dǎo)致不同初始時刻的預(yù)報誤差并無規(guī)律。為了實現(xiàn)最佳的神經(jīng)網(wǎng)絡(luò)模型補(bǔ)償效果,必須找到與當(dāng)前時刻預(yù)報誤差變化波形最為相近的歷史時刻中的一條預(yù)報軌道。采用歷史時刻的預(yù)報軌道和預(yù)報誤差作為訓(xùn)練樣本,訓(xùn)練得到神經(jīng)網(wǎng)絡(luò)模型。在實際工程應(yīng)用中,因為當(dāng)前時刻之后的預(yù)報弧段中的精密軌道無法獲取,故不能獲得當(dāng)前時刻的預(yù)報誤差波形變化規(guī)律,所以并不能直接通過預(yù)報誤差波形比對來尋找補(bǔ)償當(dāng)前時刻預(yù)報軌道的訓(xùn)練樣本。但是基于動力學(xué)模型外推可以得到當(dāng)前時刻的預(yù)報軌道,如果能找到預(yù)報軌道與預(yù)報誤差之間的波形變化對應(yīng)關(guān)系,就可得到當(dāng)前時刻的預(yù)報誤差波形變化規(guī)律。由于預(yù)報誤差的變化周期與軌道周期相同,對于GEO/IGSO衛(wèi)星均為1d,通過對比預(yù)報誤差波形變化最大值和最小值出現(xiàn)的時刻,搜尋得到用于補(bǔ)償當(dāng)前時刻預(yù)報誤差的訓(xùn)練樣本。由于預(yù)報軌道在數(shù)值上遠(yuǎn)遠(yuǎn)大于預(yù)報誤差,為了便于分析問題,將兩者進(jìn)行歸一化處理,即分別將兩者除以各自的最大值,這樣它們就在±1之間變化。圖2和圖3分別給出了某GEO衛(wèi)星和某IGSO衛(wèi)星在2013年第23天預(yù)報8d的軌道與相應(yīng)的預(yù)報誤差之間的對應(yīng)關(guān)系。其中,橫坐標(biāo)表示預(yù)報時間,單位為d;縱坐標(biāo)表示歸一化后的數(shù)值,無量綱。1)對于兩種類型的衛(wèi)星,在J2000坐標(biāo)系中X和Y軸方向,當(dāng)預(yù)報軌道X/Y=0時,對應(yīng)時刻的預(yù)報誤差為最大值(峰值)或最小值(谷值)。預(yù)報軌道從正值變化為負(fù)值經(jīng)過零值的時刻對應(yīng)著預(yù)報誤差的峰值,從負(fù)值變化為正值經(jīng)過零值的時刻則對應(yīng)著預(yù)報誤差的谷值。2)在Z軸方向,GEO衛(wèi)星的預(yù)報軌道和預(yù)報誤差之間并無明顯的對應(yīng)關(guān)系;IGSO衛(wèi)星存在與X/Y軸相同的對應(yīng)關(guān)系。將作為訓(xùn)練樣本的預(yù)報誤差選擇定義在J2000坐標(biāo)系中,主要是因為在該坐標(biāo)系中預(yù)報誤差的規(guī)律性強(qiáng),并且與預(yù)報軌道之間存在一定的對應(yīng)關(guān)系。
2.2訓(xùn)練步長對預(yù)報精度的影響預(yù)報誤差改進(jìn)率的計算公式如下。以某GEO衛(wèi)星為例,表1給出了不同預(yù)報弧長、不同訓(xùn)練步長下利用神經(jīng)網(wǎng)絡(luò)模型得到的預(yù)報誤差改進(jìn)率。分析表1中的數(shù)據(jù)可以看出下列3點。1)訓(xùn)練步長越小,神經(jīng)網(wǎng)絡(luò)模型的改進(jìn)率就越高。2)預(yù)報弧長的長度與對訓(xùn)練步長的敏感度成反比,即弧長越長,訓(xùn)練步長的延長對改進(jìn)率的影響就越小。訓(xùn)練步長從5min延長至40min,預(yù)報8,15和30d的改進(jìn)率分別降低5.68%,3.9%和1.36%。3)由于訓(xùn)練步長越小,訓(xùn)練時間越長,因此改進(jìn)率與訓(xùn)練時間是一對矛盾體。從綜合改進(jìn)率和訓(xùn)練時間的要求考慮,即改進(jìn)率應(yīng)盡可能高,而訓(xùn)練時間應(yīng)盡可能短。故預(yù)報8,15和30d應(yīng)選擇的訓(xùn)練步長分別為10,20和25min。
2.3訓(xùn)練噪聲對預(yù)報精度的影響以某初始時刻的軌道預(yù)報誤差(稱為訓(xùn)練值)作為訓(xùn)練樣本訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型,用其補(bǔ)償另一個初始時刻利用動力學(xué)模型外推得到的預(yù)報誤差(稱為期望值)。如果訓(xùn)練值和期望值在同一時刻吻合的很好,那么利用神經(jīng)網(wǎng)絡(luò)模型一定能很好地修正動力學(xué)模型的預(yù)報誤差。以某GEO衛(wèi)星軌道預(yù)報8d為例,圖4給出了采用不同噪聲值時訓(xùn)練值和期望值之間的吻合關(guān)系。分為無噪聲、噪聲為0.01、噪聲為0.05和噪聲為0.10共4種情況。從圖4中可以看到,不加噪聲時訓(xùn)練值與其期望值的差別較大,因此應(yīng)加入訓(xùn)練噪聲以提高神經(jīng)網(wǎng)絡(luò)的泛化能力;加入噪聲后訓(xùn)練值與期望值吻合的較好,但無法區(qū)分噪聲值為多大時預(yù)報精度最高。表2給出了采用不同訓(xùn)練噪聲時,經(jīng)神經(jīng)網(wǎng)絡(luò)模型補(bǔ)償后的軌道預(yù)報誤差最大值的統(tǒng)計結(jié)果。其中原始預(yù)報誤差為未進(jìn)行補(bǔ)償時的采用動力學(xué)模型外推得到的預(yù)報誤差。表2不同訓(xùn)練噪聲下的預(yù)報分析表2中數(shù)據(jù)可以看出下列兩點。1)無噪聲時,前4d無改善,精度反而降低;預(yù)報8d及更長弧段時預(yù)報誤差略有改善,故應(yīng)加入訓(xùn)練噪聲。2)增加噪聲后,噪聲從0.001~0.100的變化對預(yù)報精度的改進(jìn)幅度相當(dāng)。但從總體來看,噪聲越小,前6d的預(yù)報精度越高;但預(yù)報8d以及更長弧段時噪聲為0.010的預(yù)報誤差最小,故應(yīng)選擇訓(xùn)練噪聲為0.010。
3試驗結(jié)果及分析
根據(jù)上述短、中、長期軌道預(yù)報方案,并結(jié)合不同神經(jīng)網(wǎng)絡(luò)模型參數(shù)的優(yōu)化設(shè)計分析,給出了利用神經(jīng)網(wǎng)絡(luò)模型進(jìn)行軌道預(yù)報的試驗結(jié)果。通過與精密星歷比對可以分別得到動力學(xué)模型和神經(jīng)網(wǎng)絡(luò)模型的預(yù)報精度。表3列出了BDS系統(tǒng)中兩顆GEO、三顆IGSO共5顆衛(wèi)星在2013年第23天利用神經(jīng)網(wǎng)絡(luò)模型和動力學(xué)模型外推得到的預(yù)報誤差(其中NN代表神經(jīng)網(wǎng)絡(luò)模型;Dyn代表動力學(xué)模型)。Sat02衛(wèi)星由于軌道機(jī)動未能統(tǒng)計其中長期預(yù)報結(jié)果。表3中誤差是在一定弧段內(nèi)預(yù)報誤差的最大值。從表3可得,神經(jīng)網(wǎng)絡(luò)模型1d預(yù)報誤差有時會大于動力學(xué)模型的預(yù)報誤差;但預(yù)報4,8,15及30d各衛(wèi)星采用神經(jīng)網(wǎng)絡(luò)模型補(bǔ)償后的預(yù)報精度均有所提高。這主要因為1d的預(yù)報弧段規(guī)律性不強(qiáng),不利于神經(jīng)網(wǎng)絡(luò)模型的學(xué)習(xí)及訓(xùn)練。隨著弧段的增長,訓(xùn)練樣本的規(guī)律性增強(qiáng),神經(jīng)網(wǎng)絡(luò)模型的補(bǔ)償效果有所提高。為了更好地衡量神經(jīng)網(wǎng)絡(luò)模型的改進(jìn)效果,給出各衛(wèi)星的預(yù)報精度提高幅度,其與預(yù)報誤差改進(jìn)率的計算公式相同。表4給出了各衛(wèi)星經(jīng)神經(jīng)網(wǎng)絡(luò)模型補(bǔ)償后的預(yù)報精度提高幅度。從表4中可以看出,預(yù)報4d各衛(wèi)星的軌道精度改進(jìn)幅度為40.25%~60.31%;預(yù)報8d各衛(wèi)星的軌道精度改進(jìn)幅度為63.28%~72.59%;預(yù)報15d改進(jìn)幅度為47.01%~82.37%;預(yù)報30d改進(jìn)幅度為34.67%~82.35%??梢娚窠?jīng)網(wǎng)絡(luò)模型在改進(jìn)軌道預(yù)報誤差中的作用顯著。
4結(jié)論
關(guān)鍵詞:神經(jīng)網(wǎng)絡(luò)技術(shù),ANNBP網(wǎng)絡(luò)算法
1、人工神經(jīng)網(wǎng)絡(luò)概述
人工神經(jīng)網(wǎng)絡(luò)是模擬生物神經(jīng)信息處理方法的新型計算機(jī)系統(tǒng),它可以模擬人腦的一些基本特征,(如自適應(yīng)性,自組織性和容錯性),是一個并行、分布處理結(jié)構(gòu),它由處理單元及其稱為聯(lián)接的無向信號通道互連而成。
人工神經(jīng)網(wǎng)絡(luò)力圖模仿生物神經(jīng)系統(tǒng),通過接受外部輸入的刺激,不斷獲得并積累知識,進(jìn)而具有一定的判斷預(yù)測能力。盡管神經(jīng)網(wǎng)絡(luò)模型的種類很多,但基本模式都是由大量簡單的計算單元(又稱為節(jié)點或神經(jīng)元)廣泛相互連接而構(gòu)成的一種并行分布處理網(wǎng)絡(luò)。。基于神經(jīng)信息傳輸?shù)脑?,各個節(jié)點通過可變的權(quán)值彼此相連接,每個節(jié)點對N個加權(quán)的輸入求和,當(dāng)求和值超過某個閾值時,節(jié)點呈“興奮”狀態(tài),有信號輸出。節(jié)點的特征由其閾值、非線性函數(shù)的類型所決定,而整個神經(jīng)網(wǎng)絡(luò)則由網(wǎng)絡(luò)拓?fù)?、?jié)點特征以及對其進(jìn)行訓(xùn)練所使用的規(guī)則所決定。
2、多層前向網(wǎng)絡(luò)
神經(jīng)網(wǎng)絡(luò)按拓?fù)浣Y(jié)構(gòu)分為前饋型網(wǎng)絡(luò)和反饋型網(wǎng)絡(luò)。前饋型網(wǎng)絡(luò)在結(jié)構(gòu)上采用的是其信息只能從前一層到它下面一層的單元,在網(wǎng)絡(luò)運(yùn)算過程中不存在任何反饋。從學(xué)習(xí)觀點看,前饋網(wǎng)絡(luò)是一種強(qiáng)有力的學(xué)習(xí)系統(tǒng),其結(jié)構(gòu)簡單,易于編程;從系統(tǒng)觀點看,前饋網(wǎng)絡(luò)是非線性映射,通過簡單非線性處理單元的復(fù)合映射可獲得復(fù)雜的非線性處理能力,因此具有較強(qiáng)的分類能力和模式識別能力。
反向傳播(BP)網(wǎng)絡(luò)是典型的前饋型網(wǎng)絡(luò),結(jié)構(gòu)上它屬于多層前向網(wǎng)絡(luò),它的結(jié)構(gòu)如圖1所示。它分為輸入層、隱含層和輸出層,層與層之間多采用全互連方式,同一層之間不存在相互連接。網(wǎng)絡(luò)中每一層權(quán)值都可通過學(xué)習(xí)來調(diào)節(jié),且網(wǎng)絡(luò)的基本處理單元(輸入單元除外)為非線性輸入、輸出關(guān)系,處理單元的輸入、輸出值可連續(xù)變化。由于BP網(wǎng)絡(luò)可在多個連續(xù)的輸入和一個或多個連續(xù)的輸出之間建立非線性映射這一特性,它常被用于智能預(yù)測。
多層前向網(wǎng)絡(luò)是使用最廣泛的一種網(wǎng)絡(luò)結(jié)構(gòu),它可很好的解決XOR等經(jīng)典的非線性問題,比起單層的感知器有很大的優(yōu)越性,尤其80年代中期,Rumelhart和Mcclelland最先提出了多層前饋網(wǎng)絡(luò)的反向傳播學(xué)習(xí)算法,簡稱BP算法,它的效率很高,是目前應(yīng)用最為普遍的訓(xùn)練算法,這使得多層前饋網(wǎng)絡(luò)應(yīng)用更加廣泛。應(yīng)該指出,我們常說的BP網(wǎng)絡(luò),嚴(yán)格說是基于BP算法的多層前向網(wǎng)絡(luò)。
圖 1 BP網(wǎng)絡(luò)結(jié)構(gòu)圖
4、 BP網(wǎng)絡(luò)算法
BP網(wǎng)絡(luò)算法的思想是把一組樣本的I/O問題變?yōu)橐粋€非線性優(yōu)化問題,使用了優(yōu)化中最普通的梯度下降法,用迭代運(yùn)算求解權(quán)對應(yīng)于學(xué)習(xí)記憶問題,加入隱含層節(jié)點使優(yōu)化問題的可調(diào)參數(shù)增加,從而可得到更精確的解。BP網(wǎng)絡(luò)模型設(shè)計的最大特點是網(wǎng)絡(luò)權(quán)值是通過使用網(wǎng)絡(luò)模型輸出值與已知的樣本值之間的誤差平方和達(dá)到期望值而不斷調(diào)整出來的,并且確定BP神經(jīng)網(wǎng)絡(luò)評價模型時涉及隱含層節(jié)點數(shù)、轉(zhuǎn)移函數(shù)、學(xué)習(xí)參數(shù)和網(wǎng)絡(luò)模型的最后選定等問題。下面簡單介紹一下基本BP算法相關(guān)數(shù)學(xué)描述:
(1)梯度下降算法
(2)S(Sigmoid)型函數(shù)
BP網(wǎng)絡(luò)的激活函數(shù)經(jīng)常使用的是Sigmoid對數(shù)或正切激活函數(shù)和線性函數(shù)。對數(shù)S型函數(shù) f(x)=1/(1+exp(-x)), Sigmoid 函數(shù)具有非線性放大功能,它可以把輸入從負(fù)無窮大到正無窮大的信號,變換成-1到1之間的輸出,對較大的輸入信號,放大系數(shù)較小,而較小的輸入,放大系數(shù)較大,所以采用S型激活函數(shù)可以去逼近非線性的輸入/輸出關(guān)系。
(3)BP算法
BP網(wǎng)絡(luò)學(xué)習(xí)是典型的有導(dǎo)師學(xué)習(xí),其學(xué)習(xí)算法是對簡單的學(xué)習(xí)規(guī)則的推廣和發(fā)展。BP網(wǎng)絡(luò)實現(xiàn)了多層網(wǎng)絡(luò)學(xué)習(xí)的設(shè)想,其學(xué)習(xí)過程包括正向傳播和反向傳播兩部分。。
在正向傳播過程中,給定網(wǎng)絡(luò)的一個輸入模式時,輸入信息從輸入層經(jīng)過隱含層逐層處理,并傳向輸出層,每一層神經(jīng)元的狀態(tài)只影響下一層神經(jīng)元的狀態(tài),由輸出層單元產(chǎn)生一個輸出模式,這是一個逐層狀態(tài)更新過程,稱為前向傳播。。如果輸出響應(yīng)與期望輸出的模式誤差值不滿足要求,那么就轉(zhuǎn)入誤差反向傳播,將誤差值沿連接通路逐層傳送并修正各層連接權(quán)值。對于給定的一組樣本,不斷用一個個訓(xùn)練模式進(jìn)行學(xué)習(xí),重復(fù)前向傳播和誤差反向傳播過程,當(dāng)各個訓(xùn)練模式都滿足要求時,BP網(wǎng)絡(luò)訓(xùn)練完畢。
其中的激發(fā)函數(shù)我們采用S型函數(shù), 即f(x)=1/(1+exp(-x))。BP算法描述如下:
(2)提供訓(xùn)練樣本:輸入矢量Xk ,k=1,2,..n 和期望輸出tk, k=1,2,…,m;對每個輸入樣本進(jìn)行(3)到(5)的迭代。
(3)計算網(wǎng)絡(luò)的實際輸出okj 。
(4)分別計算輸出層和隱含層的訓(xùn)練誤差
其中(4-2)為輸出層的誤差值, (4-3)為隱含層的誤差值。
(5)修正權(quán)值和閾值
(6)判斷實際誤差指標(biāo)是否滿足規(guī)定誤差的要求,滿足則到(7)。
(7)結(jié)束 。
BP算法是人工神經(jīng)網(wǎng)絡(luò)中最為重要的網(wǎng)絡(luò)之一, 也是迄今為止應(yīng)用最為廣泛的網(wǎng)絡(luò)算法, 實踐證明這種基于誤差反傳遞算法可以解決許多實際問題, 但其算法自身也存在著局部極小點、算法的收斂速度慢等缺陷,需要我們在今后的研究中不斷完善改進(jìn)。
一般而言,計算機(jī)網(wǎng)路安全管理指的是計算機(jī)在連接網(wǎng)絡(luò)后進(jìn)行信息的交換、瀏覽以及下載的過程中,對信息安全進(jìn)行有效的管理,防止信息被他人竊取或者破壞。隨著信息時代的到來,越來越多的人對計算機(jī)產(chǎn)生了很強(qiáng)的依賴,從兒童到老年人,計算機(jī)的影響無處不在,隨著計算機(jī)的普及,人們在使用計算機(jī)的過程中對其安全性就有了顧忌。對于計算機(jī)網(wǎng)絡(luò),只要連接互聯(lián)網(wǎng),隨時都存在被攻擊的可能,相對而言,沒有任何計算機(jī)是絕對的安全或者是不受到任何的攻擊。運(yùn)用計算機(jī)網(wǎng)絡(luò)技術(shù)進(jìn)行攻擊或者盜取個人信息或者是企業(yè)信息的事件凡乎每年都會發(fā)生,計算機(jī)網(wǎng)絡(luò)存在嚴(yán)重的安全隱患。所以,要及時的認(rèn)識以及了解計算機(jī)網(wǎng)絡(luò)面臨的安全隱患,積極的采取相應(yīng)的措施加強(qiáng)對計算機(jī)網(wǎng)絡(luò)安全的管理
2神經(jīng)網(wǎng)絡(luò)在計算機(jī)網(wǎng)絡(luò)安全管理應(yīng)用的現(xiàn)狀
2.1對神經(jīng)網(wǎng)絡(luò)在計算機(jī)安全管理運(yùn)用中的重視程度不夠。計算機(jī)網(wǎng)絡(luò)安全是因特網(wǎng)發(fā)展的最基礎(chǔ)的目的,但與此同時近乎所有的計算機(jī)網(wǎng)絡(luò)在開創(chuàng)以及不斷的發(fā)展過程中都趨向于實用以及便利,相反卻在一定程度卜沒有重視對計算機(jī)的安全管理,更沒有將神經(jīng)網(wǎng)絡(luò)技術(shù)運(yùn)用到計算機(jī)的安全管理中,進(jìn)而對計算機(jī)網(wǎng)絡(luò)的安全管理留下了嚴(yán)重的隱患。另外,神經(jīng)網(wǎng)絡(luò)在計算機(jī)網(wǎng)絡(luò)安全管理中主要是對計算機(jī)的網(wǎng)絡(luò)安全進(jìn)行評估,然而由于不重視對神經(jīng)網(wǎng)絡(luò)在計算機(jī)網(wǎng)絡(luò)安全管理中的運(yùn)用,使得沒有建立良好的計算機(jī)網(wǎng)絡(luò)安全評價標(biāo)準(zhǔn)體系。
2.2對神經(jīng)網(wǎng)絡(luò)在計算機(jī)網(wǎng)絡(luò)安全評價模型的設(shè)計和實際運(yùn)用不夠合理。一般來說,神經(jīng)網(wǎng)絡(luò)在計算機(jī)網(wǎng)絡(luò)安全管理中主要是對計算機(jī)網(wǎng)絡(luò)安全進(jìn)行一定的評估,在對其進(jìn)行評估的過程中,就需要設(shè)計一定的計算機(jī)網(wǎng)絡(luò)安全評價模型,主要包含刊浦俞入層、輸出層以及隱含層的設(shè)計;但是,目前神經(jīng)網(wǎng)絡(luò)在計算機(jī)網(wǎng)絡(luò)安全管理中對于評價模型的設(shè)計還沒有將這三方面有效的聯(lián)系起來、除此之外,對神經(jīng)網(wǎng)絡(luò)在計算機(jī)網(wǎng)絡(luò)安全管理的實際運(yùn)用中,不能科學(xué)、合理的實現(xiàn)計算機(jī)網(wǎng)絡(luò)安全管理評價模型運(yùn)用,不注重對評價模型的學(xué)習(xí)以及不關(guān)注對評價模型進(jìn)行有效的驗證。
3加強(qiáng)神經(jīng)網(wǎng)絡(luò)在計算機(jī)網(wǎng)絡(luò)安全管理中的應(yīng)用采取的措施
3.1神經(jīng)網(wǎng)絡(luò)在計算機(jī)網(wǎng)絡(luò)安全管理中要科學(xué)、合理的設(shè)計網(wǎng)絡(luò)安全評價模型。神經(jīng)網(wǎng)絡(luò)在計算機(jī)網(wǎng)絡(luò)安全管理中要科學(xué)。合理的設(shè)計網(wǎng)絡(luò)安全評價模型,以便更好的實現(xiàn)計算機(jī)網(wǎng)絡(luò)安全、高效的運(yùn)行。為此,計算機(jī)網(wǎng)絡(luò)安全評價模型需要進(jìn)行一下設(shè)計:首先是對輸入層的設(shè)計,一般來說,神經(jīng)網(wǎng)絡(luò)在計算機(jī)網(wǎng)絡(luò)安全管理運(yùn)用中,對于輸入層考慮的是神經(jīng)元的節(jié)點數(shù)以及評價指標(biāo)的數(shù)量,盡可能的使這兩者數(shù)量保持一致。其次是對隱含層的設(shè)計,對于隱含層的設(shè)計需要注意的是若某個連續(xù)函數(shù)在任意的閉區(qū)間中,可以通過在隱含層里的神經(jīng)網(wǎng)絡(luò)來靠近,大多數(shù)情況下,神經(jīng)網(wǎng)絡(luò)通常運(yùn)用的是單隱含層。最后是輸出層的設(shè)計,神經(jīng)網(wǎng)絡(luò)的輸出層設(shè)計主要是獲得計算機(jī)網(wǎng)絡(luò)安全管理評價的最終結(jié)果,例如可以設(shè)置計算機(jī)網(wǎng)絡(luò)安全管理評價的輸出層節(jié)點數(shù)為2,那么相應(yīng)的輸出結(jié)果(l,)l指的是非常安全、(o,)l指的是較不安全、(,l山指的是基本安全以及(,0切指的是非常的不安全。
3.2神經(jīng)網(wǎng)絡(luò)在計算機(jī)網(wǎng)絡(luò)安全管理運(yùn)用中要對評價模型進(jìn)行有效的驗證。需要注意的是,神經(jīng)網(wǎng)絡(luò)在計算機(jī)網(wǎng)絡(luò)安全管理運(yùn)用中要對評價模型進(jìn)行有效的驗證,一般體現(xiàn)在一下幾方面:首先是要關(guān)注評價模型的實現(xiàn),為了實現(xiàn)神經(jīng)網(wǎng)絡(luò)在計算機(jī)網(wǎng)絡(luò)安全管理中的良好運(yùn)用,就要依據(jù)客戶滿意的評價模型,運(yùn)用計算機(jī)網(wǎng)絡(luò)技術(shù)創(chuàng)建設(shè)置含有輸入層、隱含層以及輸出層的神經(jīng)網(wǎng)絡(luò)模型,然后再對網(wǎng)絡(luò)安全進(jìn)行檢驗。其次是要注意對評價模型的學(xué)習(xí),在對計算機(jī)網(wǎng)絡(luò)安全進(jìn)行評價之前,需要對神經(jīng)網(wǎng)絡(luò)進(jìn)行標(biāo)準(zhǔn)化的處理,才能盡可能的減少對計算機(jī)網(wǎng)絡(luò)安全管理評價中的誤差。最后要注意對評價模型進(jìn)行驗證,當(dāng)神經(jīng)網(wǎng)絡(luò)經(jīng)過標(biāo)準(zhǔn)化處理以及在計l章機(jī)網(wǎng)絡(luò)安全評價之后,就需要刊輸出的結(jié)果進(jìn)行一定的驗證,以便確定神經(jīng)網(wǎng)絡(luò)對計算機(jī)網(wǎng)絡(luò)安全的評價輸出結(jié)果是否與期望的評價結(jié)果相一致,進(jìn)一步驗證神經(jīng)網(wǎng)絡(luò)在計算機(jī)網(wǎng)絡(luò)安全管理中安全評價模型的準(zhǔn)確與否。
3.3重視神經(jīng)網(wǎng)絡(luò)在計算機(jī)網(wǎng)絡(luò)安全管理運(yùn)用以及建立健全安全評價標(biāo)準(zhǔn)體系。神經(jīng)網(wǎng)絡(luò)在計算機(jī)網(wǎng)絡(luò)安全管理運(yùn)用中主要的任務(wù)是對計算機(jī)網(wǎng)絡(luò)的安全進(jìn)行一定的評價,并且將評價的結(jié)果準(zhǔn)確、及時的反饋給用戶,所以就應(yīng)該對其在計算機(jī)網(wǎng)絡(luò)安全管理中的應(yīng)用引起高度的重視,為此就應(yīng)該建立健全計算機(jī)網(wǎng)絡(luò)安全管理的評價標(biāo)準(zhǔn)體系。一方面是評價指標(biāo)的建立,計算機(jī)網(wǎng)絡(luò)安全管理是復(fù)雜的過程,同時影響計算機(jī)網(wǎng)絡(luò)安全的因素比較多。因此,建立科學(xué)、合理以及有效的計算機(jī)網(wǎng)絡(luò)安全管理評價標(biāo)準(zhǔn),對于神經(jīng)網(wǎng)絡(luò)高效的開展評價工作有很大的關(guān)聯(lián)。另一方面是刊評價標(biāo)準(zhǔn)的準(zhǔn)確化,影響計算機(jī)網(wǎng)絡(luò)安全管理的因素非常的多,就應(yīng)該對各種評價標(biāo)準(zhǔn)進(jìn)行細(xì)化,以達(dá)到評價的準(zhǔn)確。
4結(jié)束語
1基于貝葉斯算法的BP神經(jīng)網(wǎng)絡(luò)
1.1貝葉斯算法基于貝葉斯算法的BP神經(jīng)網(wǎng)絡(luò)是基于貝葉斯定理而發(fā)展出來的用于解決統(tǒng)計問題的方法,即任意一個待求量都可以看作是一個隨機(jī)變量,因此可以通過概率分布來對待求量進(jìn)行描述,這個概率是在抽樣前就有的關(guān)于待求量的先驗概率分布。貝葉斯理論正是在沒有樣本信息時,只根據(jù)先驗概率分布來求解待求量。而在有樣本后,則可根據(jù)總體、樣本和先驗信息的聯(lián)合分布來對未知量進(jìn)行判斷。后驗分布π(θ|x)是反映人們在抽樣后對隨機(jī)變量θ的認(rèn)識,其與先驗分布即樣本x的差異是由于樣本出現(xiàn)后人們對θ的調(diào)整,即后驗分布π(θ|x)為抽樣信息對先驗分布π(θ)調(diào)整的結(jié)果[6]。
1.2貝葉斯算法BP神經(jīng)網(wǎng)絡(luò)基于貝葉斯算法的BP神經(jīng)網(wǎng)絡(luò)是一種以神經(jīng)網(wǎng)絡(luò)基本原理為構(gòu)架,通過引入貝葉斯推理有效地控制網(wǎng)絡(luò)模型的復(fù)雜度,進(jìn)而更好地解決非線性問題及其不確定性[7]。在BP神經(jīng)網(wǎng)絡(luò)中,訓(xùn)練樣本集為D(xm,Om),xm為輸入信號,Om為輸出節(jié)點,在一定的網(wǎng)絡(luò)結(jié)構(gòu)A與網(wǎng)絡(luò)參數(shù)W下,可以得到網(wǎng)絡(luò)的輸出由網(wǎng)絡(luò)的輸入D唯一的確定。網(wǎng)絡(luò)訓(xùn)練的目標(biāo)函數(shù)為誤差函數(shù)ED(D|W,A),則有。采用貝葉斯算法BP神經(jīng)網(wǎng)絡(luò)步驟如下:(1)確定網(wǎng)絡(luò)結(jié)構(gòu)A,初始化超參數(shù)α,β,對網(wǎng)絡(luò)參數(shù)W進(jìn)行賦值。(2)以最終目標(biāo)函數(shù)為M(W)最小為原則,對BP神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,尋找最優(yōu)可能網(wǎng)絡(luò)參數(shù)W。(3)尋找最優(yōu)可能參數(shù)α,β。(4)采用不同初始網(wǎng)絡(luò)參數(shù)尋找最優(yōu)網(wǎng)絡(luò)參數(shù)。(5)對不同網(wǎng)絡(luò)結(jié)構(gòu)A,尋找最優(yōu)網(wǎng)絡(luò)參數(shù)。
2貝葉斯算法的BP神經(jīng)網(wǎng)絡(luò)量化結(jié)果分析
2.1訓(xùn)練樣本與測試樣本在對管道進(jìn)行磁化的過程中,最常用的方法是沿管道軸向進(jìn)行磁化,提取缺陷處沿軸向變化的漏磁場與沿周向變化的漏磁場,缺陷的長度信息主要由沿軸向變化漏磁場反應(yīng),缺陷的寬度信息主要由沿周向變化的漏磁場反應(yīng),而缺陷的深度信息則是由這兩個量共同反應(yīng)[9]。本文采用實驗的方法獲取網(wǎng)絡(luò)所需樣本,這里以對陡壁缺陷的分析為例,研究貝葉斯算法的BP神經(jīng)網(wǎng)絡(luò)對陡壁缺陷量化的有效性。分別制作缺陷長度為3,3.5,4,4.5,5,5.5倍管道壁厚,寬度為0.5,1,1.5,2倍管道壁厚,深度為0.1,0.15,0.2,0.25倍管道壁厚,共得到96組測量結(jié)果,取其中80個缺陷特征作為網(wǎng)絡(luò)的訓(xùn)練樣本,剩余的16個缺陷特征作為測試樣本。
2.2長度的量化采用統(tǒng)計分析的方法選取與缺陷長度關(guān)系密切的特征量作為神經(jīng)網(wǎng)絡(luò)的輸入信號,將缺陷長度作為網(wǎng)絡(luò)的輸出信號來對網(wǎng)絡(luò)進(jìn)行訓(xùn)練。所選取主要特征有漏磁場軸向分量的靜態(tài)閾值截取長度、一階微分信號極小值的位置與周向變化漏磁場動態(tài)閾值截取長度。分別對基本的BP神經(jīng)網(wǎng)絡(luò)與貝葉斯算法的BP神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,當(dāng)均方誤差小于10-3時停止訓(xùn)練,得到兩種網(wǎng)絡(luò)的訓(xùn)練與學(xué)習(xí)過程如圖1所示。比較兩種算法訓(xùn)練過程可以看出貝葉斯算法的BP神經(jīng)網(wǎng)絡(luò)總共進(jìn)行了331次訓(xùn)練,而基本的BP神經(jīng)網(wǎng)絡(luò)總共進(jìn)行了1789次訓(xùn)練,可見貝葉斯算法的BP神經(jīng)網(wǎng)絡(luò)的收斂速率更快。用16組測試數(shù)據(jù)對兩種網(wǎng)絡(luò)長度的量化誤差進(jìn)行比較,得到量化后缺陷最大相對誤差與最小相對誤差如表1所示,對應(yīng)貝葉斯算法BP神經(jīng)網(wǎng)絡(luò)量化的缺陷如表2所示。從表2中可以看出,采用貝葉斯算法的BP神經(jīng)網(wǎng)絡(luò)量化得到的缺陷長度與設(shè)計值的誤差明顯小于基本的BP神經(jīng)網(wǎng)絡(luò),最大相對誤差僅為0.05%。
2.3寬度的量化與缺陷長度的量化相似,采用統(tǒng)計分析的方法選取與缺陷寬度關(guān)系密切的特征量作為神經(jīng)網(wǎng)絡(luò)的輸入信號,將缺陷寬度作為網(wǎng)絡(luò)的輸出信號來對網(wǎng)絡(luò)進(jìn)行訓(xùn)練。所選取主要特征有軸向變化漏磁場峰谷值、周向變化漏磁場波形面積、波形能量、靜態(tài)閾值截取長度。分別對基本的BP神經(jīng)網(wǎng)絡(luò)與貝葉斯算法的BP神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,當(dāng)均方誤差小于10-3時停止訓(xùn)練,得到兩種網(wǎng)絡(luò)的訓(xùn)練與學(xué)習(xí)過程如圖2所示。比較兩種算法訓(xùn)練過程可以看出貝葉斯算法的BP神經(jīng)網(wǎng)絡(luò)總共進(jìn)行了269次訓(xùn)練,而基本的BP神經(jīng)網(wǎng)絡(luò)總共進(jìn)行了2248次訓(xùn)練,可見引入貝葉斯算法后的BP神經(jīng)網(wǎng)絡(luò)的收斂速率大幅提升。與之前相同,用16組測試數(shù)據(jù)對兩種網(wǎng)絡(luò)寬度的量化誤差進(jìn)行比較,得到量化后缺陷誤差如表3所示,貝葉斯算法BP神經(jīng)網(wǎng)絡(luò)量化達(dá)到誤差的缺陷見表4。在對缺陷寬度進(jìn)行量化的過程中,盡管量化得到的最大相對誤差仍較大,采用貝葉斯算法的BP神經(jīng)網(wǎng)絡(luò)量化得到的缺陷寬度與設(shè)計值的誤差明顯小于基本的BP神經(jīng)網(wǎng)絡(luò)。
2.4深度的量化在對缺陷的深度進(jìn)行量化時,采用統(tǒng)計分析的方法選取了缺陷的長度、寬度以及軸向變化漏磁場的兩個峰谷值、波形面積、周向變化漏磁場峰值、峰谷值作為神經(jīng)網(wǎng)絡(luò)的輸入信號,將缺陷深度作為網(wǎng)絡(luò)的輸出信號來對網(wǎng)絡(luò)進(jìn)行訓(xùn)練。對基本的BP神經(jīng)網(wǎng)絡(luò)與貝葉斯算法的BP神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,得到兩種網(wǎng)絡(luò)的訓(xùn)練與學(xué)習(xí)過程如圖3所示。貝葉斯算法BP神經(jīng)網(wǎng)絡(luò)總共進(jìn)行了4152次訓(xùn)練,基本的BP神經(jīng)網(wǎng)絡(luò)總共進(jìn)行了8763次訓(xùn)練,盡管引入貝葉斯算法BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程仍舊較長,但比基本BP神經(jīng)網(wǎng)絡(luò)的收斂速率有所提升。用16組測試數(shù)據(jù)對兩種網(wǎng)絡(luò)深度的量化誤差進(jìn)行比較,得到量化后缺陷誤差如表5所示,貝葉斯算法BP神經(jīng)網(wǎng)絡(luò)量化達(dá)到誤差的缺陷見表6。從對缺陷深度量化結(jié)果可以看出,采用貝葉斯算法的BP神經(jīng)網(wǎng)絡(luò)對缺陷深度進(jìn)行量化,得到的缺陷深度與設(shè)計值的誤差小于基本的BP神經(jīng)網(wǎng)絡(luò)。
3結(jié)束語
本文主要介紹了人工神經(jīng)網(wǎng)絡(luò)的概念,并對幾種具體的神經(jīng)網(wǎng)絡(luò)進(jìn)行介紹,從它們的提出時間、網(wǎng)絡(luò)結(jié)構(gòu)和適用范圍幾個方面來深入講解。
【關(guān)鍵詞】神經(jīng)網(wǎng)絡(luò) 感知器網(wǎng)絡(luò) 徑向基網(wǎng)絡(luò) 反饋神經(jīng)網(wǎng)絡(luò)
1 引言
人工神經(jīng)網(wǎng)絡(luò)是基于對人腦組織結(jié)構(gòu)、活動機(jī)制的初步認(rèn)識提出的一種新型信息處理體系。它實際上是一個由大量簡單元件相互連接而成的復(fù)雜網(wǎng)絡(luò),具有高度的非線性,能夠進(jìn)行復(fù)雜的邏輯操作和非線性關(guān)系實現(xiàn)的系統(tǒng),通過模仿腦神經(jīng)系統(tǒng)的組織結(jié)構(gòu)以及某些活動機(jī)理,人工神經(jīng)網(wǎng)絡(luò)可呈現(xiàn)出人腦的許多特征,并具有人腦的一些基本功能,利用這一特性,可以設(shè)計處具有類似大腦某些功能的智能系統(tǒng)來處理各種信息,解決不同問題。下面對幾種具體的神經(jīng)網(wǎng)絡(luò)進(jìn)行介紹。
2 感知器網(wǎng)絡(luò)
感知器是由美國學(xué)者Rosenblatt在1957年首次提出的,感知器可謂是最早的人工神經(jīng)網(wǎng)絡(luò)。感知器具有分層結(jié)構(gòu),信息從輸入層進(jìn)入網(wǎng)絡(luò),逐層向前傳遞到輸出層。感知器是神經(jīng)網(wǎng)絡(luò)用來進(jìn)行模式識別的一種最簡單模型,屬于前向神經(jīng)網(wǎng)絡(luò)類型。
2.1 單層感知器
單層感知器是指只有一層處理單元的感知器,它的結(jié)構(gòu)與功能都非常簡單,通過讀網(wǎng)絡(luò)權(quán)值的訓(xùn)練,可以使感知器對一組輸入矢量的響應(yīng)達(dá)到元素為0或1的目標(biāo)輸出,從而實現(xiàn)對輸入矢量分類的目的,目前在解決實際問題時很少被采用,但由于它在神經(jīng)網(wǎng)絡(luò)研究中具有重要意義,是研究其他網(wǎng)絡(luò)的基礎(chǔ),而且較易學(xué)習(xí)和理解,適合于作為學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的起點。
2.2 多層感知器
多層感知器是對單層感知器的推廣,它能夠成功解決單層感知器所不能解決的非線性可分問題,在輸入層與輸出層之間引入隱層作為輸入模式的“內(nèi)部表示”,即可將單層感知器變成多層感知器。
3 線性神經(jīng)網(wǎng)絡(luò)
線性神經(jīng)網(wǎng)絡(luò)類似于感知器,但是線性
神經(jīng)網(wǎng)絡(luò)的激活函數(shù)是線性的,而不是硬限轉(zhuǎn)移函數(shù)。因此線性神經(jīng)網(wǎng)絡(luò)的輸出可以使任意值,而感知器的輸出不是0就是1。線性神經(jīng)網(wǎng)絡(luò)最早的典型代表就是在1963年由美國斯坦福大學(xué)教授Berhard Windrow提出的自適應(yīng)線性元件網(wǎng)絡(luò),它是一個由輸入層和輸出層構(gòu)成的單層前饋性網(wǎng)絡(luò)。自適應(yīng)線性神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)算法比感知器的學(xué)習(xí)算法的收斂速度和精度都有較大的提高,自適應(yīng)線性神經(jīng)網(wǎng)絡(luò)主要用于函數(shù)逼近、信號預(yù)測、系統(tǒng)辨識、模式識別和控制等領(lǐng)域。
4 BP神經(jīng)網(wǎng)絡(luò)
BP神經(jīng)網(wǎng)絡(luò)是1986年由以Rumelhart和McCelland為首的科學(xué)家小組提出的,是一種按誤差逆?zhèn)鞑ニ惴ㄓ?xùn)練的多層前饋網(wǎng)絡(luò),在人工神經(jīng)網(wǎng)絡(luò)的實際應(yīng)用中,80%~90%的人工神經(jīng)網(wǎng)絡(luò)模型采用BP網(wǎng)絡(luò)或者它的變化形式,它也是前向網(wǎng)絡(luò)的核心部分,體現(xiàn)了人工神經(jīng)網(wǎng)絡(luò)最精華的部分,BP神經(jīng)網(wǎng)絡(luò)由信息的正向傳播和誤差的反向傳播兩個過程組成。輸入層各神經(jīng)元負(fù)責(zé)接收來自外界的輸入信息,并傳遞給中間層各神經(jīng)元;中間層是內(nèi)部信息處理層,負(fù)責(zé)信息變換,根據(jù)信息變化能力的需求,中間層可以設(shè)計為單隱層或者多隱層結(jié)構(gòu);最后一個隱層傳遞到輸出層各神經(jīng)元的信息,經(jīng)過一步處理后完成一次學(xué)習(xí)的正向傳播處理過程,由輸出層向外界輸出信息處理結(jié)果。當(dāng)實際輸出與期望輸出不符時,進(jìn)入誤差的反向傳播階段。誤差通過輸出層,按誤差梯度下降的方式修正各層權(quán)值,向隱層、輸入層逐層反傳。周而復(fù)始的信息正向傳播和誤差反向傳播過程,是各層權(quán)值不斷調(diào)整的過程,也是神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)訓(xùn)練過程,此過程一直進(jìn)行到網(wǎng)絡(luò)輸出的誤差減少到可以接受的程度,或者達(dá)到預(yù)先設(shè)定的學(xué)習(xí)次數(shù)為止。
BP網(wǎng)絡(luò)主要應(yīng)用于以下方面:
(1)函數(shù)逼近:用輸入矢量和相應(yīng)的輸出矢量訓(xùn)練一個網(wǎng)絡(luò)逼近一個函數(shù)。
(2)模式識別:用一個特定的輸出矢量將它與輸入矢量聯(lián)系起來。
(3)分類:對輸入矢量以所定義的合適方式進(jìn)行分類。
(4)數(shù)據(jù)壓縮:減少輸出矢量維數(shù)以便于傳輸或存儲。
5 反饋神經(jīng)網(wǎng)絡(luò)
美國加州理工學(xué)院物理學(xué)家J.J.Hopfield教授于1982年發(fā)表了對神經(jīng)網(wǎng)絡(luò)發(fā)展頗具影響的論文,提出一種單層反饋神經(jīng)網(wǎng)絡(luò),后來人們將這種反饋網(wǎng)絡(luò)稱作Hopfield網(wǎng)。在多輸入/多輸出的動態(tài)系統(tǒng)中,控制對象特性復(fù)雜,傳統(tǒng)方法難以描述復(fù)雜的系統(tǒng)。為控制對象建立模型可以減少直接進(jìn)行實驗帶來的負(fù)面影響,所以模型顯得尤為重要。但是,前饋神經(jīng)網(wǎng)絡(luò)從結(jié)構(gòu)上說屬于一種靜態(tài)網(wǎng)絡(luò),其輸入、輸出向量之間是簡單的非線性函數(shù)映射關(guān)系。實際應(yīng)用中系統(tǒng)過程大多是動態(tài)的,前饋神經(jīng)網(wǎng)絡(luò)辨識就暴露出明顯的不足,用前饋神經(jīng)網(wǎng)絡(luò)只是非線性對應(yīng)網(wǎng)絡(luò),無反饋記憶環(huán)節(jié),因此,利用反饋神經(jīng)網(wǎng)絡(luò)的動態(tài)特性就可以克服前饋神經(jīng)網(wǎng)絡(luò)的缺點,使神經(jīng)網(wǎng)絡(luò)更加接近系統(tǒng)的實際過程。
Hopfield神經(jīng)網(wǎng)絡(luò)的應(yīng)用:
(1)在數(shù)字識別方面。
(2)高??蒲心芰υu價。
(3)應(yīng)用于聯(lián)想記憶的MATLAB程序。
6 徑向基神經(jīng)網(wǎng)絡(luò)
徑向基RBF網(wǎng)絡(luò)是一個3層的網(wǎng)絡(luò),除了輸入、輸出層之間外僅有一個隱層。隱層中的轉(zhuǎn)換函數(shù)是局部響應(yīng)的高斯函數(shù),而其他前向網(wǎng)絡(luò),轉(zhuǎn)換函數(shù)一般都是全局響應(yīng)函數(shù)。由于這樣的差異,要實現(xiàn)同樣的功能,RBF需要更多的神經(jīng)元,這就是RBF網(wǎng)絡(luò)不能取代標(biāo)準(zhǔn)前向型絡(luò)的原因。但是RBF網(wǎng)絡(luò)的訓(xùn)練時間更短,它對函數(shù)的逼近時最優(yōu)的,可以以任意精度逼近任意連續(xù)函數(shù)。隱層中的神經(jīng)元越多,逼近越精確。
徑向基網(wǎng)絡(luò)的應(yīng)用:
(1)用于曲線擬合的RBF網(wǎng)絡(luò)。
(2)徑向基網(wǎng)絡(luò)實現(xiàn)非線性函數(shù)回歸。
7 自組織神經(jīng)網(wǎng)絡(luò)
自組織競爭型神經(jīng)網(wǎng)絡(luò)是一種無教師監(jiān)督學(xué)習(xí),具有自組織功能的神經(jīng)網(wǎng)絡(luò),網(wǎng)絡(luò)通過自身的訓(xùn)練。能自動對輸入模式進(jìn)行分類,一般由輸入層和競爭層夠曾。兩層之間各神經(jīng)元實現(xiàn)雙向連接,而且網(wǎng)絡(luò)沒有隱含層。有時競爭層之間還存在著橫向連接。
常用自組織網(wǎng)絡(luò)有一下幾種:
(1)自組織特征映射網(wǎng)絡(luò)。
(2)學(xué)習(xí)矢量量化網(wǎng)絡(luò)。
(3)自適應(yīng)共振理論模型。
(4)對偶傳播網(wǎng)絡(luò)。
參考文獻(xiàn)
[1]韓力群.人工神經(jīng)網(wǎng)絡(luò)教程[M].北京:北京郵電大學(xué)出版社,2006.
[2]周品.神經(jīng)網(wǎng)絡(luò)設(shè)計與應(yīng)用[M].北京:清華大學(xué)出版社,2013.
作者簡介
孔令文(1989-),男,黑龍江省齊齊哈爾市人。現(xiàn)為西南林業(yè)大學(xué)機(jī)械與交通學(xué)院在讀研究生。研究方向為計算機(jī)仿真。
關(guān)鍵詞:神經(jīng)網(wǎng)絡(luò);RBF神經(jīng)網(wǎng)絡(luò);高壓斷路器;故障診斷
中圖分類號:TP3文獻(xiàn)標(biāo)識碼:A文章編號:1009-3044(2009)25-7224-02
The Research and Application of RBF Neural Network
MA Yan-fang1,2, ZHOU Bing2
(1.Henan Polytechnic University, Jiaozuo 454000, China; 2.JiaoZuo University, Jiaozuo 454000, China)
Abstract: neural network is the mathematical simulation to human brain’s nervous system, its goal is to study and imitate human brain's information processing way. The paper introduced the principle and model of neural network, the learning process of RBF neural network as well as the training process of using RBF neural network to carry on fault diagnosis on high voltage circuit breaker.
Key words: neural network; RBF neural network; high voltage circuit breaker; fault diagnosis
神經(jīng)網(wǎng)絡(luò)是對人腦神經(jīng)系統(tǒng)的數(shù)學(xué)模擬,其目的是學(xué)習(xí)和模仿人腦的信息處理方式。人們對神經(jīng)系統(tǒng)的研究已經(jīng)有了很長一段歷史,早在十九世紀(jì)末,人們就開始認(rèn)識到人腦包含著數(shù)量大約在1010-1012之間的神經(jīng)元,他們有著復(fù)雜的聯(lián)接,并形成一個整體,使得人腦具有各種智能行為,由三個區(qū)組成:細(xì)胞體、樹突、軸突。一個神經(jīng)元有多個樹突,它們起感受作業(yè)即接受外部(包括其它神經(jīng)元)傳來的信息。軸突只有一條,用于傳遞和輸出消息。神經(jīng)元之間通過突觸聯(lián)結(jié),突觸是一個神經(jīng)元軸突的末梢與另一個神經(jīng)元的細(xì)胞體或樹突相接觸的地方,每個神經(jīng)元大約有103-104個突觸與其它神經(jīng)元有連接,正是因為這些突觸才使得全部大腦神經(jīng)元形成一個復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu)。
由此可知,人腦神經(jīng)系統(tǒng)的工作原理就是:外部刺激信號或上級神經(jīng)元信號經(jīng)合成后由樹突傳給神經(jīng)元細(xì)胞體處理,最后由突觸輸出給下級神經(jīng)元或做出響應(yīng)。
人工神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)模型有很多種,如感知器網(wǎng)絡(luò)、線性網(wǎng)絡(luò)、BP網(wǎng)絡(luò)、徑向基函數(shù)網(wǎng)絡(luò)(RBF網(wǎng)絡(luò))、自組織網(wǎng)絡(luò)、回歸網(wǎng)絡(luò)等。本文介紹RBF網(wǎng)絡(luò)的學(xué)習(xí)過程以及采用RBF神經(jīng)網(wǎng)絡(luò)進(jìn)行高壓斷路器故障診斷的過程。
1 RBF神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過程
對于RBF網(wǎng)絡(luò)的數(shù)學(xué)描述可表達(dá)為:在n維空間中,給定N個輸入樣本Xi(i=1,2,…,N),則網(wǎng)絡(luò)隱含層的第k個節(jié)點的輸出可以表示為:
(1)
其中,Xi是n維輸入向量;Tk是第k個隱層節(jié)點的中心,k=1,2,…,l;?通常為歐式范數(shù)。
R(?)即是RBF函數(shù),具有局部感受的特性,體現(xiàn)了RBF網(wǎng)絡(luò)的非線性映射能力。而網(wǎng)絡(luò)輸出層第j個節(jié)點的輸出,則為隱含層節(jié)點到輸出層的線性映射,即:
(2)
式中,wkj是隱含層到輸出層的權(quán)值,θj是第j個輸出節(jié)點的閾值,m是輸出節(jié)點數(shù)。
最常用的RBF函數(shù)形式是Gauss函數(shù):
(3)
它的可調(diào)參數(shù)有兩個,即中心和寬度參數(shù)隱含層節(jié)點k的傳遞函數(shù)表達(dá)式為:
(4)
其中,X=(x1,x2,…,xn)―n維輸入向量,Tki為節(jié)點k的中心Tk的第i個分量,σk為節(jié)點k的Gauss分布寬度,?表示歐式范數(shù)。
輸出層節(jié)點j相應(yīng)的輸出則可以表示為:
(5)
由此可見,對于RBF網(wǎng)絡(luò)來說,Tk、σk及w是最為重要的參數(shù),設(shè)計RBF網(wǎng)絡(luò)的任務(wù)就是用一定的學(xué)習(xí)算法來確定這三個參數(shù)。
設(shè)有N個訓(xùn)練樣本,則系統(tǒng)對所有N個訓(xùn)練樣本的總誤差函數(shù)為:
(6)
式中,N為模式樣本對數(shù);L為網(wǎng)絡(luò)輸出節(jié)點數(shù);tkp表示在樣本p作用下的第k個神經(jīng)元的期望輸出;ykp表示在樣本p作用下的第k個神經(jīng)元的實際輸出。
RBF網(wǎng)絡(luò)的學(xué)習(xí)過程分為兩個階段:第一階段是無教師學(xué)習(xí),是根據(jù)所有的輸入樣本決定隱含層各節(jié)點的高斯核函數(shù)的中心向量ci和標(biāo)準(zhǔn)化常數(shù)σi;第二階段是有教師學(xué)習(xí),在決定好隱含層的參數(shù)后,根據(jù)樣本,利用最小二乘原則,求出隱含層和輸出層的權(quán)值wki。有時在完成第二階段的學(xué)習(xí)后,再根據(jù)樣本信號,同時校正隱含層和輸出層的參數(shù),以進(jìn)一步提高網(wǎng)絡(luò)的精度。下面具體介紹一下這兩個階段:
1) 無教師學(xué)習(xí)階段
無教師學(xué)習(xí)也稱為非監(jiān)督學(xué)習(xí),是對所有樣本的輸入進(jìn)行聚類,求得各隱含層節(jié)點的RBF的中心向量ci。這里介紹k-均值聚類算法調(diào)整中心向量,此算法將訓(xùn)練樣本集中的輸入向量分為若干族,在每個數(shù)據(jù)族內(nèi)找出一個徑向基函數(shù)中心向量,使得該族內(nèi)各樣本向量距該族中心的距離最小。
算法步驟如下:
① 給定各隱節(jié)點的初始中心向量ci(0)和判定停止計算的ε;
② 計算距離(歐氏距離)并求出最小距離的節(jié)點;
(7)
式中,k為樣本序號,r為中心向量ci(k-1)與輸入樣本x(k)距離最近的隱節(jié)點序號;
③ 調(diào)整中心
(8)
式中,β(k)是學(xué)習(xí)速率;, int(?)表示對(?)進(jìn)行取整運(yùn)算。可見,每經(jīng)過q個取樣本之后,調(diào)小一次學(xué)習(xí)速率,逐漸減至零;
④ 判定聚類質(zhì)量
對于全部樣本k(k=1,2,…,N)反復(fù)進(jìn)行以上②, ③步,直至滿足以下條件,則聚類結(jié)束。
(9)
2) 有教師學(xué)習(xí)階段
有教師學(xué)習(xí)也稱為有監(jiān)督學(xué)習(xí)。當(dāng)確定以后,訓(xùn)練由隱含層至輸出層之間的權(quán)值,由上可知,它是一個線性方程組,則求權(quán)值就成為線性優(yōu)化問題。因此,問題有惟一確定的解,不存在BP網(wǎng)絡(luò)中所遇到的局部極小值問題,肯定能獲得全局最小點。
類似于線性網(wǎng)絡(luò),RBF神經(jīng)網(wǎng)絡(luò)的隱含層至輸出層之間的連接權(quán)值wki(k=1,2,…,L;i=1,2,…,q)學(xué)習(xí)算法為
(10)
式中,,Ri(x)為高斯函數(shù);η為學(xué)習(xí)速率??梢宰C明,當(dāng)0
2 高壓斷路器故障的訓(xùn)練
對高壓斷路器進(jìn)行狀態(tài)監(jiān)測,獲取12組故障樣本數(shù)據(jù),包括機(jī)構(gòu)正常(ZC)、操作電壓過低(GD)、合閘鐵心開始階段有卡澀(HKS)、操作機(jī)構(gòu)有卡澀(CKS)、合閘鐵心空行程太大(TD)、輔助開關(guān)動作接觸不良(FK),其中前6組數(shù)據(jù)作為建立神經(jīng)網(wǎng)絡(luò)時的輸入向量,二進(jìn)制輸出向量的位數(shù)由故障的種類數(shù)來決定,發(fā)生某種故障時其所對應(yīng)的二進(jìn)制位為1,其余位為0。利用
net=newrb(P,T,Goal,SPREAD)
建立神經(jīng)網(wǎng)絡(luò),取誤差目標(biāo)值Goal為 0.01;RBF網(wǎng)絡(luò)的分布密度SPREAD為0.6。
接下來對網(wǎng)絡(luò)進(jìn)行訓(xùn)練,用后六組數(shù)據(jù)如表1做為訓(xùn)練樣本。輸入到上面建立的RBF網(wǎng)絡(luò)中。
訓(xùn)練結(jié)果如圖1所示。
可見,經(jīng)過10次的訓(xùn)練后,網(wǎng)絡(luò)的輸出已經(jīng)達(dá)到預(yù)先設(shè)定的精度要求,結(jié)果如圖1所示。輸出結(jié)果如表2所示。
以表2中所示的樣本序號3為例,當(dāng)輸入合閘鐵心開始階段有卡澀故障樣本數(shù)據(jù)時,其輸出結(jié)果中越接近1表明發(fā)生該故障的幾率越大,因此可以看出發(fā)生HKS故障的幾率最大。說明此RBF神經(jīng)網(wǎng)絡(luò)可以投入實際應(yīng)用之中。
3 結(jié)束語
人工神經(jīng)網(wǎng)絡(luò)是模仿生物腦結(jié)構(gòu)和功能的一種信息處理系統(tǒng),已經(jīng)在信號處理、目標(biāo)跟蹤、模式識別、機(jī)器人控制、專家系統(tǒng)等眾多領(lǐng)域顯示出極大的應(yīng)用價值。本文介紹了RBF神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過程,并給出了RBF神經(jīng)網(wǎng)絡(luò)在高壓斷路器故障診斷中的應(yīng)用。
參考文獻(xiàn):
[1] 劉愛民,林蘋,劉向東.基于(RBF)神經(jīng)網(wǎng)絡(luò)的自動化電器設(shè)備故障診斷方法[J].控制與監(jiān)測,2005.(12):67-72.
關(guān)鍵詞:ZISC78;徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)(RBFNN);實時;預(yù)報
1引言
神經(jīng)網(wǎng)絡(luò)是近年來得到廣泛關(guān)注的一種非線性建模預(yù)報技術(shù)。它具有自組織、自學(xué)習(xí)、自適應(yīng)和非線性處理、并行處理、信息分布存儲、容錯能力強(qiáng)等特性,對傳統(tǒng)方法效果欠佳的預(yù)報領(lǐng)域有很強(qiáng)的吸引力?;谏窠?jīng)網(wǎng)絡(luò)的非線性信息處理方法已應(yīng)用于軍事信息處理及現(xiàn)代武器裝備系統(tǒng)的各個方面,并有可能成為未來集成智能化的軍事電子信息處理系統(tǒng)的支撐技術(shù)。該技術(shù)在一些先進(jìn)國家已部分形成了現(xiàn)實的戰(zhàn)斗力。
船舶在波浪中航行,會受到風(fēng)、浪和流的影響,因而將不可避免地發(fā)生搖蕩運(yùn)動。嚴(yán)重的搖蕩會使船員工作效率下降、物品損壞、軍艦的戰(zhàn)斗力下降。如果能夠預(yù)知未來一段時間船舶的運(yùn)動情況,不僅有利于盡早采用先進(jìn)控制算法控制艦載武器平臺隔離船舶運(yùn)動的影響,使其始終穩(wěn)定瞄準(zhǔn)目標(biāo),而且還可獲得未來一個海浪周期內(nèi)的船舶運(yùn)動情況,以研究船載武器上層的控制策略,從而提高火力密度,因此,有必要研究在海浪中具有一定精度的海浪中船舶運(yùn)動的短期預(yù)報。此外,如能有效準(zhǔn)確地預(yù)報船舶的橫搖運(yùn)動,對于提高船舶的耐波性和適航性也有重要意義。
國內(nèi)外學(xué)者也將神經(jīng)網(wǎng)絡(luò)用于船舶運(yùn)動預(yù)報研究,但往往沒有考慮實時性等實現(xiàn)問題,因而不能實用化。神經(jīng)網(wǎng)絡(luò)實現(xiàn)技術(shù)是神經(jīng)網(wǎng)絡(luò)研究的一個重要方面。神經(jīng)網(wǎng)絡(luò)實現(xiàn)可分為全硬件實現(xiàn)和軟件實現(xiàn)兩種。目前神經(jīng)網(wǎng)絡(luò)的實現(xiàn)還主要以軟件模擬為主,由于現(xiàn)行的馮諾曼計算機(jī)體系結(jié)構(gòu)不能實現(xiàn)并行計算,因而神經(jīng)網(wǎng)絡(luò)軟件的實時應(yīng)用還受到一定限制。
目前,一些著名集成電路制造公司如Intel、Mo-torola、松下、日立、富士通等均已推出自己的模擬或數(shù)字神經(jīng)網(wǎng)絡(luò)芯片,這些芯片無論在網(wǎng)絡(luò)規(guī)模還是運(yùn)行速度上都已接近實用化的程度,因而給神經(jīng)網(wǎng)絡(luò)應(yīng)用的發(fā)展以極大的推動。由于艦載武器系統(tǒng),需選用具有在片學(xué)習(xí)功能的神經(jīng)網(wǎng)絡(luò)芯片,即將網(wǎng)絡(luò)訓(xùn)練所需的反饋電路及權(quán)值存儲、計算和修正電路都集成在了一個芯片,因而可實現(xiàn)全硬件的、具有自學(xué)習(xí)能力的神經(jīng)網(wǎng)絡(luò)系統(tǒng),也可以說,這是一種具有自適應(yīng)能力的神經(jīng)網(wǎng)絡(luò)。
2ZISC78的功能及工作原理
ZISC78是由IBM公司和Sillicon聯(lián)合研制的一種低成本、在線學(xué)習(xí)、33MHz主頻、CMOS型100腳LQFP封裝的VLSI芯片,圖1所示是ZISC78的引腳排列圖。ZISC78的特點如下:
內(nèi)含78個神經(jīng)元;
采用并行結(jié)構(gòu),運(yùn)行速度與神經(jīng)元數(shù)量無關(guān);
支持RBF/KNN算法;
內(nèi)部可分為若干獨(dú)立子網(wǎng)絡(luò);
采用鏈連接,擴(kuò)展不受限制;
具有64字節(jié)寬度向量;
L1或LSUP范數(shù)可用于距離計算;
具有同步/異步工作模式。
2.1ZISC78神經(jīng)元結(jié)構(gòu)
ZISC78采用的神經(jīng)元結(jié)構(gòu)如圖2所示,該神經(jīng)元有以下幾種狀態(tài):
(1)休眠狀態(tài):神經(jīng)網(wǎng)絡(luò)初始化時,通常處于這種狀態(tài)。
(2)準(zhǔn)備學(xué)習(xí)狀態(tài):任何時侯,神經(jīng)網(wǎng)絡(luò)中的神經(jīng)元都處于這種狀態(tài)。
(3)委托狀態(tài):一個包含有原型和類型的神經(jīng)元處于委托狀態(tài)。
(4)激活狀態(tài):一個處于委托狀態(tài)的神經(jīng)元,通過評估,其輸入矢量處于其影響域時,神經(jīng)元就被激活而處于激活狀態(tài)。
(5)退化狀態(tài):當(dāng)一個神經(jīng)元的原型處于其它神經(jīng)元類型空間內(nèi),而大部分被其他神經(jīng)元類型空間重疊時,這個神經(jīng)元被宣布處于退化狀態(tài)。
2.2ZISC78神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
從圖3所示的ZISC78神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)可以看出,所有神經(jīng)元均通過“片內(nèi)通信總線”進(jìn)行通信,以實現(xiàn)網(wǎng)絡(luò)內(nèi)所有神經(jīng)元的“真正”并行操作?!捌瑑?nèi)通信總線”允許若干個ZISC78芯片進(jìn)行連接以擴(kuò)大神經(jīng)網(wǎng)絡(luò)的規(guī)模,而這種操作不影響網(wǎng)絡(luò)性能。
ZISC78片內(nèi)有6bit地址總線和16bit數(shù)據(jù)總線,其中數(shù)據(jù)總線用于傳輸矢量數(shù)據(jù)、矢量類型、距離值和其它數(shù)據(jù)。
2.3ZISC78的寄存器組
ZISC78使用兩種寄存器:全局寄存器和神經(jīng)元寄存器。全局寄存器用于存儲與所有神經(jīng)元有關(guān)的信息,每片僅有一組全局寄存器。全局寄存器組中的信息可被傳送到所有處于準(zhǔn)備學(xué)習(xí)狀態(tài)和委托狀態(tài)的神經(jīng)元。神經(jīng)元寄存器用于存儲所屬神經(jīng)元的信息,該信息在訓(xùn)練學(xué)習(xí)操作中寫入,在識別操作中讀出。
2.4ZISC78的操作
ZISC78的操作包括初始化、矢量數(shù)據(jù)傳播、識別和分類等三部分。
初始化包括復(fù)位過程和清除過程。
矢量數(shù)據(jù)傳播包括矢量數(shù)據(jù)輸入過程和神經(jīng)元距離計算過程。神經(jīng)元距離就是輸入矢量和神經(jīng)元中存儲的原型之間的范數(shù)。通??蛇xL1范數(shù)或Lsup范數(shù):
其中,Xi為輸入矢量數(shù)據(jù),Xs為存貯的原型數(shù)據(jù)。
對于識別和分類,ZISC78提供有兩種可選擇的學(xué)習(xí)算法RBF和KNN。其中RBF是典型的徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)。在該RBF模式下,可輸出識別、不確定或不認(rèn)識的狀態(tài);KNN模式是RBF模式的限制形式,即在KNN模式下,新原型的影響域總被設(shè)為1,輸出的是輸入向量和存儲原型之間的距離。需要指出的是,ZISC78具有自動增加或減小神經(jīng)元個數(shù)以適應(yīng)輸入信號的分類和識別功能,神經(jīng)元個數(shù)的最大值和最小值在全局寄存器組中設(shè)定。
2.5ZISC78的組網(wǎng)
一個ZISC78芯片內(nèi)可以通過寄存器操作定義若干個獨(dú)立的網(wǎng)絡(luò)。若干個ZISC78芯片通過層疊可以組成一個更大的神經(jīng)網(wǎng)絡(luò),組網(wǎng)芯片數(shù)量沒有限制,小于10個ZISC78組網(wǎng)時,甚至連電源中繼器件也不需要。所以,ZISC78具有最大的靈活性,能夠滿足不同的需要。
3仿真實例
為了驗證ZISC78用于船舶運(yùn)動實時預(yù)報的精度,本文對徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)預(yù)報進(jìn)行了仿真,圖4給出了基于徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)和船舶運(yùn)動慣導(dǎo)實測信號預(yù)報的0.3秒(15步)誤差曲線圖。
通過以慣導(dǎo)實測數(shù)據(jù)ZHX_lg.dat為例預(yù)報0.3秒(15步)以后的船舶運(yùn)動,作者運(yùn)用相空間重構(gòu)理論已經(jīng)判斷出本數(shù)據(jù)為非線性信號。
該仿真的最大預(yù)報誤差方差為6.4666e-004,該數(shù)據(jù)可以滿足戰(zhàn)技指標(biāo)。
關(guān)鍵詞:BP神經(jīng)網(wǎng)絡(luò);學(xué)習(xí)過程;模式識別;旋轉(zhuǎn)機(jī)械;故障診斷
中圖分類號:TP311 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2009)15-3982-02
The Study and Application of the BP Neural Network
HOU Zhi-bin, WEN Bi-teng, PENG-Hua, LI Chun-hou
(Department for Graduate Students of Artillery Academy, Hefei 230031,China)
Abstract: The manual NN as a highly integrated chiasma subject. Most of models about NN are adopting the BP network and the changed form at the practical appliance, which is also the hard core of forward network, incarnating the essential part of NN. The paper introduces the studying process of the BP network and uses the BP network for the mechanical failure diagnoses as assorted organ in the mode identification.
Key words: BP neural network; studying process; mode identification; revolving machine; failure diagnoses
1 引言
人工神經(jīng)網(wǎng)絡(luò)是一門高度綜合的交叉學(xué)科,它的研究和發(fā)展涉及神經(jīng)生理學(xué)、數(shù)理科學(xué)、信息科學(xué)和計算機(jī)科學(xué)等眾多學(xué)科領(lǐng)域。
人工神經(jīng)網(wǎng)絡(luò)是模仿生物腦結(jié)構(gòu)和功能的一種信息處理系統(tǒng),雖然目前的模仿還處于低水平,但已顯示出一些與生物腦類似的特點:1) 大規(guī)模并行結(jié)構(gòu)與信息的分布式存儲和并行處理,克服了傳統(tǒng)的智能診斷系統(tǒng)出現(xiàn)的無窮遞歸、組合爆炸及匹配沖突問題,它特別適用于快速處理大量的并行信息。2) 具有良好的自適應(yīng)性,系統(tǒng)在知識表示和組織、診斷求解策略與實施等方面可根據(jù)生存環(huán)境自適應(yīng)、自組織達(dá)到自我完善。3) 具有較強(qiáng)的學(xué)習(xí)、記憶、聯(lián)想、識別功能,系統(tǒng)可根據(jù)環(huán)境提供的大量信息,自動進(jìn)行聯(lián)想、書記及聚類等方面的自組織學(xué)習(xí),也可在導(dǎo)師的指導(dǎo)下學(xué)習(xí)特定的任務(wù),從而達(dá)到自我完善。4) 具有很強(qiáng)的容錯性,當(dāng)外界輸入到神經(jīng)網(wǎng)絡(luò)中的信息存在某些局部錯誤時,不會影響到整個系統(tǒng)的輸出性能。神經(jīng)網(wǎng)絡(luò)已經(jīng)在信號處理、模式識別、目標(biāo)跟蹤、機(jī)器人控制、專家系統(tǒng)、系統(tǒng)辨識等眾多領(lǐng)域顯示出其極大的應(yīng)用價值,作為一種新的模式識別技術(shù)或一種知識處理方法,神經(jīng)網(wǎng)絡(luò)在機(jī)械故障診斷中顯示了其極大應(yīng)用潛力。
目前,在人工神經(jīng)網(wǎng)絡(luò)的實際應(yīng)用中,絕大部分的神經(jīng)網(wǎng)絡(luò)模型是采用BP網(wǎng)絡(luò)和它的變化形式,它也是前向網(wǎng)絡(luò)的核心部分,體現(xiàn)了人工神經(jīng)網(wǎng)絡(luò)最精華的部分。本文介紹BP網(wǎng)絡(luò)的學(xué)習(xí)過程以及從模式識別角度應(yīng)用BP神經(jīng)網(wǎng)絡(luò)作為分類器進(jìn)行機(jī)械故障診斷。
2 BP神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過程
有多層感知器可知,輸入層中人以神經(jīng)元的輸出為輸入模式分量的加權(quán)和。其余各層中,設(shè)某一層中任一神經(jīng)元j輸入為netj,輸出為yi,與這一層相鄰的低一層中任一神經(jīng)元i的輸出為yi。則有
如式(5)和式(6)所示,輸出層中神經(jīng)元的輸出誤差反向傳播到前面各層,以各層之間的權(quán)值進(jìn)行修正。
3 旋轉(zhuǎn)機(jī)械故障的訓(xùn)練
表1是一組旋轉(zhuǎn)機(jī)械故障的訓(xùn)練示例,表內(nèi)的值表示各訓(xùn)練示例的特征值大小,其取值區(qū)間為[0,1],如在不平衡訓(xùn)練示例中,0~1/4倍頻的振動幅值的當(dāng)量值為0;1/4~3/4倍頻的振動幅值的當(dāng)量值為0;3/4~1倍頻的振動幅值的當(dāng)量值還為0;1倍頻的振動幅值的當(dāng)量值為0.9;2倍頻的振動幅值的當(dāng)量值為0.1;等等,其余類推。
將這些故障訓(xùn)練示例輸入到一個具有8個輸入節(jié)點,8個中間層節(jié)點和3個輸出層節(jié)點的網(wǎng)絡(luò)中,經(jīng)過1200次迭代,形成了一個網(wǎng)絡(luò),該網(wǎng)絡(luò)的記憶效果如表2所示,經(jīng)過12000次迭代形成網(wǎng)絡(luò)的記憶效果如表3所示。
表2中第一行表示,當(dāng)輸入一組不平衡故障時,得出該故障的置信度為0.94,而其他故障幾乎為0;第二行表示,當(dāng)輸入一組油膜渦動故障時,得出該故障的置信度為0.96,而其他故障幾乎為0;第三行表示,當(dāng)輸入一組不對中故障時,得出該故障的置信度為0.90,而其他故障幾乎為0。表3中的結(jié)果有所改進(jìn),其值已趨于穩(wěn)定。通過比較表2和表3,可看出訓(xùn)練中迭代次數(shù)越多,所得到的網(wǎng)絡(luò)越能夠更好的聯(lián)想出訓(xùn)練示例。但訓(xùn)練次數(shù)不宜過長,只要滿足精度要求,訓(xùn)練次應(yīng)盡可能少,以減少訓(xùn)練時間。
4 結(jié)論
人工神經(jīng)網(wǎng)絡(luò)是模仿生物腦結(jié)構(gòu)和功能的一種信息處理系統(tǒng),并且已經(jīng)在信號處理、模式識別、目標(biāo)跟蹤、機(jī)器人控制、專家系統(tǒng)、系統(tǒng)辨識等眾多領(lǐng)域顯示出其極大的應(yīng)用價值。文章介紹了BP神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過程,并給出了BP神經(jīng)網(wǎng)絡(luò)在旋轉(zhuǎn)機(jī)械故障診斷中的應(yīng)用。作為一種新的模式識別技術(shù)或一種知識處理方法,神經(jīng)網(wǎng)絡(luò)在機(jī)械故障診斷中顯示了其極大的應(yīng)用潛力。
參考文獻(xiàn):
[1] 王江萍.機(jī)械設(shè)備故障診斷技術(shù)及應(yīng)用[M].西安:西北工業(yè)大學(xué)出版社,2001.
[2] 盛兆順,尹琦嶺.設(shè)備狀態(tài)監(jiān)測與故障診斷技術(shù)及應(yīng)用[M].北京:化學(xué)工業(yè)出版社,2003.
[3] 溫熙森.模式識別與狀態(tài)監(jiān)控[M].長沙:國防科技大學(xué)出版社,1997.
[4] 李孝安.神經(jīng)網(wǎng)絡(luò)與神經(jīng)計算機(jī)導(dǎo)論[M].西安: 西北工業(yè)大學(xué)出版社,1994.
關(guān)鍵詞神經(jīng)網(wǎng)絡(luò);反向傳播算法;PSO算法;適應(yīng)度函數(shù)
人工神經(jīng)網(wǎng)絡(luò)是由人工神經(jīng)元互連而成的網(wǎng)絡(luò),它從微觀結(jié)構(gòu)和功能上實現(xiàn)對人腦的抽象和簡化,具有許多優(yōu)點。對神經(jīng)網(wǎng)絡(luò)的權(quán)值系數(shù)的確定,傳統(tǒng)上采用反向傳播算法(BP算法)。BP網(wǎng)絡(luò)是一種多層前向反饋神經(jīng)網(wǎng)絡(luò),BP算法是由兩部分組成:信息的正向傳遞與誤差的反向傳播。在反向傳播算法中,對權(quán)值的訓(xùn)練采用的是爬山法(即:δ算法)。這種方法在諸多領(lǐng)域取得了巨大的成功,但是它有可能陷入局部最小值,不能保證收斂到全局極小點。另外,反向傳播算法訓(xùn)練次數(shù)多,收斂速度慢,使學(xué)習(xí)結(jié)果不能令人滿意。
粒子群優(yōu)化算法(ParticleSwarmOptimizer,PSO)是一種進(jìn)化計算技術(shù)(evolutionarycomputation)。源于對鳥群捕食的行為研究,PSO中,每個優(yōu)化問題的解都是搜索空間中的一只鳥,我們稱之為粒子。所有的粒子都有一個由被優(yōu)化的函數(shù)決定的適應(yīng)值(fitnessvalue),每個粒子還有一個速度決定他們飛翔的方向和距離。然后粒子們就追隨當(dāng)前的最優(yōu)粒子在解空間中搜索。如果用粒子群算法對神經(jīng)網(wǎng)絡(luò)的權(quán)值進(jìn)行訓(xùn)練,會得到較快的收斂速度,而且可以避免局部最值得出現(xiàn)。研究表明PSO是一種很有潛力的神經(jīng)網(wǎng)絡(luò)算法。
本文提出了一種基于PSO算法的BP網(wǎng)絡(luò)學(xué)習(xí)算法,并通過MATLAB7.0實現(xiàn)對一組簡單的向量進(jìn)行訓(xùn)練對PSO—BP算法和BP算法進(jìn)行了對比,試驗結(jié)果說明PSO—BP算法適合訓(xùn)練BP網(wǎng)絡(luò),并且也有希望應(yīng)用于其他種類的前向網(wǎng)絡(luò)的訓(xùn)練。
1PSO算法
PSO中,每個優(yōu)化問題的解都是搜索空間中的一只鳥。我們稱之為“粒子”。所有的例子都有一個由被優(yōu)化的函數(shù)決定的適應(yīng)值(fitnessvalue),每個粒子還有一個速度決定它們飛翔的方向和距離。然后粒子們就追隨當(dāng)前的最優(yōu)粒子在解空間中搜索。
D維搜索空間中,有m個粒子,其中第i個粒子的位置是,m,其速度為。將帶入目標(biāo)函數(shù)可計算出適應(yīng)值。記第i個粒子搜索到的最優(yōu)位置為,整個粒子群搜索到的最優(yōu)位置為。離子狀態(tài)更新操作為:
其中,i=1,2…,m,d=1,2…,D;是非負(fù)常數(shù),稱為慣性因子。也可以隨著迭代線性減?。粚W(xué)習(xí)因子,是非負(fù)常數(shù);r1,r2是介于[0,1]之間的隨機(jī)數(shù);是常數(shù)。
迭代中止條件一般選為最大迭代次數(shù)和粒子群迄今為止搜索到的最有位置滿足適應(yīng)閾值。
2基于PSO的BP網(wǎng)絡(luò)學(xué)習(xí)算法
BP網(wǎng)絡(luò)是一種多層結(jié)構(gòu)的前向網(wǎng)絡(luò),其隱層神經(jīng)元的激活函數(shù)為S型函數(shù),而輸出神經(jīng)元的激活函數(shù)可以是S型函數(shù),也可以實線性函數(shù),典型的S型函數(shù)為:
(3)
其中:s為神經(jīng)元的加權(quán)輸入函數(shù)。
用PSO算法訓(xùn)練BP網(wǎng)絡(luò)時,定義粒子群的位置向量的元素是BP網(wǎng)絡(luò)的全體連接權(quán)和閾值。首先初始化位置向量,然后用PSO算法搜索最優(yōu)位置,使如下均方誤差指標(biāo)(適應(yīng)值)達(dá)到最小
(4)
其中,N是訓(xùn)練集的樣本數(shù);是第i個樣本的第j個網(wǎng)絡(luò)輸出節(jié)點的理想輸出值;是第i個樣本的第j個網(wǎng)絡(luò)輸出節(jié)點的實際輸出值;C是網(wǎng)絡(luò)輸出神經(jīng)遠(yuǎn)的個數(shù)。
基于PSO算法的BP網(wǎng)絡(luò)學(xué)習(xí)算法流程如下:
1)選定粒子數(shù)m;適應(yīng)值閾值ε;最大允許迭代步數(shù);、和;初始化X和V為(0,1)間的隨機(jī)數(shù)。
8)endfor
9)fori=1:1:m
10)按式(1)計算;按式(2)計算;
11)endfor
12)endwhile
13)以所得權(quán)值閾值為初始值用BP算法對網(wǎng)絡(luò)進(jìn)行訓(xùn)練
上述流程中,1)到12)用標(biāo)準(zhǔn)PSO算法對權(quán)值和閾值進(jìn)行訓(xùn)練,13)對PSO輸出的權(quán)值和閾值作為初始值用BP算法訓(xùn)練網(wǎng)絡(luò)(MATLAB中有集成的訓(xùn)練函數(shù))。另外,,其中是第I個粒子的位置;V=,其中是第I個粒子的速度;是m個粒子迄今搜索到的最優(yōu)適應(yīng)值,其對應(yīng)的粒子位置矩陣是p=;是粒子群迄今搜索到的最優(yōu)適應(yīng)值,對應(yīng)的最優(yōu)粒子位置是,粒子數(shù)m選定為30個。
3結(jié)果分析
本實例中隨機(jī)選取機(jī)輸入和輸出矩陣,如:p=[00000;10001;01001;00100;00010];t=[0000;1000;0100;0010;0001]。由于P是五行的矩陣,所以網(wǎng)絡(luò)輸入層的神經(jīng)元個數(shù)為:5個,T為五行矩陣,故輸出層神經(jīng)元個數(shù)為:5個,隱含層神經(jīng)元個數(shù)為:6個。
首先觀察一下PSO算法中的適應(yīng)值(fitness)的變化過程,圖1中,實線表示適應(yīng)值的平均值,虛線表示是最優(yōu)適應(yīng)值。從圖中可以看出適應(yīng)值迅速的選擇過程。
圖2為用PSO—BP算法和BP算法在訓(xùn)練誤差精度為0.002的情況下的誤差演化曲線:(a)為PSO—BP算法訓(xùn)練誤差演化曲線,所用時間是20.422000s。(b)為常用BP算法訓(xùn)練誤差演化曲線,對權(quán)值的訓(xùn)練采用的是梯度下降法,所用時間是27.172000s。從圖中可以看到:PSO—BP算法的迭代次數(shù)遠(yuǎn)遠(yuǎn)小于BP算法,并且訓(xùn)練時間也縮短了。
(a)
(b)
圖2
為了充分說明實驗結(jié)果,筆者做了多次反復(fù)實驗,實驗結(jié)果如下表:在訓(xùn)練誤差精度為0.002的情況下,十次試驗中PSO—BP算法的平均迭代次數(shù)遠(yuǎn)小于BP算法,收斂時間較接近。
算法
次數(shù)BP算法PSO—BP算法
迭代次數(shù)收斂時間迭代次數(shù)收斂時間
1158735.79700071719.547000
2105123.17200079433.390000
391718.28100068327.813000
480916.28200087933.265000
5132333.125000109730.218000
6214643.76600093126.046000
7116123.64100056817.391000
853014.68700073625.782000
9141526.75000086927.625000
10122724.17200095329.422000
平均值1216.625.967300822.727.04990
4結(jié)論
本次試驗中對BP算法和PSO—BP算法進(jìn)行了對比試驗,試驗結(jié)果證明:PSO—BP算法優(yōu)于BP算法。具體表現(xiàn)在:學(xué)習(xí)算法的收斂速度有所提高;BP算法中的局部極小問題常令學(xué)習(xí)結(jié)果不滿意,PSO的全局優(yōu)化能力使問題得到解決。
參考文獻(xiàn)
[1]MartinT.Hagan,HowardB.Demuth,MarkH.Beale,著,戴葵,等譯.《神經(jīng)網(wǎng)絡(luò)設(shè)計》.機(jī)械工業(yè)出版社,2002年9月
[2]徐麗娜編著.《神經(jīng)網(wǎng)絡(luò)控制》.電子工業(yè)出版社,2003年2月
[3]高雋編著.《人工神經(jīng)網(wǎng)絡(luò)原理及仿真實例》.機(jī)械工業(yè)出版社,2003年8月
[4]ZbigniewMichalewicz,DavidB.Fogel著,曹宏慶,李艷,董紅斌,吳志健,譯.《如何求解問題——現(xiàn)代啟發(fā)式方法》.中國水利水電出版社,2003年2月