前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的神經(jīng)網(wǎng)絡(luò)的含義主題范文,僅供參考,歡迎閱讀并收藏。
計(jì)算機(jī)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)主要是指計(jì)算機(jī)連接網(wǎng)絡(luò)之后,其自身設(shè)備與傳輸媒介所共同組成的一種物理構(gòu)成模式,其網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的形式主要是由通信子網(wǎng)來決定的,其結(jié)構(gòu)的主要功能是實(shí)現(xiàn)數(shù)據(jù)信息的網(wǎng)絡(luò)共享、處理及交換,并要在一定程度上提升網(wǎng)絡(luò)數(shù)據(jù)信息運(yùn)行的可靠性,站在網(wǎng)絡(luò)拓?fù)涞慕Y(jié)構(gòu)來講,計(jì)算機(jī)網(wǎng)絡(luò)結(jié)構(gòu)的主要部分是鏈路與結(jié)點(diǎn),計(jì)算機(jī)網(wǎng)絡(luò)實(shí)質(zhì)上是由一組結(jié)點(diǎn)以及多條鏈路所共同組成的一種模擬結(jié)構(gòu)。計(jì)算機(jī)網(wǎng)絡(luò)通常表示為:G=<V,E>,其中V表示的是網(wǎng)絡(luò)結(jié)點(diǎn)集,E表示的是鏈路集,如果應(yīng)用Va來表示結(jié)構(gòu)中增加的結(jié)點(diǎn)集,Eb來表示增加的連接集,那么就能夠得到其拓?fù)鋽U(kuò)展的計(jì)算機(jī)網(wǎng)絡(luò)結(jié)構(gòu)為G’=<V’,E’>。
2基于計(jì)算機(jī)網(wǎng)絡(luò)連接優(yōu)化中的神經(jīng)網(wǎng)絡(luò)算法
本次研究中分析的均場神經(jīng)網(wǎng)絡(luò)算法實(shí)際上是一種神經(jīng)網(wǎng)絡(luò)算法與均場退火技術(shù)相結(jié)合的算法,應(yīng)用這種方法能夠有效的增強(qiáng)計(jì)算機(jī)的網(wǎng)絡(luò)連接,并且達(dá)到更優(yōu)化、更快的連接效果,這其實(shí)是一種利潤最大化的網(wǎng)絡(luò)優(yōu)化算法,其能夠最大限度的提高計(jì)算機(jī)網(wǎng)絡(luò)的性價(jià)比。
2.1神經(jīng)網(wǎng)絡(luò)算法
人工神經(jīng)網(wǎng)絡(luò)屬于非線性動(dòng)力學(xué)系統(tǒng),其能夠?qū)π畔⑦M(jìn)行分布式的存儲(chǔ)及協(xié)同處理,其在人工神經(jīng)網(wǎng)絡(luò)之上的人工神經(jīng)網(wǎng)絡(luò)系統(tǒng)的基礎(chǔ)之上,應(yīng)用網(wǎng)絡(luò)算法及網(wǎng)絡(luò)模型進(jìn)行各種信號(hào)的處理,或者是對(duì)某種運(yùn)行模式進(jìn)行識(shí)別,從而建立其一個(gè)獨(dú)立的專家系統(tǒng),或者是構(gòu)成機(jī)器人,當(dāng)前在多個(gè)領(lǐng)域中,人工神經(jīng)網(wǎng)絡(luò)系統(tǒng)都得到了廣泛的應(yīng)用,在該基礎(chǔ)上所發(fā)展起來的人工神經(jīng)網(wǎng)絡(luò)算法是一種監(jiān)督性的學(xué)習(xí)算法,人們對(duì)于其重視程度逐漸增加,但是在實(shí)際的應(yīng)用中,其存在收斂速度較慢的缺陷,難以保證將收斂程度壓制到全局的最小點(diǎn),容易導(dǎo)致計(jì)算機(jī)網(wǎng)絡(luò)學(xué)習(xí)及記憶不穩(wěn)定性增強(qiáng)的問題,這會(huì)對(duì)計(jì)算機(jī)網(wǎng)絡(luò)的連接效果造成直接的影響,做好其網(wǎng)絡(luò)連接的優(yōu)化非常的必要。
2.2均場神經(jīng)網(wǎng)絡(luò)算法
在基于計(jì)算機(jī)網(wǎng)絡(luò)連接增強(qiáng)優(yōu)化下的均場神經(jīng)網(wǎng)絡(luò)算法的研究中,對(duì)其網(wǎng)絡(luò)效果進(jìn)行判斷,需要建立起一個(gè)完整的場均神經(jīng)網(wǎng)絡(luò)模型,在模型的構(gòu)建過程中,應(yīng)該做好函數(shù)法構(gòu)造過程中的目標(biāo)函數(shù)的構(gòu)建問題,具體的構(gòu)建方式表現(xiàn)為:應(yīng)用Si來表示Hopfield計(jì)算網(wǎng)絡(luò)中的一個(gè)神經(jīng)元狀態(tài),并且規(guī)定當(dāng)Si=1時(shí),表示的含義是網(wǎng)絡(luò)選中了連接i,可以實(shí)現(xiàn)正常的連接,當(dāng)Si=0時(shí),表示的含義是:網(wǎng)絡(luò)中沒有選中連接i,網(wǎng)絡(luò)無法實(shí)現(xiàn)正常連接,再應(yīng)用罰函數(shù)法就結(jié)構(gòu)來進(jìn)行網(wǎng)絡(luò)模型的創(chuàng)建。
2.3實(shí)例分析
根據(jù)上文中分析的計(jì)算方法,在得到計(jì)算結(jié)果之后,能夠?qū)鶊鼍W(wǎng)絡(luò)算法的可行性及有效性進(jìn)行判定,我們分別采用模擬退火算法、遺傳算法、均場神經(jīng)網(wǎng)絡(luò)算法進(jìn)行比較,結(jié)果顯示模擬退火算法需要計(jì)算99次,這樣才能保證計(jì)算出規(guī)定的連接集,并從中獲取一定的利潤值,在遺傳算法中需要進(jìn)行96次的計(jì)算,在均場神經(jīng)網(wǎng)絡(luò)算法中,需要實(shí)施88次的計(jì)算,均場神經(jīng)網(wǎng)絡(luò)算法在獲得網(wǎng)路連接效果等方面,更快、更加有效,更適宜應(yīng)用于計(jì)算機(jī)網(wǎng)絡(luò)連接的增強(qiáng)優(yōu)化以及網(wǎng)絡(luò)結(jié)構(gòu)拓?fù)涞臄U(kuò)展工作中。
3結(jié)束語
關(guān)鍵詞:BP神經(jīng)網(wǎng)絡(luò);經(jīng)濟(jì)評(píng)價(jià);石油項(xiàng)目;經(jīng)濟(jì)預(yù)測
中圖分類號(hào): TP319
文獻(xiàn)標(biāo)識(shí)碼: A
文章編號(hào): 16727800(2017)004014503
0引言 在石油項(xiàng)目前期評(píng)估中,需判斷其可行性并對(duì)項(xiàng)目經(jīng)濟(jì)效益進(jìn)行評(píng)價(jià)。人工神經(jīng)網(wǎng)絡(luò) (Artificial Neural Network,ANN)[13] 利用大量非線性并行處理關(guān)系模擬眾多神經(jīng)網(wǎng)絡(luò),通過自學(xué)習(xí)找出輸入值與輸出值之間的關(guān)系,能輕松處理非線性問題,是一種基于黑箱原理的處理系統(tǒng)。針對(duì)傳統(tǒng)經(jīng)濟(jì)評(píng)價(jià)決策方法中存在的問題,將神經(jīng)網(wǎng)絡(luò)應(yīng)用到石油經(jīng)濟(jì)評(píng)價(jià)中。將多個(gè)石油項(xiàng)目的經(jīng)濟(jì)評(píng)價(jià)指標(biāo)作為ANN的輸入值,通過相應(yīng)訓(xùn)練樣本的學(xué)習(xí),使基于人工神經(jīng)網(wǎng)絡(luò)的石油經(jīng)濟(jì)評(píng)價(jià)系統(tǒng)更接近人類思維模式,對(duì)項(xiàng)目作出更合理的決策。1BP神經(jīng)網(wǎng)絡(luò) 反向傳播(Back Propagation,BP)神經(jīng)網(wǎng)絡(luò)是一個(gè)多層前饋神經(jīng)網(wǎng)絡(luò)[45],是當(dāng)前應(yīng)用較多且較為成熟的神經(jīng)網(wǎng)絡(luò)模型之一,其基本網(wǎng)絡(luò)包含3層:輸入層、隱含層和輸出層,隱藏層可以是單層或多層。典型的BP網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示,為一個(gè)單隱層BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),學(xué)習(xí)過程由正向傳播信號(hào)和反向傳播誤差組成,輸入信號(hào)由輸入層向前傳播經(jīng)過激發(fā)函數(shù)作用由隱藏節(jié)點(diǎn)傳到輸出節(jié)點(diǎn),如果輸出層輸出數(shù)值與期望不符,則將誤差作為調(diào)整信號(hào)按照原路逐層反向傳播,并對(duì)連接各層神經(jīng)元之間的權(quán)重和閾值進(jìn)行調(diào)整,逐漸縮小誤差值,直至誤差小于一個(gè)可接受的范圍方停止學(xué)習(xí)。同時(shí),也是一個(gè)監(jiān)督學(xué)習(xí),因?yàn)槊總€(gè)訓(xùn)練樣本都帶有標(biāo)簽,這些訓(xùn)練樣本預(yù)先確定了經(jīng)過BP網(wǎng)絡(luò)訓(xùn)練后的輸出值。經(jīng)過多次學(xué)習(xí),就能將該神經(jīng)網(wǎng)絡(luò)逼近某個(gè)函數(shù),這個(gè)訓(xùn)練好的網(wǎng)絡(luò)就能用于評(píng)價(jià)預(yù)測,學(xué)習(xí)過程其實(shí)就是將n維映射成m維,為了獲得正確的映射需要經(jīng)過反復(fù)學(xué)習(xí)即調(diào)整相關(guān)參數(shù)(權(quán)重和閾值)。
2石油項(xiàng)目經(jīng)濟(jì)評(píng)價(jià)指標(biāo)體系構(gòu)建2.1石油投資經(jīng)濟(jì)效益指標(biāo) 對(duì)于石油項(xiàng)目的經(jīng)濟(jì)效益評(píng)價(jià),可借助經(jīng)濟(jì)指標(biāo)反映石油項(xiàng)目在未來項(xiàng)目壽命期內(nèi)的經(jīng)濟(jì)效益。鑒于石油項(xiàng)目的復(fù)雜性,單一的評(píng)價(jià)指標(biāo)無法對(duì)項(xiàng)目作出全面的評(píng)價(jià)。根據(jù)文獻(xiàn)[6]-[7]選擇采用多個(gè)相互聯(lián)系且相對(duì)獨(dú)立的評(píng)價(jià)指標(biāo),如圖2所示,包括:凈現(xiàn)值、費(fèi)用現(xiàn)值、凈現(xiàn)值指數(shù)、投資收益率、內(nèi)部收益率和動(dòng)態(tài)投資回收期。
一個(gè)項(xiàng)目首先要判斷是否可行,主要考慮凈現(xiàn)值(NPV),NPV表示現(xiàn)金流入與流出的差額,當(dāng)NPV≥0時(shí)表示項(xiàng)目可行,此時(shí)項(xiàng)目到達(dá)或超過基準(zhǔn)收益率標(biāo)準(zhǔn),能給投資者帶來利潤,否則項(xiàng)目不可行,會(huì)損壞投資者價(jià)值。而在多個(gè)項(xiàng)目方案比較選擇中,一般凈現(xiàn)值最大的項(xiàng)目是最佳項(xiàng)目。凈現(xiàn)值指數(shù)指標(biāo)對(duì)于項(xiàng)目評(píng)價(jià)的準(zhǔn)則與凈現(xiàn)值一樣,這個(gè)指標(biāo)是凈現(xiàn)值與凈投資現(xiàn)值的比值,比起凈現(xiàn)值還考慮到最初投資額的大小。投資收益率是一個(gè)靜態(tài)指標(biāo),是指單位投資可獲得的利潤,值越大越好,當(dāng)它的值超過標(biāo)準(zhǔn)投資收益率時(shí)意味著該項(xiàng)目可行。內(nèi)部收益率是指當(dāng)凈現(xiàn)值為零時(shí)的貼現(xiàn)率,即在整個(gè)項(xiàng)目壽命期內(nèi),現(xiàn)金流入剛好完全抵補(bǔ)現(xiàn)金流出,是項(xiàng)目經(jīng)濟(jì)評(píng)價(jià)重要指標(biāo)之一。費(fèi)用現(xiàn)值是指在項(xiàng)目壽命期內(nèi)只考慮現(xiàn)金流出,也就是費(fèi)用支出,包含總投資和成本費(fèi)用,代表成本的值肯定越小越好。投資回收期是指項(xiàng)目的累計(jì)凈現(xiàn)值抵補(bǔ)全部投資的返本年限,即累計(jì)利潤達(dá)到零的時(shí)間期限,只是一個(gè)輔指標(biāo),選用動(dòng)態(tài)投資回收期這一指標(biāo),是因?yàn)楸绕痨o態(tài)回收期,此標(biāo)準(zhǔn)考慮到資金的時(shí)間價(jià)值。2.2石油經(jīng)濟(jì)評(píng)價(jià)指標(biāo)計(jì)算模型 上述指標(biāo)經(jīng)過下列計(jì)算模型計(jì)算后,可作為人工神經(jīng)網(wǎng)絡(luò)輸入層的輸入數(shù)據(jù),計(jì)算模型參考文獻(xiàn)[8],具體如下:
3石油項(xiàng)目前期經(jīng)濟(jì)效益評(píng)價(jià)3.1石油項(xiàng)目經(jīng)濟(jì)評(píng)價(jià)指標(biāo)歸一化將上述6個(gè)石油項(xiàng)目的經(jīng)濟(jì)評(píng)價(jià)指標(biāo)作為BP神經(jīng)網(wǎng)絡(luò)的輸入數(shù)據(jù),這些數(shù)據(jù)具有不可共度性,也就是說衡量這些數(shù)值的單位不相同,有些是百分?jǐn)?shù),有些以時(shí)間為單位,無法進(jìn)行比較。石油項(xiàng)目中關(guān)于項(xiàng)目費(fèi)用和盈利的指標(biāo)的數(shù)值是非常大的,這會(huì)導(dǎo)致BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)緩慢,收斂慢,有時(shí)數(shù)值太大,經(jīng)神經(jīng)網(wǎng)絡(luò)作用后,偏差也會(huì)很大;而且對(duì)于神經(jīng)網(wǎng)絡(luò)中所應(yīng)用的激活函數(shù)來說,有些函數(shù)是有值域的,數(shù)據(jù)太大或太小都會(huì)影響網(wǎng)絡(luò)學(xué)習(xí)效果。為了解決這些問題,一般在訓(xùn)練樣本數(shù)據(jù)前要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,進(jìn)行歸一化后的數(shù)據(jù)收斂性更強(qiáng),參考文獻(xiàn)[9]~[11]采用最值法作為數(shù)據(jù)歸一化方法。但是費(fèi)用現(xiàn)值和動(dòng)態(tài)投資回收期的值對(duì)于石油項(xiàng)目來說越小越好,而剩下4個(gè)指標(biāo)體現(xiàn)石油項(xiàng)目收益,這些指標(biāo)值越大越好,因此對(duì)上述分成收益型指標(biāo)和成本型指標(biāo)兩類數(shù)據(jù)歸一化,費(fèi)用現(xiàn)值和動(dòng)態(tài)投資回收期為成本型指標(biāo),其余皆為效益型指標(biāo)。假設(shè)有n個(gè)訓(xùn)練樣本,每個(gè)訓(xùn)練樣本含6個(gè)指標(biāo)數(shù)值,按以下公式將每個(gè)樣本的6個(gè)指標(biāo)進(jìn)行數(shù)據(jù)歸一化,限制在[0,1]區(qū)間內(nèi)。 (1)收益型指標(biāo),包括凈現(xiàn)值、凈現(xiàn)值指數(shù)、投資收益率和內(nèi)部收益率。
式中yij和xij分別表示第i組訓(xùn)練樣本的第j個(gè)指標(biāo)歸一化后和歸一化前的數(shù)值,而ximax和ximin分別表示第i組訓(xùn)練樣本中的最大和最小值。3.2BP人工神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)對(duì)于石油項(xiàng)目經(jīng)濟(jì)效益評(píng)價(jià)問題,就是利用BP人工神經(jīng)網(wǎng)絡(luò)將其轉(zhuǎn)換為6個(gè)項(xiàng)目經(jīng)濟(jì)評(píng)價(jià)指標(biāo)與最終評(píng)價(jià)值之間的非線性映射。實(shí)驗(yàn)選用三層BP神經(jīng)網(wǎng)絡(luò),輸入層節(jié)點(diǎn)數(shù)為6個(gè),對(duì)應(yīng)6個(gè)石油項(xiàng)目經(jīng)濟(jì)評(píng)價(jià)指標(biāo)。激活函數(shù)選用單極性Sigmoid函數(shù)(雙曲線正切函數(shù)),公式如下:
對(duì)于隱藏層節(jié)點(diǎn)數(shù)確定,最常用的方法是試湊法[1213],以公式(3)、(4)來設(shè)置較多的隱節(jié)點(diǎn),對(duì)于每個(gè)隱節(jié)點(diǎn)數(shù)進(jìn)行一次BP網(wǎng)絡(luò)的訓(xùn)練,通過比較每次訓(xùn)練誤差的大小,選定誤差最小的作為該BP網(wǎng)絡(luò)的隱藏層節(jié)點(diǎn)個(gè)數(shù)。
其中,m表示隱藏層節(jié)點(diǎn)個(gè)數(shù),n表示輸入層節(jié)點(diǎn)個(gè)數(shù),l表示輸出層節(jié)點(diǎn)個(gè)數(shù),α取1~10之間的常數(shù),此處設(shè)計(jì)的BP網(wǎng)絡(luò)層是6個(gè)輸入節(jié)點(diǎn),1個(gè)輸出節(jié)點(diǎn),根據(jù)取值范圍,隱藏層節(jié)點(diǎn)數(shù)取值范圍是4~13。根據(jù)最終項(xiàng)目評(píng)價(jià)結(jié)果為可行與不可行來分為兩類,對(duì)于BP神經(jīng)網(wǎng)絡(luò),可行項(xiàng)目期望輸出值為1,不可行項(xiàng)目期望輸出值為0.5,如表1所示的部分訓(xùn)練樣本。將大量的石油項(xiàng)目相關(guān)數(shù)據(jù)通過BP網(wǎng)絡(luò)訓(xùn)練,得出該BP網(wǎng)絡(luò)隱藏層節(jié)點(diǎn)數(shù)為9個(gè)。
3.3石油項(xiàng)目前期經(jīng)濟(jì)效益評(píng)價(jià)過程 如圖3所示,用戶可以創(chuàng)建石油項(xiàng)目,錄入最初的原始數(shù)據(jù),比如相關(guān)基礎(chǔ)數(shù)據(jù)、成本費(fèi)用、營業(yè)稅金及附加、融資方案等。提交該項(xiàng)目后,生成財(cái)務(wù)報(bào)表,初步反映該石油項(xiàng)目在項(xiàng)目壽命期內(nèi)的經(jīng)濟(jì)情況。根據(jù)初步計(jì)算進(jìn)行不確定性分析,以盈虧平衡分析和敏感性分析為主,以表格和圖像的形式呈現(xiàn)投資項(xiàng)目的風(fēng)險(xiǎn)和不確定性,提高投資決策的可靠性。利用計(jì)算模型計(jì)算BP神經(jīng)網(wǎng)絡(luò)的輸入數(shù)據(jù),經(jīng)過神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)能力對(duì)石油項(xiàng)目進(jìn)行終極評(píng)價(jià),為最終審核提供可靠的建議。3.4實(shí)驗(yàn)結(jié)果與分析 通過石油項(xiàng)目經(jīng)濟(jì)評(píng)價(jià)系統(tǒng)獲取不同項(xiàng)目的經(jīng)濟(jì)效益評(píng)價(jià)數(shù)據(jù),將經(jīng)過歸一化后的數(shù)據(jù)作為訓(xùn)練好的BP神經(jīng)網(wǎng)絡(luò)輸入端。如圖4所示,通過樣本訓(xùn)練后,所有輸出期望值都圍繞在0.5和1附近,輸出值output=0.5時(shí),代表該石油項(xiàng)目是不可行的,輸出值output=1,代表該石油項(xiàng)目是可行的。
為了驗(yàn)證此BP神經(jīng)網(wǎng)絡(luò)對(duì)于石油項(xiàng)目經(jīng)濟(jì)效益評(píng)價(jià)預(yù)測的準(zhǔn)確性,將表2中有代表性的測試數(shù)據(jù)通過神經(jīng)網(wǎng)〖HJ*3〗絡(luò)預(yù)測獲得最終的期望值輸出。第一個(gè)石油項(xiàng)目凈現(xiàn)值大于0,成本低,投資回收期短,投資回報(bào)率高,是一個(gè)非常好的投資項(xiàng)目,與其輸出值含義相符合。相反,第二個(gè)項(xiàng)目凈現(xiàn)值小于0,收益率低,完全符合輸出值0.5,是一個(gè)不可行項(xiàng)目。項(xiàng)目3雖然凈現(xiàn)值大于0,不會(huì)虧本,但是投資大,資本回收期長,并且回報(bào)率低,這并不是一個(gè)好的項(xiàng)目,故該系統(tǒng)判定為不可行項(xiàng)目。
4結(jié)語 本文通過模擬實(shí)驗(yàn)驗(yàn)證將BP神經(jīng)網(wǎng)絡(luò)應(yīng)用于石油項(xiàng)目經(jīng)濟(jì)評(píng)價(jià)的有效性,克服傳統(tǒng)評(píng)價(jià)的缺陷和局限性。
結(jié)果表明經(jīng)過大量真實(shí)數(shù)據(jù)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)能更準(zhǔn)確地為用戶提供基于項(xiàng)目數(shù)據(jù)的判斷,能準(zhǔn)確描述代表石油項(xiàng)目經(jīng)濟(jì)效益的6個(gè)指標(biāo)與項(xiàng)目可行性之間的非線性關(guān)系。當(dāng)然BP神經(jīng)網(wǎng)絡(luò)也有其缺陷,對(duì)于隱藏層數(shù)及其節(jié)點(diǎn)數(shù)的確認(rèn)并沒有完整的理論指導(dǎo),后期將引入深度學(xué)習(xí)對(duì)其進(jìn)行經(jīng)濟(jì)效益預(yù)測,以使預(yù)測更加精確。
參考文獻(xiàn):[1]蔡自興,徐光v.人工智能極其應(yīng)用[M].第四版.北京:清華大學(xué)出版社,2011.
[2]C M BISHOP.Neural network and theirapplications[J].Revi.Scie.Instr,1994(156):18031832.
[3]胡金濱,唐旭清.人工神經(jīng)網(wǎng)絡(luò)的BP算法及其應(yīng)用[J].信息技術(shù),2004 (4):14.
[4]L K HANSEN,P SALAMON.Neural network ensembles[J].IEEE trans pattern analysis and machine intelligence,1990(12):9931001.
[5]WANG P,ZHAO T,F(xiàn)AN Y,et al.Study of Chinese farmers income forecast model based on BP neural network[J].Computer and Applications,2014(56):508511.
[6]董蔚P,單守會(huì).未開發(fā)石油儲(chǔ)量評(píng)價(jià)及經(jīng)濟(jì)分類方法[J].石油與天然氣地質(zhì),1993,14(3):251256.
[7]李敏杰.海外石油投資經(jīng)理評(píng)價(jià)指標(biāo)淺析[J].西安財(cái)經(jīng)學(xué)院學(xué)報(bào),2007,20(1):7619.
[8]游達(dá)明,劉亞錚.技術(shù)經(jīng)濟(jì)與項(xiàng)目經(jīng)濟(jì)評(píng)價(jià)[M].北京:清華大學(xué)出版社,2009:6290.
[9]Q SONG,Q JIANG,Z SONG.Economic evaluation of CO2EOR industry chain in refineries[J].Shiyou Xuebao Shiyou Jiagong/acta Petrolei Sinica,2015.
[10]L XIAOKE.Analysis of the misunderstanding in investment project economic appraisal theory[C].Business Management and Electronic Information (BMEI),2011:196198.
[11]楊偉,倪黔東,吳軍基.BP神經(jīng)網(wǎng)絡(luò)權(quán)值初始值與收斂性問題研究[J].電力系統(tǒng)及自動(dòng)化學(xué)報(bào),2002,14(1):2022.
[關(guān)鍵詞]電力系統(tǒng)自動(dòng)化;智能技術(shù);分析
1、電力系統(tǒng)自動(dòng)化與智能技術(shù)的含義
電力系統(tǒng)自動(dòng)化,從含義上是對(duì)電能生產(chǎn)、傳輸和管理實(shí)現(xiàn)自動(dòng)化、自動(dòng)調(diào)度和自動(dòng)化管理;從種類上,它的分類較多,例如:電網(wǎng)調(diào)度自動(dòng)化等。智能技術(shù)是智能計(jì)算機(jī)技術(shù)的簡稱,從含義上它包含體系結(jié)構(gòu)和人機(jī)接口;從種類上,它的種類也較多,例如:模糊控制等。
智能技術(shù)是具備學(xué)習(xí)、適應(yīng)及組織功能的行為,能夠?qū)Ξa(chǎn)品問題進(jìn)行合適求解,解決傳統(tǒng)魯棒性控制和自適應(yīng)控制無法解決出令人滿意結(jié)果的,非線性、時(shí)變性和不確定性的控制問題。目前,智能技術(shù)尚處于發(fā)展階段,但它已受到人們的普遍重視,廣泛應(yīng)用于電力系統(tǒng)各個(gè)領(lǐng)域中,并取得了一定的實(shí)效。
專家系統(tǒng)在電力系統(tǒng)中的應(yīng)用范圍很廣,它是一種基于知識(shí)的系統(tǒng),用于智能協(xié)調(diào)、組織和決策,激勵(lì)相應(yīng)的基本級(jí)控制器完成控制規(guī)律的實(shí)現(xiàn)。主要針對(duì)各種非結(jié)構(gòu)化問題,處理定性的、啟發(fā)式或不確定的知識(shí)信息。如:電力系統(tǒng)恢復(fù)控制、故障點(diǎn)的隔離、調(diào)度員培訓(xùn)、處于警告或緊急狀態(tài)的辨識(shí)、配電系統(tǒng)自動(dòng)化等。以智能的方式求得受控系統(tǒng)盡可能地優(yōu)化和實(shí)用化,并經(jīng)過各種推理過程達(dá)到系統(tǒng)的任務(wù)目標(biāo)。雖然取得廣泛應(yīng)用,但存在如難以模仿電力專家的創(chuàng)造性等局限性。一般而言,專家控制系統(tǒng)應(yīng)用較大的原因是由于該方法可適用范圍廣,且能為電力系統(tǒng)處于各種狀態(tài)提出辨識(shí),根據(jù)這種具體情況給出警告或提示,同時(shí)還能進(jìn)行控制和恢復(fù)。雖然專家系統(tǒng)得到一定的應(yīng)用,但是仍存在一定的局限性,這種局限包括對(duì)創(chuàng)造性的難以模仿,而只限于淺層知識(shí)的應(yīng)用,缺乏極有效的深層模仿和設(shè)計(jì),難以適應(yīng)復(fù)雜狀態(tài)。因此,在開發(fā)專家系統(tǒng)方面應(yīng)注意專家系統(tǒng)的代價(jià)/效益分析方法、專家系統(tǒng)軟件的有效性和試驗(yàn)、知識(shí)獲取、專家系統(tǒng)與其他常規(guī)計(jì)算工具相結(jié)合等問題。
模糊方法是一種對(duì)系統(tǒng)宏觀的控制,十分簡單而易于掌握,為隨機(jī)、非線性和不確定性系統(tǒng)的控制,提供了良好的途徑。將人的操作經(jīng)驗(yàn)用模糊關(guān)系來表示,通過模糊推理和決策方法,對(duì)復(fù)雜過程對(duì)象進(jìn)行有效控制。通常用“如果……,則……”的方式來表達(dá),在實(shí)際控制中的專家知識(shí)和經(jīng)驗(yàn)不依賴被控對(duì)象模型,魯棒性較強(qiáng)。模糊控制技術(shù)的應(yīng)用非常廣泛,與常規(guī)控制相比,其在提高模糊控制的控制品質(zhì),如:穩(wěn)態(tài)誤差、超調(diào)等問題,自身的學(xué)習(xí)能力還不完善,因此要求系統(tǒng)具有完備的知識(shí),對(duì)工業(yè)智能系統(tǒng)的設(shè)計(jì)而言是困難的,如模糊變結(jié)構(gòu)控制、自適應(yīng)或自組織模糊控制、自適應(yīng)神經(jīng)網(wǎng)絡(luò)控制、神經(jīng)網(wǎng)絡(luò)變結(jié)構(gòu)控制等。另一方面包含了各種智能控制方法之間的交叉結(jié)合,對(duì)電力系統(tǒng)這樣一個(gè)復(fù)雜的大系統(tǒng)來講,綜合智能控制更具備巨大的應(yīng)用潛力。現(xiàn)在,在電力系統(tǒng)中研究較多的有神經(jīng)網(wǎng)絡(luò)與專家系統(tǒng)的結(jié)合,專家系統(tǒng)與模糊控制的結(jié)合,神經(jīng)網(wǎng)絡(luò)與模糊控制的結(jié)合,神經(jīng)網(wǎng)絡(luò)、模糊控制與自適應(yīng)控制的結(jié)合等方面。這些模糊方法的運(yùn)用因其可使用范圍廣,目前已在自動(dòng)化控制中被廣泛應(yīng)用。智能集成化是綜合智能控制重要的技術(shù)發(fā)展方向,其可將多項(xiàng)智能技術(shù)相互結(jié)合于一體,不再單獨(dú)運(yùn)用,各取優(yōu)勢。如模糊技術(shù)和神經(jīng)網(wǎng)絡(luò)的結(jié)合、神經(jīng)網(wǎng)絡(luò)與模糊控制的結(jié)合、神經(jīng)網(wǎng)絡(luò)與專家系統(tǒng)的結(jié)合等,這些都在電力系統(tǒng)自動(dòng)化控制中有較多研究。
2、智能技術(shù)與電力系統(tǒng)自動(dòng)化的結(jié)合
智能技術(shù)被應(yīng)用在電力系統(tǒng)自動(dòng)化中,進(jìn)一步完善和發(fā)展了電力系統(tǒng)自動(dòng)化。智能系統(tǒng)在電力系統(tǒng)中的有效應(yīng)用,不僅協(xié)調(diào)了電力系統(tǒng)發(fā)展的不成熟性和該系統(tǒng)本身的不穩(wěn)定性,還滿足了公眾對(duì)于相對(duì)廉價(jià)、便利的電力網(wǎng)絡(luò)的需求。所以,智能技術(shù)作為一種技術(shù)被應(yīng)用于電力系統(tǒng)自動(dòng)化中。
眾所周知,智能技術(shù)從分類上可分為以下幾個(gè)部分:模糊控制和神經(jīng)網(wǎng)絡(luò)控制、專家系統(tǒng)控制、線性最優(yōu)控制和綜合智能控制。如今,電力系統(tǒng)自動(dòng)化還未發(fā)展成熟,還存在一些缺點(diǎn)以待改進(jìn),如:強(qiáng)非線性,時(shí)變性且參數(shù)不確切可知,含有大量未建模動(dòng)態(tài)部分和電力覆蓋范圍大但卻具有網(wǎng)絡(luò)阻滯、延遲等。下面,我們將具體分析如何通過應(yīng)用智能系統(tǒng)改變電子系統(tǒng)智能化的缺點(diǎn)。
3、將智能技術(shù)應(yīng)用到電力系統(tǒng)自動(dòng)化中的具體做法
3.1模糊控制在電力系統(tǒng)自動(dòng)化中的應(yīng)用
模糊控制使得建立模型來進(jìn)行控制變得十分簡單和易于掌握。通過建立模型進(jìn)行控制是一種比較現(xiàn)代的方法,與建立常規(guī)的模式相比,更具優(yōu)越性、相對(duì)簡單。例如,交通信號(hào)燈的轉(zhuǎn)換是由前面的主列隊(duì)與后面的主列隊(duì)決定,并使用一定的工具實(shí)現(xiàn)二維模糊控制器。洗衣機(jī)可根據(jù)清洗過程中水質(zhì)的變化對(duì)衣物進(jìn)行不同程度的清洗,以保證衣物的干凈。模糊控制主要是在汽車的自動(dòng)變速器上起作用,是通過自動(dòng)變速器檢測駕駛員的速度得出駕駛員的駕駛意圖,判斷路況和汽車受到的阻力、監(jiān)測發(fā)動(dòng)機(jī)的情況。通過以上舉例,我們可以得出模糊控制適用于電力系統(tǒng)自動(dòng)化,并且具有廣泛性和通用性,能夠適用于其他不同的領(lǐng)域。
3.2神經(jīng)網(wǎng)絡(luò)系統(tǒng)在電力系統(tǒng)自動(dòng)化中的應(yīng)用
神經(jīng)網(wǎng)絡(luò)控制技術(shù)具有與電力系統(tǒng)自動(dòng)化相適應(yīng)的性質(zhì)“非線性特性”,同時(shí),其還具有自我學(xué)習(xí)與自我組織的能力,以及具有強(qiáng)壯的網(wǎng)絡(luò)系統(tǒng)和處理的能力。因此,大量的、簡單的神經(jīng)元構(gòu)成了神經(jīng)網(wǎng)絡(luò)控制技術(shù),有了神經(jīng)網(wǎng)絡(luò)控制方式。神經(jīng)網(wǎng)絡(luò)利用一定的學(xué)習(xí)算法,將隱藏在其連接權(quán)值上的大量信息進(jìn)行了調(diào)節(jié)權(quán)值,從而實(shí)現(xiàn)了非線性的復(fù)雜映射,從m維空間到n維空間。這個(gè)概念被應(yīng)用于許多領(lǐng)域,如:自動(dòng)控制領(lǐng)域;處理組合優(yōu)化問題;模式識(shí)別;圖像處理;傳感信號(hào)處理和醫(yī)學(xué)領(lǐng)域等。因?yàn)槿梭w與疾病之間的關(guān)鏈非常復(fù)雜,因此神經(jīng)網(wǎng)絡(luò)控制技術(shù)也被廣泛應(yīng)用到醫(yī)學(xué)上的多個(gè)領(lǐng)域,例如:醫(yī)學(xué)專家系統(tǒng)中的麻醉和危重醫(yī)學(xué)相關(guān)領(lǐng)域的研究等。由上述舉例,我們可以知道神經(jīng)網(wǎng)絡(luò)控制技術(shù)適用于電力系統(tǒng)自動(dòng)化,具有廣泛性和通用性,能夠適應(yīng)于其他不同的領(lǐng)域。
3.3專家系統(tǒng)控制在電力系統(tǒng)自動(dòng)化中的應(yīng)用
專家系統(tǒng)控制能及時(shí)處理和辨識(shí)發(fā)生故障的電力系統(tǒng),最大限度地降低網(wǎng)絡(luò)阻滯或延遲給人們帶來的危險(xiǎn)和不便。專家系統(tǒng)在電力系統(tǒng)中有較為廣泛的應(yīng)用范圍,例如能夠辨識(shí)電力系統(tǒng)所處的狀態(tài):警告狀態(tài)或緊急狀態(tài)、緊急的處理、系統(tǒng)恢復(fù)控制、系統(tǒng)規(guī)劃、切負(fù)荷和電壓無功控制、故障點(diǎn)距離的測量、做出短期負(fù)荷預(yù)報(bào)、所處狀態(tài)的安全分析以及先進(jìn)的人機(jī)接口等方面。在電梯控制中的應(yīng)用,隨著科技的日新月異,電梯的制作技術(shù)也在不斷地發(fā)展與更新,由簡單逐漸趨向于復(fù)雜化,現(xiàn)在,在電梯即將出廠時(shí),會(huì)有專門的工作人員進(jìn)行調(diào)試,但當(dāng)安裝好后,電梯一旦出現(xiàn)故障時(shí),為本單位所配備的維修人員,卻不能快速找到問題,解除故障,這是由于電梯構(gòu)造復(fù)雜化了,因此我們需要在安裝電梯之前,安裝專家控制器以確保電梯的可用性和保障性。由此可見,專家系統(tǒng)控制適用于電力系統(tǒng)自動(dòng)化。
3.4綜合智能系統(tǒng)在電力系統(tǒng)自動(dòng)化中的應(yīng)用
綜合智能系統(tǒng)根據(jù)模糊控制結(jié)構(gòu)有效、合理地將這些控制方法結(jié)合起來,以完善電力系統(tǒng)自動(dòng)化,使其能夠具備穩(wěn)定性、協(xié)調(diào)性和簡易性。由于智能控制方法之間的交叉結(jié)合,一般人們會(huì)將其進(jìn)行如下組合進(jìn)行分析,例如:神經(jīng)系統(tǒng)與專家系統(tǒng)的結(jié)合;專家系統(tǒng)和模糊控制的結(jié)合;神經(jīng)網(wǎng)絡(luò)與模糊控制的結(jié)合;神經(jīng)網(wǎng)絡(luò)、模糊控制與自適應(yīng)控制的結(jié)合等方面。
關(guān)鍵詞:信用風(fēng)險(xiǎn)評(píng)估;支持向量機(jī)集成;預(yù)測
中圖分類號(hào):F830.51
文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1003-5192(2009)04-0057-05
1 引言
商業(yè)銀行作為國民經(jīng)濟(jì)的總樞紐和金融信貸中心,發(fā)揮著融通資金、引導(dǎo)資產(chǎn)流向和調(diào)節(jié)社會(huì)供需平衡等諸多不可替代的作用。然而商業(yè)銀行在營運(yùn)過程中面臨著各種各樣的風(fēng)險(xiǎn),包括系統(tǒng)風(fēng)險(xiǎn)和非系統(tǒng)風(fēng)險(xiǎn),其中在非系統(tǒng)風(fēng)險(xiǎn)中信用風(fēng)險(xiǎn)占有特殊的重要地位。世界銀行對(duì)全球銀行業(yè)危機(jī)的研究表明,導(dǎo)致銀行破產(chǎn)的最常見原因就是信用風(fēng)險(xiǎn)。信用風(fēng)險(xiǎn)又稱違約風(fēng)險(xiǎn),是指借款人、證券發(fā)行人或交易對(duì)方因種種原因,不愿或無力履行合同條件而構(gòu)成違約,致使銀行,投資者或交易對(duì)方遭受損失的可能性[1]。信用風(fēng)險(xiǎn)是商業(yè)銀行信貸風(fēng)險(xiǎn)管理中一項(xiàng)基礎(chǔ)性的工作,其目的在于分析銀行在貸款業(yè)務(wù)中可能面臨的信用風(fēng)險(xiǎn)――借款人如期履行特定債務(wù)的能力與意愿,從而為貸款決策提供依據(jù)。
信用評(píng)估方法在不斷演進(jìn),大致經(jīng)歷了定性分析、統(tǒng)計(jì)分析和人工智能三個(gè)發(fā)展階段,最初它只是通過信貸分析員閱讀申請(qǐng)表并決定是否放貸,但是這一方法主觀因素太強(qiáng),必然存在誤判的可能性。統(tǒng)計(jì)方法主要是判別分析(DA)[2],判別分析是分類預(yù)測的主要研究范疇之一[3],但是判別分析在操作上的一個(gè)缺點(diǎn)是其基本假設(shè)很容易被打亂。另外,模型只能在已被通過的貸款樣本中進(jìn)行估計(jì),因此存在參數(shù)估計(jì)的樣本偏差。隨著信用行業(yè)的發(fā)展以及貸款組合種類的不斷增加,信用評(píng)估的準(zhǔn)確率哪怕只提高零點(diǎn)幾個(gè)百分點(diǎn),都會(huì)帶來巨大的效益,因此,人們積極探索開發(fā)更加準(zhǔn)確的信用評(píng)估模型,先后就非參數(shù)統(tǒng)計(jì)模型、人工智能等方法在信用評(píng)估方面的應(yīng)用進(jìn)行了嘗試[4],尤其是最近幾年中己經(jīng)開發(fā)出來包括分類樹[5]、神經(jīng)網(wǎng)絡(luò)[6]以及多元判別法分析[7]等在內(nèi)的多種方法。但是,這些方法都存在一些缺點(diǎn),即不能量化解釋指標(biāo)的重要程度,在分類樹分析中沒有參數(shù),而在神經(jīng)網(wǎng)絡(luò)中則沒有參數(shù)解釋,用于信用風(fēng)險(xiǎn)評(píng)估具有一定的片面性。同時(shí),神經(jīng)網(wǎng)絡(luò)的訓(xùn)練是在黑箱中進(jìn)行的,這種運(yùn)算摒棄許多行業(yè)經(jīng)驗(yàn)和專家經(jīng)驗(yàn),具有一定的盲目性,人們不能對(duì)之進(jìn)行干預(yù)。神經(jīng)網(wǎng)絡(luò)適合于對(duì)數(shù)量指標(biāo)的分析,而忽略對(duì)影響因素中的定性指標(biāo)的分析,顯然是不合理的、片面的。而且用神經(jīng)網(wǎng)絡(luò)來評(píng)價(jià)經(jīng)濟(jì)問題時(shí),很難說明神經(jīng)網(wǎng)絡(luò)訓(xùn)練后,各網(wǎng)絡(luò)參數(shù)和閥值的經(jīng)濟(jì)含義,使得模型缺乏說服性。
研究表明組合分類器的分類精度一般比單個(gè)分類器的分類精度高,但是神經(jīng)網(wǎng)絡(luò)集成[8]在信用評(píng)分中的應(yīng)用結(jié)果表明,神經(jīng)網(wǎng)絡(luò)集成的分類精度不如單個(gè)神經(jīng)網(wǎng)絡(luò)。因?yàn)樯窠?jīng)網(wǎng)絡(luò)分類建立在大樣本的基礎(chǔ)上,而目前銀行所保存的數(shù)據(jù)樣本量有限,用集成神經(jīng)網(wǎng)絡(luò)分類則必須把所收集的樣本分割成多個(gè)子樣本,從而減少了單個(gè)神經(jīng)網(wǎng)絡(luò)的訓(xùn)練樣本數(shù),進(jìn)而影響了其分類精度?;诖?許多學(xué)者在支持向量機(jī)[9~11]的基礎(chǔ)上又發(fā)展了基于小樣本學(xué)習(xí)的支持向量基集成[12~14],許多領(lǐng)域都用此方法來改善分類精度,應(yīng)用結(jié)果表明支持向量機(jī)集成的分類精度至少和單個(gè)支持向量機(jī)的分類精度一樣好。但是目前的研究普遍是基于最多投票原則的集成方法,該方法沒有考慮子支持向量機(jī)分類器的輸出重要性。
長期以來信用風(fēng)險(xiǎn)評(píng)估一直被看作是模式識(shí)別中的一類分類問題,依據(jù)的信用風(fēng)險(xiǎn)衡量標(biāo)準(zhǔn)是貸款企業(yè)“違約與否”,利用的是模型與方法的分類功能,形成信用風(fēng)險(xiǎn)的分類評(píng)估模式,這種做法被稱為“粗暴的經(jīng)驗(yàn)主義方法”。分類評(píng)估模式所反映的有限的經(jīng)濟(jì)信息并不能充分滿足信貸風(fēng)險(xiǎn)決策的需要,轉(zhuǎn)變?cè)u(píng)估模式的關(guān)鍵在于確立更為有效、客觀的信用風(fēng)險(xiǎn)衡量標(biāo)準(zhǔn)和評(píng)估預(yù)測模型, 而實(shí)施貸款風(fēng)險(xiǎn)的五級(jí)分類體系可以提高分類準(zhǔn)確性,本文建立基于模糊積分的支持向量機(jī)集成方法,該方法考慮了各子分類器的分類結(jié)果和各子分類器判決對(duì)最終決策的重要程度,并對(duì)商業(yè)銀行信用風(fēng)險(xiǎn)進(jìn)行五級(jí)分類,以某商業(yè)銀行的實(shí)際數(shù)據(jù)進(jìn)行實(shí)證研究,評(píng)估結(jié)果表明該評(píng)價(jià)方法具有科學(xué)、簡潔、預(yù)測精度高等特點(diǎn),而且模型的結(jié)構(gòu)與方法應(yīng)用前景廣闊。
2 基于模糊積分SVMs集成的模型構(gòu)建
2.1 Bagging個(gè)體生成
Bagging[15]的基礎(chǔ)是可重復(fù)采樣(Bootstrap Sampling)。在該方法中,各支持向量分類器的訓(xùn)練集由原始訓(xùn)練集中隨機(jī)抽取若干示例組成。訓(xùn)練集的規(guī)模通常與原始訓(xùn)練集相當(dāng),訓(xùn)練例允許重復(fù)選取。這樣,原始訓(xùn)練集中某些示例可能在新的訓(xùn)練集中出現(xiàn)多次,而另一些示例可能一次也不出現(xiàn)。Bagging方法通過重新選取訓(xùn)練集增加了分類器集成的差異度,從而提高了泛化能力。
3 模糊密度的確定方法
由模糊積分的定義可知,確定描述各個(gè)子支持向量分類器重要性的模糊密度值是基于模糊積分的多分類器集成的關(guān)鍵所在。本文使用混淆矩陣來確定各個(gè)支持向量分類器的模糊密度值。
在子支持向量分類器訓(xùn)練完畢后,用子分類器各自的訓(xùn)練集對(duì)各個(gè)子分類器進(jìn)行測試得到各自的混淆矩陣。
假定一個(gè)K類分類問題,對(duì)于子分類器SVCk,其混淆矩陣可以定義為
通過混淆矩陣可以得到各個(gè)支持向量機(jī)的模糊密度,為利用模糊積分進(jìn)行支持向量機(jī)集成奠定了基礎(chǔ)。
4 五類別問題實(shí)證分析
4.1 試驗(yàn)過程
仿真實(shí)驗(yàn)在Libsvm軟件的基礎(chǔ)上進(jìn)行,采用Visual C++編譯實(shí)現(xiàn)。驗(yàn)證平臺(tái)為256MB內(nèi)存的AMD Athlon 1800+,操作系統(tǒng)為Windows 2000。支持向量機(jī)集成流程如圖1所示。
實(shí)驗(yàn)過程如下:
第1步 使用Bagging方法從原始訓(xùn)練集中產(chǎn)生各個(gè)子支持向量分類器的訓(xùn)練集,對(duì)各子支持向量分類器進(jìn)行訓(xùn)練;
第2步 給出各訓(xùn)練完畢的子支持向量分類器的五級(jí)分類的概率輸出模型[17];
第3步 根據(jù)第3節(jié)中介紹的方法確定模糊密度{g({SVMi,}),k=1,…,c},以此來表示各子支持向量機(jī)SVMi,i=1,…,m在各自訓(xùn)練樣本上執(zhí)行好壞的概率密度;
第4步 當(dāng)給定一個(gè)測試樣本,得到各子支持向量分類器對(duì)該測試樣本的類概率輸出;第5步 對(duì)于ωk,k=1,…,c,根據(jù)2.2計(jì)算模糊積分ek,集成各子支持向量機(jī);
4.2 指標(biāo)體系的建立
商業(yè)銀行面臨的信用風(fēng)險(xiǎn)主要與貸款企業(yè)本身的信用狀況有關(guān),另外還與銀行自身貸款分布和行業(yè)集中度等因素有關(guān),具體可分為貸款企業(yè)風(fēng)險(xiǎn)、商業(yè)銀行風(fēng)險(xiǎn)、宏觀經(jīng)濟(jì)風(fēng)險(xiǎn)和其他風(fēng)險(xiǎn)因素。
綜合考慮信用風(fēng)險(xiǎn)的各影響因素,依據(jù)指標(biāo)選擇原則,借鑒我國財(cái)政部統(tǒng)計(jì)評(píng)價(jià)司的企業(yè)績效評(píng)價(jià)指標(biāo)體系和中國工商銀行企業(yè)資信評(píng)估指標(biāo)體系,并參考國內(nèi)外有關(guān)文獻(xiàn),兼顧我國信用風(fēng)險(xiǎn)的特殊性和數(shù)據(jù)的可獲得性,最終確定以下16個(gè)指標(biāo)(圖2)用作商業(yè)銀行信用風(fēng)險(xiǎn)評(píng)估。
圖2 信用風(fēng)險(xiǎn)評(píng)估指標(biāo)體系
4.3 樣本的獲取
本文的數(shù)據(jù)來源于中國工商銀行哈爾濱某分行,在采集數(shù)據(jù)時(shí),注重樣本自身的行業(yè)特征,不同行業(yè)的企業(yè)經(jīng)營環(huán)境和業(yè)務(wù)范圍差距很大,企業(yè)的各項(xiàng)財(cái)務(wù)指標(biāo)和非財(cái)務(wù)指標(biāo)也不具有可比性,而且又缺乏必要的行業(yè)標(biāo)準(zhǔn)和經(jīng)驗(yàn)值,因此模型中選用同一行業(yè)短期貸款的樣本數(shù)據(jù)來避開這一問題。采集的數(shù)據(jù)檢索條件如下:
(1)樣本行業(yè)范圍:制造業(yè);
(2)貸款種類:短期貸款(一年及一年以內(nèi));
(3)貸款發(fā)放日期:1998年1月1日至1月31日;
(4)貸款余額截止日:2001年8月13日;
(5)貸款金額:貸款實(shí)際發(fā)放金額;
(6)貸款余額:截止2001年8月13日確定為損失的貸款余額;
(7)貸款形態(tài):貸款目前所處的形態(tài);
(8)企業(yè)全稱及代碼:識(shí)別企業(yè)的唯一標(biāo)識(shí)碼;
(9)報(bào)表日期與報(bào)表:1997年12月31日的企業(yè)資產(chǎn)負(fù)債表和損益表;
(10)經(jīng)過收集、整理共獲取176個(gè)樣本,涉及貸款額50多億元人民幣。
4.4 樣本數(shù)據(jù)處理
首先對(duì)樣本進(jìn)行穩(wěn)健性處理,選用兩倍、三倍標(biāo)準(zhǔn)差檢驗(yàn)法進(jìn)行異常數(shù)據(jù)剔除,最終獲得157個(gè)樣本數(shù)據(jù)。將樣本集劃分為訓(xùn)練樣本集和測試樣本集,隨機(jī)抽取35%(56家)作為訓(xùn)練樣本集,用于構(gòu)造SVMs集成模型,其余的65%(101家)作為測試樣本集,用于檢驗(yàn)?zāi)P偷姆夯芰ΑR燥L(fēng)險(xiǎn)為依據(jù),按銀行所承受的風(fēng)險(xiǎn)大小來劃分貸款質(zhì)量的分類法,即通常所說的將貸款分為正常、關(guān)注、次級(jí)、可疑、損失五類的“五級(jí)分類法”(表1)。原始數(shù)據(jù)中,關(guān)于原始數(shù)據(jù)的實(shí)際信用等級(jí),該商業(yè)銀行是按貸款損失占貸款總額的比率來進(jìn)行統(tǒng)計(jì)的。本文采用的是用貸款損失/貸款總額來確定貸款劃分的類型,因此不可能完全按照中國人民銀行規(guī)定的貸款五級(jí)分類法的標(biāo)準(zhǔn),具有一定的預(yù)測性,但是,同樣,對(duì)貸款風(fēng)險(xiǎn)也有較好的指導(dǎo)作用。
在因子分析之前還需要進(jìn)行巴特利特球體檢驗(yàn)和KMO測度,測試結(jié)果顯示有必要對(duì)模型輸入指標(biāo)進(jìn)行因子分析。本文采用主成分分析法求解初始因子,依據(jù)特征值準(zhǔn)則(取特征值大于等于1的主成分作為初始因子),因子個(gè)數(shù)應(yīng)該確定為4,根據(jù)碎石檢驗(yàn)準(zhǔn)則(Scree Test Criterion)也得到同樣的結(jié)論,而此時(shí)因子累計(jì)解釋方差的比例可以達(dá)到74%以上,保留了原有數(shù)據(jù)的主要經(jīng)濟(jì)信息,并且各因子經(jīng)濟(jì)含義較為明確,表明因子個(gè)數(shù)的確定較為適宜。由于在因子負(fù)載矩陣中,相對(duì)于0.3的負(fù)載而言,變量的方差能夠被該因子解釋的部分不足10%,所以對(duì)于絕對(duì)值小于0.3的負(fù)載一般可以不予解釋,各因子的經(jīng)濟(jì)含義較為明確,而且因子與指標(biāo)間的內(nèi)在聯(lián)系比較顯著,各因子依次可以歸結(jié)為營運(yùn)能力因子、償債能力因子、盈利能力因子和貸款方式因子。
4.5 實(shí)證結(jié)果分析
依據(jù)表1,按銀行所承受的風(fēng)險(xiǎn)大小來劃分貸款質(zhì)量,將貸款分為正常、關(guān)注、次級(jí)、可疑、損失五類,再將分類結(jié)果和實(shí)際的分類進(jìn)行比較,判斷分類的正確性,以此對(duì)信用風(fēng)險(xiǎn)模型進(jìn)行評(píng)價(jià)。
本文采用一對(duì)一策略來實(shí)現(xiàn)多類別分類,訓(xùn)練出9個(gè)SVMs。各子支持向量分類器使用RBF核函數(shù),每個(gè)SVM通過10重交叉驗(yàn)證的方法來選擇相應(yīng)的參數(shù),本文進(jìn)行了10次實(shí)驗(yàn),并將本文提出的模糊積分支持向量機(jī)集成方法在五級(jí)分類上的執(zhí)行效果與單一SVM和基于最多投票原則的SVMs集成等的執(zhí)行效果進(jìn)行比較,圖3為平均執(zhí)行效果比較,從左到右依次是:(1)神經(jīng)網(wǎng)絡(luò)集成;(2)單一模糊神經(jīng)網(wǎng)絡(luò),(3)單一SVM,(4)基于最多投票SVMs集成,(5)基于模糊積分的SVMs集成。由圖3可知,基于模糊積分的SVMs集成的分類正確率為87.10%,基于最多投票的SVMs集成的分類正確率為85.17%,單一SVM的正確率為84.524%,模糊神經(jīng)網(wǎng)絡(luò)的分類正確率為82.59%,神經(jīng)網(wǎng)絡(luò)集成的分類正確率為81.72%。
應(yīng)用結(jié)果表明,基于模糊積分SVMs集成比單個(gè)SVM、基于最多投票的SVMs集成和單個(gè)模糊神經(jīng)網(wǎng)絡(luò)的分類效果好,而單個(gè)模糊神經(jīng)網(wǎng)絡(luò)的分類正確率比神經(jīng)網(wǎng)絡(luò)集成的分類正確率高。支持向量機(jī)集成的分類精度最高,可能是因?yàn)殂y行目前所保存的樣本量有限,支持向量機(jī)適合小樣本訓(xùn)練,而神經(jīng)網(wǎng)絡(luò)訓(xùn)練則需要大樣本支持,在有限的樣本中重復(fù)抽樣,會(huì)減少樣本量,這樣就會(huì)降低神經(jīng)網(wǎng)絡(luò)的訓(xùn)練精度,從而進(jìn)一步證明了支持向量機(jī)對(duì)于小樣本訓(xùn)練的優(yōu)勢;并且模糊積分在進(jìn)行多分類器決策融合的時(shí)候綜合考慮了各子分類器的分類結(jié)果和各子分類器判決對(duì)最終決策的重要程度的緣故,證實(shí)了本文提出的方法的準(zhǔn)確性和有效性。
5 結(jié)束語
本文提出了一個(gè)基于模糊積分的支持向量機(jī)集成方法。該方法最主要的優(yōu)點(diǎn)是它不僅組合各個(gè)分類結(jié)果,而且考慮不同SVMs分類器的相對(duì)重要性。將此方法應(yīng)用于商業(yè)銀行信用風(fēng)險(xiǎn)評(píng)估,模擬結(jié)果表明該方法比單個(gè)SVM、基于最多投票的SVMs集成方法、神經(jīng)網(wǎng)絡(luò)和神經(jīng)網(wǎng)絡(luò)集成的效率高,效果好。說明基于模糊積分的SVMs集成的商業(yè)銀行信用風(fēng)險(xiǎn)評(píng)價(jià)是可行和有效的。進(jìn)一步研究的方向是設(shè)定更加合理的模糊密度和用其它方法(如加速法)來構(gòu)建SVMs。
參 考 文 獻(xiàn):
[1]丁欣.國外信用風(fēng)險(xiǎn)評(píng)估方法的發(fā)展現(xiàn)狀[J].湖南大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2002,16(3):140 142.
[2]Jackson P, Perraudin W. Regulatory implications of credit risk modelling[J]. Journal of Banking and Finance, 2000, 24(1): 1 14.
[3]De Andres J, Linda M, Lorca P. Forecasting business profitability by using classification techniques: a comparative analysis based on a Spanish case[J]. European Journal of Operational Research, 2005, 167(2): 518 542.
[4]West D. Neural network credit searing models[J]. Computers & Operations Researeh, 2000, 27(4): 1131 1152.
[5]姜明輝,王歡,王雅林.分類樹在個(gè)人信用評(píng)估中的應(yīng)用[J].商業(yè)研究,2003,(12):15 19.
[6]Lee K C, Han I, Kwon Y. Hybrid neural network models for bankruptcy predictions[J]. Decision Support System, 1996, 18(1): 63 72.
[7]方洪全,曾勇.運(yùn)用多元判別法評(píng)估企業(yè)信用風(fēng)險(xiǎn)的實(shí)例[J].預(yù)測,2004,23(2):6568.
[8]Tsai C F, Wu J W. Using neural network ensembles for bankruptcy prediction and credit scoring[J]. Expert Systems with Applications, 2008, 34(4): 2639 2649.
[9]Huang C L, Chen M C, Wang C J. Credit scoring with a data mining approach based on support vector machines[J]. Expert Systems with Applications, 2007,33(4): 847856.
[10]Xu Xiujuan, Zhou Chunguang, Wang Zhe. Credit scoring algorithm based on link analysis ranking with support vector machine[J]. Expert Systems with Applications, 2008, 36(2): 18.
[11]Crook J N, Edelman D B, Thomas L C. Recent developments in consumer credit risk assessment[J]. European Journal of Operational Research, 2007, 183(3): 1447 1465.
[12]Nanni L, Lumini A. MppS: an ensemble of support vector machine based on multiple physicochemical properties of amino acids[J]. Neurocomputing, 2006, 69(13): 1688 1690.
[13]Li Bo, Li Xinjun, Zhao Zhiyan. Novel algorithm for constructing support vector machine regression ensemble[J]. Journal of Systems Engineering and Electronics, 2006, 17(3): 541 545.
[14]Bertoni A, Folgieri R, Valentini G. Bio molecular cancer prediction with random subspace ensembles of support vector machines[J]. Neurocomputing, 2005, 63(6): 535 539.
[15]Breiman L. Bagging predictors[J]. Machine Learning, 1996, 24(2): 123 140.
[16]Kwak K C, Pedrycz W. Face recognition: a study in information fusion using fuzzy integral[J]. Pattern Recognition Letters, 2005, 26(6): 719 733.
關(guān)鍵詞:倒立擺;PID;模糊神經(jīng)網(wǎng)絡(luò);穩(wěn)定性控制;仿真
中圖分類號(hào):TP18文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2012)13-3165-06
Inverted Pendulum System Based on PID and Fuzzy Neural Networks Control
LIU Zhi-long, PAN Yu-min
(Department of Electronic Information Engineering, North China Institute of Science and Technology, Beijing 101601, China)
Abstract: In this paper, we adopt PID and the adaptive neural network based fuzzy inference method to control the inverted pendulum, combined the fuzzy control into the neural control. This method can improve the capability of the fuzzy controller through learning the data of PID controller to train the fuzzy controller. When the model parameters were changed, the adaptive neural network based fuzzy inference system had good adopt ability to anti-interfere. The car can go to the destine position exactly.
Key words: inverted pendulum; PID; neural network based fuzzy inference system; stable control; simulation
倒立擺是一種典型的高階、非線性、強(qiáng)耦合、多變量、不穩(wěn)定的裝置,但是它的結(jié)構(gòu)簡單、成本低、容易調(diào)試的特點(diǎn)使得它成為檢驗(yàn)各種控制策略、控制理論的理想平臺(tái)。
對(duì)倒立擺系統(tǒng)的學(xué)習(xí)研究具有廣泛、深遠(yuǎn)的現(xiàn)實(shí)和實(shí)踐意義,其控制效果可以有效衡量控制理論有效性,另外,一些抽象的控制概念也可以通過倒立擺來理解,例如穩(wěn)定性、魯棒性、能控能觀性等。倒立擺起初是用來進(jìn)行航空航天領(lǐng)域的原理應(yīng)用的,而后倒立擺系統(tǒng)便成為驗(yàn)證控制理論與策略的理想對(duì)象。由于倒立擺豎直穩(wěn)定的狀態(tài)與機(jī)器人直立行走的形態(tài)及其相似,倒立擺的平衡控制與火箭發(fā)射過程中的調(diào)姿極為相像,因此,倒立擺系統(tǒng)的控制原理也被用與雙足機(jī)器人直立行走及火箭穩(wěn)定發(fā)射與飛行方面。近年來,對(duì)多級(jí)倒立擺和各種復(fù)雜結(jié)構(gòu)的倒立擺進(jìn)行有效控制成為各個(gè)學(xué)科領(lǐng)域不斷研究、不斷創(chuàng)新的課題之一。把模糊邏輯系統(tǒng)與人工神經(jīng)網(wǎng)絡(luò)有機(jī)結(jié)合并運(yùn)用于倒立擺系統(tǒng)的控制中,成為一種實(shí)現(xiàn)倒立擺系統(tǒng)穩(wěn)定控制的有效方法。
1倒立擺模型的受力分析及數(shù)學(xué)模型的建立
倒立擺系統(tǒng)如圖1所示。
滑軌
圖1一級(jí)倒立擺控制原理
圖1中擺和小車參數(shù):l=0.5m, g=9.8m/s2,m=0.1kg,M=3kg。各參數(shù)含義如表1所示。倒立擺的受力分析如圖2所示。
(1)
對(duì)擺桿水平方向進(jìn)行受力分析并進(jìn)行整理化簡可以得到等式
N=mx?+mlθ?cosθ-mlθ?2sinθ(2)
將(2)式代入(1)式中,可以得到系統(tǒng)的第一個(gè)運(yùn)動(dòng)方程:
F=(M+m)x?+bx?+mlθ?cosθ-mlθ?2sinθ(3)
對(duì)擺桿垂直方向進(jìn)行受力分析并進(jìn)行整理化簡可以得到下式
P=mg-mlθ?sinθ-mlθ?2cosθ
(4)
力矩平衡方程如(5)式
-plsinθ-Nlcosθ=Iθ?
(5)
將P和N的等式代入(5)式中可得到系統(tǒng)的第二個(gè)運(yùn)動(dòng)方程
(I+ml2)θ?+mglsinθ=-mlx?cosθ(6)
假設(shè)?遠(yuǎn)小于1(單位弧度),即?
?è=0,cosθ=-1,sinθ=-φ(7)
將被控對(duì)象的輸入力F用u來表示后可以得到兩個(gè)線性化后的運(yùn)動(dòng)方程
(8)
經(jīng)拉氏變換并假設(shè)初始條件為零從而分析整理的倒立擺的數(shù)學(xué)模型如下:
帶入數(shù)據(jù)得到倒立擺的模型如下[3]:
2模糊神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)及學(xué)習(xí)算法
采用模糊神經(jīng)網(wǎng)絡(luò)控制,對(duì)于知識(shí)的表達(dá)并不是通過一條條顯式的規(guī)則,而只需通過高速并行分布計(jì)算即可產(chǎn)生輸出結(jié)果,利用神經(jīng)網(wǎng)絡(luò)來實(shí)現(xiàn)模糊推理、記憶并調(diào)整模糊規(guī)則。規(guī)則隱含地分布在整個(gè)網(wǎng)絡(luò)中,在實(shí)際控制應(yīng)用過程中,不必進(jìn)行復(fù)雜的規(guī)則搜索、推理。
2.1 ANFIS系統(tǒng)神經(jīng)模糊系統(tǒng)
本文采用自適應(yīng)模糊神經(jīng)推理系統(tǒng)ANFIS (Adaptive-Network-based Fuzzy Inference System)實(shí)現(xiàn)模糊神經(jīng)網(wǎng)絡(luò)的功能。假定一模糊推理系統(tǒng)輸入x和y,單輸出z,對(duì)于一階Sugeno糊模型,有兩條模糊規(guī)則:
1)if x isA1, y isB1,then f1=p1x1+q1x2+r1 2)if x isA2,y isB2,then f2=p2x1+q2x2+r2圖3表示了對(duì)應(yīng)的推理機(jī)制。圖3 ANFIS結(jié)構(gòu)原理圖
網(wǎng)絡(luò)共分5層:
第1層:計(jì)算輸入的模糊隸屬度
o1,i=gxi(x,ai,bi),i=1,2
o1,j=gy(j-2)(y,cj-2,dj-2),j=3,4(13)
第2層:計(jì)算規(guī)則適用度
o2,1=gxi(x,ai,bi)?gy1(y,c1,d1)
o2,2=gx2(x,a2,b2)?gy2(y,c2,d2)(14)
第3層:適用度歸一化
o3,1=
(16)第4層:計(jì)算每條規(guī)則的輸出
zi=pix+qiy+ri,i=1,2
(17)第5層:計(jì)算模糊系統(tǒng)輸出
z=wˉ1z1+wˉ2z2
(18)
網(wǎng)絡(luò)中包含待定的前件參數(shù),即隸屬度函數(shù)中的參數(shù)和后件參數(shù),通過某種算法訓(xùn)練ANFIS,可以按照指定的指標(biāo)得到這些參數(shù),從而可以達(dá)到模糊建模的目的。
3 PID控制器的原理及構(gòu)成
PID控制器是一種線性控制器,通過對(duì)誤差信號(hào)e(t)進(jìn)行比例、積分和微分的運(yùn)算,對(duì)各運(yùn)算結(jié)果進(jìn)行加權(quán)和便得到控制器的輸出u(t),u(t)就是所需控制量的大小。PID控制器的數(shù)學(xué)描述為:
u(t)=Kpé
?ê
(19)
式中u(t)為控制輸入,e(t)=r(t)-c(t)為誤差信號(hào),r(t)為輸入量,c(t)為輸出量。其控制輸出由三部分組成:
比例環(huán)節(jié)是依據(jù)偏差的大小來作用的,在系統(tǒng)中器穩(wěn)定被控量的作用,同時(shí)能加快系統(tǒng)的響應(yīng)速度。積分環(huán)節(jié)是根據(jù)偏差是否存在來動(dòng)作的,在系統(tǒng)中起到消除靜差的作用,能提高系統(tǒng)的無差度。積分作用的強(qiáng)弱取決于積分時(shí)間常數(shù)Ti的大小,Ti越大,積分作用越弱;Ti越小,積分作用越強(qiáng)。微分環(huán)節(jié)是根據(jù)偏差的變化來動(dòng)作的,在偏差信號(hào)發(fā)生較大的變化以前,提前引入一個(gè)早期的校正信號(hào),起到超前調(diào)節(jié)的作用,但是微分作用過強(qiáng),可能引起系統(tǒng)的振蕩。
4 PID控制器與模糊神經(jīng)控制器的設(shè)
通常的模糊控制器可以處理模糊信息,并能完成模糊推理,而模糊神經(jīng)控制器的學(xué)習(xí)則是一種能完成模糊推理的神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)。
模糊神經(jīng)網(wǎng)絡(luò)控制是利用離線訓(xùn)練的網(wǎng)絡(luò),通過在線計(jì)算即可得到最佳輸出,這種控制方式的反應(yīng)速度快,并且神經(jīng)網(wǎng)絡(luò)還具有自學(xué)習(xí)和聯(lián)想能力,而且對(duì)于未在訓(xùn)練中出現(xiàn)的樣本,也可以通過聯(lián)想記憶做出合理控制決策,表現(xiàn)非常靈活。具體操作方法:將控制系統(tǒng)的PID輸入、輸出數(shù)據(jù)用To workspace模塊進(jìn)行采集,然后用anfisedit命令打開ANFIS編輯器來進(jìn)行模糊神經(jīng)網(wǎng)絡(luò)控制器的訓(xùn)練,將訓(xùn)練生成的FIS文件導(dǎo)入普通模糊控制器即可得到模糊神經(jīng)網(wǎng)絡(luò)控制器,該控制器可以達(dá)到甚至超過PID控制器的控制精度。
在MATLAB中可通過anfis函數(shù)對(duì)ANFIS進(jìn)行訓(xùn)練,從而使模糊控制器的建立變得容易。模糊控制器的建立過程可分成如下6個(gè)步驟:
1)通過采集或其他方法產(chǎn)生訓(xùn)練所需數(shù)據(jù)和檢驗(yàn)所需數(shù)據(jù);
2)選定輸入變量的隸屬度函數(shù)類型及個(gè)數(shù);
3)由genfist函數(shù)產(chǎn)生初始的FIS結(jié)構(gòu);
4)設(shè)定ANFIS訓(xùn)練的步數(shù)及訓(xùn)練精度;
5)用antis函數(shù)訓(xùn)練ANFIS,從而生成FIS文件;
6)將得到的FIS文件嵌入到模糊控制器中并檢驗(yàn)其控制效果。
ANFIS界面及訓(xùn)練過程如圖4所示。
數(shù)據(jù)從workspace導(dǎo)入,每個(gè)輸入選取三個(gè)模糊語言變量,即大、中、小,采用高斯函數(shù)作為隸屬度函數(shù),訓(xùn)練精度設(shè)為0.0001,訓(xùn)練600次,達(dá)到精度為0.00022011。
5仿真過程及結(jié)果結(jié)果
利用Matlab中的Simulink建立PID控制的結(jié)構(gòu)圖如圖5所示。
PID1主要用來控制倒立擺系統(tǒng)小車的位移,當(dāng)單位階躍輸入時(shí),系統(tǒng)的輸出能夠迅速跟蹤階躍輸入,示波器x用來測試輸出波形,波形如圖7所示。
結(jié)構(gòu)圖中的限幅值選為2,-2;當(dāng)輸入大于2或小于-2時(shí),限幅環(huán)節(jié)飽和輸出起到限幅作用。
PID2主要是對(duì)倒立擺的偏角進(jìn)行控制,保證在小車運(yùn)動(dòng)或存在擾動(dòng)時(shí)始終保持?jǐn)[桿的偏角為零,從而使系統(tǒng)得以實(shí)現(xiàn)。示波器ang測試擺角輸出,輸出波形如圖8。
圖8擺桿擺角輸出波形
將PID控制器的三個(gè)輸入與一個(gè)輸出送到workspace,將得到的數(shù)據(jù)進(jìn)行訓(xùn)練得到模糊神經(jīng)網(wǎng)絡(luò)控制器,結(jié)構(gòu)圖如圖9所示。
用得到的模糊神經(jīng)網(wǎng)控制器替代PID控制器進(jìn)行仿真,由示波器x得到小車位移波形如圖10所示。
結(jié)構(gòu)圖中限幅值依然是2,-2,采用經(jīng)過訓(xùn)練的模糊神經(jīng)網(wǎng)絡(luò)控制器進(jìn)行控制,其余與PID控制部分相同;由示波器ang得到小車運(yùn)動(dòng)過程中擺桿擺角的波形,如圖11所示。
經(jīng)分析可得;PID控制器與模糊神經(jīng)網(wǎng)絡(luò)控制器都能對(duì)倒立擺系統(tǒng)進(jìn)行很好的控制,得出理想的輸出波形,由兩者的對(duì)比可知,PID控制器與模糊神經(jīng)網(wǎng)絡(luò)控制器對(duì)小車位移的控制效果相當(dāng),但模糊神經(jīng)網(wǎng)絡(luò)控制器對(duì)擺桿擺角的控制更加平緩,擺桿擺動(dòng)角度更小。
參考文獻(xiàn):
[1]楊世勇,劉殿通,譚翚.倒立擺與控制理論研究[J].自動(dòng)化技術(shù)與應(yīng)用. 2011, 30(5):1-3.
[2]王玉琢.基于模糊神經(jīng)網(wǎng)絡(luò)的倒立擺系統(tǒng)控制研究[D].哈爾濱:哈爾濱理工大學(xué),2010:17-21.
[關(guān)鍵詞]神經(jīng)網(wǎng)絡(luò);卷煙運(yùn)輸;短期預(yù)測
[DOI]1013939/jcnkizgsc201529087
1成品煙產(chǎn)運(yùn)系統(tǒng)的短期負(fù)荷預(yù)測
各煙草工業(yè)企業(yè)紛紛以物流為導(dǎo)向建立起協(xié)調(diào)生產(chǎn)、倉儲(chǔ)、配送各環(huán)節(jié)一體的綜合管控平臺(tái),以一定周期成品煙流動(dòng)量和波次,制定產(chǎn)量與儲(chǔ)量。隨著卷煙物流的不斷發(fā)展,對(duì)成品煙產(chǎn)量與成品煙配送的要求也日趨精益化,控制周期愈發(fā)縮短,如何在短時(shí)間內(nèi)提供有效的預(yù)測,制訂更貼切實(shí)際需求的產(chǎn)運(yùn)計(jì)劃,本文利用BP神經(jīng)網(wǎng)絡(luò)模型提供一種短期負(fù)荷預(yù)測方法,確保綜合管控平臺(tái)的合理運(yùn)營。
1.1產(chǎn)運(yùn)平臺(tái)短期負(fù)荷預(yù)測實(shí)施含義
產(chǎn)運(yùn)系統(tǒng)負(fù)荷預(yù)測是煙草工業(yè)企業(yè)產(chǎn)運(yùn)領(lǐng)域的系統(tǒng)調(diào)度、實(shí)時(shí)控制、運(yùn)行計(jì)劃和發(fā)展規(guī)劃的前提,是煙草工業(yè)企業(yè)物流調(diào)度部門、生產(chǎn)部門與規(guī)劃部門所必須具有的基本信息。準(zhǔn)確的負(fù)荷預(yù)測有助于提高煙草產(chǎn)運(yùn)系統(tǒng)的安全性和穩(wěn)定性,能夠減少倉儲(chǔ)成本。
短期負(fù)荷預(yù)測通常是指24小時(shí)的日負(fù)荷預(yù)測和168小時(shí)的周負(fù)荷預(yù)測,本文主要預(yù)測的是日平均負(fù)荷。對(duì)于短期負(fù)荷預(yù)測,有兩個(gè)基本要求:第一,精確。例如,準(zhǔn)確度要求預(yù)測某地區(qū)各品規(guī)配送相對(duì)誤差不超過3%;第二,短期負(fù)荷預(yù)測的目的是即時(shí)預(yù)測,而不是像中期負(fù)荷預(yù)測那樣,預(yù)測負(fù)荷的發(fā)展趨勢。負(fù)荷是即時(shí)變化的,因此,要求用以進(jìn)行短期負(fù)荷預(yù)測的模型能夠隨時(shí)適應(yīng)負(fù)荷的變化,所以理想的情況應(yīng)是進(jìn)行在線預(yù)測。所以時(shí)間要越短越好。
短期負(fù)荷預(yù)測一般是要考慮品規(guī)種類與品規(guī)數(shù)量因素影響的,實(shí)際上煙草品規(guī)因素和負(fù)荷的關(guān)系,是復(fù)雜的非線性關(guān)系,精確的考慮是非常困難的。為了解決這個(gè)問題可以將人工神經(jīng)網(wǎng)絡(luò)引入煙草產(chǎn)運(yùn)系統(tǒng)的負(fù)荷預(yù)測領(lǐng)域。人工神經(jīng)網(wǎng)絡(luò),通過多個(gè)神經(jīng)元的相互連接,使其輸入和輸出構(gòu)成一個(gè)復(fù)雜的非線性處理系統(tǒng),用于日負(fù)荷預(yù)測,同樣利用其可以記憶復(fù)雜的非線性輸入輸出映射關(guān)系的特性,而這種特性正是一些傳統(tǒng)的負(fù)荷預(yù)測方法難以實(shí)現(xiàn)的。
1.2BP神經(jīng)網(wǎng)絡(luò)算法在產(chǎn)運(yùn)平臺(tái)短期負(fù)荷預(yù)測應(yīng)用分析
神經(jīng)網(wǎng)絡(luò)在目前已有幾十種不同的模型。在人們提出的幾十種神經(jīng)網(wǎng)絡(luò)模型中,人們較多用的是Hopfield網(wǎng)絡(luò)、BP網(wǎng)絡(luò)、Kohonen網(wǎng)絡(luò)和ART(自適應(yīng)共振理論)網(wǎng)絡(luò)。其中BP網(wǎng)絡(luò)是反向傳播(Back Propagation)網(wǎng)絡(luò)。它是一種多層前向網(wǎng)絡(luò),采用最小均方差方式。這是一種最廣泛應(yīng)用的網(wǎng)絡(luò)。
BP算法是用于前饋多層網(wǎng)絡(luò)的學(xué)習(xí)算法,前饋多層網(wǎng)絡(luò)含有輸入層、輸出層以及處于輸入輸出層之間的中間層。中間層有單層或多層,由于它們和外界沒有直接的聯(lián)系,故也稱為隱層。在隱層中的神經(jīng)元也稱隱層單元。隱層雖然和外界不連接但是,它們的狀態(tài)則影響輸入輸出之間的關(guān)系。這也是說,改變隱層的權(quán)系數(shù),可以改變整個(gè)多層神經(jīng)網(wǎng)絡(luò)的性能。
BP網(wǎng)絡(luò)也存在著問題。第一,BP算法的學(xué)習(xí)速度很慢。其原因主要有三點(diǎn):一是由于BP算法本質(zhì)上為梯度下降法,而它所要優(yōu)化的目標(biāo)函數(shù)又非常復(fù)雜,因此,必然會(huì)出現(xiàn)“鋸齒形現(xiàn)象”,這使得BP算法低效;二是存在麻痹現(xiàn)象,由于優(yōu)化的目標(biāo)函數(shù)很復(fù)雜,它必然會(huì)在神經(jīng)元輸出接近0或1的情況下,出現(xiàn)一些平坦區(qū),在這些區(qū)域內(nèi),權(quán)值誤差改變很小,使訓(xùn)練過程幾乎停頓;三是為了使網(wǎng)絡(luò)執(zhí)行BP算法,不能用傳統(tǒng)的一維搜索法求每次迭代的步長,而必須把步長的更新規(guī)則預(yù)先賦予網(wǎng)絡(luò),這種方法將引起算法低效。第二,網(wǎng)絡(luò)訓(xùn)練失敗的可能性較大。其原因有四點(diǎn):一是從數(shù)學(xué)角度看,BP算法為一種局部搜索的優(yōu)化方法,但它要解決的問題為求解復(fù)雜非線性函數(shù)的全局極值,因此,算法很有可能陷入局部極值,使訓(xùn)練失??;二是網(wǎng)絡(luò)的逼近、推廣能力同學(xué)習(xí)樣本的典型性密切相關(guān),而從問題中選取典型樣本實(shí)例組成訓(xùn)練集是一個(gè)很困難的問題。三是難以解決應(yīng)用問題的實(shí)例規(guī)模和網(wǎng)絡(luò)規(guī)模間的矛盾。這涉及網(wǎng)絡(luò)容量的可能性與可行性的關(guān)系問題,即學(xué)習(xí)復(fù)雜性問題;四是網(wǎng)絡(luò)結(jié)構(gòu)的選擇尚無一種統(tǒng)一而完整的理論指導(dǎo),一般只能由經(jīng)驗(yàn)選定。為此,有人稱神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)選擇為一種藝術(shù)。而網(wǎng)絡(luò)的結(jié)構(gòu)直接影響網(wǎng)絡(luò)的逼近能力及推廣性質(zhì)。
2BP神經(jīng)網(wǎng)絡(luò)綜合改進(jìn)
確定連接權(quán)修正值的計(jì)算過程,實(shí)際上是優(yōu)化計(jì)算的梯度下降法。當(dāng)能量公式對(duì)應(yīng)的誤差曲面為窄長型時(shí),這種算法在谷的兩壁跳來跳去,影響了網(wǎng)絡(luò)的收斂速度,對(duì)算法最普通的改進(jìn)方法是增加附加動(dòng)量項(xiàng)。利用附加動(dòng)量項(xiàng)可以起到平滑梯度方向的劇烈變化,增加算法的穩(wěn)定性。在具體計(jì)算中,學(xué)習(xí)率η越大,學(xué)習(xí)速度會(huì)越快,但過大時(shí)會(huì)引起震蕩效應(yīng);而動(dòng)量因子α取得過大可能導(dǎo)致發(fā)散,過小則收斂速度過慢。
并為了解決BP易于陷于極小值現(xiàn)象,用人工遺傳算法來優(yōu)化BP網(wǎng)絡(luò)的初始權(quán)值。遺傳算法是根據(jù)生物進(jìn)化思想而啟發(fā)得出的一種全局優(yōu)化算法,在本質(zhì)上是一種不依賴具體問題的直接搜索方法,它僅需給出目標(biāo)函數(shù)的描述,從一組隨機(jī)產(chǎn)生的稱為“種群(population)”的初始解開始,從全局空間出發(fā)搜索問題的最優(yōu)解。由于遺傳算法善于全局搜索,且能以較大的概率找到全局最優(yōu)解,故用它來完成前期搜索能較好的克服BP算法的局部極小的缺陷。將GA和BP結(jié)合起來,形成GA―BP混合訓(xùn)練算法,以GA優(yōu)化BP網(wǎng)絡(luò)的初始權(quán)值和閾值,再由BP算法按負(fù)梯度方向修正網(wǎng)絡(luò)權(quán)值及閾值,進(jìn)行網(wǎng)絡(luò)訓(xùn)練。這種方法避免了BP網(wǎng)絡(luò)易陷入局部極小問題,達(dá)到優(yōu)化網(wǎng)絡(luò)目的,更精確的實(shí)現(xiàn)產(chǎn)量與運(yùn)輸量的預(yù)測。
3云南中煙省外前置庫短期負(fù)荷預(yù)測優(yōu)化仿真
云南中煙物流綜合管控平臺(tái)是云南中煙物流管理部提出了建立資源整合、集中調(diào)度、協(xié)同運(yùn)作的物流保障體系的工作思路的體現(xiàn)。搭建云南中煙統(tǒng)一的物流綜合管控平臺(tái)框架,以成品物流為重點(diǎn),同時(shí)考慮原料、半成品、煙用物資的物流管理需求,建立以基礎(chǔ)層、調(diào)度作業(yè)層、監(jiān)控管理層為三層架構(gòu)的綜合管控平臺(tái),實(shí)現(xiàn)云南中煙與紅塔集團(tuán)、紅云紅河集團(tuán)統(tǒng)一使用的信息系統(tǒng)。
為了協(xié)同成品物流運(yùn)作,快速響應(yīng)市場要求與行業(yè)和公司系統(tǒng)無縫集成,建立支持新的行業(yè)供貨模式、企業(yè)職責(zé)轉(zhuǎn)變、客戶訂單集成、工商協(xié)同的新型物流保障體系,快速響應(yīng)市場要求。建立以訂單計(jì)劃為核心的物流模式,此模式可根據(jù)需要生成訂單的運(yùn)輸計(jì)劃和倉儲(chǔ)作業(yè)計(jì)劃等,在橫向?qū)崿F(xiàn)儲(chǔ)運(yùn)協(xié)同作業(yè),在縱向?qū)崿F(xiàn)統(tǒng)一調(diào)度和聯(lián)合倉儲(chǔ)。通過整合資源,集中運(yùn)輸調(diào)度業(yè)務(wù),平臺(tái)集成所有相關(guān)物流資源,實(shí)現(xiàn)各物流業(yè)務(wù)操作,滿足云南中煙,紅塔集團(tuán)與紅云紅河集團(tuán)現(xiàn)行管理模式和流程的統(tǒng)一運(yùn)輸調(diào)度,并支持模式統(tǒng)一時(shí)靈活配置,滿足快速實(shí)現(xiàn)業(yè)務(wù)調(diào)整。
實(shí)現(xiàn)提供智能化,作業(yè)參考,逐步實(shí)現(xiàn)成品調(diào)度自動(dòng)根據(jù)業(yè)務(wù)邏輯規(guī)則和分配計(jì)算原則,建立規(guī)則優(yōu)化引擎,逐步實(shí)現(xiàn)計(jì)劃排程和費(fèi)用核算的自動(dòng)化和智能化操作。
3.1問題描述
根據(jù)云南中煙2014年數(shù)據(jù)計(jì)算負(fù)荷情況,在原始數(shù)據(jù)共測量了105天,每天測量40點(diǎn)負(fù)荷品規(guī)數(shù)據(jù)。依據(jù)負(fù)荷的歷史統(tǒng)計(jì)數(shù)據(jù),基于BP神經(jīng)網(wǎng)絡(luò)算法來對(duì)2015年4月16日的負(fù)荷進(jìn)行預(yù)測。
在對(duì)短期負(fù)荷進(jìn)行預(yù)報(bào)前,一個(gè)特別重要的問題是如何劃分負(fù)荷類型或日期類型??v觀已經(jīng)發(fā)表的文獻(xiàn)資料,大體有兩種劃分模式。一是將40余種品規(guī)按照運(yùn)輸?shù)攸c(diǎn)分為省外三個(gè)前置庫(沈陽、晉中、南昌);二是將40余種品規(guī)按照生產(chǎn)地方式劃分;共有7種類型。
本文采用第1種負(fù)荷劃分模式,將40余種品規(guī)按照運(yùn)輸?shù)攸c(diǎn)分為省外三個(gè)前置庫。根據(jù)分類后的負(fù)荷情況,用歷史數(shù)據(jù)分別對(duì)所建BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行省外三個(gè)前置庫的訓(xùn)練,訓(xùn)練完成后用以預(yù)測以后的工作日和休息日的負(fù)荷情況,并將預(yù)測結(jié)果與實(shí)際結(jié)果進(jìn)行對(duì)比分析。此外考慮到這105天歷史數(shù)據(jù)前面部分是春節(jié)期間測到的數(shù)據(jù),而我們預(yù)測的日期遠(yuǎn)離春節(jié),為了減小節(jié)假日對(duì)負(fù)荷預(yù)測的影響,在選取訓(xùn)練樣本時(shí)只取后面若干天的負(fù)荷作為樣本。
3.2輸入/輸出向量設(shè)計(jì)
由于負(fù)荷值曲線相鄰的點(diǎn)之間不會(huì)發(fā)生突變,因此后一時(shí)刻的值必然和前一時(shí)刻的值有關(guān),除非出現(xiàn)重大事故等特殊情況。所以這里將預(yù)測日的前一天的實(shí)時(shí)負(fù)荷數(shù)據(jù)作為網(wǎng)絡(luò)的樣本數(shù)據(jù)。由于每天測量了40品規(guī),所以輸入變量就是一個(gè)40維的向量。顯而易見,目標(biāo)向量就是預(yù)測日當(dāng)天的40個(gè)負(fù)荷值,這樣一來,輸出變量也是一個(gè)40維的向量。
在用樣本對(duì)BP網(wǎng)絡(luò)進(jìn)行訓(xùn)練之前,需要對(duì)輸入樣本數(shù)據(jù)進(jìn)行歸一化處理,將數(shù)據(jù)處理為區(qū)間[0,1]之間的數(shù)據(jù)。之所以輸入數(shù)據(jù)需要?dú)w一化,一是考慮到量綱問題,我們需要平等看待輸入向量的每一個(gè)元素;此外數(shù)據(jù)歸一化之后可以有效降低計(jì)算復(fù)雜度,加快算法的收斂。
歸一化方法有許多種形式,這里采用如下公式:
x[DD(]∧[DD)]=[SX(]x-xmin[]xmax-xmin[SX)]
在樣本中,輸入向量為預(yù)測日前天的發(fā)出品規(guī)實(shí)際負(fù)荷數(shù)據(jù),目標(biāo)向量是預(yù)測日當(dāng)天的發(fā)出品規(guī)負(fù)荷。由于這都是實(shí)際的測量值,因此,這些數(shù)據(jù)可以對(duì)網(wǎng)絡(luò)進(jìn)行有效的訓(xùn)練。如果從提高網(wǎng)絡(luò)精度的角度出發(fā),一方面可以增加網(wǎng)絡(luò)訓(xùn)練樣本的數(shù)目,另一方面還可以增加輸入向量的維數(shù)。即,或者增加每日的測量點(diǎn),或者把預(yù)測日前幾天的負(fù)荷數(shù)據(jù)作為輸入向量。目前,訓(xùn)練樣本數(shù)目的確定沒有通用的方法,一般認(rèn)為樣本過少可能使得網(wǎng)絡(luò)的表達(dá)不夠充分,從而導(dǎo)致網(wǎng)絡(luò)外推能力不夠;而樣本過多可能會(huì)出現(xiàn)樣本冗長現(xiàn)象,既增加了網(wǎng)絡(luò)的訓(xùn)練負(fù)擔(dān),也可能出現(xiàn)信息量過剩使得網(wǎng)絡(luò)出現(xiàn)過擬合現(xiàn)象。
3.3BP網(wǎng)絡(luò)的優(yōu)化設(shè)計(jì)
本文采用BP優(yōu)化網(wǎng)絡(luò)對(duì)負(fù)荷值進(jìn)行預(yù)報(bào)。如圖1所示,為預(yù)測負(fù)荷的BP優(yōu)化網(wǎng)絡(luò)。
根據(jù)BP網(wǎng)絡(luò)來設(shè)計(jì)優(yōu)化網(wǎng)絡(luò),一般的預(yù)測問題都可以通過單隱層的BP網(wǎng)絡(luò)實(shí)現(xiàn)。由于輸入向量有40個(gè)元素,所以網(wǎng)絡(luò)輸入層的神經(jīng)元有40個(gè),經(jīng)過多次訓(xùn)練網(wǎng)絡(luò)中間層的神經(jīng)元可以取13個(gè)。而輸出向量有40個(gè),所以輸出層中的神經(jīng)元應(yīng)該有40個(gè)。網(wǎng)絡(luò)隱含層的神經(jīng)元激勵(lì)函數(shù)采用S型正切函數(shù)tansig,輸出層神經(jīng)元激勵(lì)函數(shù)采用S型對(duì)數(shù)函數(shù)logsig。這是因?yàn)楹瘮?shù)的輸出位于區(qū)間[0,1]中,正好滿足網(wǎng)絡(luò)輸出的要求。
3.4網(wǎng)絡(luò)訓(xùn)練參數(shù)
網(wǎng)絡(luò)經(jīng)過訓(xùn)練后才可以用于產(chǎn)運(yùn)網(wǎng)絡(luò)負(fù)荷預(yù)測的實(shí)際應(yīng)用。考慮到網(wǎng)絡(luò)的結(jié)構(gòu)比較復(fù)雜,神經(jīng)元個(gè)數(shù)比較多,需要適當(dāng)增大訓(xùn)練次數(shù)和學(xué)習(xí)速率。訓(xùn)練參數(shù)的設(shè)定如下表所示。
訓(xùn)練參數(shù)表
最大訓(xùn)練次數(shù)[]訓(xùn)練誤差目標(biāo)[]學(xué)習(xí)速率[]省外三個(gè)前置庫樣本數(shù)[]省外其他
1000[]001[]01[]最近30個(gè)[]最近8個(gè)
3.5仿真結(jié)果
按照表1設(shè)定的參數(shù)得到省外三個(gè)前置庫、的訓(xùn)練收斂曲線分別如圖2、圖3所示??梢娊?jīng)過數(shù)次訓(xùn)練后,網(wǎng)絡(luò)目標(biāo)誤差就能達(dá)到要求,其中省外三個(gè)前置庫訓(xùn)練到目標(biāo)誤差需要16次訓(xùn)練,省外其他的9次訓(xùn)練。
利用訓(xùn)練好后的BP網(wǎng)絡(luò)進(jìn)行預(yù)測,得到工作日和休息日的預(yù)測誤差曲線、預(yù)測日實(shí)際負(fù)荷曲線與預(yù)測負(fù)荷曲線分別如圖4、圖5所示。且工作日與休息日的平均絕對(duì)百分誤差結(jié)果為:err=2.6025(省外三個(gè)前置庫);err1=52174(省外)。由此可見,采用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測效果良好。對(duì)比圖4、圖5發(fā)現(xiàn)對(duì)休息日的預(yù)測波動(dòng)較大,這可能跟訓(xùn)練樣本數(shù)目不同有關(guān)系。仿真中用于訓(xùn)練工作日神經(jīng)網(wǎng)絡(luò)的樣本數(shù)為30個(gè),而用于訓(xùn)練休息日的樣本僅僅為8個(gè)。為了驗(yàn)證網(wǎng)絡(luò)設(shè)計(jì)中一些參數(shù)對(duì)結(jié)果的影響,改變中間層神經(jīng)元的個(gè)數(shù)進(jìn)行對(duì)比。
在建立神經(jīng)網(wǎng)絡(luò)時(shí),中間層神經(jīng)元的個(gè)數(shù)的確定沒有特別的說明,數(shù)量越多可能會(huì)給預(yù)測精度帶來好處,但會(huì)增加計(jì)算的復(fù)雜度,降低系統(tǒng)的穩(wěn)定性甚至使得算法發(fā)散。經(jīng)驗(yàn)上講如果神經(jīng)網(wǎng)絡(luò)輸入向量的維數(shù)是M,輸出向量的維數(shù)是N個(gè),那么中間層神經(jīng)元的個(gè)數(shù)為sqrt(M+N)+L(L為6到10的常數(shù))。為了研究中間層神經(jīng)元個(gè)數(shù)對(duì)仿真結(jié)果的影響,減少中間層神經(jīng)元個(gè)數(shù)到25個(gè)。仿真收斂曲線如圖6、圖7所示,誤差及預(yù)測曲線如圖8、圖9所示。工作日與休息日的平均絕對(duì)百分誤差結(jié)果為:err=2.5(省外三個(gè)前置庫);err1=2.97(省外其他)。對(duì)比之前可以看出,適當(dāng)調(diào)節(jié)中間層神經(jīng)元個(gè)數(shù)可以加快算法收斂的速度,改善預(yù)測準(zhǔn)確度。
3.6結(jié)果分析
通過綜合使用神經(jīng)網(wǎng)絡(luò)的仿真結(jié)果顯示,省外三個(gè)前置庫(沈陽、晉中、南昌)在物流網(wǎng)絡(luò)下其收斂性、預(yù)報(bào)誤差及預(yù)測曲線均高于其他同類庫房,顯示出較好的抗壓和負(fù)荷周轉(zhuǎn)能力。
4結(jié)語
關(guān)于成品煙品規(guī)的負(fù)荷預(yù)測是產(chǎn)運(yùn)平臺(tái)重要工作,國內(nèi)外關(guān)于短期負(fù)荷預(yù)測的文獻(xiàn)很多,但是由于品規(guī)受訂量等諸多因素的影響和產(chǎn)量本身的不確定性,使得迄今還沒有一種十分滿意的方法。由仿真結(jié)果知,本文介紹的基于BP優(yōu)化神經(jīng)網(wǎng)絡(luò)的預(yù)測方法,再經(jīng)過一定次數(shù)的訓(xùn)練便能取得較好的負(fù)荷預(yù)測效果。
參考文獻(xiàn):
[1]Senjyu TH,Takara K,F(xiàn)unabashi TOne-hour-ahead Load Forecasting Using Neural Network[J].IEEE Trans Power System,2002,17(1)
摘要:財(cái)務(wù)危機(jī)的出現(xiàn)意味著企業(yè)基本面發(fā)生根本性變化,處理不當(dāng)就會(huì)導(dǎo)致企業(yè)破產(chǎn)。因此,識(shí)別企業(yè)財(cái)務(wù)危機(jī),并對(duì)其做出預(yù)警,不僅對(duì)企業(yè)經(jīng)營者及時(shí)采取措施化解危機(jī)具有重大的意義,而且對(duì)于投資者規(guī)避風(fēng)險(xiǎn)也有非常重要的價(jià)值。
關(guān)鍵詞:財(cái)務(wù)危機(jī);預(yù)警;指標(biāo)體系
一、引言
“財(cái)務(wù)危機(jī)”又稱財(cái)務(wù)困境,最嚴(yán)重的財(cái)務(wù)危機(jī)是企業(yè)破產(chǎn)。企業(yè)因財(cái)務(wù)危機(jī)最終導(dǎo)致破產(chǎn)實(shí)際上是一種違約行為,所以財(cái)務(wù)危機(jī)又可稱為“違約風(fēng)險(xiǎn)”。
關(guān)于財(cái)務(wù)危機(jī)的定義,目前尚無一個(gè)統(tǒng)一的說法。具有代表性的觀點(diǎn)有以下幾種:(1)Beaver(1966)將破產(chǎn)、拖欠優(yōu)先股股利、拖欠債務(wù)界定為財(cái)務(wù)危機(jī)。(2)Altman(1968)定義的財(cái)務(wù)危機(jī)是進(jìn)入法定破產(chǎn)、被接管或者重整的企業(yè)。(3)Deakin(1972)則認(rèn)為財(cái)務(wù)危機(jī)公司僅包括已經(jīng)經(jīng)歷破產(chǎn)、無力償債或?yàn)閭鶛?quán)人利益而已經(jīng)進(jìn)行清算的公司。(4)Carmichael(1972)認(rèn)為財(cái)務(wù)危機(jī)是企業(yè)履行義務(wù)時(shí)受阻,具體表現(xiàn)為流動(dòng)性不足、權(quán)益不足、債務(wù)拖欠及資金不足四種形式。(5)Wruck(1990)給出的財(cái)務(wù)危機(jī)的定義是企業(yè)現(xiàn)金流量不足以抵償現(xiàn)有債務(wù)的情況,這些債務(wù)包括應(yīng)付未付款、訴訟費(fèi)用、違約的利息和本金等。(6)Ross等人(1999;2000)則認(rèn)為可從四個(gè)方面定義企業(yè)的財(cái)務(wù)危機(jī):一是企業(yè)失敗,即企業(yè)清算后仍無力支付債權(quán)人的債務(wù);二是法定破產(chǎn),即企業(yè)和債權(quán)人向法院申請(qǐng)企業(yè)破產(chǎn);三是技術(shù)破產(chǎn),即企業(yè)無法按期履行債務(wù)合約付息還本;四是會(huì)計(jì)破產(chǎn),即企業(yè)的賬面凈資產(chǎn)出現(xiàn)負(fù)數(shù),資不抵債。(7)Lee(2004)認(rèn)為可以從兩方面定義財(cái)務(wù)危機(jī):一是未能償還到期借款的本息,借款期間有過延期還款和減少本息支付的協(xié)議;二是公司的凈資產(chǎn)減少到其股本的一半以下。
綜合上述各種定義可知,無論財(cái)務(wù)危機(jī)如何定義,企業(yè)發(fā)生財(cái)務(wù)危機(jī)都具有無力償還到期債務(wù)、現(xiàn)金流的緊張狀態(tài)可能使經(jīng)營無法持續(xù)的特點(diǎn)。財(cái)務(wù)危機(jī)的出現(xiàn)意味著企業(yè)基本面發(fā)生根本性變化,處理不當(dāng)就會(huì)導(dǎo)致企業(yè)破產(chǎn)。因此,識(shí)別企業(yè)財(cái)務(wù)危機(jī),并對(duì)其做出預(yù)警,不僅對(duì)企業(yè)經(jīng)營者及時(shí)采取措施化解危機(jī)具有重大的意義,而且對(duì)于投資者規(guī)避風(fēng)險(xiǎn)也有非常重要的價(jià)值。
二、文獻(xiàn)綜述
企業(yè)財(cái)務(wù)危機(jī)預(yù)警問題的研究很早就引起了各方面的關(guān)注,很多經(jīng)濟(jì)學(xué)家與財(cái)務(wù)專家都在這方面做了大量的工作,他們利用相應(yīng)的財(cái)務(wù)變量構(gòu)造了一系列的預(yù)測模型,其中有代表性的研究成果可歸納為四類。
(一)單變量模型
單變量模型是運(yùn)用單一變數(shù)、個(gè)別財(cái)務(wù)比率來預(yù)測財(cái)務(wù)危機(jī)的模型。最早的財(cái)務(wù)預(yù)警研究是Fitzpatrick(1932)的單變量破產(chǎn)預(yù)測研究。此后,WilliamBeaver(1966)使用單變量為分析方法,采用成對(duì)抽樣法進(jìn)行樣本配對(duì),考察了29個(gè)財(cái)務(wù)比率在企業(yè)陷入財(cái)務(wù)困境前1-5年的預(yù)測能力。Beaver發(fā)現(xiàn)在破產(chǎn)前一年的預(yù)測正確率可以達(dá)到87%,對(duì)于失敗企業(yè)是最具有預(yù)測能力的指標(biāo)。國內(nèi)學(xué)者對(duì)單變量模型也作了較深入的研究,包括陳靜(1999)以1998年的27家ST公司和27家非ST公司,使用1995-1997年的財(cái)務(wù)報(bào)表數(shù)據(jù),進(jìn)行了單變量分析。吳世農(nóng)和盧賢義(2001)以70家ST公司和70家非ST公司,應(yīng)用單變量分析法研究了在上市公司陷入財(cái)務(wù)危機(jī)前5年21個(gè)財(cái)務(wù)指標(biāo)之間所存在的差異。
單變量模型的優(yōu)點(diǎn)是只需要觀測一個(gè)變量,應(yīng)用比較簡單;但是,任何一個(gè)財(cái)務(wù)比率無法充分和全面地反映企業(yè)的財(cái)務(wù)特征,所以該方法在現(xiàn)今的研究中很少被單獨(dú)使用,一般都是與其他方法結(jié)合運(yùn)用。
(二)多變量分析模型
多變量分析模型又可以分為多元回歸分析模型和多元判別分析模型。EdwardAltman(1968)使用多變量分析法對(duì)企業(yè)財(cái)務(wù)危機(jī)進(jìn)行研究。他以1946-1965年間33家破產(chǎn)的制造業(yè)企業(yè)為樣本,并配對(duì)33家正常企業(yè),將22項(xiàng)財(cái)務(wù)比率分為流動(dòng)性、獲利性、財(cái)務(wù)杠桿、償債能力和活動(dòng)力五大類指數(shù),利用多變量分析法建立了著名的Z-Score記分模型。Meyer和Pifer(1970)以1948-1965年間失敗的30家銀行與其相匹配的30家非失敗銀行為樣本,利用二元回歸分析法建立模型,并且用9對(duì)相匹配銀行組成的預(yù)測樣本對(duì)模型進(jìn)行了驗(yàn)證。此外,還有其他典型的判別分析模型,包括:Deakin模型、Blum模型、Casey模型和Taffler模型等等。國內(nèi)的相關(guān)研究主要有陳靜(1999)使用1995-1997年的財(cái)務(wù)數(shù)據(jù),對(duì)27家ST公司和27家非ST公司進(jìn)行的多元判別分析。張玲(2000)以120家公司為研究對(duì)象,使用其中60家公司的財(cái)務(wù)數(shù)據(jù),通過多元判別法建立了財(cái)務(wù)危機(jī)預(yù)警模型。盧守林等(2002)以滬深兩市A股市場上所有上市公司1998-2000年的財(cái)務(wù)資料為依據(jù),用多元判別分析法構(gòu)建的Z-Score模型。
多變量分析法彌補(bǔ)了單變量分析法的不足,具有較高的準(zhǔn)確率和穩(wěn)定性,但是也存在著一些不足:第一,這種方法受到了統(tǒng)計(jì)假設(shè)的限制,只適用于自變量近似服從正態(tài)分布的情況,并且要求組內(nèi)的協(xié)方差矩陣相等,否則得到的預(yù)測結(jié)果可能是有偏的;第二,多元判別分析要求財(cái)務(wù)危機(jī)公司與正常公司之間一定要配對(duì),而配對(duì)的標(biāo)準(zhǔn)具有較大的主觀性。
(三)多元條件概率模型
多元條件概率模型是使用極大似然法對(duì)參數(shù)進(jìn)行估計(jì)的一類概率模型,包括Logistic模型和Probit模型。Martin(1977)首次使用Logit模型預(yù)測公司的破產(chǎn)及違約概率。Ohlson(1980)從1970-1976年間在美國的上市公司之中排除公共事業(yè)、運(yùn)輸公司、金融服務(wù)業(yè),總共挑選出105家破產(chǎn)公司和2058家正常公司為樣本,采用九個(gè)財(cái)務(wù)比率建立了Logit模型。Huffman&Ward(1996)運(yùn)用Logit模型對(duì)1977-1991年間違約的171家企業(yè)的高收益?zhèn)M(jìn)行了預(yù)測研究等。國內(nèi)的相關(guān)研究主要包括:吳世農(nóng)和盧賢義(2001)分別采用多元判別分析和Logit回歸方法建立和估計(jì)了預(yù)警模型。劉旻(2001)使用1999年28家ST公司與另外28家正常公司陷入財(cái)務(wù)危機(jī)前3年的數(shù)據(jù),通過Logit回歸方法建立了財(cái)務(wù)危機(jī)預(yù)警模型。姜秀華(2002)和齊治平(2002)利用Logit模型對(duì)我國上市公司進(jìn)行信用風(fēng)險(xiǎn)分析。李萌(2005)以不良貸款率作為信用風(fēng)險(xiǎn)衡量標(biāo)準(zhǔn),構(gòu)造商業(yè)銀行信用風(fēng)險(xiǎn)評(píng)估的Logit模型等。
多元條件概率模型的主要優(yōu)點(diǎn)是不需要自變量服從多元正態(tài)分布和組內(nèi)協(xié)方差矩陣相等的假設(shè)條件,但是要求因變量有邏輯含義,而且計(jì)算過程較為復(fù)雜,有很多近似處理。
(四)神經(jīng)網(wǎng)絡(luò)預(yù)警模型
神經(jīng)網(wǎng)絡(luò),又稱人工神經(jīng)網(wǎng)絡(luò)(ArtificialNeuralNetwork,ANN)是一種從神經(jīng)心理學(xué)和認(rèn)識(shí)科學(xué)的研究成果出發(fā),應(yīng)用數(shù)學(xué)方法發(fā)展起來的并行分布模式處理系統(tǒng)。常見的神經(jīng)網(wǎng)絡(luò)模型主要有:BP神經(jīng)網(wǎng)絡(luò)模型、MDA協(xié)助神經(jīng)網(wǎng)絡(luò)模型、ID3協(xié)助神經(jīng)網(wǎng)絡(luò)模型和SOFM協(xié)助神經(jīng)網(wǎng)絡(luò)模型。Odom和Sharda(1990)是將人工神經(jīng)網(wǎng)絡(luò)模型應(yīng)用在破產(chǎn)預(yù)測模式中最具代表性的學(xué)者。Koh和Tan(1999)以1978-1985年間出現(xiàn)的165家破產(chǎn)公司為失敗樣本并以正常公司165家作為配對(duì)樣本,使用人工神經(jīng)網(wǎng)絡(luò)模型構(gòu)建了企業(yè)危機(jī)預(yù)警模型。在我國,王春峰(1998)、楊保安(2001)等學(xué)者也在此領(lǐng)域進(jìn)行了深入的研究,楊保安通過對(duì)中信實(shí)業(yè)銀行的分析,選取了4大類共15個(gè)財(cái)務(wù)指標(biāo),運(yùn)用BP神經(jīng)網(wǎng)絡(luò)方法建立了一個(gè)可供銀行用于授權(quán)評(píng)價(jià)的預(yù)警系統(tǒng)。臺(tái)灣的林文修(2000)選取1992-1996年在臺(tái)灣證交所上市企業(yè)中的36家失敗企業(yè)和64家正常企業(yè),并區(qū)分為學(xué)習(xí)樣本73家與測試樣本27家,比較了多元判別分析、Logit模型、BP神經(jīng)網(wǎng)絡(luò)模型和演化式神經(jīng)網(wǎng)絡(luò)模型等四種方法的模型預(yù)測準(zhǔn)確率。神經(jīng)網(wǎng)絡(luò)預(yù)警模型的主要優(yōu)點(diǎn)是分析層次清晰且邏輯關(guān)系嚴(yán)密,并依據(jù)心理學(xué)理論加入了一主觀因素,從而有效地使客觀分析與主觀判斷相融合。它的缺點(diǎn)是規(guī)范分析特點(diǎn)明顯,不適宜做實(shí)證分析,分析模式缺乏靈活性,數(shù)據(jù)性假設(shè)條件過于苛刻。
三、財(cái)務(wù)危機(jī)預(yù)警的指標(biāo)體系設(shè)計(jì)
導(dǎo)致企業(yè)發(fā)生財(cái)務(wù)危機(jī)的因素很多,且錯(cuò)綜復(fù)雜,單變量模型與多變量模型僅能揭示影響關(guān)系與程度,變量的選擇會(huì)因分析人員偏好的不同而不同,其不僅缺乏統(tǒng)一的理論基礎(chǔ),而且系統(tǒng)性往往較差,多元條件概率模型和神經(jīng)網(wǎng)絡(luò)預(yù)警模型雖然在分析技術(shù)上較為先進(jìn),且分析企圖試圖更精確,但它們?cè)趶?qiáng)調(diào)分析技術(shù)的同時(shí),往往忽略了立論的基本依據(jù),且在變量選擇中往往伴隨較明顯的盲目性。因此,作為完善多變量模型系統(tǒng),為多元條件概率模型和神經(jīng)網(wǎng)絡(luò)預(yù)警模型提供變量選擇的依據(jù),利用相應(yīng)的財(cái)務(wù)理論構(gòu)建企業(yè)財(cái)務(wù)危機(jī)預(yù)警指標(biāo)體系就是研究企業(yè)財(cái)務(wù)危機(jī)的基礎(chǔ)之基礎(chǔ)。但從財(cái)務(wù)本身的角度去分析,財(cái)務(wù)危機(jī)形成的原因可以歸結(jié)為以下幾點(diǎn):(1)公司經(jīng)營狀況不佳,導(dǎo)致營業(yè)收入無法穩(wěn)定增長,造成公司的連續(xù)虧損,使得財(cái)務(wù)危機(jī)發(fā)生的可能性增大;(2)過高的負(fù)債使公司面臨更大的財(cái)務(wù)危機(jī)。雖然公司本身有盈余,但是可能因?yàn)闊o法應(yīng)付短期的龐大利息支出而造成破產(chǎn)倒閉;(3)現(xiàn)金流量發(fā)生持續(xù)性的凈流出,企業(yè)就像是流動(dòng)性資產(chǎn)的儲(chǔ)水槽,若水槽中的流量變小(資產(chǎn)變少),流入量減少(現(xiàn)金流入減少),流出量增加(現(xiàn)金流出增加),流入量與流出量之間的差量就會(huì)逐步增大,這樣會(huì)使公司出現(xiàn)財(cái)務(wù)危機(jī)的概率增加。
綜合引起財(cái)務(wù)危機(jī)的三個(gè)主要因素,可以對(duì)應(yīng)用五個(gè)方面的財(cái)務(wù)指標(biāo)來描述或預(yù)警財(cái)務(wù)危機(jī),用經(jīng)營能力指標(biāo)、成長能力指標(biāo)和獲利能力指標(biāo)來度量或反映企業(yè)的經(jīng)營狀況,用公司的償債能力指標(biāo)來度量或反映企業(yè)的債務(wù)負(fù)擔(dān),用現(xiàn)金流量指標(biāo)來度量現(xiàn)金流。從預(yù)警的角度考慮,五個(gè)方面的財(cái)務(wù)指標(biāo)可進(jìn)一步細(xì)分為20個(gè)更具體的財(cái)務(wù)變量(見表1),以此構(gòu)成財(cái)務(wù)危機(jī)預(yù)警的指標(biāo)體系。
以深滬兩市A股中被ST的上市公司為實(shí)際考察對(duì)象,利用2006年1月1日-2007年12月31日深滬兩市A股中154家被ST的上市公司的數(shù)據(jù)。剔除由于以下幾種原因而被ST的上市公司:(1)上市兩年內(nèi)被特別處理的公司;(2)因自然災(zāi)害、重大事故等意外事件而被特別處理的公司。經(jīng)過剔除后,本文選取的有效樣本變?yōu)?0家。根據(jù)研究期間一致、行業(yè)相同或相近、規(guī)模相當(dāng)?shù)脑瓌t按1:1的比例選擇沒有被ST的上市公司作為配對(duì)樣本。由于我國上市公司年報(bào)披露制度規(guī)定上市公司公布其年報(bào)的截止日期為下一年的4月30日,上市公司(t-1)年的年報(bào)和其在第t年是否被ST幾乎同時(shí)發(fā)生,因此,用(t-1)年的數(shù)據(jù)預(yù)測第t年是否被ST沒有實(shí)際意義。在本文中采用(t-2)年的數(shù)據(jù)進(jìn)行分析。
表6是財(cái)務(wù)危機(jī)公司和正常公司的成長能力指標(biāo)在發(fā)生財(cái)務(wù)危機(jī)前2年的統(tǒng)計(jì)性描述,包括最大值、最小值、平均數(shù)、標(biāo)準(zhǔn)差和t值。
四、結(jié)論
中圖分類號(hào):TP393.08 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-914X(2016)21-0013-01
0 前言
隨著我國交通事業(yè)的飛速發(fā)展,城市交通宏觀規(guī)劃與調(diào)控則更是處于跨越式的發(fā)展階段,人工的現(xiàn)場交通指揮已不能滿通事業(yè)的發(fā)展需求,而三維交通仿真系統(tǒng)集成了多項(xiàng)計(jì)算機(jī)技術(shù),可以動(dòng)態(tài)地、真實(shí)地仿真交通流和交通事故等各種交通現(xiàn)象,重現(xiàn)交通流的時(shí)間和空間的動(dòng)態(tài)變化。由于現(xiàn)有的三維交通仿真系統(tǒng)是基于PC客戶端運(yùn)行的,便攜性較差,不能將設(shè)備適時(shí)地移動(dòng)到現(xiàn)場進(jìn)行仿真。而基于移動(dòng)平臺(tái)的三維交通仿真手勢設(shè)計(jì)與識(shí)別系統(tǒng)將用戶的視覺與觸覺以及測試場景巧妙的結(jié)合起來,增強(qiáng)了人機(jī)交互的直觀性、用戶體驗(yàn)感,方便了城市交通規(guī)劃與設(shè)計(jì)。
1 基于移動(dòng)平臺(tái)的三維交通仿真手勢設(shè)計(jì)與識(shí)別系統(tǒng)的研究內(nèi)容
首先,通過對(duì)參與交通仿真的用戶習(xí)慣進(jìn)行調(diào)查分析,根據(jù)人機(jī)交互理論,提出具有最為優(yōu)化用戶體驗(yàn)的手勢軌跡和對(duì)應(yīng)的手勢命令,最終綜合設(shè)計(jì)一系列高效、簡潔的多點(diǎn)觸控手勢設(shè)計(jì)與識(shí)別方案。同時(shí)針對(duì)多點(diǎn)觸控操控手勢的特點(diǎn),提出一種高效的手勢數(shù)據(jù)捕捉方案,為下一步的識(shí)別算法模型做好充分的準(zhǔn)備。
其次,根據(jù)設(shè)計(jì)的多點(diǎn)觸控手勢方案,提出與之相適應(yīng)的多點(diǎn)手勢識(shí)別算法模型,針對(duì)多點(diǎn)手勢的特點(diǎn),將 BP網(wǎng)絡(luò)與多點(diǎn)手勢相結(jié)合,進(jìn)行數(shù)學(xué)建模和流程分析,提出完備的多點(diǎn)手勢的神經(jīng)元和神經(jīng)網(wǎng)絡(luò)的模型,并給出多點(diǎn)手勢的訓(xùn)練算法流程,和手勢識(shí)別算法流程,最終完成整套的算法模型,并實(shí)現(xiàn)一套多點(diǎn)觸控手勢識(shí)別的算法原程序。
2 系統(tǒng)手勢的設(shè)計(jì)原則與方案
設(shè)計(jì)原則:
(1)符合用戶習(xí)慣:手勢是人類主要信息交流手段之一,故手勢設(shè)計(jì)需符合用戶日常的使用習(xí)慣,易于記憶和被接受。用戶作為系統(tǒng)的使用者,必須以用戶為中心,使用戶能夠有效熟練的控制系統(tǒng)交互過程。
(2)文化約定:手勢的設(shè)計(jì)需符合特定文化的用法,相同手勢在不同的文化中的含義不盡相同。因此需要設(shè)計(jì)“通用的符號(hào)”作為手勢。
(3))實(shí)物隱喻:由于手勢通常會(huì)跟隨實(shí)際生活中對(duì)產(chǎn)品的操作模式,即其內(nèi)涵具有實(shí)物的隱喻意義,所以手勢設(shè)計(jì)要映射實(shí)際產(chǎn)品的操作隱喻。。
設(shè)計(jì)方案如表1:
3 BP神經(jīng)網(wǎng)絡(luò)多點(diǎn)觸控手勢的識(shí)別
識(shí)別網(wǎng)絡(luò)的訓(xùn)練算法如圖1:
識(shí)別算法流程:
(1)輸入數(shù)據(jù),將收集來的觸摸數(shù)據(jù)處理成為待匹配輸入向量。
(2)將輸入向量放入BP神經(jīng)網(wǎng)絡(luò)中進(jìn)行迭代匹配。
(3)通過BP神經(jīng)網(wǎng)絡(luò)的迭代計(jì)算,返回最終匹配的輸出向量,輸出向量為一個(gè)N維數(shù)組,N=預(yù)置手勢個(gè)數(shù)。其中數(shù)組總的每一個(gè)值代表對(duì)應(yīng)的手勢的匹配程度,匹配度越高的手勢越接近正確結(jié)果。
(4)過濾輸出向量,選出匹配度最高的手勢。判斷若其匹配度高于預(yù)設(shè)閾值,則匹配成功,否則,匹配失敗。
4 結(jié)語
本章主要描述了基于BP神經(jīng)網(wǎng)絡(luò)的多點(diǎn)觸控手勢識(shí)別的算法模型。提出的這套多點(diǎn)觸控手勢識(shí)別算法正好與之結(jié)合緊密,同時(shí)還支持手勢的學(xué)習(xí)和擴(kuò)展,更為之后的研究打下了基礎(chǔ),可以使多點(diǎn)觸控手勢進(jìn)一步發(fā)揮它的優(yōu)勢。
參考文獻(xiàn)
[1] 凌云翔,張國華,李銳,等.基于多點(diǎn)觸摸的自然手勢識(shí)別方法的研究[J].國防科技大學(xué)學(xué)報(bào),2010,32(1):4-5.
[2] 王曉慶,等. 多點(diǎn)觸摸手勢分析及識(shí)別算法的研究[J].計(jì)算機(jī)科學(xué),2012,39(6A):522-525.
[3] 中國觸控屏網(wǎng) (http://).多點(diǎn)觸控技術(shù)的特點(diǎn)及其發(fā)展.
基金項(xiàng)目
寧夏師范學(xué)院科學(xué)研究基金資助。
關(guān)鍵詞:數(shù)據(jù)挖掘;網(wǎng)頁分類;神經(jīng)網(wǎng)絡(luò);學(xué)習(xí)算法
中圖分類號(hào):TP393文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2008)12-20ppp-0c
Process Neural Network and its Application in Web Document Automatic Classification
SUI Chang-fu
(Teaching Administration Office of Daqing Petroleum Institute at Qinhuangdao,Hebei 066004 China)
Abstract: Aiming to web document classification in data mining, a classification method is presented in this paper. The method is based on vector space model and process neural network. The network includes input layer, hidden layer and output layer. Input layer performs import of samples, hidden layer extracts model characters of samples and output layer presents classification results. The availability of model and algorithms is proved by classification of some web documents in Internet.
Key words: Data mining; Web document classification; Neural network; Learning algorithm
1 引言
目前,數(shù)字圖書館及與之相關(guān)的數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)研究已成為全球性的一個(gè)熱點(diǎn)。這是Internet和萬維網(wǎng)發(fā)展的必然結(jié)果。文檔自動(dòng)分類在數(shù)據(jù)挖掘中是一項(xiàng)非常重要的任務(wù)。分類的目的是根據(jù)若干已知的規(guī)則,構(gòu)造一個(gè)分類函數(shù)或分類模型(也常稱作分類器),把數(shù)據(jù)庫中的數(shù)據(jù)項(xiàng)映射到給定類別中的某一個(gè)。分類器的構(gòu)造有統(tǒng)計(jì)方法、機(jī)器學(xué)習(xí)方法等[1]。統(tǒng)計(jì)方法包括貝葉斯法和非參數(shù)法;機(jī)器學(xué)習(xí)方法包括決策樹法和規(guī)則歸納法。人工神經(jīng)網(wǎng)絡(luò)理論(Artificial Neural Network)是80年代中后期世界范圍內(nèi)迅速發(fā)展起來的一個(gè)前沿研究領(lǐng)域。該理論作為人工智能的一個(gè)重要分支領(lǐng)域,已顯示了它活躍的生命力。除了在語言識(shí)別、自動(dòng)控制等領(lǐng)域應(yīng)用外,已有實(shí)踐證明,在文檔分類、聚類分析等信息挖掘領(lǐng)域也有著相當(dāng)高的實(shí)用價(jià)值。近幾年來,有關(guān)人工神經(jīng)網(wǎng)絡(luò)理論的新的研究成果不斷涌現(xiàn),目前我國人工智能及其他相關(guān)學(xué)科領(lǐng)域的專家、學(xué)者在人工神經(jīng)元網(wǎng)絡(luò)理論和應(yīng)用研究方面做出了許多可喜的成績。過程神經(jīng)元網(wǎng)絡(luò)就是很有代表性的一例。該網(wǎng)絡(luò)模型誕生于2000年,是傳統(tǒng)神經(jīng)元網(wǎng)絡(luò)在時(shí)域上的擴(kuò)展。目前該網(wǎng)絡(luò)基本理論已比較成熟。
基于向量空間模型的文檔分類方法,文檔特征向量維數(shù)一般較高(從幾十維到上百維),雖然理論上三層反傳播神經(jīng)網(wǎng)絡(luò)能夠逼近任意非線性映射,但普通反傳播神經(jīng)網(wǎng)絡(luò)對(duì)于高維映射問題往往收斂很慢,且容易發(fā)生過擬合現(xiàn)象,使泛化能力受到影響。在過程神經(jīng)網(wǎng)絡(luò)中,將文檔特征向量看作若干個(gè)與各個(gè)類別對(duì)應(yīng)的過程,將這些過程作為網(wǎng)絡(luò)輸入,從而大大降低了文檔特征向量的維數(shù)。本文嘗試將該網(wǎng)絡(luò)用于基于特征向量描述的Web文檔分類。
2 文檔特征提取
特征提取是文檔分類系統(tǒng)中十分關(guān)鍵的問題,文檔分類特征選取恰當(dāng)與否對(duì)文檔分類的正確性和分類效率有重要影響。一個(gè)有效的特征項(xiàng)集,必須具備以下兩個(gè)特征:(1)完全性,特征項(xiàng)能夠體現(xiàn)全部文檔內(nèi)容;(2)可區(qū)分性,根據(jù)特征項(xiàng)集,能將目標(biāo)文檔同其它文檔相區(qū)分。特征項(xiàng)集的構(gòu)造可從構(gòu)造每篇文檔的模糊特征項(xiàng)集開始。如何根據(jù)正文的語義提取可近似表示正文語義的特征項(xiàng)集是一個(gè)復(fù)雜問題,嚴(yán)格講除了要求理解正文的含義之外,尚需有總結(jié)概括的能力乃至有較深的領(lǐng)域知識(shí)才能較好地解決這個(gè)問題,這是難以用現(xiàn)有計(jì)算機(jī)技術(shù)來實(shí)現(xiàn)的。因此最好與語言學(xué)家們結(jié)合根據(jù)人類在抽取正文特征項(xiàng)時(shí)所遵循的一般原則進(jìn)行手工抽取。
2.1 特征項(xiàng)集的構(gòu)造
假設(shè)有P篇待分類文檔,特征項(xiàng)集的構(gòu)造可描述如下:
step 1:首先對(duì)P篇文檔,進(jìn)行手工抽取特征項(xiàng),并記錄特征項(xiàng)的文檔頻數(shù)(特征項(xiàng)在文檔中出現(xiàn)的次數(shù)),構(gòu)造特征項(xiàng)集:?C1,C2,…,Cp;然后對(duì)各特征項(xiàng)集進(jìn)行篩選,除去頻數(shù)過低的特征項(xiàng)。即根據(jù)給定閾值λ,濾除各篇文檔中頻數(shù)低于λ的特征項(xiàng),此時(shí)可以得到每篇文檔的特征項(xiàng)集合:C1,C2,…,Cp
step 2:在以上集合中,將特征項(xiàng)的同義詞、轉(zhuǎn)義詞、近義詞看作同一特征項(xiàng),計(jì)算P個(gè)集合的并集:C=C1∪C2∪…∪Cp={T1,T2, …,TN},得到全部文檔的特征項(xiàng)集{T1,T2,…,TN}。具體算法:令C=C1,對(duì)?Tji∈Cj(i=1,2, …Nj;j=2,3, …,p),若(Tji?C)且(?Tji?C),則C=C∪{Tji},其中,?Tji為Tji的同義詞、轉(zhuǎn)義詞或近義詞。
2.2 特征向量的構(gòu)造
以特征項(xiàng)集{T1,T2, …,TN}為論域,根據(jù)每個(gè)特征項(xiàng)在某一文檔中出現(xiàn)的頻數(shù)構(gòu)造該篇文檔的特征向量。另外,構(gòu)造特征向量時(shí)還應(yīng)考慮特征項(xiàng)的專指度。特征項(xiàng)的專指度可用文檔總數(shù)與含有該特征項(xiàng)的文檔數(shù)的比值表示。專指度過低的特征項(xiàng)會(huì)抑制分類的精確性。因此對(duì)于專指度較高的特征項(xiàng),應(yīng)適當(dāng)增加其文檔頻數(shù);而對(duì)于專指度較低的特征項(xiàng),則應(yīng)適當(dāng)減小其文檔頻數(shù)。具體構(gòu)造過程可描述如下:
step 1:分別對(duì)P篇文檔,計(jì)算特征項(xiàng)集{T1,T2, …,TN}中每個(gè)特征項(xiàng)在該篇文檔中出現(xiàn)的文檔頻數(shù);
step 2:按下式構(gòu)造P篇文檔的特征向量{fT(Tp1), fT(Tp2), …, fT(TpN),}{ };(p=1,2, …,P)。
其中:VTFpk表示特征項(xiàng)Tk在文檔p中的出現(xiàn)頻數(shù),N表示全部訓(xùn)練集中的文檔數(shù),Nk表示含有特征項(xiàng)Tk的文檔數(shù)目。
step 3:對(duì)以上特征向量歸一化,可得p篇文檔的特征向量?Tp={T(Tp1), T(Tp2), …, T(TpN),};(p=1,2, …,p)。
3 過程神經(jīng)元網(wǎng)絡(luò)
3.1 過程神經(jīng)元
過程神經(jīng)元由加權(quán)、聚合和激勵(lì)三部分組成。與傳統(tǒng)神經(jīng)元不同之處在于過程神經(jīng)元的輸入和權(quán)值都是可以時(shí)變的,即可以是依賴于時(shí)間的函數(shù)。其聚合運(yùn)算既有對(duì)空間的多輸入聚合,也有對(duì)時(shí)間過程的積累。因此它是傳統(tǒng)神經(jīng)元在時(shí)域上的擴(kuò)展,傳統(tǒng)神經(jīng)元可以看成是過程神經(jīng)元的特例[1]。單個(gè)過程神經(jīng)元的結(jié)構(gòu)如圖1所示。輸入輸出關(guān)系見(1)式。
3.2 過程神經(jīng)元網(wǎng)絡(luò)模型
過程神經(jīng)元網(wǎng)絡(luò)是由若干個(gè)過程神經(jīng)元按一定的拓?fù)浣Y(jié)構(gòu)組成的網(wǎng)絡(luò)。其拓?fù)浣Y(jié)構(gòu)如圖2所示[2]。
其中,中間層(隱層)各單元由圖1所示神經(jīng)元組成,并設(shè)有m個(gè)單元。輸出層為一非時(shí)變神經(jīng)元。
3.3 學(xué)習(xí)算法
過程神經(jīng)元網(wǎng)絡(luò)的學(xué)習(xí)可借鑒梯度下降法,如BP算法[3]。若假設(shè)輸出層中g(shù)(u)=u, θ=0,則:
將xj(t)、wji(t)用沃爾什基函數(shù)展開[4](在保證展開精度的前提下只取前L項(xiàng)):
由基函數(shù)的正交性,(2)式可簡化為:
網(wǎng)絡(luò)誤差函數(shù)可取為:
由梯度下降法,網(wǎng)絡(luò)權(quán)值學(xué)習(xí)規(guī)則為:
其中i=1,2, …,m;j=1,2,,m;l-1,2, …,L;;α、β、γ為學(xué)習(xí)速度。
4 文檔分類實(shí)施方案
假設(shè)有P篇已知類別的文檔,分類實(shí)施方案的構(gòu)造過程可描述如下:
(1)實(shí)施特征抽取,構(gòu)造特征向量;
假設(shè)待分類模式共有n類,每類抽取m個(gè)特征項(xiàng),則模式空間為n維。記xkij為第i類中第j個(gè)特征項(xiàng)第k篇文檔中的文檔頻數(shù),編碼后的輸入向量如(9)式:
(2)對(duì)(9)式實(shí)施離散沃爾什基函數(shù)展開,構(gòu)造展開后的系數(shù)向量:
其中:scf15.tif
(3)初始化網(wǎng)絡(luò)參數(shù):層數(shù);各層單元數(shù);誤差精度ε;學(xué)習(xí)速度α;慣性系數(shù)η;累計(jì)學(xué)習(xí)迭代次數(shù)s;最大學(xué)習(xí)迭代次數(shù)Max;
(4) 初始化過程神經(jīng)元隱層權(quán)值(設(shè)有q個(gè)神經(jīng)元),采用沃爾什基函數(shù),初始化系數(shù):
(5)初始化其他隱層及輸出層權(quán)值及閥值(同傳統(tǒng)BP網(wǎng)絡(luò));
(6) 按(4)式計(jì)算輸出,按(5)式計(jì)算誤差E;
(7)若(EMax)轉(zhuǎn)(9);
(8)按(6)-(8)式修正各層權(quán)值及閥值,s=s+1,轉(zhuǎn)(6);
(9)輸出結(jié)果,訓(xùn)練結(jié)束。
上述經(jīng)過訓(xùn)練的網(wǎng)絡(luò)即可用于對(duì)未知類別文檔的分類識(shí)別。
5 實(shí)際應(yīng)用分析
我們以Internet上旅游網(wǎng)頁作為分類文檔源,參考《中國分類主題詞表》中的分類情況,將旅游網(wǎng)頁分為如下八個(gè)子類別:1.旅游景點(diǎn);2.旅游指南;3.旅行社;4.賓館飯店;5.租車服務(wù);6.旅游交通;7.海外旅游;8.旅游綜合信息??紤]評(píng)價(jià)與測試文檔自動(dòng)分類算法需要兩個(gè)重要指標(biāo):查全率和查準(zhǔn)率,按下面公式計(jì)算類別Ci的查全率recall(Ci)和查準(zhǔn)率precision(Ci):
(1)recall(Ci)=Tn/N,Tn為通過分類算法被正確分類為Ci類的文檔的數(shù)目;N為未分類文檔之前屬于Ci類的文檔的數(shù)目。
(2)precision(Ci)=Tn/Cn,Tn為通過分類算法被正確分類為Ci類的文檔的數(shù)目;Cn為通過分類算法被分類為Ci類的文檔的數(shù)目。
對(duì)以上8個(gè)子類別通過網(wǎng)站搜索簡體中文網(wǎng)頁,構(gòu)造出規(guī)模為1200個(gè)旅游類網(wǎng)頁的自動(dòng)分類樣本集,其中800個(gè)用作訓(xùn)練集,400個(gè)用作測試集。綜合考慮全部網(wǎng)頁的特征及類屬,共提取特征項(xiàng)64個(gè)(每類8個(gè))。每類的第一個(gè)特征項(xiàng)為類屬名稱。對(duì)全部1200個(gè)網(wǎng)頁實(shí)施編碼處理。部分網(wǎng)頁編碼結(jié)果見表1。
網(wǎng)絡(luò)輸入節(jié)點(diǎn)為模式類別數(shù),本例為8個(gè);因樣本數(shù)目較多,過程神經(jīng)元隱層節(jié)點(diǎn)取30個(gè);輸出層用二進(jìn)制數(shù)表示樣本類別,取3個(gè)節(jié)點(diǎn)。誤差精度ε=0.05,學(xué)習(xí)速度α=0.1,慣性系數(shù)η=0.5,限定迭代次數(shù)Max=5000。實(shí)際迭代3815次收斂。對(duì)訓(xùn)練集自身的平均查全率和平均查準(zhǔn)率均達(dá)到了90%,網(wǎng)絡(luò)的分類結(jié)果如表2所示。
將訓(xùn)練好的網(wǎng)絡(luò)應(yīng)用于測試集400個(gè)網(wǎng)頁的分類,平均查全率和查準(zhǔn)率也均達(dá)到86%以上,與訓(xùn)練集分類結(jié)果較為相近,說明所抽取出的文檔類特征和類模式具有普遍性和有效性。關(guān)于此方法的有效性,我們與BP算法作了對(duì)比。采用三層BP網(wǎng)絡(luò)結(jié)構(gòu),輸入層64個(gè)節(jié)點(diǎn),輸出層3個(gè)節(jié)點(diǎn)。當(dāng)隱層為80節(jié)點(diǎn)時(shí),迭代11038次收斂,對(duì)測試集網(wǎng)頁的識(shí)別率僅為73%;當(dāng)隱層為100節(jié)點(diǎn)時(shí),迭代9687次收斂,對(duì)測試集網(wǎng)頁的識(shí)別率降為62%。說明BP網(wǎng)絡(luò)對(duì)于高維樣本的分類問題,不僅收斂速度慢,而且容易產(chǎn)生過擬合現(xiàn)象,影響了網(wǎng)絡(luò)的泛化推廣能力。而應(yīng)用本文提出的方法就能較好的克服這些問題。
6 結(jié)束語
過程神經(jīng)網(wǎng)絡(luò)是神經(jīng)網(wǎng)絡(luò)領(lǐng)域最近提出的新模型,其輸入不再是幾何式的單點(diǎn)輸入,而將輸入看作一個(gè)過程,在這一點(diǎn)上,過程神經(jīng)元網(wǎng)絡(luò)較好的模擬了生物神經(jīng)元特性。幾何點(diǎn)式的瞬間輸入只能在理論上存在,過程式輸入放寬了傳統(tǒng)神經(jīng)元網(wǎng)絡(luò)模型對(duì)輸入的同步瞬時(shí)控制。使問題更為一般化?,F(xiàn)實(shí)中很多應(yīng)用可歸結(jié)為此問題。過程神經(jīng)元網(wǎng)絡(luò)的輸入為信息矩陣,在向量空間模型中,這為高維的文檔特征向量的處理提供了可行之路。本文嘗試將該模型應(yīng)用于網(wǎng)頁正文分類,達(dá)到了預(yù)期效果。今后,對(duì)過程神經(jīng)元網(wǎng)絡(luò)的理論和應(yīng)用研究必將受到越來越多學(xué)者的關(guān)注。
參考文獻(xiàn):
[1] 何新貴,梁久禎.過程神經(jīng)元網(wǎng)絡(luò)的若干理論問題[J].中國工程科學(xué),2000,2(12):40-44.
[2] 何新貴,梁久禎,許少華.過程神經(jīng)元網(wǎng)絡(luò)的訓(xùn)練及其應(yīng)用[J].中國工程科學(xué),2000,3(4).
[3] 王偉.人工神經(jīng)網(wǎng)絡(luò)原理――入門與應(yīng)用[M]. 北京:北京航空航天大學(xué)出版,1995.
[4] 柳重堪.正交函數(shù)及其應(yīng)用[M].北京:國防工業(yè)出版社,1982.
級(jí)別:部級(jí)期刊
榮譽(yù):中國期刊全文數(shù)據(jù)庫(CJFD)
級(jí)別:北大期刊
榮譽(yù):中國優(yōu)秀期刊遴選數(shù)據(jù)庫
級(jí)別:統(tǒng)計(jì)源期刊
榮譽(yù):中國優(yōu)秀期刊遴選數(shù)據(jù)庫
級(jí)別:北大期刊
榮譽(yù):百種重點(diǎn)期刊
級(jí)別:北大期刊
榮譽(yù):Caj-cd規(guī)范獲獎(jiǎng)期刊