前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的計算機(jī)視覺基本原理主題范文,僅供參考,歡迎閱讀并收藏。
分布式計算是一種計算方法,和集中式計算是相對的。隨著計算技術(shù)的發(fā)展,有些計算應(yīng)用需要非常巨大的計算能力才能完成,如果采用集中式計算,需要耗費(fèi)相當(dāng)長的時間來完成。簡單來說,分布式計算將該應(yīng)用分解成許多小的部分,分配給多臺計算機(jī)進(jìn)行處理。這樣可以節(jié)約整體計算時間,大大提高計算效率。本書使用開源工具及相應(yīng)技術(shù)的開發(fā)并實現(xiàn)了大規(guī)模分布式處理系統(tǒng),提出了構(gòu)建高性能分布式計算系統(tǒng)的先進(jìn)材料,提供實際的指導(dǎo)、相關(guān)練習(xí)以及軟件框架的理論描述。
全書分為2部分,共8章。第1部分 高性能分布式計算的編程基礎(chǔ),包括1-4章:1.引言:包括分布式系統(tǒng)的介紹、分類,分布式計算體系結(jié)構(gòu)與分布式文件系統(tǒng),最后指出分布式系統(tǒng)面對的挑戰(zhàn)與發(fā)展趨勢;2.開始使用Hadoop:包括Hadoop的發(fā)展歷史、生態(tài)系統(tǒng)、HDFS的特性、單個節(jié)點的集群安裝與多個節(jié)點的集群安裝,最后介紹Hadoop編程與流;3.從Spark開始:包括Spark裝置、應(yīng)用實例、Python編程及應(yīng)用等內(nèi)容;4.Spark和Scalding的內(nèi)部編程:包括其安裝步驟與編程指南。第2部分 使用Hadoop、Scalding和Spark的實例,包括5-8章:5. 案例研究1:使用Scalding和Spark進(jìn)行數(shù)據(jù)聚類:包括聚類技術(shù)、聚類過程、K均值算法和相應(yīng)的例子,最后進(jìn)行實現(xiàn);6.案例研究2:使用Scalding和Spark進(jìn)行數(shù)據(jù)分類:包括分類及概率論的相關(guān)概念,樸素貝葉斯及其分類器的實現(xiàn),最后對Scalding的實現(xiàn)進(jìn)行實驗并說明結(jié)果;7.案例研究3:使用Scalding和Spark進(jìn)行回歸分析:包括線性回歸的代數(shù)方法和梯度下降法,并分別使用Scalding和Spark進(jìn)行了實現(xiàn);8.案例研究4:使用Scalding和Spark的推薦系統(tǒng):包括推薦系統(tǒng)的介紹、技術(shù)應(yīng)用、實現(xiàn)規(guī)則并使用Scalding和Spark進(jìn)行了實現(xiàn)。
作者K.G. Srinivasa是卡內(nèi)基梅隆大學(xué)計算機(jī)科學(xué)學(xué)院機(jī)器人研究所的副教授;是電腦專業(yè)資格認(rèn)定協(xié)會(ICCP,International Conformity Certification Programm)、國際計算機(jī)視覺期刊(IJCV,International Journal Computer Vision)、國際計算機(jī)視覺與模式識別會議(CVPR,Computer Vision and Pattern Recognition)等多個國際會議的委員會委員,發(fā)表超過20篇期刊及會議論文。他的研究領(lǐng)域包括計算機(jī)視覺、圖像處理、動態(tài)場景的計算機(jī)視覺監(jiān)控、基于人的行為和生物特征的人物識別與身份鑒定以及數(shù)字多媒體數(shù)據(jù)的水印處理等。
本書描述了構(gòu)建高性能分布式計算大規(guī)模數(shù)據(jù)處理的軟件系統(tǒng)新模式的基本原理;介紹了Hadoop生態(tài)系統(tǒng)并一步步地指導(dǎo)安裝、編程和執(zhí)行;對Spark的基礎(chǔ)知識,包括彈性分布式數(shù)據(jù)集進(jìn)行了介紹,并對使用Spark和Scalding進(jìn)行數(shù)據(jù)聚類、分類和回歸進(jìn)行了分析,提供了詳細(xì)的案例研究方法;最后使用Scalding和Spark實現(xiàn)了一個實用推薦系統(tǒng)。本書適合計算機(jī)體系結(jié)構(gòu)、計算智能、數(shù)據(jù)挖掘等專業(yè)的科研人員及研究生閱讀參考。
關(guān)鍵詞: 計算機(jī) 視覺注意機(jī)制 計算機(jī)視覺注意模型
1.引言
隨著信息技術(shù)的不斷發(fā)展,數(shù)據(jù)處理量劇增,以及用戶不斷擴(kuò)大的個性化需求,對計算機(jī)信息處理能力提出了越來越高的要求。如何在場景中快速準(zhǔn)確地找到與任務(wù)相關(guān)的局部信息,即物體選擇與識別,已經(jīng)成為計算機(jī)信息處理領(lǐng)域的一個研究熱點。隨著在心理學(xué)領(lǐng)域注意機(jī)制研究的不斷發(fā)展,將注意機(jī)制引入信息處理領(lǐng)域來解決物體識別問題,已經(jīng)不再是紙上談兵。
人類視覺系統(tǒng)進(jìn)行視覺信息處理時,總是迅速選擇少數(shù)幾個顯著對象進(jìn)行優(yōu)先處理,忽略或舍棄其他的非顯著對象。進(jìn)入人類視野的海量信息,通過注意選擇機(jī)制進(jìn)行篩選,就能使我們有選擇地分配有限的視覺處理資源,保證視覺信息處理的效率,這就是視覺選擇注意機(jī)制的原理。依據(jù)人類視覺選擇注意的基本原理,開發(fā)能夠進(jìn)行智能圖像信息處理的計算機(jī)系統(tǒng),就成為一大任務(wù)。我們研究的主要方向是使計算機(jī)處理對象時,能夠具備與人類相似的視覺選擇注意能力。
2.視覺注意機(jī)制
研究視覺注意機(jī)制是個多學(xué)科交叉的問題,目前多個領(lǐng)域的研究人員都取得了研究成果,并且對視覺注意的理論都形成了一些共識。目前普遍認(rèn)為注意既可以是按自底向上(自下而上)的圖像數(shù)據(jù)驅(qū)動的,也可以是安自頂向下(自上而下)的任務(wù)驅(qū)動的。其中,自下而上的研究主要來自圖像中物體數(shù)據(jù)本身的顯著性。例如,在視覺搜索實驗中,顯著的物體會自動跳出,如圖1中的圓點通過特征對比,以形狀跳出的形式獲得注意。自上而下的引導(dǎo)主要來自當(dāng)前的視覺任務(wù),以及場景的快速認(rèn)證結(jié)果,即我們可以“故意”去注意任何一個“不起眼”的物體,如我們可以在圖書館浩如煙海的藏書中,找到自己感興趣的那本書。
研究視覺注意機(jī)制的重要方法是研究眼睛在搜索目標(biāo)時的表現(xiàn)。顯著圖中的各目標(biāo)在競爭中吸引注意點,注意點在各個注意目標(biāo)間轉(zhuǎn)移。根據(jù)注意點轉(zhuǎn)移時是否伴隨眼動,視覺注意也分為隱式注意和顯式注意。隱式注意的中央凹不會隨著注意點的轉(zhuǎn)移而移動,而顯式注意的中央凹隨每次注意點的轉(zhuǎn)移而運(yùn)動。
對視覺注意機(jī)制的研究為計算機(jī)視覺的發(fā)展提供了可能。計算機(jī)視覺借鑒人類視覺的注意機(jī)制,建立視覺注意的計算模型。通過“注意點”的選擇與轉(zhuǎn)移,實現(xiàn)對復(fù)雜場景中任務(wù)的搜索與定位,最終來實現(xiàn)實時信息的響應(yīng)處理。在計算機(jī)視覺的研究中,顯式注意應(yīng)用較多。
3.計算機(jī)視覺注意模型
從人的角度來看,人類視覺系統(tǒng)通過視覺,選擇注意在復(fù)雜的場景中迅速將注意力集中在少數(shù)幾個顯著的視覺對象上。從場景的角度來看,場景中的某些內(nèi)容比其他內(nèi)容更能引起觀察者的注意,我們稱之為視覺顯著性,兩者其實是從不同的角度對視覺選擇注意過程的描述。
我們把引起注意的場景內(nèi)容定義為注意焦點FOA(Focus of Attention)。Treisman的特征整合理論中將視覺信息處理過程劃分為前注意和注意兩個階段,各種視覺特征在前注意階段被以并行的方式提取出來,并在注意階段以串行方式整合為視覺客體,即注意的特征和客體是通過不同方式進(jìn)行的。在注意焦點的選擇和轉(zhuǎn)移上,Koch[2]進(jìn)行了深入的研究,他提出注意焦點FOA的變化具有四個特征,即單焦點性:同一時刻只能存在一個FOA;縮放性:FOA的空間范圍可以擴(kuò)大或者縮小;焦點轉(zhuǎn)移性:FOA能夠由一個位置向另一個位置轉(zhuǎn)移;鄰近優(yōu)先性:FOA轉(zhuǎn)移時傾向于選擇與當(dāng)前注視內(nèi)容接近的位置。同時注意焦點具有抑制返回的特點,即FOA轉(zhuǎn)移時抑制返回最近被選擇過的注視區(qū)域。在此基礎(chǔ)上,視覺注意的研究人員提出了多種視覺注意模型。
4.視覺注意模型的研究現(xiàn)狀
人類的視覺注意過程包括兩個方面:一方面是對自下而上的初級視覺特征的加工,另一方面是由自上而下的任務(wù)的指導(dǎo),兩方面結(jié)合,共同完成了視覺的選擇性注意。與此對應(yīng),當(dāng)前的計算機(jī)視覺注意研究也分為這兩個方面。
4.1自下向上的數(shù)據(jù)驅(qū)動注意模型研究及分析
在沒有先驗任務(wù)指導(dǎo)的情況下,視覺注意的目標(biāo)選擇主要是由場景中自下而上的數(shù)據(jù)驅(qū)動的,目標(biāo)是否被關(guān)注,由它的顯著性決定。現(xiàn)在,自下而上的注意研究主要基于Treisman的特征整合理論和Koch&Ullman的顯著性模型,Itti、satoh等人均在此基礎(chǔ)上提出了自己的研究模型,并做了一些模型的改進(jìn)研究。自下而上的研究方法通過對輸入圖像提取顏色、朝向、亮度等方面的基本視覺特征的研究,形成各個特征對應(yīng)的顯著圖。另外,一些研究者采用基于局部或全局對比度的方法,來得到圖中每個像素的顯著性,進(jìn)而得到顯著圖。
現(xiàn)有的自下而上的視覺注意計算模型中,Itti的顯著圖模型(簡稱Itti模型)最具代表性。該模型主要包含3個模塊:特征提取、顯著圖生成和注意焦點轉(zhuǎn)移。模型通過初級特征的提取,將多種特征、多種尺度的視覺空間通過中央―周邊算子得到的各個特征的顯著性圖合成一幅顯著圖。顯著圖中的各個目標(biāo)通過勝者為王的競爭機(jī)制,選出唯一的注意目標(biāo),其中注意焦點的轉(zhuǎn)移用的是禁止返回機(jī)制。但該模型也有一些缺點,如顯著區(qū)與目標(biāo)區(qū)域有偏差、計算量較大、運(yùn)行時間較長、動態(tài)場景中實時處理不平等。
在動態(tài)場景之中,由于Itti模型很難滿足實時性的要求,科研工作者們正在努力研究動態(tài)場景的特性,并建立相應(yīng)的動態(tài)模型。如Wolfe[1]指出,影響前注意的特征包括顏色、方向、曲率、尺寸、運(yùn)動、深度特征、微調(diào)支距、光澤、形狀,等等,其中又以運(yùn)動特征最為敏感。而You等采用了一種空間域特征和時間域特征相結(jié)合的視覺注意模型,該模型假設(shè)當(dāng)場景中存在全局運(yùn)動時,視覺注意對象將極少做運(yùn)動。然而,許多真實的場景并不能滿足這個假設(shè),限制了模型的適用范圍。Hang等人提出了一種運(yùn)動圖的計算方法,并把運(yùn)動圖作為特征之一,與顏色、亮度、方向等特征結(jié)合。這些研究關(guān)注了運(yùn)動特征對視覺的影響,但是均存在一定的局限性,對于復(fù)雜的運(yùn)動場景的注意焦點計算很難取得良好的效果。
我國研究者也在Itti注意模型的基礎(chǔ)上研究了適合動態(tài)場景中的注意模型,形成了一些理論成果。如曾志宏[2]等人提出注意焦點計算模型,鄭雅羽[3]等提出基于時空特征融合的視覺注意計算模型。這些模型都能較好地提取動態(tài)場景下的視覺目標(biāo)。
4.2自上而下的任務(wù)驅(qū)動的注意模型研究及分析
自上而下的注意即任務(wù)驅(qū)動的注意,通過目標(biāo)和任務(wù)的抽象知識,在一定程度上指導(dǎo)注意焦點的選擇。在自上而下注意模型的研究方面,Laar(1997)提出了一個用于隱式視覺注意的模型,該模型通過任務(wù)學(xué)習(xí),將注意集中于重要的特征。Rabak[4]提出了基于注意機(jī)制的視覺感知識別模型,該模型在定義目標(biāo)顯著性時,通過語義分析對其他三個自下向上的視覺控制參數(shù)項進(jìn)行線性組合。Salah將可觀測馬爾科夫模型引入到模擬任務(wù)驅(qū)動的注意模型研究中,并在數(shù)字識別和人臉識別的實驗中取得了很好的效果。Itti提出以調(diào)節(jié)心理閾值函數(shù)的形式來控制視覺感知。
目前對自下而上的數(shù)據(jù)驅(qū)動方面的研究較多,而對自下而上的任務(wù)驅(qū)動方面研究較少。因為任務(wù)驅(qū)動的注意與人的主觀意識有關(guān),同時受到場景的全局特征影響。自上而下的注意涉及記憶、控制等多個模塊的分工協(xié)作,其過程非常復(fù)雜。
5.計算機(jī)視覺注意模型研究的趨勢
自底向上和自頂向下的加工是兩種方向不同的信息處理機(jī)制,兩者的結(jié)合形成了統(tǒng)一的視知覺系統(tǒng)。人類的視覺信息處理系統(tǒng)只有遵循這樣的方法,才能有效地實現(xiàn)視覺選擇注意的目的。
實踐證明,把自底向上和自頂向下的研究相分離的研究方法并不能很好地解決計算機(jī)的視覺注意過程。要想使計算機(jī)能夠準(zhǔn)確模擬人類的視覺注意過程,實現(xiàn)主動的視覺選擇注意的目的,采用兩種研究方法相結(jié)合的形式勢在必行。自底向上的視覺注意計算往往離不開與自頂向下的有機(jī)結(jié)合,實現(xiàn)二者的優(yōu)勢互補(bǔ)是以后計算機(jī)視覺注意研究的一個趨勢。
參考文獻(xiàn):
[1]Wolf J M,Cave K R.Deploying visual attention:the guided search model.In:Troscianko T,Blake A,eds.AI and the Eye.Chichester,UK:Wiley press,1990.
[2]曾志宏,周昌樂,林坤輝,曲延云,陳嘉威.目標(biāo)跟蹤的視覺注意計算模型[J].計算機(jī)工程,2008,(23).
[3]鄭雅羽,田翔,陳耀武.基于時空特征融合的視覺注意模型[J].吉林大學(xué)學(xué)報,2009,(11).
[4]Rabak I A,Gusakova V I,Golovan A V,et al.A model of attention-guided vision perception and recognition.Vision Research,1998,38.
【關(guān)鍵詞】三維重構(gòu) SIFT算法 對極幾何約束 RANSAC算法
如何求解兩幅圖像中的對應(yīng)點,是計算機(jī)視覺研究中的基本問題,也是計算機(jī)視覺高層次處理的基礎(chǔ)。通常,圖像中對應(yīng)點的求解分為兩步:第一步,在圖像中尋找一些與其鄰域有較大區(qū)別的特征點;第二步,利用這些點在結(jié)構(gòu)上或其它特征上的相似性進(jìn)行點的匹配。特征點通常位于圖像中物體的邊緣和象素灰度值變化較大的地方,如T型連接點和最大曲率點等。
1 SIFT特征匹配算法
SIFT特征匹配算法包括兩個階段,第一階段是SIFT特征向量的生成,即從多幅待匹配圖像中提取出對尺度縮放、旋轉(zhuǎn)、亮度變化無關(guān)的特征向量;第二階段是 SIFT特征向量的匹配。 一幅圖像 SIFT特征向量的生成算法總共包括3步:
(1)尺度空間極值檢測,以初步確定關(guān)鍵點位置和所在尺度;
在檢測尺度空間極值時,圖中標(biāo)記為叉號的像素需要跟包括同一尺度的周圍鄰域8個像素和相鄰尺度對應(yīng)位置的周圍鄰域9×2個像素總共26個像素進(jìn)行比較,以確保在尺度空間和二維圖像空間都檢測到局部極值。
(2)通過擬和三維二次函數(shù)以精確確定關(guān)鍵點的位置和尺度,同時去除低對比度的關(guān)鍵點和不穩(wěn)定的邊緣響應(yīng)點(因為DoG算子會產(chǎn)生較強(qiáng)的邊緣響應(yīng)),以增強(qiáng)匹配穩(wěn)定性、提高抗噪聲能力。
(3)利用關(guān)鍵點鄰域像素的梯度方向分布特性為每個關(guān)鍵點指定方向參數(shù),使算子具備旋轉(zhuǎn)不變性。
在實際計算時,我們在以關(guān)鍵點為中心的鄰域窗口內(nèi)采樣,并用直方圖統(tǒng)計鄰域像素的梯度方向。梯度直方圖的范圍是0-360度,其中每10度一個柱,總共36個柱。直方圖的峰值則代表了該關(guān)鍵點處鄰域梯度的主方向,即作為該關(guān)鍵點的方向。圖像的關(guān)鍵點已檢測完畢,每個關(guān)鍵點有三個信息:位置、所處尺度、方向。由此可以確定一個SIFT特征區(qū)域。
2 基于對極幾何約束的SIFT匹配點檢測
4 仿真算例
選取兩幅圖像作為原始圖像并采用SIFT算法進(jìn)行特征點的提取和匹配,(如圖1、2所示),利用RANSAC方法對SIFT匹配結(jié)果進(jìn)行篩選。通常,SIFT算法求得的匹配點很多,而且包含許多錯誤匹配點(如圖1所示),如何選擇合適的匹配點對于基礎(chǔ)矩陣的求解精度影響很大。下文利用RANSAC擬合對極線幾何約束的方法,迭代求解最佳的基礎(chǔ)矩陣的同時也剔除了錯誤匹配點。
由于噪聲、計算誤差等原因,所得匹配結(jié)果存在一定誤差,若將誤差小于1個像素的匹配點視為正確匹配點,那么匹配的正確率可由下式求得:
(6)
由于每次實驗得到的基礎(chǔ)矩陣不同,導(dǎo)致匹配正確率的幅度變化很大。
5 結(jié)論
本文首先介紹了基于SIFT算法的特征點提取及匹配,由于SIFT算法是以局部特征作為匹配條件,因而容易出現(xiàn)錯誤匹配點。本文采用對極幾何約束的方法,結(jié)合RANSAC算法對SIFT算法的結(jié)果進(jìn)行篩選,得到了精確的匹配點。最后,采用Quasi稠密匹配的方法,以RANSAC所求結(jié)果作為種子點進(jìn)行傳播,得到能夠充分反映物體表面信息的致密匹配點。
參考文獻(xiàn)
[1]張喜濤,司斌,王暉.利用對極幾何約束的方法提高SIFT算法的正確率[J].航空兵器,2012,3(5):377-40.
[2]梁志敏,高洪明,王志江.攝像機(jī)標(biāo)定中亞像素級角點檢測算法.焊接學(xué)報,2006,27(02):102-104.
[3]胡海峰,侯曉微.一種自動檢測棋盤角點的新算法.計算機(jī)工程,2004,30(14):19-25.
作者簡介
高曉明(1986-),女,F(xiàn)供職于深圳供電局有限公司。
關(guān)鍵詞:遺傳算法;GA;進(jìn)化;最優(yōu)化
中圖分類號:TP18 文獻(xiàn)標(biāo)識碼:A文章編號:1007-9599 (2010) 04-0000-01
Summary on Genetic Algorithm
Gao Ying
(Shandong Industry Vocational College,Zibo256414,China)
Abstract:This article has summarized the genetic algorithm basic principle and the characteristic, as well as in each domain application situation.
Keyword:Genetic algorithm;Evolution;Optimization
一、引言
在人工智能領(lǐng)域中,有不少問題需要在復(fù)雜而龐大的搜索空間中尋找最優(yōu)解或準(zhǔn)最優(yōu)解。在計算此類問題時,若不能利用問題的固有知識來縮小搜索空間則會產(chǎn)生搜索的組合爆炸。因此,研究能在搜索過程中自動獲取和積累有關(guān)搜索空間的知識并自適應(yīng)地控制搜索過程從而得到最優(yōu)解的通用搜索算法一直是令人矚目的課題[1]。遺傳算法簡稱就是這類特別有效的算法之一。
二、遺傳算法基本原理
遺傳算法是建立在自然選擇和群眾遺傳學(xué)機(jī)理基礎(chǔ)上的,具有廣泛適應(yīng)性的搜索方法。遺傳算法搜索結(jié)合了達(dá)爾文適者生存和隨機(jī)信息交換的思想,適者生存消除了解中不適應(yīng)因素,隨機(jī)信息交換利用了原有解中已知的知識,從而有力地加快了搜索過程。
遺傳算法的基本思想[2]:遺傳算法是從代表問題可能潛在解集的一個種群開始的,一個種群由經(jīng)過基因編碼的一定數(shù)目的個體組成,初始種群產(chǎn)生之后,按照適者生存和優(yōu)勝劣汰的原理,逐步演化產(chǎn)生出越來越好的近似解。在每一代,根據(jù)問題域中個體的適應(yīng)度大小挑選個體,并借助自然遺傳學(xué)的遺傳算子進(jìn)行交叉和變異,產(chǎn)生出代表新的解集的種群。這個過程將導(dǎo)致種群向自然進(jìn)化一樣的后代種群比前代更加適應(yīng)環(huán)境,末代種群中的最優(yōu)個體經(jīng)過解碼,可以作為問題近似最優(yōu)解。
三、遺傳算法的主要特點及改進(jìn)
隨著問題種類的不同以及問題規(guī)模的擴(kuò)大,要尋求一種能以有限的代價來解決搜索和優(yōu)化的通用方法,遺傳算法正是為我們提供的一個有效的途徑,它不同于傳統(tǒng)的搜索和優(yōu)化方法。主要區(qū)別在于:
(1)自組織、自適應(yīng)和自學(xué)習(xí)性。
(2)遺傳算法的本質(zhì)并行性。
(3)遺傳算法不要求導(dǎo)或其他輔助知識,而只需要影響搜索方向的目標(biāo)函數(shù)和相應(yīng)的適應(yīng)度函數(shù)。
(4)遺傳算法強(qiáng)調(diào)概率轉(zhuǎn)換規(guī)則,而不是確定的轉(zhuǎn)換規(guī)則。
(5)遺傳算法可以更加直接地應(yīng)用。
(6)遺傳算法對給定問題,可以產(chǎn)生許多的潛在解,最終選擇可以由使用者確定。
其中對全局信息有效利用和隱含并行性是遺傳算法的兩大特點,同時遺傳算法對問題本身的限制較少,因而具有很強(qiáng)的通用優(yōu)化能力。但遺傳算法容易過早收斂,這樣就會使其他個體中的有效基因不能得到有效復(fù)制,最終丟失;而且在進(jìn)化后期染色體之間的差別極小,整個種群進(jìn)化停滯不前,搜索效率較低,這樣就會導(dǎo)致搜索到的結(jié)果不是全局最優(yōu)解。
自從1975年J.H.Holland系統(tǒng)地提出遺傳算法的完整結(jié)構(gòu)和理論以來,眾多學(xué)者一直致力于推動遺傳算法的發(fā)展,對編碼方式、控制參數(shù)的確定、選擇方式和交叉機(jī)理等進(jìn)行了深入的探究,其基本途徑概括起來有以下幾個方面[3]:
(1)改變遺傳算法的組成部分或使用技術(shù);
(2)采用混合遺傳算法;
(3)采用動態(tài)自適應(yīng)技術(shù),在進(jìn)化過程中調(diào)整算法控制參數(shù)和編碼粒度;
(4)采用非標(biāo)準(zhǔn)的遺傳操作算子;
(5)采用并行遺傳算法等。
四、遺傳算法的應(yīng)用領(lǐng)域
遺傳算法經(jīng)過幾十年的發(fā)展,逐漸被人們接受和運(yùn)用,遺傳算法的應(yīng)用研究比理論研究更為豐富,下面是遺傳算法的一些主要應(yīng)用領(lǐng)域[4]:
(1)優(yōu)化問題:優(yōu)化問題包括函數(shù)優(yōu)化和組合優(yōu)化兩種。函數(shù)優(yōu)化是遺傳算法的經(jīng)典領(lǐng)域,也是對遺傳算法進(jìn)行性能評價的常用算例。對于組合優(yōu)化,隨著問題規(guī)模的擴(kuò)大,搜索空間急劇擴(kuò)大,這類復(fù)雜問題,人們已經(jīng)意識到把精力放在尋找其滿意解上。實踐證明,遺傳算法對于組合優(yōu)化中的NP完全問題非常有效。
(2)生產(chǎn)調(diào)度問題:生產(chǎn)調(diào)度問題在許多情況下所建立起來的數(shù)學(xué)模型難以精確求解,即使經(jīng)過一些簡化之后可以進(jìn)行求解,也會因簡化太多而使得求解結(jié)果與實際相差甚遠(yuǎn)。遺傳算法已成為解決復(fù)雜調(diào)度問題的有效工具,在單件生產(chǎn)車間調(diào)度、流水線生產(chǎn)車間、生產(chǎn)規(guī)劃、任務(wù)分配等方面遺傳算法都得到了有效的應(yīng)用。
(3)自動控制:在自動控制領(lǐng)域中許多與優(yōu)化相關(guān)的問題需要求解,遺傳算法的應(yīng)用日益增加,并顯示了良好的效果。例如用遺傳算法進(jìn)行航空控制系統(tǒng)的優(yōu)化、基于遺傳算法的參數(shù)辨識、利用遺傳算法進(jìn)行人工神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)優(yōu)化設(shè)計和權(quán)值學(xué)習(xí),都顯示了遺傳算法在這些領(lǐng)域中應(yīng)用的可能性。
(4)機(jī)器人智能控制:機(jī)器人是一類復(fù)雜的難以精確建模的人工系統(tǒng),而遺傳算法的起源就來自于對人工自適應(yīng)系統(tǒng)的研究。例如遺傳算法已經(jīng)在移動機(jī)器人路徑規(guī)劃、關(guān)節(jié)機(jī)器人運(yùn)動軌跡規(guī)劃、機(jī)器人逆運(yùn)動學(xué)求解、細(xì)胞機(jī)器人的結(jié)構(gòu)優(yōu)化和行動協(xié)調(diào)等方面得到研究和應(yīng)用。
(5)圖像處理和模式識別:圖像處理和模式識別是計算機(jī)視覺中的一個重要研究領(lǐng)域。在圖像處理過程中,如掃描、特征提取、圖像分割等不可避免地產(chǎn)生一些誤差,這些誤差會影響到圖像處理和識別的效果。如何使這些誤差最小是使計算機(jī)視覺達(dá)到實用化的重要要求。遺傳算法在圖像處理中的優(yōu)化計算方面是完全勝任的。目前已在圖像恢復(fù)、圖像邊緣特征提取、幾何形狀識別等方面得到了應(yīng)用。
五、總結(jié)
遺傳算法作為一種非確定性的模擬自然演化的學(xué)習(xí)過程的求解問題方法,在很多領(lǐng)域具有廣泛的應(yīng)用價值,但其在很多方面有待于進(jìn)一步研究、探討和完善??梢灶A(yù)期,隨著計算機(jī)技術(shù)的進(jìn)步和生物學(xué)研究的深入,遺傳算法在操作技術(shù)和方法上將更通用、更有效。
參考文獻(xiàn):
[1]王煦法.遺傳算法及其應(yīng)用.小型微型計算機(jī)系統(tǒng),1995,2
自適應(yīng)系統(tǒng)是一類智能的時變系統(tǒng),這類系統(tǒng)能夠通過與外界環(huán)境的接觸來動態(tài)地改善自身的信號處理。自適應(yīng)信號處理就是在信號處理中引入了某種最優(yōu)準(zhǔn)則,這種最優(yōu)準(zhǔn)則在任何時刻、任何環(huán)境下都是被滿足的,因而可增強(qiáng)期望信號、消除干擾信號。自適應(yīng)信號處理技術(shù)目前在雷達(dá)、通信、聲納、圖像處理、計算機(jī)視覺、地震勘探、生物醫(yī)學(xué)和振動工程等領(lǐng)域有著極其重要的應(yīng)用。
全書共9章。1.引言:離散時間信號及電路基礎(chǔ):包括離散時間信號的確定性和隨機(jī)序列、酉變換、離散傅里葉變換、正余弦變換,DT電路的性能、脈沖響應(yīng)、DFT和Z變換等內(nèi)容;2.自適應(yīng)信號和陣列處理介紹:包括線性及非線性數(shù)字濾波、自適應(yīng)濾波器的分類、自適應(yīng)逆模型的估計、干擾消除、生物啟發(fā)的智能電路等;3.最佳線性濾波理論:包括自適應(yīng)濾波器的基本概念、隨機(jī)優(yōu)化方法、應(yīng)用實例;4.最小二乘法:包括最小二乘法的基本原理、用最小二乘法的線性系統(tǒng)的解決方案、采用矩陣分解的LS方法、欠定稀疏系統(tǒng)(underdeterminedsparsesystems);5.一階自適應(yīng)算法:包括算法的性能、收斂性、穩(wěn)定性、階梯度算法、LMS算法的統(tǒng)計分析和性能、LMS變異化算法等;6.二階自適應(yīng)算法:包括牛頓算法、仿射投影算法、遞推最小二乘法、卡爾曼濾波器、自適應(yīng)跟蹤算法的性能、多輸入多輸出誤差序列的回歸算法等內(nèi)容;7.塊和變換域算法:包括頻域分塊自適應(yīng)濾波、疊加FDAF算法、FDAF算法性能分析、TDAF算法及性能、子帶自適應(yīng)濾波等內(nèi)容;8.線性預(yù)測和遞歸算法:線性估計:前向和后向預(yù)測、遞歸模型算法、LevinsonDurbin算法及FKA、FAEST、和FTF算法等;9.離散時空濾波:AP算法及其傳播模型、信號模型、噪聲場特性和質(zhì)量指標(biāo)、常規(guī)的波束成形技術(shù)、依賴于數(shù)據(jù)的波束成形技術(shù)等內(nèi)容。
作者AurelioUncini教授是羅馬薩皮恩扎大學(xué)(RomMarthaSapienzaUniversity)教授,講授電路理論、自適應(yīng)算法和并行計算、數(shù)字音頻處理等課程。他是智能信號處理和多媒體實驗室主任,也是薩皮恩扎大學(xué)網(wǎng)絡(luò)情報與信息安全研究中心創(chuàng)始人之一。
本書基于自適應(yīng)信號處理為讀者提供相關(guān)電路及算法設(shè)計開發(fā)的有效指導(dǎo),每章末均附有大量帶啟發(fā)性的習(xí)題和部分習(xí)題答案,以及大量的參考文獻(xiàn)。書中的實例包括多模態(tài)多媒體生物、生物醫(yī)學(xué)、經(jīng)濟(jì)、環(huán)境科學(xué)、遙感等領(lǐng)域。讀者不僅能學(xué)會如何設(shè)計和實現(xiàn)相關(guān)算法,還可以進(jìn)行算法性能的評估。本書可作為高等院校通信、雷達(dá)、聲納以及信號處理等相關(guān)專業(yè)的高年級學(xué)生和研究生的教材,也可作為工程技術(shù)人員的參考資料,對科研院所研發(fā)人員和工程技術(shù)人員解決實際的工程技術(shù)問題,也很有參考價值。
李亞寧,碩士研究生(中國科學(xué)院自動化研究所)本文來自《信號處理》雜志
關(guān)鍵詞:數(shù)字圖像處理;教學(xué)改革;試驗教學(xué)
0 引言
《數(shù)字圖像處理》是一門匯聚光電探測、電子學(xué)、數(shù)學(xué)和計算機(jī)等眾多領(lǐng)域技術(shù)的綜合叉學(xué)科,通過對原始圖像的加工,可以使圖像具備更好的視覺效果,同時滿足某些應(yīng)用的特定需要?!稊?shù)字圖像處理》是一門偏重于應(yīng)用的工程學(xué)科,經(jīng)過半個多世紀(jì)的發(fā)展,目前已廣泛應(yīng)用于工業(yè)檢測、醫(yī)療保健、航空航天、軍事等各個領(lǐng)域,其巨大成就表現(xiàn)在航空航天遙感和醫(yī)學(xué)圖像的處理方面。在航天領(lǐng)域,為太空探測成功處理了數(shù)萬張照片在生物醫(yī)學(xué)領(lǐng)域,為開辟了無損診斷的先河,體現(xiàn)出其遠(yuǎn)大的發(fā)展前景。數(shù)字圖像處理是模式識別、計算機(jī)視覺、圖像通信、多媒體技術(shù)等學(xué)科的基礎(chǔ),已經(jīng)成為高等院校電子信息工程、通信工程、信號與信息處理、計算機(jī)應(yīng)用與軟件等學(xué)科的一門重要專業(yè)課程。
對于工科類應(yīng)用型高校,主要是培養(yǎng)具有創(chuàng)新意識和競爭力、符合市場需求的實用型人才,強(qiáng)調(diào)學(xué)生的應(yīng)用動手能力。在《數(shù)字圖像處理》課程的教學(xué)過程中,我們主要從授課內(nèi)容、授課方式、試驗課設(shè)計以及考核方式進(jìn)行了改革,培養(yǎng)學(xué)生學(xué)習(xí)興趣,掌握圖像處理最基本的流程和基礎(chǔ)知識,通過主動查閱文獻(xiàn)資料與團(tuán)隊協(xié)作培養(yǎng)學(xué)生分析問題與解決問題的能力。近幾年,我們對課程教學(xué)內(nèi)容體系、教學(xué)方法與手段以及教師隊伍等方面的進(jìn)一步建設(shè),不斷進(jìn)行科技創(chuàng)新,將工程與項目的開發(fā)與設(shè)計理念引入課堂與試驗,取得了較明顯的效果,最為顯著的是學(xué)生在大四畢業(yè)設(shè)計中,具備扎實的圖像處理相關(guān)基礎(chǔ)知識,能很好地完成與圖像處理相關(guān)的畢業(yè)設(shè)計課題。
1 授課內(nèi)容改革
隨著科學(xué)技術(shù)的發(fā)展以及信息時代的到來,圖像處理的新理論和新方法層出不窮,并逐步應(yīng)用于實踐。《數(shù)字圖像處理》課程教學(xué)的側(cè)重點和教學(xué)內(nèi)容也必須發(fā)生相應(yīng)變化以適應(yīng)時代對應(yīng)用型人才培養(yǎng)的需求。
1.1優(yōu)化整合教學(xué)內(nèi)容
在眾多的《數(shù)字圖像處理》類教材中,選擇了西安電子科技大學(xué)許錄平編寫的《數(shù)字圖像處理》教材為主。主要考慮到該教材內(nèi)容全面、知識新穎,在內(nèi)容闡述上重點突出,實踐性強(qiáng),有較多的實例來幫助學(xué)生理解圖像處理的理論和算法。同時以清華大學(xué)章毓晉編寫的《圖像工程(上冊)圖像處理和分析》與岡薩雷斯的《數(shù)字圖像處理》作為我們的輔助教材。
該教材共分八章三大部分,第一部分是數(shù)字圖像處理基礎(chǔ),包括緒論、圖像處理基礎(chǔ)和圖象變換共三章。第二部分介紹圖像處理基本方法和技術(shù),包括圖象增強(qiáng)、圖像恢復(fù)和重建、圖像壓縮編碼共三章。第三部分講述數(shù)字圖像分析的基本原理和技術(shù),包括圖象分割和圖像描述共二章。對于應(yīng)用型本科教學(xué),我們對教材內(nèi)容進(jìn)行適當(dāng)增刪、重組。并劃分成如下內(nèi)容模塊:圖像基礎(chǔ)知識(圖像采集、量化與人眼視覺系統(tǒng))、圖像變換、圖像增強(qiáng)、圖像恢復(fù)、壓縮編碼、圖像分割、圖像描述與圖像分類識別。課程教學(xué)的主要任務(wù)是系統(tǒng)地講授各個模塊的基本概念、基本原理與典型方法。目的是讓學(xué)生掌握圖像處理的基本理論和技術(shù),建立一個比較完整的圖像處理和分析的理論體系,并了解和掌握常用的圖像處理和分析技術(shù)。
根據(jù)幾年的教學(xué)實踐經(jīng)驗,圖像描述與圖像分類識別應(yīng)該屬于圖像理解的范疇,作為圖像工程的高一級別的內(nèi)容,可以在本科階段略講:而圖像基本概念、各種圖像變換、灰度圖像增強(qiáng)、圖像平滑、圖像銳化和彩色圖像處理的應(yīng)用性比較強(qiáng),且在生活中經(jīng)常會遇到此類的應(yīng)用需求,應(yīng)盡量詳講;頻域增強(qiáng)、圖像復(fù)原、圖像編碼和圖像分割的地位比較特殊,這些部分的數(shù)學(xué)知識比較多,現(xiàn)實中具有很大應(yīng)用價值,應(yīng)該予以講授。
1.2補(bǔ)充學(xué)課前沿知識
在每個模塊的內(nèi)容講授安排上,在注重基礎(chǔ)知識與經(jīng)典算法講授的前提下,按照由淺入深、由易到難的順序逐漸展開,并適當(dāng)補(bǔ)充本領(lǐng)域中的一些新技術(shù)、新方法、新成果。例如:在講授圖像變換模塊時,其中的Fourier變換與離散余弦變換(DCT),學(xué)生在其他前期課程中有所接觸,相對來說學(xué)生容易接受與理解。在這個模塊我們要補(bǔ)充的前沿知識就是“小波變換”。小波分析是當(dāng)前應(yīng)用數(shù)學(xué)與工程學(xué)科中一個迅速發(fā)展的新領(lǐng)域,經(jīng)過近十年的探索研究,重要的數(shù)學(xué)形式化體系已經(jīng)建立。理論基礎(chǔ)更加扎實。與Fourier變換、DCT變換相比,小波變換是時間(空間)頻率的局部細(xì)化分析,它通過伸縮平移運(yùn)算對信號(函數(shù))逐步進(jìn)行多尺度細(xì)化,最終達(dá)到高頻處時間細(xì)化,低頻處頻率細(xì)化,能自動適應(yīng)時頻信號分析的要求,從而可聚焦到信號的任意細(xì)節(jié),解決了Fourier變通的困難問題,成為繼Fouri-er變換以來在科學(xué)方法上的重大突破,有人把小波變換稱為“數(shù)學(xué)顯微鏡”。小波變換聯(lián)系了應(yīng)用數(shù)學(xué)、物理學(xué)、計算機(jī)科學(xué)、信號與信息處理、圖像處理、地震勘探等多個學(xué)科。它在信號分析、語音合成、圖像識別、計算機(jī)視覺、數(shù)據(jù)壓縮等方面的研究都取得了許多具有重大科學(xué)意義和應(yīng)用價值的成果。再例如:在講授圖像平滑去噪模塊時,除了講解教材的均值濾波、中值濾波算法之外,還補(bǔ)充基于偏微分方程(PDE)的圖像去噪方法。在圖像處理與計算機(jī)視覺中采用PDE方法,是近些年以來圖像處理領(lǐng)域中的一個重要分支,因為它在圖像處理中具有更強(qiáng)的局部適應(yīng)性(Local Adaptability)與高度的靈活性(Flexibility),并且日益成為相關(guān)領(lǐng)域研究者關(guān)注的一個熱點,在圖像去噪、邊緣檢測與圖像分割方面積累了豐富成果。
通過在課堂上適當(dāng)?shù)匮a(bǔ)充學(xué)科前沿知識,不但可以開闊學(xué)生的視野,豐富學(xué)生的知識面,讓學(xué)生明白更多、更新的方法在教材之外,要學(xué)會查閱相關(guān)文獻(xiàn),而不要局限于書本,從而激發(fā)學(xué)生的創(chuàng)新意識。同時,在各個模塊內(nèi)容的設(shè)計中要注重知識點之間、模塊之間以及本課程與其他課程之間的內(nèi)在聯(lián)系,既體現(xiàn)知識的內(nèi)涵,又關(guān)注知識產(chǎn)生的過程。既引導(dǎo)學(xué)生對當(dāng)前所學(xué)內(nèi)容舉一反三,又能將新舊知識融會貫通。
2 教學(xué)過程的改革
2.1教學(xué)方式的選擇
《數(shù)字圖像處理》課程是一門既具有較強(qiáng)理論性又具有較強(qiáng)實踐性的學(xué)科,其中不但有基本概念與理論。還有許多具體的算法與應(yīng)用舉例。所以,在教學(xué)過程中采用以“多媒體”為主,“粉筆+黑板”為輔的教學(xué)方式。多媒體教學(xué)手段的采用能使教學(xué)內(nèi)容由平面到立體,由抽象到具體,由文字到聲音圖像,這一教學(xué)手段的運(yùn)用極大地增強(qiáng)了課堂教學(xué)的直觀性、互動性,調(diào)動了學(xué)生學(xué)習(xí)的主動性。而“粉筆+黑板”的板書可以用來進(jìn)行公式的推導(dǎo)與演算,加強(qiáng)學(xué)生對公式的理解與記憶。
2.2項目式教學(xué)
為了有效地培養(yǎng)學(xué)生的應(yīng)用能力,把基于項目式的教學(xué)策略引人課堂之中,以促進(jìn)學(xué)生高級認(rèn)知技能和問題解決策略的形成,將理論聯(lián)系實際,培養(yǎng)學(xué)生分析問題與解決問題的能力。這一策略的主要方法就是:在講授教材的知識點或具體算法時,先引入一個具體工程項目,通過對此項目的需求進(jìn)行分析,讓學(xué)生知道我們將要學(xué)習(xí)的知識在項目的哪個環(huán)節(jié)可以得到應(yīng)用。這樣既可以激發(fā)學(xué)生的求知欲,又能增強(qiáng)學(xué)生的學(xué)習(xí)興趣,調(diào)動學(xué)習(xí)的主動性。例如:在講授“圖像增強(qiáng)”這個模塊時,我們就以“視頻監(jiān)控”項目為背景,因為受光照條件、天氣變化(雨雪、大霧)等因素影響,采集的視頻圖像往往不清晰,視覺效果很差,但是,通過我們將要學(xué)習(xí)的圖像增強(qiáng)方法,可以大幅度地改善圖像的視覺效果,提高圖像的質(zhì)量,如圖1所示。
由于這一真實項目引領(lǐng)整個“圖像增強(qiáng)”模塊的學(xué)習(xí)過程,能夠有效提高學(xué)生的學(xué)習(xí)積極性,也有利于學(xué)生掌握該知識點的具體應(yīng)用價值,提高學(xué)生對理論知識的綜合運(yùn)用能力,從而提高學(xué)生分析與解決實際問題的能力。
3 試驗教學(xué)的改革
在以住《數(shù)字圖像處理》的試驗課中,通常都是在MatLab環(huán)境中,對課本中的一些算法進(jìn)行重復(fù)性驗證,試驗內(nèi)容簡單枯燥,無法引起學(xué)生學(xué)習(xí)的興趣,更加不能使學(xué)生將所學(xué)的知識與實際生活中的應(yīng)用需求相聯(lián)系。
針對上述問題,我們進(jìn)行了如下改革:
(1)設(shè)置具有應(yīng)用性的“學(xué)期項目”讓學(xué)生開發(fā),激發(fā)他們的學(xué)習(xí)興趣。俗話說“興趣是最好的老師”,只要能夠激發(fā)學(xué)生的學(xué)習(xí)興趣,就能調(diào)動學(xué)生學(xué)習(xí)的主動性與積極性。為了調(diào)動學(xué)生的學(xué)習(xí)興趣,我們選擇兼具應(yīng)用性與興趣性的試驗題目——例如“基于膚色特征的人臉分割”、“基于視覺相似性的圖像快速檢索”、“監(jiān)控圖像的增強(qiáng)與銳化”與“運(yùn)動模糊圖像的恢復(fù)”等,學(xué)生根據(jù)這些“學(xué)期項目”,分成多個小組,每個成員在組內(nèi)具有明確的分工與任務(wù),各負(fù)其責(zé),共同完成“學(xué)期項目”軟件開發(fā)。
(2)在“學(xué)期項目”軟件開發(fā)時,鼓勵學(xué)生多采用教材之外的新理論與新方法,培養(yǎng)開拓創(chuàng)新能力。要求學(xué)生在了解試驗?zāi)康那疤嵯?,自己進(jìn)行方案設(shè)計,選擇適當(dāng)?shù)乃惴?。近些年以來,各種類型的圖像處理新理論與新方法層出不窮,在不同的應(yīng)用場合,各自的優(yōu)點與缺點互不相同。鼓勵學(xué)生通過互聯(lián)網(wǎng)與學(xué)校的圖書館,查閱最新文獻(xiàn),形成自己的特點,培養(yǎng)學(xué)生的科技創(chuàng)新能力。在試驗成功后,不但要進(jìn)行試驗結(jié)果與算法性能分析,還要書寫軟件設(shè)計方案等文檔。
(3)組建圖像處理興趣小組。因為受課程學(xué)時限制,僅僅只利用課內(nèi)時間,則非常有限。我們就組建了圖像處理興趣小組,讓他們參加到教師的科研與項目中來,使學(xué)生在真實的項目研發(fā)中鍛煉自己的綜合能力。
最后,在期末之前安排兩周的時間對學(xué)生的“學(xué)期項目”進(jìn)行集中檢查,檢查的內(nèi)容主要包括:①系統(tǒng)演示;②功能方面是否正確完整;③算法的適應(yīng)能力是否魯棒;④算法的效率是否高效;⑤程序代碼是否規(guī)范;⑥試驗分析報告與PPT匯報。然后,根據(jù)這些方面的檢查情況,對學(xué)生的學(xué)習(xí)情況與動手能力進(jìn)行評分。這是基于項目試驗教學(xué)改革的重要環(huán)節(jié),不但可以督促“學(xué)期項目”完成的質(zhì)量,還能提高學(xué)生分析問題與解決問題的能力。
4 評價機(jī)制的改革
對于公選課的《數(shù)字圖像處理》課程,我們采用了“筆試+課堂表現(xiàn)+試驗考核”的一種綜合考核方式。其中筆試環(huán)節(jié)重點考察學(xué)生教材上的基本概念、基本算法等知識點記憶與掌握程度:課堂表現(xiàn)主要考察學(xué)生的學(xué)習(xí)態(tài)度,主要包括出勤率與讀書心得等內(nèi)容:試驗考核主要是考察學(xué)生綜合應(yīng)用能力,其中包括所選“學(xué)期項目”的完成質(zhì)量與試驗分析報告與軟件設(shè)計文檔。
《數(shù)字圖像處理》作為一門實踐性、應(yīng)用性都很強(qiáng)的課程,在考核時,要加大平時考查在最終成績認(rèn)定中的比重,要重點突出“學(xué)期項目”完成質(zhì)量在學(xué)習(xí)中的重要性,從而激發(fā)學(xué)生實踐學(xué)習(xí)的主動性,提高學(xué)生的實踐能力、創(chuàng)新能力,最終達(dá)不到理想的教學(xué)效果。
此外,由于選修本門課程學(xué)生基礎(chǔ)各異,專業(yè)背景相差較大,采取“分層評價”也是一種應(yīng)該提倡的方法?!胺謱釉u價”也是教學(xué)過程中的一個重要環(huán)節(jié),它是根據(jù)學(xué)生的知識水平和學(xué)習(xí)能力的差異,對不同專業(yè)的學(xué)生采取不同的評價標(biāo)準(zhǔn)以及對他們的期望值。
5 結(jié)語
魚眼鏡頭相機(jī)屬于非量測相機(jī),視場角較大(能夠達(dá)到180度以上),每張照片包含的信息量大,且廠商一般不提供內(nèi)方位元素和鏡頭畸變系數(shù)。魚眼鏡頭的投影模型不是人們習(xí)慣的透視投影,而是球面投影。對于透視投影模型及此類相機(jī)的標(biāo)定,國內(nèi)外已經(jīng)進(jìn)行了大量的研究。但對魚眼鏡頭標(biāo)定的研究相對較少,因此找出一種高精度標(biāo)定魚眼鏡頭的方法是十分必要的。
正確標(biāo)定Ladybug3全景視覺系統(tǒng)后,利用全景三維控制場,可以獲取每個相機(jī)的外方位元素,探討了僅有少量控制點情況下的全景物方點坐標(biāo)解算方法。
【關(guān)鍵詞】:相機(jī)標(biāo)定;全景視覺系統(tǒng);魚眼鏡頭;坐標(biāo)
中圖分類號: TB852 文獻(xiàn)標(biāo)識碼: A 文章編號:
Abstract:This paper based Ladybug3 structure, the study of the panoramic camera calibration method and content party point 3 d coordinate measurement. Ladybug3 panoramic vision system is panoramic technology application a example. Because it by six fisheye lens composition, distributed in side and on the top, can with the least amount of camera get more view, can cover the entire sphere panorama 360 more than 75% of the image. Fisheye lens camera belongs to the measurement camera, the view Angle is bigger (can reach 180 degrees above), each picture contains large amount of information, and generally do not provide manufacturers the inside azimuth element and lens distortion coefficient. Fisheye lens of projection model is not the people used to perspective projection, but spherical projection. For perspective projection model and such camera calibration, domestic and foreign has done a great deal of research. But for fisheye lens calibration research opposite less, so find a high precision calibration fisheye lens method is very necessary. Right Ladybug3 panoramic vision calibration system, with its panoramic 3 d control field, can obtain each camera a foreign element, discusses the control points under the circumstance of only a whole scenery party point coordinates the solution method.
Key words:The camera calibration; Panoramic vision system; Fisheye lens; coordinates
一、引言
全景技術(shù)是以近景攝影測量原理為基本原理發(fā)展起來的一種視覺新技術(shù),是目前全球范圍內(nèi)迅速發(fā)展并逐步流行的一門技術(shù)。Ladybug3是PointGrey公司最近推出的360度高性能全景視覺系統(tǒng),系統(tǒng)采用6臺魚眼鏡頭相機(jī)組合,5臺分布在側(cè)面,1臺在頂部,可以得到整個全景360球面圖像的75%以上。該系統(tǒng)可以得到單臺相機(jī)的圖像,也能夠?qū)⒍嗯_相機(jī)采集的圖像組合成一幅數(shù)字全景圖像,實時完成圖像采集、處理、拼接和校正等工作。
相機(jī)參數(shù)的標(biāo)定是計算機(jī)視覺工業(yè)測量系統(tǒng)的關(guān)鍵組成技術(shù)之一,參數(shù)的標(biāo)定精度將直接影響到測量結(jié)果。將像機(jī)的內(nèi)方位元素和鏡頭光學(xué)畸變系數(shù)統(tǒng)稱為像機(jī)的內(nèi)部參數(shù),外方位元素稱為外部參數(shù)。全景相機(jī)屬于非量測用攝影機(jī),一般不會提供內(nèi)方位元素,光學(xué)畸變大,并且不具備記載外部定向參數(shù)的功能。魚眼鏡頭成像不同于一般的透視投影成像,其投影面是一個近似球狀的曲面,光學(xué)畸變較大,進(jìn)行精確的標(biāo)定是必不可少的。本文將采用王保豐(2007)提出的“兩步法”標(biāo)定魚眼鏡頭的內(nèi)部參數(shù),并且進(jìn)一步研究,在只知道少量控制點的情況下,利用Ladybug3全景視覺系統(tǒng)量測未知物方點坐標(biāo)的方法。
二、全景相機(jī)標(biāo)定
2.1 魚眼鏡頭
魚眼鏡頭作為全景視覺系統(tǒng)的重要組成部分,它是一個半球形或魚眼形的鏡頭,可能是覆蓋一個廣泛的視野的最佳圖像采集工具。使用魚眼鏡頭能獲得超過180°視場角圖像。由于寬廣的視場角,它已被用于許多領(lǐng)域,如林業(yè)、植被覆蓋的研究、測繪中制作GPS任務(wù)的地點障礙圖表。然而,只有少數(shù)刊物發(fā)表了關(guān)于這種鏡頭類型的攝影測量,魚眼鏡頭圖像的主要限制在于不能使用傳統(tǒng)的數(shù)字?jǐn)z影測量理論。
魚眼鏡頭和普通直線鏡頭的根本區(qū)別在于,魚眼相機(jī)的成像平面是近似于球狀的曲面。根據(jù)不同的光線偏移量,式2.1給出了四種不同類型的投影公式:
1)極投影(等距離投影):
2)正投影:
3)體視投影: (2.1)
4)等立體角投影:
其中:θ是視場角,R是球面半徑,r是光學(xué)系統(tǒng)的理想像高。
2.2 魚眼鏡頭的標(biāo)定過程
所謂“兩步法”標(biāo)定魚眼鏡頭,即先把魚眼圖像轉(zhuǎn)化為透視投影圖像,然后再采用試驗場標(biāo)定法,對相機(jī)內(nèi)參數(shù) , ,R, , , , , 進(jìn)行標(biāo)定。具體步驟如下:
(1)空間直線經(jīng)球面投影后,變?yōu)?平面上半長軸為R的橢圓弧。我們先標(biāo)定鏡頭圖像的光學(xué)中心坐標(biāo)( , )和R,把魚眼鏡頭轉(zhuǎn)化為透視投影圖像。在魚眼圖像中確定一條代表實際直線的橢圓弧,在其上找若干點(至少6個),測出坐標(biāo)( , ), 為點在圖像矩陣中所在的行數(shù)(相當(dāng)于橫坐標(biāo)), 為列數(shù)(相當(dāng)于縱坐標(biāo))。用最小二乘法確定這些點所在橢圓方程:
(2.2)
用下式計算像主點坐標(biāo)( , )和投影球面的R:
,
[關(guān)鍵詞]小波變換突變信號檢測傅里葉變換MATLAB
中圖分類號:TP391文獻(xiàn)標(biāo)識碼:A文章編號:1671-7597(2009)1110028-01
一、引言
突變信號在數(shù)字信號處理中具有非常重要的地位和作用。例如,在聲吶探物、無損探傷等技術(shù)中發(fā)射的限時限頻信號,經(jīng)一段時間后反射波才能到達(dá)接收器,接受信號會發(fā)生突變,檢測這些突變點就可以估算被探測對象的距離和大小。在圖像處理中,把象素點的灰度作為象素點位置的函數(shù),那么清晰的物體邊緣在圖像中表現(xiàn)為象素點灰度值的突變,檢測這些突變點就可以掌握圖像中物體的邊緣和形體特征,等等。目前,突變信號檢測技術(shù)已經(jīng)在圖像識別、目標(biāo)檢測、計算機(jī)視覺等方面得到了廣泛的應(yīng)用[1~4]。
二、突變信號檢測原理
(一)可行性分析
則根據(jù)傅里葉變換的性質(zhì)有:
所以可得到:
若將函數(shù)看作是信號, 看作是濾波器,那么信號的導(dǎo)數(shù)與濾波器的卷積結(jié)果可以看成是濾波器的導(dǎo)數(shù)與信號的卷積。例如,如果選
為高斯函數(shù),則利用其導(dǎo)數(shù)可以構(gòu)造Morlet小波和Maar小波,因此,小波變換的突變點和極值點與信號的突變點和極值點具有對應(yīng)關(guān)系,利用小波變換可以檢測突變信號。
(二)小波檢測算法
設(shè)是一起平滑作用的低通平滑函數(shù),且滿足條件:
通常取為高斯函數(shù),即:
假設(shè)是二次可導(dǎo)的,并且定義:
因此可用做小波母函數(shù)。
由此可見,小波變換 分別是函數(shù)在尺度下由平滑后再取一階、二階導(dǎo)數(shù)。當(dāng)較小時,用對平滑的結(jié)果對的突變部分的位置與形態(tài)影響不大;當(dāng)較大時,則此平滑過程會將的一些細(xì)小的突變削去,而只剩下大尺寸的突變。由此可知,當(dāng)小波函數(shù)可看作某一平滑函數(shù)的一階導(dǎo)數(shù)時,信號小波變換模的局部極值點對應(yīng)信號的突變點(或邊緣)。當(dāng)小波函數(shù)可看作某一平滑函數(shù)的二階導(dǎo)數(shù)時,信號小波變換模的過零點,也對應(yīng)信號的突變點(或邊緣)。由此分析可知,采用檢測小波變換系數(shù)模的過零點和局部極值點,可達(dá)到檢測信號的突變點(或邊緣)的目的[5~9]。
三、信號突變點檢測的小波應(yīng)用
圖1原始時域信號是由兩個不同的頻率信號疊加而成,為了確定原始信號的頻率突變點,實驗分別采用傅里葉變換和小波進(jìn)行處理。圖中可見,小波分解后的三層高頻系數(shù)重構(gòu)圖形可清楚地確定頻率突變點的位置,而傅里葉變換卻沒有這種能力。圖中同樣可以看出,第一層分解的高頻系數(shù)重構(gòu)的圖像比 、高頻系數(shù)重構(gòu)的圖像更清楚地確定了信號突變點的位置。
圖2的原始信號是由一個正常信號和一個故障信號組成。一個正常運(yùn)行的系統(tǒng),由于某種原因系統(tǒng)出現(xiàn)故障造成了信號的頻率產(chǎn)生了較大的改變,為了將正常信號和故障信號區(qū)分開,以確定系統(tǒng)正常運(yùn)行的時間和產(chǎn)生故障的時間,為此采用小波進(jìn)行分析處理。從圖2中小波分解的高頻層系數(shù)恢復(fù)的圖形可以清楚地看出,在時,系統(tǒng)出現(xiàn)了異常情況,在時,系統(tǒng)又恢復(fù)了正常。從實驗可以看出,對信號進(jìn)行多尺度小波分析時,在信號出現(xiàn)突變點處,其小波變換后的系數(shù),具有摸量極大值,因而可以通過模量的極大值點的檢測來確定故障發(fā)生的時間點。圖2再次說明小波分析在檢測信號突變點(奇異點)應(yīng)用中具有傅里葉變換無法比擬的優(yōu)越性。
四、結(jié)語
本文介紹了小波方法進(jìn)行突變信號檢測的基本原理,利用MATLAB軟件進(jìn)行了實驗仿真,對比性實驗表明,小波分析方法在檢測信號突變點信號中具有明顯的優(yōu)勢。需要說明的是,小波分析用于信號的突變點檢測,無論采用小波變換系數(shù)的模極大點還是過零點方法,都應(yīng)在多尺度上作綜合分析和判斷,才能夠準(zhǔn)確地確定突變點的位置。通常,較小尺度下的小波變換能夠減小頻率混疊現(xiàn)象,判斷突變點位置的準(zhǔn)確度較高。
參考文獻(xiàn):
[1]陳德志,由小波變換的模極大值快速重構(gòu)信號[J].電子學(xué)報,1998,26(9):20-25.
[2]雷斌、楊宗凱,線性時頻變換在弱信號檢測中的應(yīng)用[J].電子科學(xué)雜志,1993,1(3):11-14.
[3]B.Porat.Digital processing of random signals:Theory and methods.Prentice-hall,Englewood Cliffs,NJ,1994.
[4]S.Mallat and W.L.Hwang.Singularity detection and processing with wavelets.IEEE Transactions on Information Theory,Special Issue on Wavelet Transforms and multiresolution Signal Analysis,March 1992,38(2):617-643.
[5]彭玉華,小波變換與工程應(yīng)用[M].北京:科學(xué)出版社,2000,6:1-3.
[6]許長發(fā)、李國寬,實用小波方法[M].武漢:華中科技大學(xué)出版社,2001,7:1-54.
[7]梁虹、梁潔、陳躍斌等,信號與系統(tǒng)分析及MATLAB實現(xiàn)[M].北京:電子工業(yè)出版社,2002,2.
[8]胡昌華、張軍波等編著,基于MATLAB的系統(tǒng)分析與設(shè)計--小波分析[M].西安:西安電子科技大學(xué)出版社,2000,6.
[9]陳桂明、張明照、戚紅雨編著,應(yīng)用MATLAB語言處理數(shù)字信號與數(shù)字圖像[M].北京:科學(xué)出版社,2000,1:225-315.
作者簡介:
【關(guān)鍵詞】圖像邊緣; 邊緣檢測; 微分算子
1、引言:
邊緣檢測是圖像處理中的重要內(nèi)容。它如此重要主要有以下幾個理由:首先,人眼通過追蹤位置物體的輪廓而掃視一個未知的物體。第二,經(jīng)驗告訴我們:如果我們能夠成功的得到圖像的邊緣,那么圖像分析就會大大的簡化,圖像識別就會容易多。第三,很多圖像并沒有具體的物體,對這些圖像的理解取決于他們的紋理性質(zhì),而提取這些紋理性質(zhì)與邊緣檢測有及其密切的關(guān)系[1]。計算機(jī)視覺處理實質(zhì)上就是簡化信息的一個過程。這就意味著要扔掉一些不必要的信息而盡可能的利用物體的不變性質(zhì),而邊緣就是最重要的性質(zhì)。因此邊緣檢測是圖像處理中最基礎(chǔ)和最重要的任務(wù)之一[2]。因此,邊緣檢測在圖像分割、模式識別、計算機(jī)視覺等眾多方面都有著非常重要的地位[3]。
2、圖像邊緣特征
圖像邊緣存在于圖像灰度劇變處,能夠反映出圖像邊界。通常圖像邊緣分為階躍邊緣和屋頂邊緣(也稱為線狀邊緣)。這些圖像邊緣是根據(jù)圖像灰度變化特征來劃分的,在圖2.1(a)中,灰度值呈現(xiàn)階躍性變化,在邊緣點的左右兩側(cè),灰度信息明顯從一個級別跳到另一個級別,灰度信息變化非常明顯。圖2.1(b)中是線性邊緣,從圖上顯示可知,在邊緣附近,灰度信息逐漸增加,直到另一個級別以后又開始逐漸減小,在圖中顯示出一個尖峰。
(a)階躍邊緣 (b)線狀邊緣
圖2.1 邊緣分類
根據(jù)以上圖像邊緣的特性,我們主要分析一下階躍邊緣的提取方法。根據(jù)上圖2.1(a)階躍邊緣灰度值變化的特征,我們很容易將提取圖像邊緣問題轉(zhuǎn)化為數(shù)學(xué)問題,我們對階躍邊緣求一階導(dǎo)和二階導(dǎo)數(shù),結(jié)果如圖2.2所示:
(a)一階導(dǎo)數(shù) (b)二階導(dǎo)數(shù)
圖2.2 階躍邊緣的微分特征
從上圖中可以看出,圖像邊緣點就存在于圖像一階導(dǎo)數(shù)的局部最大值,或者是二階導(dǎo)數(shù)的過零點處。邊緣具有兩個很重要的屬性,分別是幅度和方向,幅度反映的是圖像灰度變化程度,并且是圖像中局部幅值最大的點。而在數(shù)學(xué)理論中梯度就反應(yīng)了變化速率,所以可以把求局部幅值最大問題轉(zhuǎn)換為求梯度幅值最大問題。
3、邊緣檢測基本實現(xiàn)步驟
圖像邊緣檢測可以從圖像的灰度曲線著手,根據(jù)曲線變化來尋求邊緣點,這就是邊緣檢測的基本原理。在我們實際應(yīng)用中,在我們進(jìn)行邊緣檢測過程中,通常既要求檢測到的邊緣定位準(zhǔn)確,又要盡可能減少假邊緣的出現(xiàn),因此,在我們進(jìn)行邊緣檢測的過程中,通常會包含四個過程:
1)濾波:由于我們實際看到的圖像往往都攜帶著很多噪點,然而,噪點經(jīng)過求導(dǎo)以后,會被大大增強(qiáng),給邊緣檢測造成很大影響,所以,我們就希望在進(jìn)行求導(dǎo)之前先對噪點進(jìn)行濾波,盡量濾去更多噪點,以減少其對檢測效果的影響。
2)增強(qiáng):圖像可能受到各方面的影響,比如照相機(jī)像素低,或者是晚上、陰暗處光線弱、環(huán)境差,或者照片放的時間過久導(dǎo)致圖像褪色等問題,造成圖像模糊,這時候直接處理起來可能會丟失很多信息,如果在進(jìn)行處理之前,對圖像進(jìn)行增強(qiáng)處理,從而可以大大提高檢測效果。
3)檢測:檢測過程主要是從很多梯度幅值相對比較大的點中來檢測邊緣點,雖然,我們對于邊緣點的定義是可以通過梯度的大小來確定的,然而在實際操作中,并不是所有梯度幅值大的點都是邊緣點,有可能是噪點,所以,我們還需要再一次進(jìn)行邊緣檢測,從而得到更準(zhǔn)確的邊緣點。
4)定位:我們雖然已經(jīng)檢測出來邊緣點,然而這些邊緣點有可能和真正的邊緣點的位置有落差,這時候我們需要精確定位。邊緣檢測的基本步驟如圖3.1所示。
圖3.1 邊緣檢測的基本步驟
4、常用算子
根據(jù)上面圖像邊緣的分析,衍生出來一階微分算子和二階微分算子。一階微分算子的主要思想就是對邊緣求一階導(dǎo)數(shù),認(rèn)為局部最大值點是圖像邊緣點,其中,Roberts算子在水平和垂直方向檢測效果較好,但對噪點比較敏感,并且定位精度低;Sobel算子總體上檢測效果較好,對噪點有抑制作用,但是運(yùn)算量大,定位精度不高;Prewitt算子和Sobel算子大致相同,對噪點有抑制作用,但同樣存在定位精度不高的問題;Kirsch算子能夠減少細(xì)節(jié)丟失問題,但是計算量比較大。總的來說,在一階微分算子中,利用某一閾值來確定邊緣點,檢測出來的邊緣通常都比較粗,導(dǎo)致邊緣定位精度低。
二階微分算子的主要思想是,對邊緣求二階導(dǎo)數(shù),認(rèn)為過零點即是圖像邊緣點,其中,在無噪情況下,Laplacian算子和Log算子兩者的檢測效果都差不多,而當(dāng)對含噪圖像進(jìn)行檢測時,拉普拉斯算子受到噪點的影響較大,檢測出許多假邊緣,而Log算子對噪點有一定的抑制作用,檢測效果相對來說比較好,所以在以后的檢測中,Laplacian算子就慢慢的被Log算子所代替。
5、總結(jié)
圖像邊緣檢測技術(shù)是圖像處理學(xué)科中最基礎(chǔ)也是最重要的部分,目前,邊緣檢測依舊受到人們的關(guān)注,本文主要是對傳統(tǒng)算子進(jìn)行了分析總結(jié)。目前,邊緣檢測算子相對較多,而且效果越來越完善,在對邊緣沒有特殊要求的情況下,傳統(tǒng)算子是一個不錯的選擇。
參考文獻(xiàn):
[1]康牧,王寶樹.圖像處理中幾個關(guān)鍵算法的研究[D].西安:西安電子科技大學(xué),2009.