日本免费精品视频,男人的天堂在线免费视频,成人久久久精品乱码一区二区三区,高清成人爽a毛片免费网站

在線客服

計算機視覺論文

引論:我們?yōu)槟砹?篇計算機視覺論文范文,供您借鑒以豐富您的創(chuàng)作。它們是您寫作時的寶貴資源,期望它們能夠激發(fā)您的創(chuàng)作靈感,讓您的文章更具深度。

計算機視覺論文

計算機視覺論文:計算機視覺下食品工業(yè)論文

1計算機視覺技術(shù)概述

1.1自動化程度高

計算機視覺可以實現(xiàn)對農(nóng)產(chǎn)品的多個外形和內(nèi)在品質(zhì)指標(biāo)進行同時檢測分析,可以進行整體識別、增強對目標(biāo)識別的性。

1.2實現(xiàn)無損檢測

由于計算機視覺技術(shù)對農(nóng)產(chǎn)品的識別是通過掃描、攝像,而不需要直接接觸,可以減少對所檢測食品的傷害。

1.3穩(wěn)定的檢測精度

設(shè)計的運行程序確定后,計算機視覺技術(shù)的識別功能就會具有統(tǒng)一的識別標(biāo)準(zhǔn),具有穩(wěn)定的檢測精度,避免了人工識別和檢測時主觀因素所造成的差異。

2計算機視覺技術(shù)在食品檢測中的應(yīng)用

20世紀(jì)70年代初,學(xué)者開始研究計算機視覺技術(shù)在食品工業(yè)中的應(yīng)用,近幾十年電子技術(shù)得到快速發(fā)展,計算機視覺技術(shù)也越來越成熟。國內(nèi)外學(xué)者在研究計算機視覺技術(shù)在食品工業(yè)中的應(yīng)用方面主要集中在該技術(shù)對果蔬的外部形態(tài)(如形狀、重量、外觀損傷、色澤等)的識別、內(nèi)部無損檢測等方面。國內(nèi)有關(guān)計算機視覺技術(shù)在食品業(yè)中的應(yīng)用研究起始于90年代,比國外發(fā)達國家晚20多年,但是發(fā)展很快。

2.1計算機視覺技術(shù)在果蔬分級中的應(yīng)用研究

計算機視覺技術(shù)在食品檢測中的應(yīng)用研究相當(dāng)廣泛,從外部直徑、成熟度的檢測到內(nèi)部腐爛程度的檢測都有研究。韓偉等[4]采用分割水果的拍攝圖像和新的計算機算法計算水果的半徑,進而得出果蔬的較大直徑。研究表明,該算法不僅降低了計算量而且提高了計算精度,此方法用于水果分級的誤差不超過2mm,高于國際水果分級標(biāo)準(zhǔn)所規(guī)定的5mm分類標(biāo)準(zhǔn)差,可在工業(yè)生產(chǎn)中很好應(yīng)用。李慶中[5]也利用圖像的缺陷分割算法研究了計算機視覺技術(shù)在蘋果檢測與分級中的應(yīng)用,結(jié)果表明此算法能快速、有效地分割出蘋果的表面缺陷。孫洪勝等[6]以蘋果色澤特征比率的變化規(guī)律為理論基礎(chǔ),結(jié)合模糊聚類知識利用計算機視覺技術(shù)來檢測蘋果缺陷域,檢測不僅快速而且結(jié)果。劉禾等[7]通過研究認(rèn)為蘋果的表面缺陷可以利用計算機視覺技術(shù)進行檢測,計算機視覺技術(shù)還可以將蘋果按照檢測結(jié)果進行分級,把檢測過的蘋果分成裂果、刺傷果、碰傷果和蟲傷果等類別。梨的果梗是否存在是梨類分級的重要特征之一,應(yīng)義斌等[8]通過計算機視覺技術(shù)、圖象處理技術(shù)、傅立葉描述子的方法來描述和識別果形以及有無果柄,其識別率達到90%。楊秀坤等[9]綜合運用計算機視覺技術(shù)、遺傳算法、多層前饋神經(jīng)網(wǎng)絡(luò)系統(tǒng),實現(xiàn)了具有度高、靈活性強和速度快等優(yōu)點的蘋果成熟度自動判別。陳育彥等[10]采用半導(dǎo)體激光技術(shù)、計算機視覺技術(shù)和圖像分析技術(shù)相結(jié)合的方法檢測蘋果表面的機械損傷和果實內(nèi)部的腐爛情況,初步驗證了計算機視覺技術(shù)檢測蘋果表面的損傷和內(nèi)部腐爛是可行的。馮斌等[11]通過計算機視覺技術(shù)對水果圖像的邊緣進行檢測,然后確定水果的大小用以水果分級。試驗表明,該方法比傳統(tǒng)的檢測方法速度快、率高,適用于計算機視覺的實時檢測。朱偉[12]在模糊顏色的基礎(chǔ)上,分析西紅柿損傷部分和完好部分模糊顏色的差別,用分割方法對西紅柿的缺陷進行分割,結(jié)果顯示率高達96%。曹樂平等[13]人研究了溫州蜜柑的果皮顏色與果實可滴定酸含量以及糖分含量之間的相關(guān)性,然而根據(jù)相關(guān)性,樣品檢測的正確識別率分別只有約74%和67%。劉剛等[14]從垂直和水平兩個方向獲取蘋果的圖像,并通過計算機自動分析圖像數(shù)據(jù),對蘋果的外徑、體積、以及圓形度等參數(shù)進行處理,與人工檢測相比,計算機視覺技術(shù)具有檢測效率高,檢測標(biāo)準(zhǔn)統(tǒng)一性好等優(yōu)點。Blasco.J[15]通過計算機視覺技術(shù)分析柑橘果皮的缺陷,進而對其在線分級,正確率約為95%。趙廣華等[16]人綜合計算機視覺識別系統(tǒng)、輸送轉(zhuǎn)換系統(tǒng)、輸送翻轉(zhuǎn)系統(tǒng)、差速勻果系統(tǒng)和分選系統(tǒng),研制出一款適于實時監(jiān)測、品質(zhì)動態(tài)的智能分級系統(tǒng),能夠很好地實現(xiàn)蘋果分級。王江楓等[17]建立了芒果重量與攝影圖像的相互關(guān)系,應(yīng)用計算機視覺技術(shù)檢測桂香芒果和紫花芒果的重量和果面損傷,按重量分級其率均為92%,按果面損傷分級的率分別為76%和80%。

2.2計算機視覺技術(shù)在禽蛋檢測中的應(yīng)用研究

禽蛋企業(yè)在生產(chǎn)過程中,產(chǎn)品的分級、品質(zhì)檢測主要采用人工方法,不僅需要大量的物力人力,而且存在勞動強度大、人為誤差大、工作效率低等缺點,計算機視覺技術(shù)可以很好的解決這類產(chǎn)品工業(yè)生產(chǎn)中存在的困擾。歐陽靜怡等[18]利用計算機視覺技術(shù)來檢測雞蛋蛋殼裂紋,利用攝像機獲取雞蛋圖像后,采用fisher、同態(tài)濾波和BET算法等優(yōu)化后的圖像處理技術(shù),獲得裂紋形狀并判斷,試驗結(jié)果表明,計算機視覺技術(shù)對雞蛋蛋殼裂紋的檢測率高達98%。汪俊德等[19]以計算機視覺技術(shù)為基礎(chǔ),設(shè)計出一套雙黃雞蛋檢測系統(tǒng)。該系統(tǒng)獲取蛋黃指數(shù)、蛋黃特征和蛋形尺寸等特征,和設(shè)計的數(shù)學(xué)模型對比來實現(xiàn)雙黃雞蛋的檢測和識別,檢測率高達95%。鄭麗敏等[20]人通過高分辨率的數(shù)字?jǐn)z像頭獲取雞蛋圖像,根據(jù)圖像特征建立數(shù)學(xué)模型來預(yù)測雞蛋的新鮮度和貯藏期,結(jié)果表明,計算機視覺技術(shù)對雞蛋的新鮮度、貯藏期進行預(yù)測的結(jié)果率為94%。潘磊慶等[21]通過計算機視覺技術(shù)和聲學(xué)響應(yīng)信息技術(shù)相結(jié)合的方法檢測裂紋雞蛋,其檢測率達到98%。MertensK等[22]人基于計算機視覺技術(shù)研發(fā)了雞蛋的分級檢測系統(tǒng),該系統(tǒng)識別帶污漬雞蛋的正確率高達99%。

2.3計算機視覺技術(shù)在檢測食品中微生物含量的應(yīng)用研究

計算機技術(shù)和圖像處理技術(shù)在綜合學(xué)科中的應(yīng)用得到快速發(fā)展,在微生物快速檢測中的應(yīng)用也越來越多,主要是針對微生物微菌落的處理。食品工業(yè)中計算機視覺技術(shù)在微生物檢測方面的研究和應(yīng)用以研究單個細(xì)胞為主,并在個體細(xì)胞的研究上取得了一定的進展。殷涌光等[23]以顏色特征分辨技術(shù)為基礎(chǔ),設(shè)計了一套應(yīng)用計算機視覺技術(shù)快速定量檢測食品中大腸桿菌的系統(tǒng),該系統(tǒng)檢測結(jié)果與傳統(tǒng)方法的檢測結(jié)果具有很好的相關(guān)性,但與傳統(tǒng)方法相比,可以節(jié)省5d時間,檢測時間在18h以內(nèi),并且能夠有效提高產(chǎn)品品質(zhì)。Lawless等[24]人等時間段測定培養(yǎng)基上的細(xì)胞密度,然后通過計算機技術(shù)建立時間和細(xì)胞密度之間的動態(tài)關(guān)聯(lián),利用該關(guān)聯(lián)可以預(yù)測和自動檢測微生物的生長情況,如通過計算機控制自動定量采集檢測對象,然后分析菌落的邊緣形態(tài),根據(jù)菌落的邊緣形態(tài)計算機可以顯示被檢測菌落的具體位置,并且根據(jù)動態(tài)關(guān)聯(lián)計算機視覺系統(tǒng)可以同時處理多個不同的樣品。郭培源等[25]人對計算機視覺技術(shù)用于豬肉的分級進行了研究,結(jié)果顯示計算機視覺技術(shù)在識別豬肉表面微生物數(shù)量上與國標(biāo)方法檢測的結(jié)果顯著相關(guān),該技術(shù)可以有效地計算微生物的數(shù)量。Bayraktar.B等[26]人采用計算機視覺技術(shù)、光散射技術(shù)(BARDOT)和模式識別技術(shù)相結(jié)合的方法來快速檢測李斯特菌,在獲取該菌菌落中的形態(tài)特征有,對圖像進行分析處理達到對該菌的分類識別。殷涌光等[27]人綜合利用計算機視覺、活體染色、人工神經(jīng)網(wǎng)絡(luò)、圖像處理等技術(shù),用分辨率為520萬像素的數(shù)字?jǐn)z像機拍攝細(xì)菌內(nèi)部的染色效果,并結(jié)合新的圖像處理算法,對細(xì)菌形態(tài)學(xué)的8個特征參數(shù)進行檢測,檢測結(jié)果與傳統(tǒng)檢測結(jié)果顯著相關(guān)(相關(guān)系數(shù)R=0.9987),和傳統(tǒng)檢測方法相比該方法具有操作簡單、快速、結(jié)果、適合現(xiàn)場快速檢測等特點。魯靜[28]和劉侃[29]利用顯微鏡和圖像采集儀器,獲取乳制品的掃描圖像,然后微生物的圖像特征和微生物數(shù)量進行識別,并以此作為衡量乳制品質(zhì)量是否達標(biāo)的依據(jù),并對產(chǎn)品進行分級。

2.4計算機視覺技術(shù)在其他食品產(chǎn)業(yè)中的應(yīng)用研究

里紅杰等[30]通過提取貝類和蝦類等海產(chǎn)品的形狀、尺寸、紋理、顏色等外形特征,對照數(shù)學(xué)模型,采用數(shù)字圖像處理技術(shù)、計算機識別技術(shù)實現(xiàn)了對貝類和蝦類等海產(chǎn)品的無損檢測和自動化分類、分級和質(zhì)量評估,并通過實例詳細(xì)闡述了該技術(shù)的實現(xiàn)方法,證實了此項技術(shù)的有效性。計算機視覺技術(shù)還可以檢驗玉米粒形和玉米種子質(zhì)量、識別玉米品種和玉米田間雜草[31]。晁德起等[32]通過x射線照射獲取毛葉棗的透視圖像后,運用計算機視覺技術(shù)對圖像進行分析評估,毛葉棗可食率的評估結(jié)果與運用物理方法測得的結(jié)果平均誤差僅為1.47%,因此得出結(jié)論:計算機視覺技術(shù)可以應(yīng)用于毛葉棗的自動分級。GokmenV等[33-34]通過對薯片制作過程中圖像像素的變化來研究薯片的褐變率,通過分析特色參數(shù)來研究薯片中丙烯酰胺的含量和褐變率的關(guān)系,結(jié)果顯示兩項參數(shù)相關(guān)性為0.989,從而可以應(yīng)用計算機視覺技術(shù)來預(yù)測加熱食品中丙烯酰胺的含量,該方法可以在加熱食品行業(yè)中得到廣泛應(yīng)用。韓仲志等[35]人拍攝和掃描11類花生籽粒,每類100顆不同等級的花生籽粒的正反面圖像,利用計算機視覺技術(shù)對花生內(nèi)部和外部采集圖像,并通過圖像對其外在品質(zhì)和內(nèi)在品質(zhì)進行分析,并建立相應(yīng)的數(shù)學(xué)模型,該技術(shù)在對待檢樣品進行分級檢測時的正確率高達92%。另外,郭培源等[36]人以國家標(biāo)準(zhǔn)為依據(jù),通過數(shù)字?jǐn)z像技術(shù)獲取豬肉的細(xì)菌菌斑面積、脂肪細(xì)胞數(shù)、顏色特征值以及氨氣等品質(zhì)指標(biāo)來實現(xiàn)豬肉新鮮程度的分級辨認(rèn)。

3展望

新技術(shù)的研究與應(yīng)用必然伴隨著坎坷,從70年代初計算機視覺技術(shù)在食品工業(yè)中進行應(yīng)用開始,就遇到了很多問題。計算機視覺技術(shù)在食品工業(yè)中的研究及應(yīng)用主要存在以下幾方面的問題。

3.1檢測指標(biāo)有限

計算機視覺技術(shù)在檢測食品單一指標(biāo)或者以一個指標(biāo)作為分級標(biāo)準(zhǔn)進行分級時具有理想效果,但以同一食品的多個指標(biāo)共同作為分級標(biāo)準(zhǔn)進行檢測分級,則分級結(jié)果誤差較大[37]。例如,Davenel等[38]通過計算機視覺對蘋果的大小、重量、外觀損傷進行分析,但研究結(jié)果顯示,系統(tǒng)會把花萼和果梗標(biāo)記為缺陷,還由于蘋果表面碰壓傷等缺陷情況復(fù)雜,造成分級誤差很大,分級正確率只有69%。Nozer[39-40]等以計算機視覺為主要技術(shù)手段,獲取水果的圖像,進而通過分析圖像來確定水果的形狀、大小、顏色和重量,并進行分級,其正確率僅為85.1%。

3.2兼容性差

計算機視覺技術(shù)針對單一種類的果蔬分級檢測效果顯著,但是,同一套系統(tǒng)和設(shè)備很難用于其它種類的果蔬,甚至同一種類不同品種的農(nóng)產(chǎn)品也很難公用一套計算機視覺設(shè)備。Reyerzwiggelaar等[41]利用計算機視覺檢查杏和桃的損傷程度,發(fā)現(xiàn)其檢測桃子的率顯著高于杏的。Majumdar.S等[42]利用計算機視覺技術(shù)區(qū)分不同種類的麥粒,小麥、燕麥、大麥的識別正確率有明顯差異。

3.3檢測性能受環(huán)境制約

現(xiàn)階段的計算機視覺技術(shù)和配套的數(shù)學(xué)模型適用于簡單的環(huán)境,在復(fù)雜環(huán)境下工作時會產(chǎn)生較大的誤差。Plebe等[43]利用計算機視覺技術(shù)對果樹上的水果進行識別定位,但研究發(fā)現(xiàn)由于光照條件以及周邊環(huán)境的影響,水果的識別和定位精度不高,不能滿足實際生產(chǎn)的需要。綜上所述,可看出國內(nèi)外學(xué)者對計算機視覺技術(shù)在食品工業(yè)中的應(yīng)用進行了大量的研究,有些研究從單一方面入手,有些研究綜合了多個學(xué)科,在研究和應(yīng)用的過程中,取得了較大的經(jīng)濟效益,也遇到了很多問題,在新的形勢下,計算機視覺技術(shù)和數(shù)碼拍攝、圖像處理、人工神經(jīng)網(wǎng)絡(luò),數(shù)學(xué)模型建設(shè)、微生物快速計量等高新技術(shù)相融合的綜合技術(shù)逐漸成為了各個領(lǐng)域?qū)W者的研究熱點,以計算機視覺為基礎(chǔ)的綜合技術(shù)也將在食品工業(yè)中發(fā)揮更加重要的作用。

作者:姚瑞玲 單位:四川工商職業(yè)技術(shù)學(xué)院

計算機視覺論文:雙目計算機視覺的自適應(yīng)識別算法及其監(jiān)控應(yīng)用

摘要:雙目計算機視覺是利用仿生學(xué)原理,通過標(biāo)定后的雙攝像頭來得到同步曝光圖像,然后計算獲取的2維圖像像素點的第3維深度信息。為了對不同環(huán)境場景進行監(jiān)控提出了一種新的基于雙目計算機視覺的自適應(yīng)識別算法。該算法首先利用像素點的深度信息對場景進行識別判斷,然后采用統(tǒng)計的方法為場景建模,并通過時間濾波克服光照漸變,以及通過深度算法特性克服光照突變。與單攝像頭監(jiān)控系統(tǒng)相比,利用該算法實現(xiàn)的視頻監(jiān)控原型系統(tǒng),可應(yīng)用于更多場合,并利用深度信息設(shè)置報警級別,來降低誤檢率。

關(guān)鍵詞:雙目計算機視覺 深度信息 自適應(yīng) 光照變化 視頻監(jiān)控

1、引 言

面對日益復(fù)雜的社會和政治環(huán)境,國家安全、社會安全、個人人生安全和財產(chǎn)安全等都面臨著不同程度的威脅,都需要各種安全保護措施,在眾多場所建立切實有效的安保措施,成為一個迫切的課題。本文提出了一種基于雙目計算機視覺的自適應(yīng)識別算法,將該算法應(yīng)用于現(xiàn)有的監(jiān)控系統(tǒng),并賦予監(jiān)控終端智能性,不僅使其脫離人而具有獨立智能、自主判斷的能力,而且使得視頻監(jiān)控系統(tǒng)在安防方面的作用大大提高。

在現(xiàn)有的背景建模方法中,大多對于背景象素點的亮度值,例如最小亮度值、較大亮度值和較大亮度差值[ 1 ] ,或是對顏色信息進行建模[ 2 ] 。對于背景的更新,一般使用自適應(yīng)濾波器對像素的統(tǒng)計特性進行遞歸更新,為了考慮到噪聲的影響,文獻[ 3 ]提出了Kalman濾波器的方法,該文認(rèn)為系統(tǒng)的信息可通過估計獲得。考慮到環(huán)境的動態(tài)緩慢改變,文獻[ 4 ]利用統(tǒng)計模型給背景建模,即由一個時域濾波器保留著一個序列均值和一個標(biāo)準(zhǔn)偏差,并通過濾波過程統(tǒng)計值隨時間改變來反映環(huán)境的動態(tài)特性。另外有一些方法解決了光照漸變等影響[ 5~7 ] ,但計算較復(fù)雜。

2、雙目計算機視覺深度算法

基于實際應(yīng)用考慮,攝像頭的數(shù)量關(guān)系著成本和計算量,所以選擇支持雙攝像頭(雙目視覺)的算法是最合適的。在支持雙目視覺的算法中,Princeton NEC research institute 基于較大流算法(maximum2flow)的計算機視覺算法( Stereo2MF)在深度效果平滑性上做得較好[ 8, 9 ] ,適用于監(jiān)控區(qū)域深度計算的應(yīng)用背景。但原有算法所需的計算量和計算過程中的暫存數(shù)據(jù)量是較大的,雖然支持計算量的削減,但只是機械地在一塊區(qū)域中選擇中心點來進行計算,這樣計算的結(jié)果會因選擇的機械性,而出現(xiàn)大量的“偽點”,這些偽點錯誤地表現(xiàn)了該區(qū)域的平均深度信息。本文采用統(tǒng)計平均值選取計算點,通過距離因子的Gauss分布將塊內(nèi)其他點的值融合計算,從而使得計算出的值較的代表了這一塊內(nèi)的大致深度分布。

m, n分別是圖像的長和寬所包含的像素點個數(shù),M、N 表示像素點的橫縱坐標(biāo), .d 是塊內(nèi)深度統(tǒng)計平均值, dM, N為計算點的深度值, q為距離因子, dB是計算所得的塊深度代表值。圖1為改進后雙目視覺深度算法與原算法識別效果比較。由圖1可以明顯看出,修改后的算法效果在細(xì)節(jié)表現(xiàn)、平滑性、偽點減少上均有明顯改善,而且深度計算度能夠滿足視頻

圖1 改進后雙目視覺深度算法與原算法識別效果比較Fig. 1Effect comparison after algorithm modification

度計算度能夠滿足視頻監(jiān)控應(yīng)用的需要。

3、自適應(yīng)識別算法

對于一個固定的場景,場景各像素點的深度值是符合一個隨機概率分布。以某一均值為基線,在其附近做不超過某一偏差的隨機振蕩,這種情況下的場景稱之為背景。而場景環(huán)境往往是動態(tài)變化的,如環(huán)境自然光的緩變,燈光的突然熄滅或點亮,以及運動對象的出現(xiàn)、運動和消失等。如果能識別出場景中的動態(tài)變化,就能自適應(yīng)的更新背景值,將光照的改變?nèi)诤系奖尘爸抵小1疚牟扇×擞媒y(tǒng)計模型的方式給每個像素點建模,而以像素點變化的分布情況來確定光照突變引起的深度突變,并結(jié)合深度計算本身特性,解決光照緩變突變引起的誤判問題,以及判別場景中對象的主次性。

3. 1 背景象素點的深度值建模

由于雙目計算機視覺算法得到的深度值,已經(jīng)是塊融合的,可以根據(jù)精度要求,來加大塊面積, 減少數(shù)據(jù)量。本文獲得的數(shù)據(jù)量只有原像素點的( k, l分別是塊的長和寬所包含的像素點個數(shù)) 。以統(tǒng)計的方法給每個像素點的深度值建模, 設(shè)為第u幀圖像的某個像素點的深度值, 其中u代表第u幀圖像, i, j分別代表像素點的橫坐標(biāo)和縱坐標(biāo)。由一個時間濾波器來保持該像素點深度值的序列均值和時間偏差

其中,α是一個可調(diào)增益參數(shù), 其與采樣頻率有關(guān)。通過濾波過程,來得到每個像素點的深度值基于時間的統(tǒng)計特性,由于這些統(tǒng)計特性反映了環(huán)境的動態(tài)特性,據(jù)此可以了解到是環(huán)境的光照發(fā)生了突變,還是有運動對象的運動。

3. 2 背景更新與場景識別

通過上述濾波過程,就可以將光照緩變?nèi)谌氲奖尘爸腥?實現(xiàn)背景的自適應(yīng)更新。而對于光照突變,此時幾乎所有的象素點的亮度值會同時增大或減小,但根據(jù)較大流算法的特性,同方向的變化對流量差不會引起太大變化, 而對深度計算結(jié)果只會引起較小的同方向變化。這種全局的等量變化, 可以認(rèn)為是光照突變引起的。

其中, a、b和c是3個可調(diào)節(jié)系數(shù),他們的取值可依據(jù)場景的情況及檢測光照突變的速度與誤差來進行選取。s, t分別是深度圖像的長和寬所包含的像素點個數(shù)。Q是符合式( 9)的像素點個數(shù)。一旦檢測到環(huán)境光照發(fā)生了突變, 就把背景點像素的深度序列均值,全部以當(dāng)前幀像素點的深度值的測量

值代替,而j以0取代,從而實現(xiàn)背景的及時更新。

如果式(10)式(12)中任意一個不成立的話,則認(rèn)為像素塊深度值的變化并非由光照突變引起, 而是場景中有運動對象出現(xiàn)。

4、算法分析與實驗

4. 1 算法復(fù)雜度

對于光照突變檢測,若有突變的話,則會立即檢測出來,當(dāng)有運動對象出現(xiàn)時, 并且式( 10)式( 12)都接近滿足時,處理會較慢,因為需要處理突變檢測和運動對象兩個過程。當(dāng)b取25% s ×t時的處理速度與變化點比例關(guān)系如圖2所示。

相對于一般的光強、灰度的識別檢測算法,本算法的優(yōu)勢在于不僅可以利用深度特性更容易地檢測到光照的漸變與突變, 而且可以判斷出現(xiàn)的多個運動對象的主次性。

4. 2 算法誤檢率

由于光照直接對于像素點的光強、灰度等產(chǎn)生影響,所以深度算法的噪聲容限更大,這樣可降低了誤檢率,多組實驗后得到的誤檢率對比圖如圖3所示。但是由于深度算法本身對于反光或者陰暗面會產(chǎn)生偽點,所以,某些時候由于光照突變中光源的位置變化而會誤檢為運動對象,為此算法還需進一步改進能判別偽點的出現(xiàn), 除去它在光照突變檢測中的影響。另外,公式中可調(diào)系數(shù)a, b, c的選取也會對不同場景產(chǎn)生影響。

筆者在實驗室環(huán)境下做了不同光照角度、不同環(huán)境光強度、不同運動物體的多組實驗,發(fā)現(xiàn)在反光面或是陰暗面較多的情況下,光照突變檢測不是很靈敏,而且會出錯,但是在增加系數(shù)a, c的值后, 誤檢率有所降低(如圖3所示) 。

5、基于算法的監(jiān)控系統(tǒng)

我們利用該算法實現(xiàn)了視頻監(jiān)控原型系統(tǒng)。計算機視覺算法對于攝像頭的同步曝光要求很高,所以本系統(tǒng)終端用一塊單獨的MCU (micro control unit)控制同步曝光。核心算法用DSP處理。系統(tǒng)結(jié)構(gòu)如圖4所示。實際系統(tǒng)原型圖如圖5所示。

6、結(jié) 論

利用深度信息做智能場景識別,是一種新的嘗試,有其優(yōu)勢。將這種方法應(yīng)用到智能視頻監(jiān)控中,能起到很好的效果,克服了其他方法較難處理的光照漸變和突變等問題。對比單攝像頭監(jiān)控系統(tǒng),該系統(tǒng)可應(yīng)用于更多場合。后續(xù)研發(fā)準(zhǔn)備在系統(tǒng)上加上更多功能,以適用于更多的環(huán)境,并與其他 保安類監(jiān)控系統(tǒng)互聯(lián),以組成一整套功能強大、達到國內(nèi)外水平的安防系統(tǒng)。

計算機視覺論文:基于計算機視覺的虛實場景合成方法研究與應(yīng)用

論文關(guān)鍵詞:虛擬現(xiàn)實 混合現(xiàn)實 計算機視覺

論文摘要 :開發(fā)了一種虛擬場景與實時視頻之間的合成技術(shù),成功地將該技術(shù)應(yīng)用于虛擬規(guī) 劃系統(tǒng)中,詳細(xì)介紹了系統(tǒng)所采用的基于計算機視覺的標(biāo)識識別和實時、自動攝像機位置、姿態(tài)跟蹤算法,并給出了系統(tǒng)運行結(jié)果。

0 引 言

虛擬現(xiàn)實技術(shù) 的最終目的是使用戶沉浸在一個 由計算機生成的虛擬環(huán)境中,該技術(shù)已經(jīng)被成功地應(yīng)用到軍事、教育、娛樂等眾多領(lǐng)域。隨著應(yīng)用 的增多 ,虛擬現(xiàn)實技術(shù) 的缺陷也逐漸暴露出來,主要表現(xiàn)在如下兩個方面:(1)虛擬現(xiàn)實 中的場景由計算機生成,隨著繪制場景真實程度的提高,對系統(tǒng)硬件配置的要求也相應(yīng)提高,從而形成了繪制效果和實時性兩個同等重要又難以同時解決 的問題 。(2)交互方式受限.鼠標(biāo)、鍵盤等傳統(tǒng)輸入設(shè)備并沒有提供給用戶一種直觀 自然的交互方式,而數(shù)據(jù)手套等較為昂貴的外圍設(shè)備不僅使用起來不方便,而且對工作范圍也有一定的限制。

混合現(xiàn)實 技術(shù)的出現(xiàn)很大程度上解決了以上兩個問題,它將計算機生成的虛擬場景、提示信息實時疊加到用戶所能觀察到的真實世界當(dāng)中,并以此來增強用戶視覺感受 。在混合現(xiàn)實環(huán)境中用戶所能觀察到的主體是來源于真實世界的圖像信息,虛擬場景只起到輔助、提示作用,因此不需要真實感圖形繪制所需的高端的硬件配置。另一方面,由于圖像信息來源于真實世界,這就使得用戶本身能夠很自然地融合到整個系統(tǒng)中,并且能夠 以一種 自然 、直觀的方式與系統(tǒng)交互,而不必添加額外的硬件設(shè)備。正是由于以上特性,混合現(xiàn)實技術(shù)已經(jīng)被應(yīng)用到眾多領(lǐng)域當(dāng)中,而且能夠比虛擬現(xiàn)實更好地完成某些任務(wù),如交互式規(guī)劃、動態(tài)虛擬展示等。

一個實用的混合現(xiàn)實系統(tǒng)所必須具備的特性之一是幾何一致性,即系統(tǒng)必須實時地判斷攝像機相對于真實世界的位置和姿態(tài).以便將虛擬場景正確地疊加到真實世界的具體位置上,使得用戶從感官上認(rèn)為虛擬場景確實是真實世界的一部分。傳統(tǒng)的方法是利用硬件設(shè)備(電磁式、機械式跟蹤系統(tǒng))來獲取攝像頭位置信息,但這些方法不僅工作范圍受限,而且求得的結(jié)果也不夠。本文采用當(dāng)前流行的基于計算機視覺的方法來獲取位置信息,事實證明該方法是有效、可行的。

系統(tǒng)結(jié)構(gòu)及工作流程

筆者構(gòu)建 了一個如圖 1所示的混合現(xiàn)實原型系統(tǒng),主要由如下幾個部分組成:(1)平面標(biāo)識塊:一個帶有黑色邊框的正方形.尺寸、內(nèi)部圖案由用戶定義,主要功能是使系統(tǒng)能夠根據(jù)實際圖像中標(biāo)識的變形來計算虛實配準(zhǔn)所需的位置、姿態(tài)信息,同時還可以用不同的內(nèi)部圖案代表不同的虛擬場景,以增強系統(tǒng)的實用性。(2)圖像采集設(shè)備(攝像機):主要完成實時視頻采集功能。(3)圖形渲染系統(tǒng):生成與視頻合成所需的虛擬場景。(4)虛實合成:利用攝像機位置、姿態(tài)信息將視頻與虛擬場景相融合。(5)顯示設(shè)備 :包括頭盔式顯示器以及桌面臺式顯示器,用以將虛實合成的影像展現(xiàn)給使用者。

系統(tǒng)運行過程中,首先將采集到的一幀彩色圖像轉(zhuǎn)換成一幅二值(黑 白)圖像,然后對該二值圖像進行連通域分析,找出其中所有的四邊形區(qū)域作為候選匹配區(qū)域,將每一候選區(qū)域與模板庫中的模板進行匹配,如果產(chǎn)生匹配,則認(rèn)為找到了一個標(biāo)識,在生成與該標(biāo)識對應(yīng)的虛擬場景的同時利用該標(biāo)識區(qū)域的變形來計算攝像機相對于已知標(biāo)識的位置和姿態(tài),根據(jù)得到的變換矩陣實現(xiàn)虛實之間的無縫融合。

2 標(biāo)識識別與攝像機位置、姿態(tài)跟蹤算法

由上一節(jié)可知,構(gòu)建該系統(tǒng)有兩個關(guān)鍵問題需要解決 ,即如何識別標(biāo)識內(nèi)部的不同圖案以生成與之對應(yīng)的虛擬場景 以及如何利用標(biāo)識的變形計算虛實配準(zhǔn)所需的坐標(biāo)變換關(guān)系。以下分別介紹以上兩個問題的解決方法。

2.1標(biāo)識識別

本系統(tǒng) 所采用的標(biāo)識識別方法可 以分為以下幾步。

2.1.1圖像二值化

首先對采集到的彩色圖像進行二值化,處理成黑白(0,1)圖像,如圖 2(b)。具體方法為:設(shè)定一個 閾值,對圖像進行遍歷 ,根據(jù)該閾值,對圖像重新賦值。為了克服光照對識別結(jié)果造成的影響,同時采用 了自適應(yīng)閾值法 來提高系統(tǒng)穩(wěn)定性,設(shè)定當(dāng)前 閾值 為上一幀圖像中標(biāo)識投影區(qū)域像素灰度的平均值,實驗證明該方法對改善系統(tǒng)性能有較為明顯的效果。

2.1.2連通域分析

連通域分析的 目的是從復(fù)雜背景中提取標(biāo)識的投影區(qū)域。分析過程為:查找所有像素值為 1的連通區(qū)域,首先根據(jù)大小約束對區(qū)域進行預(yù)篩選,然后利用最小二乘直線擬合法篩選出所有四邊形區(qū)域 ,結(jié)果見圖 2(c)。

2.1.3 區(qū)域規(guī)則化與模板匹配

區(qū)域規(guī)則化是將圖像中經(jīng)過投影變換的標(biāo)識區(qū)域變換到標(biāo)準(zhǔn)模板空間,本文利用仿射變換 將標(biāo)識經(jīng)過投影變形后 的區(qū)域直接映射到一個 64×64大小的正方形模板,效果見圖2(d)。接下來的工作是將規(guī)則化圖像與模板庫中的模板進行匹配,以返回代表不同虛擬場景的 id值。本文采用相關(guān)系數(shù)法來完成匹配工作,方法如下:

首先利用以下四式計算規(guī)則化圖像 i和標(biāo)準(zhǔn)模板圖像 p各自的均值和方差。

然后計算兩幅圖像的相關(guān)系數(shù) p,本文選擇所有模板中與規(guī)則化圖像具有較大相關(guān)系數(shù) p且 p>0.5的模板作為當(dāng)前匹配結(jié)果,并返回與之對應(yīng)的 id值

2.2攝像機位置、姿態(tài)估計

首先給出系統(tǒng)的坐標(biāo)變換關(guān)系如圖 3所示。規(guī)定平面標(biāo)識在世界坐標(biāo)系中的位置為已知,攝像機位置、姿態(tài)計算問題轉(zhuǎn)化為攝像機坐標(biāo)系與世界坐標(biāo)系之間三維變換矩陣的求解。

世界坐標(biāo) 系與攝像機坐標(biāo)系間的變換關(guān)系可以用式(5)表示。其中 w為世界坐標(biāo)系下某點坐標(biāo),c為該點在攝像機坐標(biāo)系中的位置,t :[r r r:t] 為待求三維變換矩陣,包含三個旋轉(zhuǎn)分量和一個平移分量。

c=t w (5)

由于規(guī)定平面標(biāo)識與世界坐標(biāo)系下的z:0平面重合 ,則由式 (5)可得 ,平面標(biāo)識上的某點在世界坐標(biāo)系下的坐標(biāo) wi=(x ,y wi,0,1) 與其在攝像機坐標(biāo)系下坐標(biāo) c;:(x y z i,1) 之間的關(guān)系可以表示為式(6)。

有 8個待定系數(shù),由標(biāo)識的 四個角點可得 如下 方程組 ,則可以求取以上 8個未知數(shù)。

通過上述計算可以確定變換矩陣中的 r ,r ,t,三個分量,由變換矩陣旋轉(zhuǎn)分量的正交性可以求得r :r ×r ,需要對所求得的結(jié)果作歸一化操作以消除比例因子 t 對計算結(jié)果的影響,方法是將(1 r l+l r 1)/2去除以上各分量。

事實上由于不可能避免成像畸變以及圖像處理過程中的誤差,上述方法求得的變換矩陣 t 是不夠的。解決方法是利用上述方法求取及時幀圖像對應(yīng)的 t ,在后續(xù)計算過程中采用非線性最小二乘法求取后續(xù)幀的對應(yīng)的變換矩陣。誤差逼近計算公式見式 (1 1)。

式中(文 i)(i=0,1,2,3)為根據(jù)上一幀t 求得的標(biāo)識四個角點在像平面坐標(biāo)系下的位置,(x i,y ;)(i=0,1,2,3)為實時檢測到的標(biāo)識角點在圖像中的位置。本 文利用勒溫伯格一馬闊特方法求解式(11)。

3 應(yīng)用實例——基于混合現(xiàn)實的小區(qū)規(guī)劃系統(tǒng)

傳統(tǒng)的住宅小區(qū)規(guī)劃方法之一是制作規(guī)劃方案模型,但是制作實體模型不僅費時費力,而且修改起來也極為不便。近年來,基于虛擬現(xiàn)實技術(shù)的小區(qū)規(guī)劃方法已經(jīng)逐漸為設(shè)計者所接受,它一定程度上解決了實體模型規(guī)劃方法的缺點,但是由于缺乏高效、自然的人機交互方式,使得規(guī)劃效果大打折扣。混合現(xiàn)實技術(shù)的出現(xiàn)為小區(qū)規(guī)劃提供了新的契機,它既繼承了虛擬現(xiàn)實技術(shù)的三維表現(xiàn)能力,又具有虛實結(jié)合的特點,能夠在真實的規(guī)劃場景中整合設(shè)計要素,給設(shè)計者和方案評估者以直觀的感受。

筆者利用本文方法開發(fā)了一套基于混合現(xiàn)實技術(shù)的虛擬小區(qū)規(guī)劃系統(tǒng)。系統(tǒng)中不同的標(biāo)識對應(yīng)不同的虛擬建筑模型,用戶可以在視線范圍內(nèi)隨意移動模型.從而實現(xiàn)不 同的規(guī)劃 方案 。運行效果 如圖4該系統(tǒng)滿足了小區(qū)規(guī)劃對虛實交互、人機交互的要求,充分體現(xiàn)出混合現(xiàn)實技術(shù)在小區(qū)規(guī)劃應(yīng)用中的優(yōu)勢。

4 結(jié)束語

本文設(shè)計 了一種基于計算機視覺的虛實場景合成方法,具有實時性好、可用性高等特點,當(dāng)前系統(tǒng)中存在的主要問題是虛擬場景與真實場景之間還沒有遮擋和碰撞關(guān)系 ,從 而影響 了系統(tǒng) 的真實感 ,下一步的工作是對虛實之問的遮擋和碰撞檢測問題展開研究。

計算機視覺論文:計算機視覺技術(shù)在科學(xué)教育的作用

摘要近年來,人們對技術(shù)科學(xué)教育問題產(chǎn)生了很大的困擾,因為正確的科學(xué)技術(shù)的傳承影響著祖國下一代科技的發(fā)展。正在此時,一種類似研究如何使系統(tǒng)從圖像或多維數(shù)據(jù)中“感知”的科學(xué),即計算機視覺技術(shù)迅速崛起,并被廣泛地應(yīng)用于各個領(lǐng)域。其中最重要的是一個基于BSD許可(開源)發(fā)行的跨平臺計算機視覺庫OpenCV,本文主要介紹的就是通過利用OpenCV中的相關(guān)算法,能夠帶來的巨大價值以及此項技術(shù)在現(xiàn)代科學(xué)教育方面所發(fā)揮的重要作用。

關(guān)鍵詞OpenCV;科學(xué)教育;推廣價值

1、OpenCV庫簡介

OpenCV是由Intel微處理器研究實驗室的視覺交互組開發(fā)的一個跨平臺計算機視覺庫,它的代碼都是開源的而且都經(jīng)過非常好的優(yōu)化,并且具有很好的移植性,可以根據(jù)需求導(dǎo)入到合適的環(huán)境中使用。它可以實現(xiàn)有關(guān)圖像識別與處理和計算機視覺技術(shù)方面的很多通用算法。它的優(yōu)勢是可以運行在當(dāng)代社會使用熱門的各大操作系統(tǒng)上,適用性強,還可以脫離外部庫而獨立運行。OpenCV的C和C++都是經(jīng)過優(yōu)化的開源代碼,采用靈活的接口,提升計算機的運行速度。其中包含的函數(shù)就有500多個,包括的種類有C和C++等。OpenCV因為免費面向市場,已經(jīng)被社會各界廣泛使用。現(xiàn)已應(yīng)用于人機互動、圖像識別、圖像分割、目標(biāo)追蹤、3D重建、機器視覺、結(jié)構(gòu)分析等數(shù)個領(lǐng)域。OpenCV主要包括以下幾個部分:①cxcore:核心功能模塊,包含一些基本函數(shù),運用于各種數(shù)據(jù)類型的計算。②cv:圖像處理和計算機視覺功能。③ml:機器學(xué)習(xí)模塊,主要內(nèi)容是分類器。④cvaux:包括大部分實驗性的函數(shù),例如ViewMorph-ing、三維跟蹤、PCA、HMM等。⑤Highgui:圖像界面接口,支持?jǐn)z像頭的讀取和轉(zhuǎn)換。

2、OpenCV處理圖像的功能

OpenCV中有很多的函數(shù),可以實現(xiàn)很多不同的功能,其中具有學(xué)習(xí)價值的部分就是圖像處理。處理圖像主要分為三部分:加載圖像,顯示圖像,處理圖像。

2.1加載圖像

不同類型的圖像有著不同的內(nèi)部結(jié)構(gòu)。我們需要根據(jù)圖像的結(jié)構(gòu)采用合適的方法將圖像文件中的數(shù)據(jù)讀入內(nèi)存。OpenCV中的cvLoadImage()函數(shù),可以加載圖像數(shù)據(jù)。而且圖像的格式不影響加載的效果,加載后它以一個指向IplImage結(jié)構(gòu)體的指針形式返回,大大方便了后續(xù)處理的過程。2.2顯示圖像加載圖像后需要通過函數(shù)使其顯示。cvNamedWindow()函數(shù)由HighGUI庫提供,它可以在屏幕上創(chuàng)建一個窗口,將圖像顯示出來。cvShowImage()函數(shù)的作用是在這個創(chuàng)建的窗口中顯示出加載過后的圖像。觀察圖像時經(jīng)常用到的重要函數(shù)還有可以使程序暫停的函數(shù)cvWaitKey(),以及用于釋放內(nèi)存的函數(shù)cvReleaseImage()和cvDestoryWindow(),掌握并運用這些函數(shù),就可以輕松的實現(xiàn)觀察圖像的功能。

2.3處理圖像

OpenCV中包含的多種函數(shù),可以達到圖像處理技術(shù)方面的很多效果,包括圖像灰度化函數(shù)cvtColor(),邊緣檢測函數(shù)Sobel()、Laplacian()、Canny(),其中Canny算子只能處理8位灰度圖,其余兩種8位32位都可以,合并梯度函數(shù)addWeighted(),放大縮小函數(shù)resize(),閾值化操作函數(shù)imshow()等等。適當(dāng)選用合適的函數(shù)并加以運用即可達到目標(biāo)所需。

3、OpenCV的推廣價值體現(xiàn)

OpenCV可以應(yīng)用在社會的各個領(lǐng)域,價值就體現(xiàn)在每個科學(xué)的產(chǎn)物當(dāng)中。舉個近在身邊的例子,隨著社會的發(fā)展,生活質(zhì)量的提高,人們的居住環(huán)境也在逐漸改善,樓層越蓋越高,無數(shù)摩天大樓,商業(yè)大廈群起而立,電梯已經(jīng)成為了我們?nèi)粘I钪斜夭豢缮俚墓ぞ摺1M管現(xiàn)在電梯的功能、質(zhì)量不斷地提升,但是仍然存在些許不足,當(dāng)我們在學(xué)校的教學(xué)樓內(nèi)等電梯時發(fā)現(xiàn)了一個問題,那就是在電梯使用的高峰期時,比如在上下課時段,有很多人都在同一樓層等電梯。但是此時只有一臺離該樓層最近的電梯會過來,而其余的電梯都會自動向其它叫梯樓層運行或是閑置。可是此時這一臺電梯只能容納有限數(shù)量的人,時常不能使所有人坐上電梯,這樣就無法滿足全部人的需求,由此就導(dǎo)致了有部分人無法及時地坐上電梯,需要繼續(xù)等候,而閑置的電梯又不能及時地被利用。這樣不僅不能合理地利用資源,反而浪費了許多不必要的時間。因此,我們想到可以通過利用圖像識別與處理的方法來彌補這個不足,首先通過硬件設(shè)備連接拍照捕獲候梯人像,后臺運行判斷出候梯人數(shù),然后運用語言編程來確定調(diào)動電梯的個數(shù),從而來達到實現(xiàn)自動控制每個電梯的運行的目的,使所有人都能在及時時間乘坐電梯。而上文中提到的OpenCV就可以完成這項艱巨的任務(wù)。我們將OpenCV導(dǎo)入編程環(huán)境,其次修改電梯工作系統(tǒng)的運行程序,將軟件與硬件設(shè)備相連通,這樣通過調(diào)度程序,就可以輕松高效地解決這個問題。使用這種方法,不僅可以節(jié)約人們的候梯時間,方便學(xué)生、老師上課,而且可以合理有效地調(diào)度電梯,使電梯的價值得到較大化。見微知著,OpenCV可以應(yīng)用在每個領(lǐng)域,對各界的發(fā)展起到推動作用,造福社會的科技發(fā)展,方便人們的生活。

4、科學(xué)教育存在的問題

在歷年的教學(xué)模式中,老師們往往會強調(diào)理論知識的重要性,但卻忽略了對學(xué)生使用動手能力的培養(yǎng),學(xué)生不能獨立完成實踐性的技術(shù)操作,也就是說教學(xué)模式缺乏實踐性。只有將理論與實踐相結(jié)合,才能實現(xiàn)知識價值的較大化,因此,應(yīng)當(dāng)在教學(xué)中配合著實踐課程,舉一反三,讓學(xué)生們更加深刻地學(xué)習(xí)和了解所學(xué)到的知識。而如今雖然一部分學(xué)校也開設(shè)了實踐課程,但也只是淺嘗輒止,并沒有過多地講授計算機技術(shù)實踐方面的知識,學(xué)生們也沒有真正擁有動手實踐能力,這使學(xué)生們的技術(shù)知識十分受限。雖然現(xiàn)在多數(shù)學(xué)生對計算機略懂一二,但是實際上僅僅會使用類似Word等簡單的軟件,而技術(shù)要求較高的一些軟件及工具卻全然不知,甚至對自己所學(xué)過的課程軟件的使用也是馬馬虎虎,這對于未來工作所需的能力來講,實在是九牛一毛。目前中學(xué)生使用電腦的重心更多放在了社交軟件和游戲上,很少有人利用計算機學(xué)習(xí)更多的技能,這對青少年的發(fā)展實在是利大于弊的,而且這樣也失去了計算機的正向價值。因此,我們應(yīng)該改變現(xiàn)有的教學(xué)模式,一邊教授理論知識,一邊配合指導(dǎo)學(xué)生動手操作,將理論與實踐相結(jié)合,也能讓學(xué)生更好地消化和吸收所學(xué)到的知識,并且引導(dǎo)學(xué)生正確使用計算機,發(fā)揮計算機的價值,讓學(xué)生們都能夠在計算機中獲得更多的知識。

5OpenCV開源算法庫在各個領(lǐng)域的實例化體現(xiàn)

OpenCV在醫(yī)學(xué)領(lǐng)域、軍事領(lǐng)域、安全防護領(lǐng)域等都有很大的重要意義。在醫(yī)學(xué)領(lǐng)域中,由于有了這個開源算法庫,我們可以盡可能地調(diào)用它,從而來進行圖像處理、對象檢測,讓醫(yī)生更好更快速觀測人體結(jié)構(gòu),及時發(fā)現(xiàn)病癥。在軍事領(lǐng)域中,大多數(shù)無人操作的機器運作,比如無人機飛行、水下無人駕駛儀、無人駕駛汽車等等,都需要用到OpenCV來對圖像進行處理,并進行分析,并且可以檢測出人眼看不到的事物,這是OpenCV能夠帶來人類的巨大的進步。在安全防護領(lǐng)域中,我們現(xiàn)實生活中常見的汽車的安全駕駛,房屋入侵的檢測、自動監(jiān)視報警系統(tǒng)等等,正是由于這些技術(shù),讓我們的環(huán)境更加安全,這都是我們生活中息息相關(guān)不可缺少的。現(xiàn)如今,國家的科學(xué)技術(shù)飛速發(fā)展,日益強盛,OpenCV的成績有目共睹,未來的發(fā)展需要科學(xué)技術(shù)的不斷推進,才能為祖國未來的其他事業(yè)提供強有力的后盾。

6OpenCV在科學(xué)教育中的作用

在文化改革的大背景下,文盲的概念早已從沒有文化轉(zhuǎn)變成了不會使用計算機。因為隨著科技的進步,計算機的使用已經(jīng)越來越廣泛,計算機已經(jīng)逐步取代了以往人工可以完成的許多工作,比如在超市生成的結(jié)賬單、用計算機控制動力系統(tǒng)的運行、人造衛(wèi)星軌跡的計算等等,這些都依賴于計算機強大的功能。計算機的推廣證明著我國科技的發(fā)展和人類文明的進步,由此可見,計算機技術(shù)知識的掌握對現(xiàn)代人來說是十分重要的。如果想要成為一個真正有技術(shù)、有能力的人才,就務(wù)必要熟練掌握計算機技術(shù)的使用。但是目前當(dāng)代社會的教育在計算機技術(shù)方面的內(nèi)容還不夠豐富。減壓政策開放以來,教育課時被壓縮,技術(shù)知識的傳輸也相應(yīng)減少,學(xué)生們的能力也因此日益下降。而科學(xué)教育,顧名思義,是使科學(xué)技術(shù)在教育過程中得以傳承。想要科學(xué)地教育學(xué)生,就必須要多多講授科學(xué)技術(shù)方面有關(guān)的知識。說到科學(xué)技術(shù),它的重點自然是計算機技術(shù),而OpenCV作為計算機視覺技術(shù)的核心,可以說也是計算機技術(shù)甚至科學(xué)教育中的一個重要部分。在教育中普及并傳承這個技術(shù)無疑可以提高學(xué)生們的技術(shù)水平。但是,相信有大多數(shù)的人在此之前從未聽說過計算機視覺技術(shù),也并不了解OpenCV庫,更加不會學(xué)習(xí)到與之有關(guān)的技術(shù)知識。在這樣嚴(yán)峻的形勢下,我們更應(yīng)該將類似OpenCV方面技術(shù)有關(guān)的知識通過教育傳遞下去。各大高校應(yīng)積極開展有關(guān)計算機的活動,開設(shè)與計算機技術(shù)有關(guān)的課程。這樣才能根據(jù)社會的需求來培養(yǎng)更多的綜合性人才。如果可以將其投入到現(xiàn)代教育當(dāng)中,定會使現(xiàn)在的教育事業(yè)更加輝煌,也能使祖國的未來更加璀璨。

計算機視覺論文:計算機視覺藝術(shù)在數(shù)字媒體的應(yīng)用

摘要:現(xiàn)階段,隨著社會經(jīng)濟水平的快速穩(wěn)定發(fā)展,人們不能夠滿足物質(zhì)方面的一些滿足,開始追求精神層面的追求。當(dāng)生活與科技緊密的聯(lián)系時,設(shè)計以及藝術(shù)應(yīng)該發(fā)展成為一個主流的趨勢,屬于有效滿足精神追求的一個關(guān)鍵環(huán)節(jié)。在本文中,簡單分析了計算機視覺原理,主要分析了數(shù)字媒體當(dāng)中視覺藝術(shù)的實際應(yīng)用,更好的讓人們感受到科技以及藝術(shù)所具有的魅力。

關(guān)鍵詞:視覺原理;計算機視覺藝術(shù);數(shù)字媒體;應(yīng)用

利用計算機所具有的視覺藝術(shù),大眾僅僅利用需要實施身體動作來直接性的操作以及控制,根本就不需要學(xué)習(xí)就能夠啟動以及進行一定的操作,這樣更加方便老年人以及兒童的實際操作。在數(shù)字媒體當(dāng)中,應(yīng)該對計算機視覺藝術(shù)進行充分利用,更加方便人們的實際操作,同時還能夠保障其更好的感受藝術(shù)方面所具有的魅力,讓群眾在足夠放松的時刻能夠?qū)?chuàng)作者的實際思想以及意圖進行充分的了解以及掌握,對藝術(shù)價值進行充分發(fā)揮,進而來有效提升藝術(shù)人文的實際價值。

1對計算機視覺原理進行分析

通常來講,計算機視覺還稱為機械視覺,屬于是機械來對人類視覺進行一定的模仿的光學(xué)識別系統(tǒng),利用光學(xué)系統(tǒng)、感應(yīng)器、光源等來實現(xiàn)物體定位、動作的追蹤以及視線的判斷等相關(guān)的功能。一般情況下,工程技術(shù)所運用的基本都是計算機視覺,當(dāng)有著一定的環(huán)境以及模式時,計算機視覺在進行持續(xù)性的工作時,能夠有效保障持續(xù)工作有著非常高的正確性以及性,還能夠?qū)θ斯げ豢梢酝瓿傻娜蝿?wù)進行很好的完成。當(dāng)計算機視覺在進行實際的工作過程中,最為基本的條件是先對映像進行處理,之后輸入模擬訊號,對數(shù)字影像進行一定的處理以及分析。實際的工作流程是:影像在攝入之后,應(yīng)該對其進行一定的強化,除去噪聲,之后對圖像特征進行一定的壓縮以及獲取。在對數(shù)據(jù)庫樣本進行一定的對比之后,對程序進行有效的分析以及判斷,做出有效的指令。

2對數(shù)字媒體當(dāng)中計算機視覺藝術(shù)的實際應(yīng)用進行分析

2.1藝術(shù)與計算機進行一定的融合時,應(yīng)該對動畫、聲音以及圖像等因素進行有效結(jié)合,在對藝術(shù)語言表現(xiàn)形式進行豐富的同時,應(yīng)該提高作品的感染力

在有些結(jié)合視覺藝術(shù)以及數(shù)字媒體時,應(yīng)該保障在對畫面進行觀看時,應(yīng)該有效的欣賞畫面,還可以有效的感受到聲色等。利用高度仿真的聽覺、觸覺以及視覺,保障大眾在進行玩游戲時,可以對虛擬世界進行真實的感受,還能夠利用動作以及肢體語言等來和計算機實現(xiàn)有效的交流。保障大眾不是對電影單獨的進行欣賞,還應(yīng)該更好的參與到其中,體會藝術(shù)的表演。

2.2在數(shù)字媒體當(dāng)中運用計算機視覺藝術(shù)能夠?qū)λ囆g(shù)的實際表達形式進行有效的豐富

隨著交互技術(shù)的逐漸成熟以及發(fā)展,讓該技術(shù)得到了有效的拓展以及廣泛的運用。運用交互技術(shù),應(yīng)該讓人們不受到被動的欣賞,應(yīng)該積極的參與到視覺藝術(shù)當(dāng)中,保障大眾的積極參與以及做出判斷,同能夠利用各種選擇來呈現(xiàn)出過程以及解決,對觀眾的興趣進行充分的調(diào)動,進而來有效提高大眾的參與積極性。

2.3在電子游戲當(dāng)中,運用計算機視覺藝術(shù),應(yīng)該在相對比較大型的電子游戲當(dāng)中進行計算機視覺技術(shù)的運用

在實際的游戲過程當(dāng)中,大部分的玩家基本上不再是僅僅運用鍵盤以及鼠標(biāo)來實施游戲,大部分都是利用身體行動來移動。通常情況下,機器利用攝像機部來對玩家的具體身體動作進行一定的捕捉,玩家能夠與機器相連接的手槍進行有效的操作,射中屏幕當(dāng)中的對象。同時,手機上的相對比較小型的電子游戲,僅僅需要手指來滑動屏幕,就能夠?qū)崿F(xiàn)實物的運動以及跳躍等,進而來躲避障礙。除此之外,僅僅需要稍微的傾斜一些收集,就能夠?qū)崿F(xiàn)人物兩側(cè)的奔跑,同時還能夠保障聲光效果,實現(xiàn)互動,具有非常大的震撼力,會在很大程度上促進大眾參與的積極性。

2.4分析數(shù)字媒體中計算機視覺技術(shù)的應(yīng)用,保障數(shù)字媒體技術(shù)有效表現(xiàn)藝術(shù)

同時在實用藝術(shù)以及純藝術(shù)當(dāng)中,也會運用到數(shù)字媒體,該技術(shù)能夠讓相對比較單純的個人視覺實現(xiàn)有效的創(chuàng)造,同時還能夠把藝術(shù)箱社會性視覺產(chǎn)品進行轉(zhuǎn)化,并得到一定的經(jīng)濟效益。同時,大眾能夠通過剪切以及拷貝等相關(guān)的方式來有效獲取視覺技術(shù),之后有效的轉(zhuǎn)化藝術(shù)資源,有效奠定了創(chuàng)作視覺藝術(shù)的基礎(chǔ)。現(xiàn)階段,大眾對于個性化以及獨特性有著逐漸提高的需求,在對相對比較獨特的視覺技術(shù)進行追求時,在一定程度上提高了評價視覺作品的標(biāo)準(zhǔn)。在數(shù)字媒體當(dāng)中運用計算機視覺技術(shù),會在很大程度上提高大眾對美的享受,保障大眾能夠充分感受到舒適以及愉快的感覺,同時還能夠得到審美方面的評價,在該過程當(dāng)中,不能夠參雜任何的因素,應(yīng)該讓計算機視覺因素僅僅對視覺美感以及視覺形式進行充分的追求,可以有效體現(xiàn)藝術(shù)的本質(zhì)。同時,數(shù)字媒體有著美方面的品格,有效結(jié)合計算機視覺藝術(shù),保障數(shù)字媒體藝術(shù)的美以及真。這個實際的運用過程能夠有效提升審美方面的機制,更好的領(lǐng)悟視覺藝術(shù)當(dāng)中所存在的美。

3結(jié)語

綜上所述,在數(shù)字媒體當(dāng)中,計算機視覺技術(shù)的運用,應(yīng)該有效結(jié)合圖像、動畫、聲音以及文本等多個因素,在對語言表現(xiàn)的具體形式進行一定的豐富時,應(yīng)該讓作品具有更大的感染力。除此之外,還應(yīng)該保障視覺技術(shù)有何足夠的光聲效果,利用一定的互動,會具有非常大的震撼能力,積極促進大眾的參與程度。還可以在很大程度上滿足大眾對于美方面的追求,進而對其所具有的藝術(shù)價值進行充分發(fā)揮,有效提升藝術(shù)所具有的人文價值。

計算機視覺論文:計算機視覺下圖像檢索技術(shù)分析

從某種角度來說,在計算機視覺領(lǐng)域,這類目標(biāo)圖像檢索的研究是具有一定的挑戰(zhàn)與現(xiàn)實意義。它以計算機模擬人的視覺為基礎(chǔ),對其中相關(guān)圖像的內(nèi)容予以描述。在此基礎(chǔ)上,以描述的特點為參照,在眾多圖像中尋找那些感興趣的目標(biāo)圖像。隨著計算機網(wǎng)絡(luò)技術(shù)不斷發(fā)展,它的應(yīng)用范圍逐漸擴大。比如,網(wǎng)絡(luò)圖像檢索、醫(yī)學(xué)圖像的挖掘、不良圖像的過濾。但就當(dāng)下計算機視覺下目標(biāo)圖像檢索技術(shù)研究的現(xiàn)狀來看,并不樂觀,還有很長的路要走。可見,對計算機視覺下的目標(biāo)圖像檢索技術(shù)予以分析是非常必要的。

1計算機視覺概述

1.1計算機視覺學(xué)概述

從某種意義上說,計算機視覺學(xué)是一門在20世紀(jì)60年代興起的新學(xué)科。它是一門邊緣學(xué)科,融入了很多學(xué)科的特點,具有很強的工程性特征。比如,圖像處理、應(yīng)用數(shù)學(xué)、光電技術(shù)。換個角度來說,計算機視覺同屬于工程領(lǐng)域、科學(xué)領(lǐng)域。

1.2計算機視覺的應(yīng)用

計算機視覺的應(yīng)用能夠使計算機具有和人一樣的視覺功能。在生活和生產(chǎn)過程中,照片資料、視頻資料的處理是計算機視覺應(yīng)用的主要方面。比如,在航空事業(yè)方面,對衛(wèi)星照片的翻譯;在醫(yī)學(xué)領(lǐng)域中,主要用于輔助性方面的診斷;在工業(yè)生產(chǎn)方面,由于各種復(fù)雜因素的影響,計算機視覺在這方面的應(yīng)用顯得特別簡單,有利于相關(guān)系統(tǒng)的實際構(gòu)成。

2目標(biāo)圖像檢索存在的問題

從某種角度來說,目標(biāo)圖像檢索需要分為特征匹配、特征提取兩個方面。它們表達了不同的含義。對于特征提取來說,它是圖像進行檢索的及時步,其提取結(jié)果會對進一步的研究造成直接的影響。而對于特征匹配來說,其匹配的度會直接影響圖像檢索系統(tǒng)的返回結(jié)果。但在目標(biāo)圖像檢索完善的過程中,遇到一些問題阻礙了這兩個方面的完善。因此,本文作者對其中的一些予以了相關(guān)的探討。

2.1環(huán)境因素不斷變化

對于目標(biāo)圖像來說,環(huán)境因素是影響其率的重要因素。同時,在復(fù)雜混亂的環(huán)境中,由于受到眾多干擾物的影響,加上部分目標(biāo)圖像區(qū)域被遮蓋,致使目標(biāo)圖像信息不夠,使目標(biāo)物體特征的提取難度進一步加大。

2.2圖像噪聲的影響

子為了更好地模仿生活中的圖像檢索,數(shù)據(jù)庫中的圖像也會隨之發(fā)生一系列的變化。比如,尺度、角度、光照。而其中圖像噪音的影響會使目標(biāo)物體的外觀發(fā)生對應(yīng)的變化。在此基礎(chǔ)上,嚴(yán)重降低了目標(biāo)圖像信息獲取的度。

2.3目標(biāo)圖像檢索訓(xùn)練數(shù)據(jù)的自動標(biāo)注

由于處于網(wǎng)絡(luò)中的圖像資源信息過于繁多,需要采用手工的方式對它們進行標(biāo)注。但這種方法非常浪費時間,率也比較低。很顯然,這就需要目標(biāo)檢索圖像能夠具有自動標(biāo)注的能力。實際上,圖像檢索方法過分依賴人工標(biāo)注信息。而這些信息很多收到來自各方面因素的影響。比如,認(rèn)識差異因素、個人經(jīng)驗。以至于對圖像產(chǎn)生誤解。

3基于計算機視覺下的目標(biāo)圖像檢索技術(shù)

3.1以多尺度視覺為紐帶的目標(biāo)圖像檢索方法

該種目標(biāo)檢索技術(shù)的應(yīng)用主要是為了提高目標(biāo)圖像檢索的率,能夠?qū)崿F(xiàn)目標(biāo)圖像訓(xùn)練數(shù)據(jù)的自動化標(biāo)注。該類技術(shù)主要是用于那些沒有遮擋,不需要進行監(jiān)督的目標(biāo)圖像檢索方面。具體來說,它需要經(jīng)過一系列的訓(xùn)練。在訓(xùn)練的過程中,以統(tǒng)計學(xué)習(xí)為紐帶,對相應(yīng)多尺度的目標(biāo)檢測模型進行適當(dāng)?shù)挠?xùn)練。在此基礎(chǔ)上,以該模型為基點,對圖像中那些顯著性的區(qū)域進行合理地提取。比如,該區(qū)域的亮度、顏色。,需要對用于該實驗研究中的概率潛在語義分析模型進行合理地利用。總之,利用這種檢索方法可以對圖像中那些顯著目標(biāo)所處的區(qū)域自動進行檢測。同時,對其中目標(biāo)圖像的顯著性進行合理地排序,能夠提高檢索引擎所返回圖像結(jié)果的度。

3.2以彩色LBP局部紋理特點為媒介的目標(biāo)圖像檢索方法

這種目標(biāo)圖像檢索方法能夠有效地解決圖像信息采集過程圖像噪聲以及其它相關(guān)因素對所提取紋理特征的影響,提高了圖像目標(biāo)的率。對于這種圖像目標(biāo)檢索方法來說,它把圖像彩色空間特征和簡化的LBP特征有機地相融合。在此基礎(chǔ)上,該類方法增加了光照的不變特性,卻保留了LBP局部的旋轉(zhuǎn)特點。在提高圖像檢索速度方面,主要是利用原來的LBP特征來丟失其中的彩色信息。以此,使其中的特征維度能夠在一定程度上降低。同時,這種目標(biāo)圖像檢索方法的應(yīng)用可以使對應(yīng)計算方法的難度得以降低,還能對角度等變化狀態(tài)下的目標(biāo)圖像進行地識別以及檢索。

3.3以視覺一致性為橋梁的目標(biāo)圖像檢索方法

從某個角度來說,它的應(yīng)用主要是為了提高圖像搜索引擎的返回效果,使局部噪聲圖形具有更高的顯著性特征。一是:站在客觀的角度,對搜索引擎返回結(jié)果的目標(biāo)顯著圖予以的計算。此外,還要對其中的目標(biāo)顯著系數(shù)進行適當(dāng)?shù)剡^濾。二是:以所有圖像為基點,以顯著目標(biāo)為導(dǎo)向,采取視覺一致性的模式。三是:以視覺一致性為基礎(chǔ),對其中的不同目標(biāo)圖像信息進行客觀地分類。這種以視覺一致性為核心的方法能夠有效地提高圖像檢索結(jié)果的率。更重要的是,在提高圖像搜索引擎檢索性能的同時,能夠及時為用戶選出的圖像信息。而這些信息資源和用戶尋找的主題信息密切相關(guān)。

4結(jié)語

總而言之,在新時代下,基于計算機視覺下目標(biāo)圖像檢索技術(shù)的研究與實踐應(yīng)用有著非常深遠(yuǎn)的意義。這些檢索方法的應(yīng)用能夠有效地解決目標(biāo)圖像檢索存在的問題。以此,使我國在該方面的研究不斷完善,更好地發(fā)揮自身的實踐價值。同時,在信息大爆炸的時代,成為人們及時而有效獲取目標(biāo)圖像資源信息道路上重要的基石。,作者希望本文在豐富廣大讀者朋友們內(nèi)心世界的同時,也能喚起他們對此的思考以及展望。

作者:單位:海口經(jīng)濟學(xué)院

計算機視覺論文:計算機視覺教學(xué)改革分析

人類從外界獲取的信息中70-80%來源于視覺,因此,使計算機具備人類視覺的功能具有巨大的應(yīng)用價值。近年來,計算機視覺技術(shù)市場前景明朗,需求日趨廣泛,計算機視覺領(lǐng)域工程師人才供不應(yīng)求。在此背景下,國內(nèi)外高校大多都開設(shè)了這門課程,深受學(xué)生歡迎。傳統(tǒng)計算機視覺課程根據(jù)Marr理論框架,圍繞由2D圖像獲取3D信息的基礎(chǔ)理論展開教學(xué)。通常,計算機視覺的目標(biāo)設(shè)定為獲取3D場景的有用信息,如深度、結(jié)構(gòu)、運動、表面朝向等。經(jīng)過多年工程碩士及本科教育發(fā)現(xiàn),以工程應(yīng)用能力培養(yǎng)為目標(biāo)的工程師培養(yǎng)中,傳統(tǒng)計算機視覺教學(xué)中尚存在如下問題:

(1)課程內(nèi)容方面:工程應(yīng)用價值較小的內(nèi)容居多;具備工程應(yīng)用價值的方法,如基于結(jié)構(gòu)光的3D信息獲取,在課程內(nèi)容中卻極少出現(xiàn)。

(2)課程定位方面:現(xiàn)有課程體系中未能體現(xiàn)近期研究成果,而掌握世界近期工程應(yīng)用成果是工程師的基本要求之一。

(3)教學(xué)形式方面:傳統(tǒng)計算機視覺課程側(cè)重基本原理,盡管范例教學(xué)被引入到課堂教學(xué)中,在一定程度上幫助學(xué)生理解,但工程師培養(yǎng)目標(biāo)是培養(yǎng)學(xué)生解決實際工程問題的能力。針對工程師培養(yǎng)目標(biāo),以及目前計算機視覺課程中存在的問題,本文提出工程應(yīng)用導(dǎo)向型的課程內(nèi)容、面向近期成果的課程定位、理論實例化與工程實踐化的教學(xué)形式,以培養(yǎng)具有扎實理論基礎(chǔ)及工程實踐能力的工程師。

1工程應(yīng)用導(dǎo)向型的課程內(nèi)容傳統(tǒng)計算機視覺課程圍繞Marr理論框架展開教學(xué),其中部分原理僅在理想狀態(tài)或若干假設(shè)下成立,不能直接運用到工程實踐中。近年來已具備工程應(yīng)用基礎(chǔ)的原理及方法,在傳統(tǒng)課程內(nèi)容中較少出現(xiàn),如已在工業(yè)測量、視頻監(jiān)控、游戲娛樂等領(lǐng)域中應(yīng)用的主動式三維數(shù)據(jù)獲取方法等。我們對工程應(yīng)用價值高的課程內(nèi)容,增加課時,充分講解其原理及算法,并進行工程實例分析;對工程應(yīng)用價值較低內(nèi)容,壓縮課時,以介紹方法原理為主。例如,在教授3D信息獲取部分時,課時主要投入到工程應(yīng)用價值較大的內(nèi)容,如立體視覺、運動恢復(fù)結(jié)構(gòu)、基于結(jié)構(gòu)光的3D信息獲取等;而對于基于陰影的景物恢復(fù)等缺乏應(yīng)用基礎(chǔ)的內(nèi)容主要介紹其基本原理,并引導(dǎo)學(xué)生進行其工程應(yīng)用的可行性分析,培養(yǎng)學(xué)生縝密的思維習(xí)慣,訓(xùn)練學(xué)生辯證的分析能力。

2面向近期成果的課程定位計算機視覺近十年來發(fā)展迅速,新方法和新理論層出不窮,在現(xiàn)有課程體系中未能得以體現(xiàn)。跟進世界近期成果是工程師的基本要求之一,因此計算機視覺課程定位應(yīng)當(dāng)面向國際近期成果。為實現(xiàn)這一目標(biāo),我們主要從以下兩方面入手。

(1)選用涵蓋近期成果的教材。我們在教學(xué)中加入國際近期科研成果及應(yīng)用范例,在教材選取上采用2010年RichardSzeliski教授所著《Computervision:algorithmsandapplications》作為參考教材。該書是RichardSzeliski教授在多年MIT執(zhí)教經(jīng)驗及微軟多年計算機視覺領(lǐng)域工作經(jīng)驗基礎(chǔ)上所著,涵蓋計算機視覺領(lǐng)域的主要科研成果及應(yīng)用范例,參考文獻近期引用至2010年。這是目前近期的計算機視覺著作之一,條理清晰,深入淺出,特點在于對計算機視覺的基本原理介紹非常詳盡,算法應(yīng)用緊跟國際前沿。

(2)強化學(xué)生調(diào)研及自學(xué)能力。“授之以魚”,不如“授之以漁”。在教授學(xué)生的同時,更重要的是培養(yǎng)學(xué)生調(diào)研、跟蹤、學(xué)習(xí)并分析國際近期科研及工程應(yīng)用成果的能力。為強化學(xué)生的知識結(jié)構(gòu),培養(yǎng)學(xué)生跟蹤國際前沿的能力,我們在教學(xué)中加入10%的課外學(xué)時,指導(dǎo)每位學(xué)生完成最近三年本領(lǐng)域的國際近期文獻調(diào)研及工程應(yīng)用新技術(shù)調(diào)研,并撰寫相關(guān)調(diào)研論文。同時,設(shè)置2學(xué)時課內(nèi)學(xué)時,讓每位學(xué)生介紹調(diào)研成果,并進行課堂討論。在調(diào)研基礎(chǔ)上,選擇相關(guān)算法進行了實驗證明,進一步強化學(xué)習(xí)成果。實踐證明,由于學(xué)生能夠根據(jù)自己的興趣,選擇本領(lǐng)域感興趣的課題進行深入調(diào)研,極大地調(diào)動了學(xué)生的積極性,強化了學(xué)生調(diào)研、跟蹤、學(xué)習(xí)并分析國際近期科研及工程應(yīng)用成果的能力。

3工程實踐化的教學(xué)形式我們在教學(xué)中提出工程實踐化的教學(xué)形式,即以人類視覺功能為背景,由相應(yīng)工程實例引出相關(guān)理論,并最終將理論運用到工程實例中的算法和方法傳授給學(xué)生。

(1)工程實例化的理論講解。在工程實例的系統(tǒng)功能基礎(chǔ)上,提出教學(xué)內(nèi)容的命題;在關(guān)鍵技術(shù)及難點基礎(chǔ)上,講解基本原理及方法。在教學(xué)過程中,不斷穿插眾所周知的實例。例如,講解攝像機模型時,由“近大遠(yuǎn)小”的原理,解釋青少年流行拍攝的“大頭照”,從上而下俯拍容易拍出視覺更美的“錐子臉”;由過近拍照產(chǎn)生面部變形,解釋鏡頭原理及畸變現(xiàn)象。科學(xué)研究發(fā)現(xiàn),大學(xué)生課堂注意力平均為10-15分鐘。課堂教學(xué)質(zhì)量的優(yōu)劣關(guān)鍵取決于教學(xué)效率,因此,抓住學(xué)生注意力至關(guān)重要。經(jīng)過我們的教學(xué)實踐發(fā)現(xiàn),大量學(xué)生熟悉并感興趣的實例引入后,學(xué)生的注意力會即時迅速提高,興趣大大提升。

(2)理論的工程實踐化。工程師培養(yǎng)的關(guān)鍵是利用所學(xué)算法與方法解決實際工程問題的能力。計算機視覺課程中介紹的方法大部分基于理想狀況的假設(shè)。在工程實踐中,生搬硬套將出現(xiàn)錯誤。因此,培養(yǎng)學(xué)生將理論進行工程實踐,是工程師培養(yǎng)中必不可少的一個環(huán)節(jié)。該過程不僅可以鍛煉學(xué)生的動手能力,更重要的是引導(dǎo)學(xué)生認(rèn)識到理論知識與工程應(yīng)用的距離,提煉并解決理論結(jié)合實際時需解決的關(guān)鍵問題。同時,工程應(yīng)用中遇到的問題,往往不是一門課程內(nèi)的知識可以解決的,需協(xié)同多門課程知識。這樣,可培養(yǎng)學(xué)生通匯貫通課程及相關(guān)領(lǐng)域知識,解決問題的能力。我們依托計算機視覺與模式識別實驗室多年來在該領(lǐng)域的研究基礎(chǔ)與實驗條件,對學(xué)生的工程實踐能力進行配套培養(yǎng)。主要包括兩個策略:利用10%的課內(nèi)學(xué)時,選取相關(guān)經(jīng)典工程實踐實驗,指導(dǎo)學(xué)生獨立完成;利用10%的課外學(xué)時,指導(dǎo)學(xué)生調(diào)研近期科研成果,指導(dǎo)學(xué)生分組完成仿真實驗。實踐證明,該過程加深了學(xué)生對理論的理解,大大提高了學(xué)生的成就感、學(xué)習(xí)興趣及工程實踐能力。4結(jié)論本文提出的計算機視覺課程教學(xué)方法是經(jīng)過多年工程型碩士及本科教學(xué)實踐探索的經(jīng)驗所得,并在三個班次進行了教學(xué)實踐。工程應(yīng)用導(dǎo)向型的課程內(nèi)容緊貼實際,所學(xué)即所用,極大地增強了學(xué)生的學(xué)習(xí)興趣及動手樂趣;面向近期成果的課程定位緊跟計算機視覺的技術(shù)發(fā)展,培養(yǎng)學(xué)生調(diào)研、跟蹤、學(xué)習(xí)并分析國際近期科研及工程應(yīng)用成果,開闊學(xué)生眼界和思路;理論實例化與工程實踐化的教學(xué)形式,注重理論聯(lián)系實際的能力培養(yǎng)。教學(xué)實踐表明,上述方法對培養(yǎng)具有扎實理論基礎(chǔ)、理論結(jié)合實踐的工程實踐能力的工程師,起到了有別于傳統(tǒng)計算機視覺教學(xué)的良好效果。

計算機視覺論文:計算機視覺在交通領(lǐng)域的運用

近年來,隨著科技水平的提高,計算機視覺技術(shù)逐漸被人們熟知并廣泛應(yīng)用。相較于其他傳感器來說,視覺能獲得更多的信息。因此,在我國交通領(lǐng)域中,也對計算機視覺技術(shù)進行研究完善,將計算機視覺技術(shù)應(yīng)用在交通領(lǐng)域各個方面中,并取得了顯著的成效。

1計算機視覺的概述及基本體系結(jié)構(gòu)

1.1計算機視覺概述

通過使用計算機和相關(guān)設(shè)備,對生物視覺進行模擬的方式,就是計算機視覺。對采集到的圖片或視頻進行相應(yīng)的技術(shù)處理,從而獲得相應(yīng)的三維信息場景,是計算機視覺的主要任務(wù)。計算機視覺是一門學(xué)問,它就如何通過計算機和照相機的運用,使人們獲得被拍攝對象的數(shù)據(jù)與信息所需等問題進行研究。簡單的說,就是讓計算機通過人們給其安裝上的“大腦”和“眼睛”,對周圍環(huán)境進行感知。計算機視覺是一門綜合性學(xué)科,在各個領(lǐng)域都有所作為,已經(jīng)吸引了各個領(lǐng)域的研究者對其研究。同時,計算機視覺也是科學(xué)領(lǐng)域中一個具有重要挑戰(zhàn)性的研究。

1.2計算機視覺領(lǐng)域基本體系結(jié)構(gòu)

提出及時個較為完善的視覺系統(tǒng)框架的是Marr,他從信息處理系統(tǒng)角度出發(fā),結(jié)合圖像處理、心理物理學(xué)等多領(lǐng)域的研究成果,提出被計算機視覺工作者基本接受的計算機視覺系統(tǒng)框架。在此基礎(chǔ)上,研究者們針對視覺系統(tǒng)框架的各個角度、各個階段、各個功能進行分析研究,得出了計算機視覺系統(tǒng)的基本體系結(jié)構(gòu),如圖1。

2計算機視覺在交通領(lǐng)域的應(yīng)用

2.1牌照識別

車輛的身份是車輛牌照。在檢測違規(guī)車輛、稽查被盜車輛和管理停車場工作中,車輛牌照的有效識別與檢測具有重要的作用和應(yīng)用價值。然而在實際應(yīng)用工作中,雖然車牌識別技術(shù)相對成熟,但是由于受到拍攝角度、光照、天氣等因素的影響,車牌識別技術(shù)仍需改善。車牌定位技術(shù)、車牌字符識別技術(shù)和車牌字符分割技術(shù)是組成車牌識別技術(shù)的重要部分。

2.2車輛檢測

目前,城市交通路口處紅綠燈的間隔時間是固定不變的,但是受交通路口的位置不同、時間不同的影響,每個交通路口的交通流量也是持續(xù)變化的。此外,對于某些交通區(qū)域來說,公共資源的配備,比如交通警察、交通車輛的數(shù)量是有限的。如果能根據(jù)計算機視覺技術(shù),對交通路口的不同時間、不同位置的交通情況進行分析計算,并對交通流量進行預(yù)測,有利于為交通警察縮短出警時間、為交通路口的紅綠燈根據(jù)實際情況設(shè)置動態(tài)變化等技術(shù)提供支持。

2.3統(tǒng)計公交乘客人數(shù)

城市公共交通的核心內(nèi)容是城市公交調(diào)度問題,一個城市如何合理的解決公交調(diào)度問題,是緩解城市運力和運量矛盾,緩解城市交通緊張的有效措施。城市公交調(diào)度問題,為公交公司與乘客的平衡利益,為公交公司的經(jīng)濟利益和社會效益的提高做出了巨大的貢獻。由于在不同的地域、不同的時間,公交客流會存在不均衡性,高峰時段的公交乘客過多,平峰時段的公交乘客過少,造成了公交調(diào)度不均衡問題,使有限資源浪費嚴(yán)重。在計算機視覺智能公交系統(tǒng)中,自動乘客計數(shù)技術(shù)是其關(guān)鍵技術(shù)。自動乘客計數(shù)技術(shù),是對乘客上下車的時間和地點自動收集的最有效的技術(shù)之一。根據(jù)其收集到的數(shù)據(jù),從時間和地點兩方面對客流分析,為城市公交調(diào)度進行合理的安排。

2.4對車道偏離程度和駕駛員工作狀態(tài)判斷

交通事故的發(fā)生率隨著車輛數(shù)量的增加而增加。引發(fā)交通事故的重要因素之一就是駕駛員疲勞駕駛。據(jù)相關(guān)數(shù)據(jù)顯示,因車道偏離導(dǎo)致的交通事故在40%以上。其中,駕駛員的疲勞駕駛就是導(dǎo)致車道偏離的主要原因。針對此種現(xiàn)象,為減少交通事故的發(fā)生,計算機視覺中車道偏離預(yù)警系統(tǒng)被研究開發(fā)并被廣泛應(yīng)用。針對駕駛員眨眼頻率,利用計算機視覺對駕駛員面部進行圖像處理和分析,再根據(jù)疲勞駕駛關(guān)注度與眨眼頻率的關(guān)系,對駕駛員的工作狀態(tài)進行判斷。此外,根據(jù)道路識別技術(shù),對車輛行駛狀態(tài)進行檢測,也是判斷駕駛員工作狀態(tài)的方法之一。這兩種方法,是目前基于計算機視覺的基礎(chǔ)上,檢測駕駛員疲勞狀態(tài)的有效方法。

2.5路面破損檢測

最常見的路面損壞方式就是裂縫。利用計算機視覺,及時發(fā)現(xiàn)路面破損情況,并在其裂縫程度嚴(yán)重之前進行修補,有利于節(jié)省維護成本,也避免出現(xiàn)路面坍塌,車輛凹陷的情況發(fā)生。利用計算機視覺進行路面檢測,相較于之前人工視覺檢測相比,有效提高了視覺檢測的效率,增強了自動化程度,提高了安全性,為市民的出行安全帶來了更高保障。

3結(jié)論

本文從計算機視覺的概述,及計算機視覺基本體系結(jié)構(gòu),和計算機視覺在交通領(lǐng)域中的應(yīng)用三面進行分析,可見計算機視覺在交通領(lǐng)域中的廣泛應(yīng)用,在交通領(lǐng)域中應(yīng)用的有效性、顯著性,以此可得計算機視覺在現(xiàn)展過程中的重要性。隨著計算機視覺技術(shù)的越來越成熟,交通領(lǐng)域的檢測管理一定會加嚴(yán)格,更加安全。

作者:夏棟 單位:同濟大學(xué)軟件學(xué)院

計算機視覺論文:計算機視覺交互技術(shù)在企業(yè)日常工作中的應(yīng)用

摘要:在現(xiàn)代企業(yè)的新產(chǎn)品開發(fā),市場調(diào)研數(shù)據(jù)分析報告等集體智力活動當(dāng)中需要很多的可視化的展示與溝通工作。目前很多情況下企業(yè)往往是采用傳統(tǒng)的PPT方式進行,這些PPT中大部分動畫都是單向無實時交互的。隨著現(xiàn)代計算機視覺識別和交互技術(shù)的發(fā)展,可以設(shè)計更好的交互展示系統(tǒng),幫助企業(yè)改善復(fù)雜問題的溝通。

關(guān)鍵詞:計算機技術(shù);視覺識別技術(shù);交互技術(shù);會議展示;智能辦公環(huán)境

在日常的企業(yè)辦公管理活動中,有很多時候需要可視化地展示企業(yè)市場計劃、新產(chǎn)品設(shè)計、數(shù)據(jù)分析報告等。盡管這些活動所需要的材料在事前可以經(jīng)由辦公自動化軟件處理,但處理結(jié)果卻很大程度上只能由靜態(tài)的PPT展示和說明。但很多時候,這些展示和說明往往是多個部門不同專業(yè)背景的人員參與,于是展示材料制作的水平和質(zhì)量就很大程度上影響到了參與者對所展示內(nèi)容的理解和吸收程度。很多復(fù)雜的問題或者設(shè)計的展示,如果能采用互動交互的方式展示,在很大程度上能夠幫助問題討論的參與者對所討論問題更好的理解。這一點在常規(guī)的教育過程中已經(jīng)獲得了充分的證實,相關(guān)的數(shù)據(jù)和結(jié)果可以從多媒體教學(xué)的優(yōu)勢的相關(guān)研究中得到。同樣,企業(yè)中很多方案的討論,數(shù)據(jù)分析報告的說明其實對于企業(yè)而言也是一個方案設(shè)計者或數(shù)據(jù)研究分析者對相關(guān)人員類似教學(xué)的過程。采用現(xiàn)有企業(yè)常規(guī)會議設(shè)備諸如投影儀、普通筆記本電腦、電腦攝像頭配合相應(yīng)的計算機視覺識別程序,我們可以將交互的投影演示引入到企業(yè)日常的展示討論活動中,增強溝通效果,提高工作效率,并且在技術(shù)上同樣的識別交互的程序配合上相應(yīng)的員工面部特征的數(shù)據(jù)庫,還能擴展延伸到考勤或門禁系統(tǒng)中提供更加智能化的辦公環(huán)境。對于以展示溝通為主的教育培訓(xùn)企業(yè),通過配合一般人臉數(shù)據(jù)特征,可以通過攝像頭捕捉現(xiàn)場視頻并識別其中人臉識別,記錄現(xiàn)場關(guān)注展示內(nèi)容的人員的數(shù)量,作為日后教學(xué)效果的自然客觀的評估參考。

1目前辦公信息化中存在的問題

1.1會議演示文稿展示時多人交互型差

目前主流的演示文稿制作及展示軟件主要大多都集成在套裝的辦公軟件中,其中主要常見的種類分別是MicrosoftOffice系列中的PowerPoint、MacOS系統(tǒng)下的KeyNote、基于Linux操作系統(tǒng)的Openoffice中的Impress。它們主要的功能都是對輸入的文字、圖片聲音等多媒體進行編輯制作生成電腦上播放的多媒體幻燈片,盡管它們都具有強大的多媒體數(shù)據(jù)的處理能力,但最終制作的多媒體幻燈片在演示時都是“單向交互”的,即由播放者播放,而其中的內(nèi)容及動畫按預(yù)先設(shè)計好的模式顯示。如果使用Adobe公司的Captivate或Authware這樣的多媒體交互制作軟件則會需要有專人進行操作,浪費大量的時間和精力,但如果是配置專門的多點觸摸屏幕,則一來屏幕尺寸有所限制,二來費用相對較高容易造成設(shè)備的浪費。

1.2傳統(tǒng)辦公考勤與門禁系統(tǒng)的弱勢

目前企業(yè)常規(guī)的門禁系統(tǒng)與日常考勤系統(tǒng)往往是分離的,兩個系統(tǒng)使用了各自獨立的軟硬件環(huán)境,其中門禁系統(tǒng)使用的是攝像監(jiān)控設(shè)備采集信息并通過專人24小時值班,其主要職能僅僅是監(jiān)控辦公環(huán)境的人員進出并記錄下相應(yīng)的影像資料。而企業(yè)日常的考勤系統(tǒng)則要么采用人工簽到的方式,要么采用人工打卡或者指紋打卡方式。如果采用打卡方式管理則需要添置專門的打卡機,這些打卡機多數(shù)是獨立工作,對于員工的考勤則需要人工根據(jù)卡片記錄情況統(tǒng)計。無論是員工自身打卡或者是統(tǒng)計考勤都是人工完成,有時還會出現(xiàn)錯誤和疏漏,同時主要的問題還在于容易出現(xiàn)代人打卡等作假的情況。所以,在傳統(tǒng)的辦公考勤與門禁系統(tǒng)獨立的情況下,兩個系統(tǒng)各自記錄各自的相關(guān)數(shù)據(jù),同時投入兩套不同的軟硬件環(huán)境,有時這樣的辦公環(huán)境的信息化反而沒有給人員帶來便利,而是增加一項打卡簽到的日常任務(wù)。

2對存在的部分問題的分析和討論

2.1傳統(tǒng)演示設(shè)備缺乏交互型功能

由于很長一段時間硬件以及軟件的條件約束,電腦的鍵盤、鼠標(biāo)完成了95%以上的數(shù)據(jù)輸入工作,單一顯示功能的顯示器投影儀也成了最主要的信息輸出設(shè)備。所以常規(guī)軟件設(shè)計和開發(fā)時都是把鍵盤、鼠標(biāo)、顯示器/投影儀的輸入輸出組合當(dāng)做幾乎所有使用情況下的模式。但隨著觸摸屏與多點觸控硬件的出現(xiàn),多點觸控、屏幕的直接交互輸入輸出操作成了未來發(fā)展的一個趨勢,并且相對普通鼠標(biāo)和單一顯示功能的顯示器用戶交互體驗明顯提升,人機交互界面更友好直觀。但是對于普通辦公中使用的投影儀,由于其投影的目標(biāo)位置情況多樣,如果一體化的設(shè)計制造具有交互功能的互動投影儀其成本要比普通投影儀更高,對于解決互動操作的問題經(jīng)濟上不是的。而大面積的多點觸控屏幕由于設(shè)備體積和重量的因素?zé)o法在需要靈活移動的新產(chǎn)品推廣談判等活動中使用,如果只是企業(yè)自身辦公環(huán)境中做普通會議展示的效果改進,其投入產(chǎn)出的效率也不理想。

2.2基于傳統(tǒng)輸入輸出設(shè)備的開發(fā)

由于長期以來人機交互都是以鼠標(biāo)鍵盤為主,所以絕大多數(shù)程序開發(fā)設(shè)計都只考慮這種單一的輸入方式。但對于目前多媒體數(shù)據(jù)增多的趨勢,這樣傳統(tǒng)的輸入輸出模式就存在著很多弊端,其中最明顯的是對于多媒體數(shù)據(jù)的采集就需要單獨使用設(shè)備,采集后再人工處理。而為了簡化系統(tǒng)設(shè)計的復(fù)雜度,很多管理信息系統(tǒng)的數(shù)據(jù)采集和錄入主要基于鍵盤鼠標(biāo)的錄入,如果出現(xiàn)非鍵盤鼠標(biāo)錄入的數(shù)據(jù)則被要求人工進行數(shù)據(jù)格式的轉(zhuǎn)換,所以從一個側(cè)面也反映出一些企業(yè)排斥信息化,因為原本帶來效率提升與管理便利的信息系統(tǒng),反而由于一些數(shù)據(jù)格式的錄入要求增加了人工勞動。如果直接使用現(xiàn)實當(dāng)中的多媒體類的數(shù)據(jù)則系統(tǒng)又缺少相應(yīng)轉(zhuǎn)換的功能。因為系統(tǒng)在考慮使用鍵盤鼠標(biāo)錄入采集數(shù)據(jù)時已經(jīng)默認(rèn)了操作者來完成數(shù)據(jù)錄入前的標(biāo)準(zhǔn)化工作。但是實際上隨著現(xiàn)代計算機視覺以及人工智能、模式識別技術(shù)的發(fā)展和完善,過去無法識別的原始多媒體數(shù)據(jù)現(xiàn)在也可以由計算機識別并進行標(biāo)準(zhǔn)化的處理。

3運用計算機視覺技術(shù)改善人機交互

3.1低分辨率識別情況下改善會議演示交互效果

采用現(xiàn)代的計算機影像處理技術(shù)和方法,可以用普通的圖像采集設(shè)備配合程序識別影像當(dāng)中的特定顏色區(qū)域的移動軌跡,并對軌跡做出判斷實現(xiàn)與計算機的交互。由于該識別只是需要識別圖像中的特定顏色的區(qū)域的運動,而非具體的形狀與細(xì)節(jié),所以識別的難度相對不大,可以運用在會議的展示環(huán)境下,通過定位確定普通投影區(qū)域與特定顏色區(qū)域的位置關(guān)系,并通過圖形圖像的投影與變形運算,實現(xiàn)人與普通投影的交互。在環(huán)境背景比較清晰,圖像采集設(shè)備分辨率與色彩分辨比較靈敏的情況下還能更進一步對人體膚色和手的幾何特征進行識別,實現(xiàn)更加自然良好的人機互動交互,并且還能引入人工智能的模式識別算法,實現(xiàn)多人的互動交互,從而大大改善互動展示效果,實現(xiàn)更加人性化有效的溝通。特別在教育培訓(xùn)行業(yè),在現(xiàn)有普通硬件條件下能夠?qū)崿F(xiàn)更加生動的教學(xué)講解演示,提高學(xué)生的課堂體驗激發(fā)更多興趣,改善教學(xué)效果。

3.2運用計算機視覺與模式識別技術(shù)整合企業(yè)門禁與考勤系統(tǒng)

應(yīng)用計算機視覺技術(shù)配合相對高分辨率的識別與人像數(shù)據(jù)庫,企業(yè)可以采用現(xiàn)有的門禁系統(tǒng)的硬件設(shè)備配合相應(yīng)的軟件實現(xiàn)門禁與考勤系統(tǒng)的整合,以此提高企業(yè)辦公環(huán)境的智能化人性化的效果,并對員工進行更加精細(xì)化的管理。重要的是,通過人機接口的改進改變以往服務(wù)信息系統(tǒng)的面貌,讓人在自然的環(huán)境下工作提高系統(tǒng)的人性化程度。同時整合門禁與考勤系統(tǒng)可以通過識別企業(yè)內(nèi)部員工與外來人員加強辦公環(huán)境的管理,而且在硬件上可以利用現(xiàn)有的設(shè)備,軟件方面可以與前面提到的交互演示系統(tǒng)共用相同的圖形圖像處理內(nèi)核,減少代碼的冗余降低系統(tǒng)復(fù)雜度提高性。就目前的人像識別技術(shù)而言,已經(jīng)在個人電腦的安全保護上得到了應(yīng)用,所以在技術(shù)上是可行的,并且也有了實際應(yīng)用的例子。將該技術(shù)移植到普通的門禁管理系統(tǒng)與考勤系統(tǒng)中,只需要解決接口的數(shù)據(jù)交換就能實現(xiàn),并且隨著現(xiàn)代企業(yè)辦公環(huán)境的要求,應(yīng)用該技術(shù)能大大提高企業(yè)的辦公環(huán)境的智能化程度,并且通過門禁系統(tǒng)提取的企業(yè)員工考勤信息更加自然和真實,能夠更加地掌握和管理企業(yè)員工的日常工作情況提高管理精度。

3.3具體實現(xiàn)方法與原理

為了能充分利用企業(yè)現(xiàn)有的硬件設(shè)備,并使得附加的程序簡單化,這里針對類似會議互動展示這樣不需要細(xì)節(jié)識別的情況采用的是顏色識別的方法,即統(tǒng)計場景中的圖像直方圖,然后探測直方圖上的變化,由于特定顏色的待識別區(qū)域的引入可以對整體直方圖的特定區(qū)域產(chǎn)生峰值的變化,并且通過反向的直方圖運算又可以確定特定區(qū)域的位置。而直方圖的運算屬于比較簡單的圖像運算處理所以能夠在很多圖像處理的開發(fā)工具中直接找到。并且對于細(xì)節(jié)識別要求比較高的人像的模式識別,采用以上的運算也能縮小待檢測區(qū)域的大小,提高識別效率,并且人的面部特征采用色識別也能很快找到特征點(眼睛、鼻孔、嘴唇、頭發(fā)以及頭像邊緣)。在前面通過色彩識別找到的檢測區(qū)域中,識別出特征點,并測量特征點的位置關(guān)系比例,進而在和數(shù)據(jù)庫中數(shù)據(jù)對比模式匹配找到最終結(jié)果。

4結(jié)語

在越南河內(nèi)的機場,為了使乘客能在等待航班時有比較輕松的環(huán)境,在旅客的候機大廳專門安放了一臺具有互動功能的投影儀,并將互動內(nèi)容投影在地面,乘客可以在候機時與地面上的互動投影交互,緩解候機帶來的單調(diào)乏味感。同樣我們可以把它引入到日常企業(yè)辦公會議或者是培訓(xùn)教育類企業(yè)的日常教學(xué)中,運用現(xiàn)有的投影屏幕和現(xiàn)有的設(shè)備實現(xiàn)多人的在投影屏幕上的互動交互討論。而人像識別系統(tǒng)在單機上的應(yīng)用也在很多商用筆記本電腦上得到了應(yīng)用,在一些科研院所和高科技企業(yè)人像識別的門禁系統(tǒng)也被應(yīng)用到了辦公環(huán)境當(dāng)中,提高了辦公環(huán)境的智能化程度;將人像識別技術(shù)結(jié)合考勤系統(tǒng)則在教育行業(yè)能夠?qū)崿F(xiàn)更為方便的考勤管理防止目前比較嚴(yán)重的代簽逃課等情況的發(fā)生。隨著現(xiàn)在對數(shù)據(jù)挖掘技術(shù)的研究,從日常情況采集到的數(shù)據(jù)積累到一定程度還能為今后分析員工/學(xué)生行為做出數(shù)據(jù)的積累。這里所討論和解決的問題主要只是集中在人機交互界面的一些改進,其實對于IT技術(shù)而言這只是一小部分,對于企業(yè)而言需要使用IT技術(shù)真正提高企業(yè)的工作效率還需要其他很多方面的配合和集成。

計算機視覺論文:基于計算機視覺的植物黑腐病病斑分析

摘要:給出一種基于圖像處理和神經(jīng)網(wǎng)絡(luò)技術(shù)進行植物黑腐病病斑分析的方法,即利用圖像處理技術(shù)提取病斑的幾何特征和顏色特征,其中幾何特征根據(jù)病斑形狀提取,并基于HSV空間提取病斑顏色矩結(jié)合紅綠顏色特征作為病斑的顏色特征,利用神經(jīng)網(wǎng)絡(luò)加以識別,從而判斷病斑所處的生長周期?給出系統(tǒng)的總體設(shè)計和實現(xiàn)方案,研究結(jié)果表明,該系統(tǒng)獲得了較為理想的檢測效果?這一思路為植物病害檢測和分析提供一種新的方法?

關(guān)鍵詞:計算機視覺;神經(jīng)網(wǎng)絡(luò);病斑分析

1引言

基于計算機視覺的植物黑腐病病斑的檢測與分析的研究內(nèi)容和目標(biāo)是提取植物葉片及黑腐病病斑的特征,分類并確定病害程度?十字花科蔬菜黑腐病(Xanthomonas campestris pv.campestris (Pammel) Dowson)俗稱“半邊癱”,是蔬菜生產(chǎn)重的主要病害之一[1]?它是一種細(xì)菌引起的病害,癥狀是引起維管束壞死變黑?細(xì)菌從葉緣入侵后,產(chǎn)生玉米粒大小的黃褐色壞死斑,再延葉脈蔓延,逐漸擴大成“V”字形或長條形斑塊,周邊伴有黃色退綠暈帶?進入致病末期,葉緣形成火燒似的卷縮燒邊,致使大量外葉枯死?因為植物病害等級判定的一些特性一般都可以由采集樣本觀察測量獲得數(shù)據(jù),即所選的性狀都是可以直接觀察到的,則相應(yīng)的數(shù)字化圖片上同樣可以獲得,所以我們利用計算機自動?高效?的特點,提出了基于計算機視覺的植物黑腐病病斑分析的概念,并對黑腐病病斑危害程度的確定進行了探索?本文根據(jù)病斑的幾何及顏色特征進行選擇,并用人工神經(jīng)網(wǎng)絡(luò)的方法加以識別?

2病斑的幾何特征選擇

由于黑腐病進入中后期后,病斑呈較為規(guī)則的“V”字形斑塊,所以可以選擇其幾何特征作為其等級判斷的依據(jù)?通過多次試驗,我們選擇了以下幾種較為具有代表性的幾何特征[2]:

2.1病斑區(qū)域與葉片區(qū)域的面積比p

式中,s為葉片面積,S為病斑面積,葉片和病斑區(qū)域面積可以通過掃描圖像,累加同一標(biāo)記區(qū)域中象素的個數(shù)來表示?

2.2病斑區(qū)域的圓形度C

圓形度C描述的是病斑形狀接近圓形的程度,其計算公式為:式中,S表示的是病斑面積,L為病斑周長;C值的范圍是0~1,當(dāng)病斑區(qū)域為圓形時周長最短,C=1,病斑區(qū)域越偏離圓形,則C值越小?

2.3病斑區(qū)域長?寬比E

E=min{寬度,高度}mx{寬度,高度}病斑區(qū)域越細(xì)長,E越小,當(dāng)病斑區(qū)域為圓形時,E=1?

2.4病斑形狀復(fù)雜性e

式中,L表示周長,S表示面積,用離散指數(shù)e來描述單位面積圖形的周長大小?e越大,表示單位面積圖形周長越大,即圖形離散,為復(fù)雜圖形?

2.5從重心到輪廓線的長度的平均變動系數(shù)d

如果從病斑重心出發(fā),每隔10°對病斑輪廓進行掃描,設(shè)重心到輪廓的距離分別為 n,其中n=0°,10°,…,350°,則平均變動系數(shù):

3病斑的顏色特征選擇

由于葉片的生長及病斑的蔓延存在很大的隨機性,所以單一依靠病斑的幾何特征無法對病斑做出而有效的判斷?鑒于此種情況,除幾何特征外,我們提取病斑的顏色特征結(jié)合上述幾何特征共同作為病斑的評判依據(jù)?

3.1基于HSV空間的病斑顏色矩特征提取

為了處理彩色圖像,首先要選取合適的顏色空間?由于常用的RGB三色空間中,兩點間的歐氏距離與顏色距離不成線性比例,也就是說顏色受亮度影響很大,RGB空間不具有進行彩色圖像處理所要求的獨立性和均勻性指標(biāo),所以我們在提取病斑顏色矩特征時采用了均勻性更好的HSV空間?從RGB到HSV的轉(zhuǎn)換公式為[3]:

由于顏色信息集中在圖像顏色的低階矩中,我們主要對每種顏色分量的一階?二階和三階矩 進行統(tǒng)計?這三個顏色矩的數(shù)學(xué)定義如下[4]:式中:pij是第j個象素的第i個顏色分量的值;N是象素數(shù)量?由于每幅圖像有3個顏色分量,每個顏色分量包括3個顏色矩,這樣就一共得到了9個特征向量?

顏色矩的優(yōu)點是特征描述比較緊湊,缺點是低階顏色矩往往分辨率不夠,所以除此之外我們又提出了基于統(tǒng)計的病斑紅?綠象素特征特提取的方法?

3.2基于統(tǒng)計的病斑紅?綠象素特征提取病菌對葉片的侵蝕實際上是一種破壞植物葉綠素的過程?經(jīng)過實驗發(fā)現(xiàn),葉片致病后病斑部位與正常葉片相比,圖像G通道平均數(shù)值相對R通道大幅降低,由原先G>R轉(zhuǎn)變?yōu)镚

圖2正常葉片的R?G?B曲線圖3早期黃色病斑的R?G?B曲線圖4中后期褐色病斑的R?G?B曲線

基于此種情況,我們提取R通道和G通道的象素平均灰度值和的相 對關(guān)系參數(shù)X和L作為病斑特征?其中N是象素個數(shù),Ri和Gi分別是R通道和G通道第i個象素的灰度值,式中X描述病斑由黃色轉(zhuǎn)為褐色,R?G通道數(shù)值均減小的過程,L則表征伴隨病情的加重,葉綠素的減少,G值相對R值變化的過程?

4人工神經(jīng)網(wǎng)絡(luò)分類器設(shè)計

4.1神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)在本文中,我們利用bp算法進行人工神經(jīng)網(wǎng)絡(luò)分類器的設(shè)計[5],借助MATLAB2006Ra及其所帶的神經(jīng)網(wǎng)絡(luò)工具箱系統(tǒng)進行系統(tǒng)的實現(xiàn)?最終采用3層神經(jīng)網(wǎng)絡(luò):16個輸入節(jié)點,分別為文中上述提取的16種特征;30個隱含層節(jié)點;3個輸出節(jié)點,分別代表病斑處于致病的早期,中期和晚期?

4.2取樣與神經(jīng)網(wǎng)絡(luò)的訓(xùn)練

由于實驗室培育的黑腐病發(fā)病周期一般為6天,我們在2006年4月3日~2006年4月8日間,在溫度為24~28℃,濕度為80%的廣西大學(xué)生命科學(xué)院溫室內(nèi),每天隨機采取樣本40枚,共計采取樣本240枚?將其掃描為圖片后,從中挑選出75張圖片作為訓(xùn)練樣本?其中發(fā)病頭兩天的25張,作為早期;發(fā)病3~4天的圖片25張,作為中期;剩下25張作為末期?經(jīng)過大量實驗,我們將中間層的傳遞函數(shù)和輸出層的傳遞函數(shù)均設(shè)為S型的對數(shù)函數(shù),即logsig/logsig,訓(xùn)練次數(shù)設(shè)為1000次,訓(xùn)練目標(biāo)誤差為0.001?經(jīng)過736次后訓(xùn)練后,網(wǎng)絡(luò)收斂,目標(biāo)誤差達到要求?

5實驗結(jié)果

使用早期,中期,晚期圖片各20張為測試樣本(其中15張為新取樣本,5張為已使用過的學(xué)習(xí)樣本)對已學(xué)習(xí)好的神經(jīng)網(wǎng)絡(luò)進行測試,網(wǎng)絡(luò)輸出值大于等于0.85時算作1,當(dāng)輸出值小于等于0.15時算作0?則表1為全部測試樣本的判別結(jié)果:

6結(jié)論與展望

應(yīng)用上述方案進行識別實驗,bp訓(xùn)練網(wǎng)絡(luò)全部收斂,而且收斂速度較快,15個學(xué)習(xí)樣本全部正確識別?從上表中可以看出,病斑危害程度的平均識別率達到了90%,其中晚期病斑識別率較高,達到了95%?中期識別率較低,為85%,這可能是由于某些病斑發(fā)展較快或較慢導(dǎo)致中期特征并不明顯,使得識別時出現(xiàn)偏差?另外早期病斑的識別率偏低,這可能是由于有些早期病斑太小,感染初期病斑形狀很不規(guī)則,所以出現(xiàn)誤分?如何在判別中增加早期病斑顏色判據(jù)的權(quán)重,增加晚期病斑形狀判別的權(quán)重,使得分類更加合理,是下一步需要繼續(xù)思考的問題?

計算機視覺論文:計算機視覺在案例推理系統(tǒng)中的應(yīng)用

摘要:本文結(jié)合案例推理的關(guān)鍵技術(shù),從計算機視覺如何圖像獲取、如何圖像預(yù)處理、如何圖像特征抽取描述及案例如何進行檢索,得出計算機視覺如何在案例推理系統(tǒng)應(yīng)用,實現(xiàn)案例推理系統(tǒng)對產(chǎn)品實時質(zhì)量檢測、監(jiān)控和故障診斷。

關(guān)鍵詞:計算機視覺;案例推理;圖像處理;圖像描述

1 引言

基于案例推理(case-base reasoning)是人工智能中正不斷發(fā)展的一項重要推理技術(shù)。基于案例推理與類比推理方法相似,案例推理將舊經(jīng)驗或教訓(xùn)轉(zhuǎn)換為知識,出現(xiàn)新問題時,首先查找以前是否有相似的案例,并用相似案例解決新問題。如果沒遇到相似案例的,經(jīng)過推理后解決新問題的方法,又會成為新的案例或新經(jīng)驗,下一次再遇到相同問題時,就可以復(fù)用這些案例或經(jīng)驗。

這與人遇到問題時,首先會用經(jīng)驗思考解決問題的方式相似,這也是解決問題較好的方法。基于案例推理應(yīng)用于工業(yè)產(chǎn)品檢測或故障診斷時具有以下特點:

CBR智能化程度較高。利用案例中隱含的難以規(guī)則化的知識,以輔助規(guī)則推理的不足,提高故障診斷系統(tǒng)的智能化程度。

CBR較好解決“知識獲取”的瓶頸。CBR知識表示以案例為基礎(chǔ),案例的獲取比規(guī)則獲取要容易,大大簡化知識獲取的過。

CBR求解效率較高。是對過去的求解結(jié)果進行復(fù)用,而不是再次從頭開始推導(dǎo),可以提高對新問題的求解效率。

CBR求解的質(zhì)量較高。CBR以過去求解成功或失敗的經(jīng)歷,可以指導(dǎo)當(dāng)前求解時該怎樣走向成功或避開失敗。

CBR持續(xù)不斷的學(xué)習(xí)能力,使得它可以適應(yīng)于將來問題的解決。

所以基于案例推理方法正不斷應(yīng)用在產(chǎn)品質(zhì)量檢測和設(shè)備故障診斷方面,并取得較好的經(jīng)濟效益。為了產(chǎn)品檢測和設(shè)備故障診斷中,更為智能化,更容易實現(xiàn)現(xiàn)場檢測和診斷,計算機視覺技術(shù)起到很大的作用。

計算機視覺是研究用計算機來模擬人和生物的視覺系統(tǒng)功能的技術(shù)學(xué)科,使計算機具有感知周圍視覺世界的能力。通過計算機視覺,進行圖像的獲取預(yù)處理、圖像分割與特征抽取、識別與分類、三維信息理解、景物描述、圖像解釋,讓計算機具有對周圍世界的空間物體進行傳感、抽象、判斷的能力,從而達到識別、理解的目的。

計算機視覺隨著科學(xué)技術(shù)發(fā)展,特別計算機技術(shù)、通信技術(shù)、圖像采集技術(shù)、傳感器技術(shù)等,以及神經(jīng)網(wǎng)絡(luò)理論、模糊數(shù)學(xué)理論、小波的分析理論等計算機視覺理論的不斷發(fā)展和日趨成熟,使計算機視覺從上世紀(jì)60年代開始興起發(fā)展到現(xiàn)在,取得快速發(fā)展,已經(jīng)從簡單圖像質(zhì)量處理發(fā)展到圍繞著紋理分析、圖像編碼、圖像分割和濾波等研究。圖像的分析與處理,也由靜止轉(zhuǎn)向運動,由二維轉(zhuǎn)向三維,并主要著眼于對圖像的識別和理解上,也使計算機視覺的應(yīng)用領(lǐng)域更為廣泛,為案例推理中運用計算機視覺打下基礎(chǔ)。

2 案例推理系統(tǒng)的主要關(guān)鍵技術(shù)

(1)案例的表示與組織

案例的表示與組織即是如何抽取案例的特征變量,并以一定的結(jié)構(gòu)在計算機中組織存儲。如何將信息抽取出特征變量,選擇什么語言描述案例和選擇什么內(nèi)容存放在案例中,案例按什么組織結(jié)構(gòu)存放在存儲器中,這關(guān)系到基于案例推理方法的效率,而且對于案例數(shù)量越來越多,結(jié)構(gòu)十分復(fù)雜的案例庫,尤其重要。

(2)案例的索引與檢索

案例的索引與檢索即是為了查找相似案例,如何建立案例索引和相似度算法,利用檢索信息從案例庫中檢索并選擇潛在可用相似案例。后面的工作能否發(fā)揮出應(yīng)有的作用,很大程度上依賴于這一階段得到的案例質(zhì)量的高低,因此這一步非常關(guān)鍵。

(3)案例的復(fù)用和調(diào)整

案例的復(fù)用即是如何根據(jù)舊案例得出新解,涉及到找出案例與新問題之間的不同之處,案例中的哪些部分可以用于新問題,哪些部分不適合應(yīng)用于新問題的解決。而復(fù)用還分案例的結(jié)果復(fù)用,案例的求解方法復(fù)用。

(4)案例的學(xué)習(xí)

案例的學(xué)習(xí)即是將新解添加到案例庫中,擴充案例庫的案例種類與數(shù)量,這過程也是知識獲取。此過程涉及選取哪些信息保留,以及如何把新案例有機集成到案例庫中,包括如何存儲,如何建立索引等等。

針對案例推理的關(guān)鍵技術(shù),根據(jù)檢測和故障診斷系統(tǒng)的特點,計算機視覺主要解決如何將產(chǎn)品圖像輸入系統(tǒng),如何將產(chǎn)品圖像特征進行抽取和描述,如何區(qū)別產(chǎn)品不同之處。以便案例推理系統(tǒng)進行案例建模,確立案例的表示形成和案例相似度的計算。本文主要從計算機視覺如何運用在案例推理系統(tǒng)進行探討。

3 產(chǎn)品輸入系統(tǒng)

產(chǎn)品輸入系統(tǒng)在不同產(chǎn)品類型和生產(chǎn)環(huán)境可能有不同之處,主要應(yīng)有傳感器單元和圖像采集單元。如圖1。

圖1 產(chǎn)品輸入系統(tǒng)結(jié)構(gòu)

傳感器單元主要判斷是否有產(chǎn)品存在,是否需要進行圖像采集,是否繼續(xù)下一個產(chǎn)品圖像的采集。這簡單傳感器可使用光電開關(guān),配合光源,當(dāng)產(chǎn)品經(jīng)過時,產(chǎn)品遮擋住光源,使光電開關(guān)產(chǎn)生一個0值,而沒有產(chǎn)品經(jīng)過時,光電開關(guān)產(chǎn)生相反的1值,系統(tǒng)通過判斷光電開關(guān)的值,從而判斷是否有產(chǎn)品。

圖像采集單元簡單地說是將產(chǎn)品拍攝并形成數(shù)字化圖像,主要包括光源、反射鏡、CCD相機和圖像采集卡等組成。光源和反射鏡作用主要使圖像中的物體和背景之間有較大灰度。CCD相機主要是拍攝設(shè)備。圖像采集卡主要是將圖像數(shù)字化。通過傳感器判斷有產(chǎn)品后,光源發(fā)出的光均勻地照在被測件上,CCD相機拍攝,拍攝圖像經(jīng)過圖像采集卡數(shù)字化后輸入存儲設(shè)備。存儲設(shè)備即為計算機硬盤。存放原始圖像、數(shù)據(jù)、處理結(jié)果等。

這是案例推理系統(tǒng)的原始數(shù)據(jù),是圖像處理、圖像特征抽取描述的基礎(chǔ)。

4 圖像處理

在案例推理系統(tǒng)中,需要對案例的組織和案例建模,案例的組織即案例的表示,相對計算機而言,即圖像特征的抽取,即某圖像具有與其它圖像不同之處,用于區(qū)別其它圖像,具有性。同時,又能完整地表示該圖像。所以案例的表示要體現(xiàn)案例的完整性、性、操作容易性。

圖像中有顏色區(qū)別、又有物體大小之分以及圖像由不同的物體組成。如何表示圖像,或說圖像內(nèi)部包含表示的本質(zhì),即圖像的描述。根據(jù)圖像特點,確立圖像案例的表示,以圖像的像素、圖像的數(shù)字化外觀、圖像物體的數(shù)字組成等屬性。這需要對產(chǎn)品輸入的原始圖像進行處理。

在計算機視覺技術(shù)中,對原始圖像主要進行圖像增強、平滑、邊緣銳化、分割、特征抽取、圖像識別與理解等內(nèi)容。經(jīng)過這些處理后,輸出圖像的質(zhì)量得到相當(dāng)程度的改善,既改善了圖像的視覺效果,又便于計算機對圖像進行分析、處理和識別。具體工作流程如圖2所示:

圖2 計算機視覺的任務(wù)與工作流程

圖像預(yù)處理是將產(chǎn)品的數(shù)字圖像輸入計算機后,首先要進行圖像的預(yù)處理,主要完成對圖像噪聲的消除以及零件的邊緣提取。預(yù)處理的步驟為:圖像二值化處理;圖像的平滑處理;圖像的邊緣提取。

圖像二值化處理主將灰度圖形二值化的關(guān)鍵是閾值的選取,由于物體與背景有明顯的灰度差,可以選取根據(jù)灰度直方圖中兩峰之間的谷值作為閾值來分割目標(biāo)和背景。

圖像的平滑處理技術(shù)即圖像的去噪聲處理,主要是為了去除實際成像過程中因成像設(shè)備和環(huán)境所造成的圖像失真,提取有用信息。

圖像邊緣提取是為了將圖像中有意義的對象與其背景分開,并使之具有某種指定的數(shù)學(xué)或符號表達形式,使計算機能夠理解對象的具體含義,檢測出邊緣的圖像就可以進行特征提取和形狀分析了。可采用多種算法,如采用Sobel算子提取邊緣。

圖像預(yù)處理是為下一步的特征描述打基礎(chǔ),預(yù)處理的好壞直接影響案例推理的結(jié)果和檢測診斷的效率。

特征提取是對圖像進行描述,是案例建模關(guān)鍵,案例建模是根據(jù)案例組織要求抽取圖像特征,是建立案例索引和檢索的關(guān)鍵。如果圖像沒有特征,就談不上進行檢索。圖像特征可通過圖像邊界、圖像分割、圖像的紋理等方法,確定圖像特征,包括是什么產(chǎn)品、產(chǎn)品形狀大小、產(chǎn)品顏色,產(chǎn)品有什么缺陷、產(chǎn)品缺陷在什么位置等特征,根據(jù)這些圖像特征進行描述,形成計算機中屬性值,并從數(shù)據(jù)庫查找相應(yīng)信息資料,從而確定產(chǎn)品之間的關(guān)系,相似度,也就是案例推理的方向。

5 系統(tǒng)的檢索

根據(jù)案例推理原理和相應(yīng)算法,建立案例推理系統(tǒng)模型,如圖3所示。

圖3 案例推理系統(tǒng)

對話系統(tǒng):完成人機交互、問題描述、結(jié)果顯示和系統(tǒng)總控制。

案例庫系統(tǒng):由案例庫及案例庫管理系統(tǒng)組成。

數(shù)據(jù)析取系統(tǒng):對各種已有的源數(shù)據(jù)庫的數(shù)據(jù)通過轉(zhuǎn)換而形成所需的數(shù)據(jù)。

多庫協(xié)同器:根據(jù)問題求解的需要,按照一定的數(shù)據(jù)抽取策略,完成問題求解過程中對模型庫系統(tǒng)、方法庫系統(tǒng)、知識庫系統(tǒng)和數(shù)據(jù)庫系統(tǒng)等資源的調(diào)度與協(xié)調(diào)。

知識庫系統(tǒng):由產(chǎn)生式規(guī)則組成,這些知識包括專家經(jīng)驗和以規(guī)則形式表示的有關(guān)知識,也可以是數(shù)據(jù)挖掘結(jié)論,支持案例檢索、案例分析、案例調(diào)整等。 模型庫系統(tǒng):由模型庫、算法庫、模型庫管理系統(tǒng)組成。完成模型識別和調(diào)用,并把結(jié)果綜合,送入對話系統(tǒng)顯示,作為補充信息供案例檢索、調(diào)整使用。

數(shù)據(jù)庫系統(tǒng):存放待決策支持的所有問題,并完成其維護與查詢等功能。

由于系統(tǒng)主要應(yīng)用產(chǎn)品的現(xiàn)場實時檢測監(jiān)控或故障診斷,所以系統(tǒng)的檢索時,也必須輸入檢索值,即輸入現(xiàn)場產(chǎn)品的圖像,在通過產(chǎn)品預(yù)處理、圖像的二值化、分割和邊界處理后,進行圖像特征描述,根據(jù)圖像描述進行分類識別。根據(jù)案例推理的算法檢索案例庫中,是否有相似的案例。即確定相似度。相似度確定主要由案例推理的算法確定,如貼近分析法。確定相似度較大作為結(jié)果,并將案例的解輸出,給相關(guān)控制系統(tǒng)進行決策。如產(chǎn)品質(zhì)量檢測,確定產(chǎn)品質(zhì)量是否合格,是否有不合格產(chǎn)品,不合格產(chǎn)品是什么原因造成,故障源是什么,如何解決和排除故障,等等。

6 結(jié)論

案例推理方法有效地解決計算機視覺技術(shù)中圖像檢索問題。對提高圖像檢索的效率和度提供了平臺。

計算機視覺技術(shù)也為案例推理系統(tǒng)實現(xiàn)產(chǎn)品現(xiàn)場實時檢測、監(jiān)控、診斷提供技術(shù)支持。計算機視覺技術(shù)現(xiàn)場的數(shù)據(jù)采集、處理為案例推理打好基礎(chǔ)。

兩者的結(jié)合設(shè)計的系統(tǒng)適用范圍很廣,只要產(chǎn)品需要進行質(zhì)量檢測、監(jiān)控,或設(shè)備需要進行故障診斷和維護,都可以適用。

系統(tǒng)提供的實時檢測、監(jiān)控和診斷功能,提高企業(yè)的生產(chǎn)效益,降低了生產(chǎn)成本。

計算機視覺論文:計算機視覺技術(shù)在交通工程測量中的應(yīng)用

一、引言

隨著科技的發(fā)展,計算機替代人的視覺與思維已經(jīng)成為現(xiàn)實,這也是計算機視覺的突出顯現(xiàn)。那么在物體圖像中識別物體并作進一步處理,是客觀世界的主觀反應(yīng)。在數(shù)字化圖像中,我們可以探尋出較為固定的數(shù)字聯(lián)系,在物體特征搜集并處理時做到二次實現(xiàn)。這既是對物體特征的外在顯現(xiàn)與描繪,更是對其定量信息的標(biāo)定。從交通工程領(lǐng)域的角度來看,該種技術(shù)一般應(yīng)用在交管及安全方面。監(jiān)控交通流、識別車況及高速收費都是屬于交通管理的范疇;而對交通重大事件的勘察及甄別則是交通安全所屬。在這個基礎(chǔ)上,筆者對計算機視覺系統(tǒng)的組成及原理進行了分析,并形成視覺處理相關(guān)技術(shù)研究。

二、設(shè)計計算機視覺系統(tǒng)構(gòu)成

計算機視覺處理技術(shù)的應(yīng)用是建立在視覺系統(tǒng)的建立基礎(chǔ)上的。其內(nèi)部主要的構(gòu)成是計算機光源、光電轉(zhuǎn)換相關(guān)器件及圖像采集卡等元件。

(一)照明條件的設(shè)計。在測量物體的表征時,環(huán)境的創(chuàng)設(shè)是圖像分析處理的前提,其主要通過光線反射將影像投射到光電傳感器上。故而要想獲得清晰圖像離不開照明條件的選擇。在設(shè)計照明條件時,我們通常會視具體而不同處理,不過總的目標(biāo)是一定的,那就是要利于處理圖像及對其進行提取分析。在照明條件的設(shè)定中,主動視覺系統(tǒng)結(jié)構(gòu)光是較為典型的范例。

(二)數(shù)據(jù)采集的處理。如今電耦合器件(CCD)中,攝像機及光電傳感器較為常見。它們輸出形成的影像均為模擬化的電子信號。在此基礎(chǔ)上,A模式與D模式的相互對接更能夠讓信號進入計算機并達到數(shù)字處理標(biāo)準(zhǔn),再量化入計算機系統(tǒng)處理范圍。客觀物體色彩的不同,也就造就了色彩帶給人信息的差異。一般地黑白圖像是單色攝像機輸入的結(jié)果;彩色圖像則需要彩色相機來實現(xiàn)。其過程為:彩色模擬信號解碼為RGB單獨信號,并單獨A/D轉(zhuǎn)換,輸出后借助色彩查找表來顯示相應(yīng)色彩。每幅圖像一旦經(jīng)過數(shù)字處理就會形成點陣,并將n個信息濃縮于每點中。彩色獲得的圖像在16比特,而黑白所獲黑白灰圖像則僅有8比特。故而從信息采集量上來看,彩色的圖像采集分析更為繁復(fù)些。不過黑白跟灰度圖像也基本適應(yīng)于基礎(chǔ)信息的特征分析。相機數(shù)量及研究技法的角度,則有三個分類:“單目視覺”、“雙目”及“三目”立體視覺。

三、研究與應(yīng)用計算機視覺處理技術(shù)

從對圖像進行編輯的過程可以看出,計算機視覺處理技術(shù)在物體成像及計算后會在灰度陣列中參雜無效信息群,使得信息存在遺失風(fēng)險。成像的噪聲在一定程度上也對獲取有效信息造成了干擾。故而,處理圖像必須要有前提地預(yù)設(shè)分析,還原圖像本相,從而消去噪音。邊緣增強在特定的圖像變化程度中,其起到的是對特征方法的削減。基于二值化,分割圖像才能夠進一步開展。對于物體的檢測多借助某個范圍來達到目的。識別和測算物體一般總是靠對特征的甄別來完成的。

四、分析處理三維物體技術(shù)

物體外輪擴線及表面對應(yīng)位置的限定下,物體性質(zhì)的外在表現(xiàn)則是其形狀。三維物體從內(nèi)含性質(zhì)上來看也有體現(xiàn),如通過其內(nèi)含性質(zhì)所變現(xiàn)出來的表層構(gòu)造及邊界劃定等等。故而在確定圖像特征方面,物體的三維形態(tài)是最常用的處理技術(shù)。檢測三維物體形狀及分析距離從計算機視覺技術(shù)角度來看,渠道很多,其原理主要是借助光源特性在圖像輸入時的顯現(xiàn)來實現(xiàn)的。其類別有主動與被動兩類。借助自然光照來對圖像獲取并挖掘深入信息的技術(shù)叫做被動測距;主動測距的光源條件則是利用人為設(shè)置的,其信息也是圖像在經(jīng)過測算分析時得到的。被動測距的主要用途體現(xiàn)在軍工業(yè)保密及限制環(huán)境中,而普通建筑行業(yè)則主要利用主動測距。特別是較小尺寸物體的測算,以及擁有抗干擾及其他非接觸測距環(huán)境。

(一)主動測距技術(shù)。主動測距,主要是指光源條件是在人為創(chuàng)設(shè)環(huán)境中滿足的,且從景物外像得到相關(guān)點化信息,可以適當(dāng)顯示圖像大概并進行初步分析處理,以對計算適應(yīng)功率及信息測算程度形成水平提高。從技術(shù)種類上說,主動測距技術(shù)可分為雷達取像、幾何光學(xué)聚焦、圖像干擾及衍射等。除了結(jié)構(gòu)光法外的測量方法均為基于物理成像,并搜集所成圖像,并得到特殊物理特征圖像。從不同的研究環(huán)境到條件所涉,以結(jié)構(gòu)光法測量作為主要技術(shù)的工程需求較為普遍,其原理為:首先在光源的設(shè)計上由人為來進行環(huán)境考慮測算,再從其中獲取較為的離散點化信息。在離散處理后,此類圖像已經(jīng)形成了較多的物體真是特征表象。在此基礎(chǔ)上,信息需要不斷簡化與甄別、壓縮。如果分析整個物體特征信息鏈,則后期主要體現(xiàn)在對于數(shù)據(jù)的簡化分析。如今人們已經(jīng)把研究的目光轉(zhuǎn)向了結(jié)構(gòu)光測量方法的應(yīng)用,體現(xiàn)在物體形狀檢測等方面。

(二)被動測距技術(shù)。被動測距,對光照條件的選擇具有局限性,其主要通過對于自然光的覆蓋得以實現(xiàn)。它在圖像原始信息處理及分析匹配方面技術(shù)指向較為突出。也通過此三維物體之形狀及周圍環(huán)境深度均被顯露。在圖像原始信息基礎(chǔ)上的應(yīng)用計算,其與結(jié)構(gòu)光等相比繁雜程度較高。分析物體三維特性,著重從立體視覺內(nèi)涵入手,適應(yīng)物體自身特點而存在。不過相對來說獲得圖像特征才是其適應(yīng)匹配的條件保障。點、線、區(qū)域及結(jié)構(gòu)紋理等是物象特征的主體形式。其中物特較為基礎(chǔ)與原始的特征是前兩個特征,同時它們也是其他相關(guān)表征的前提。計算機系統(tǒng)技術(shù)測量基本原理為對攝像機進行構(gòu)建分析,并對其圖像表征進行特征匹配,以得到圖像不同區(qū)間的視覺差異。

五、結(jié)束語

通過對計算機視覺技術(shù)的研究,悉知其主要的應(yīng)用領(lǐng)域及技術(shù)組成。在系統(tǒng)使用的基礎(chǔ)上深入設(shè)計,對系統(tǒng)主要構(gòu)成環(huán)節(jié)進行分析。從而將三維復(fù)雜形態(tài)原理、算法及測量理論上升到實際應(yīng)用。隨著社會對于計算機的倚賴程度增加,相信該技術(shù)在建筑或者其他領(lǐng)域會有更加深入的研究及應(yīng)用。

計算機視覺論文:計算機視覺技術(shù)及其在自動化中的應(yīng)用

摘要:隨著社會的發(fā)展,科技的進步,計算機的應(yīng)用范圍也越來越廣,人們開始試圖建立利用計算機來代替人類進行自動識別的人工智能系統(tǒng),而要想建成這種系統(tǒng)一項必不可少的技術(shù)就是計算機視覺技術(shù)。為了進一步促進計算機視覺技術(shù)的發(fā)展,使計算機視覺技術(shù)得到更廣泛的推廣與應(yīng)用,本文概述了計算機視覺技術(shù)的基本概念、工作原理與理論框架,并重點分析了計算機視覺技術(shù)在農(nóng)業(yè)自動化、工業(yè)自動化以及醫(yī)學(xué)自動化中的應(yīng)用,以期為計算機視覺技術(shù)的推廣與發(fā)展貢獻自己的綿薄之力。

關(guān)鍵詞:計算機;視覺技術(shù);應(yīng)用;分析

計算機人工智能技術(shù)中的一項重要技術(shù)就是計算機視覺技術(shù),這種技術(shù)主要是讓計算機利用圖像來實現(xiàn)認(rèn)知環(huán)境信息的目的,這一目的的實現(xiàn)需要用到多種高尖端技術(shù)。近年來隨著計算機技術(shù)以及計算機網(wǎng)絡(luò)的普及與發(fā)展,計算機視覺技術(shù)也得到了較快發(fā)展,并且在實際生產(chǎn)與生活中的應(yīng)用也越來越廣泛。

1 計算機視覺技術(shù)概述

1.1 基本概念

計算機視覺技術(shù)主要研究計算機認(rèn)知能力的一門技術(shù),其具體主要是通過用攝像機代替人的眼睛,用電腦代替人的大腦,最終使計算機具備類似于人類的識別、判斷以及記憶目標(biāo)的功能,代替人類進行部分生產(chǎn)作業(yè)。人們目前研究的人工智能技術(shù)中的一項重要內(nèi)容就是計算機視覺技術(shù),通過研究計算機視覺技術(shù)可以讓計算機擁有利用二維圖像認(rèn)知三維環(huán)境的功能。總的來說,計算機視覺技術(shù)是在圖像與信號處理技術(shù)、概率分析統(tǒng)計、網(wǎng)絡(luò)神經(jīng)技術(shù)以及信息處理技術(shù)的基礎(chǔ)上,利用計算機來分析、處理視覺信息的技術(shù),它是現(xiàn)代社會新興起的一門高新技術(shù)。

1.2 工作原理

在亮度滿足要求的情況下,首先使用攝像機對具體事物的圖像信息進行采集,利用網(wǎng)絡(luò)把采集到的圖像信息向計算機內(nèi)部輸送,然后在計算機系統(tǒng)內(nèi)部處理加工圖像信息會把事物的原始圖像得到,隨后利用圖像處理技術(shù)進一步處理原始圖像,獲得優(yōu)化質(zhì)量效果之后的圖像,分類與整理圖像中有特征價值的信息,通過智能識別技術(shù)識別與描述提取到的圖像信息特征,把得到的高層次的抽象信息存儲起來,在進行識別事務(wù)時分析對比這些儲存信息就可以實現(xiàn)事物的識別,這樣視覺系統(tǒng)的基本任務(wù)也就完成了。其具體視覺系統(tǒng)如圖1所示:

1.3理論框架

人類研究視覺技術(shù)雖然起步比較早,但取得較大進步是在20世紀(jì)80年代初伴隨著視覺計算理論的出現(xiàn)。它的出現(xiàn)把研究視覺理論的策略問題解決了,視覺技術(shù)是一項特別復(fù)雜的信息處理過程,要想對視覺的本質(zhì)完整的理解,必須從不同角度與層次研究與分析視覺本質(zhì)。視覺計算理論研究層次大致可分為:計算機理論、算法以及實際執(zhí)行。站在計算機理論的角度分析視覺技術(shù),我們可知必須用要素圖、維圖、以及三維模型表像來描述視覺信息。

所以,可以把計算機視覺技術(shù)當(dāng)做從三維環(huán)境圖像中抽取、描述與解釋信息的過程,其主要分析步驟可分為感覺、處理、描述、識別、解釋等。若依據(jù)上述各過程實現(xiàn)需用到的方法與技術(shù)的復(fù)雜性劃分層次,可大致把計算機視覺技術(shù)劃分為:低層視覺處理、中層視覺處理、高層視覺處理三個層次。

2 計算機視覺技術(shù)在自動化中的應(yīng)用

2.1 農(nóng)業(yè)自動化中計算機視覺技術(shù)的應(yīng)用

在農(nóng)業(yè)自動化中應(yīng)用計算機視覺技術(shù)可以全天候?qū)崟r監(jiān)測農(nóng)作物的生長狀況,便于科學(xué)管理農(nóng)作物。還可以應(yīng)用計算機視覺技術(shù)來檢測農(nóng)產(chǎn)品的質(zhì)量,例如可以應(yīng)用計算機監(jiān)測技術(shù)來監(jiān)測大多數(shù)蔬菜的質(zhì)量,傳統(tǒng)的人工檢測蔬菜質(zhì)量的方法,不僅費時費力,而且檢測結(jié)果的性也不能很好的保障,在實際人工檢測過程中還容易傷害蔬菜,可以通過利用計算機視覺技術(shù)來感應(yīng)蔬菜自身釋放的紅外線、紫外線以及其他可見光的能量大小,然后和質(zhì)量達標(biāo)蔬菜的光線能量大小進行對比,根據(jù)這些對比結(jié)果可以把蔬菜質(zhì)量的好壞判斷出來,在蔬菜質(zhì)量檢測過程中應(yīng)用計算機視覺技術(shù),把傳統(tǒng)的蔬菜檢測方法顛覆了,極大的方便了農(nóng)產(chǎn)品的質(zhì)量檢測,由此可見,計算機視覺技術(shù)在農(nóng)業(yè)生產(chǎn)中有很高的使用與推廣價值。

2.2 在工業(yè)自動化中計算機視覺技術(shù)的應(yīng)用

計算機視覺技術(shù)在工業(yè)自動化應(yīng)用的一個重要領(lǐng)域就是可以精密測量零件尺寸,其測量與被測對象的原理如圖2所示。

光學(xué)系統(tǒng)、計算機處理系統(tǒng)以及CCD攝像頭,是計算機檢測系統(tǒng)的主要組成,被測物體由光源發(fā)出的平行光束進行照射,利用顯微光學(xué)鏡把待檢測部位的輪廓圖像呈現(xiàn)在攝像機的面陣CCD上,然后再通過計算機處理這些圖像,進而把被測部位的輪廓位置信息獲取下來,若被測對象是出現(xiàn)位移時,可通過兩次重復(fù)測量,利用兩次測量的位置差就可以得出,被測物體的位移量。

此外計算機視覺技術(shù)還可以應(yīng)用于逆向工程中,應(yīng)用3D數(shù)字化測量儀可以快速的測出現(xiàn)有工件輪廓的坐標(biāo)值,同時還能構(gòu)建曲面,保存成CAD或CAM圖像,把這些圖像送入CNC制作中心加工,便可制作出產(chǎn)品,這也就是所謂的逆向工程。由上述分析我們可知逆向工程要想實現(xiàn),最關(guān)鍵的一環(huán)就是如何通過精密測量系統(tǒng)來測量樣品的三圍尺寸,獲得各部位數(shù)據(jù),進而做曲面處理進而加工生產(chǎn)。對于這一難題我可以通過利用線結(jié)構(gòu)光測量物體表面輪廓技術(shù)來實現(xiàn),器具體輪廓結(jié)構(gòu)示意圖如下圖3所示。

這種測量方法的工作原理為:利用激光穿越平行、等距的振幅光柵組件,或直接采用干涉儀發(fā)出的干涉條紋,形成平面條紋結(jié)構(gòu)光,再向物體表面投射,由于物體各表面的深度與曲率的不同,條紋會自動出現(xiàn)變化,然后再通過使用CCD攝像機對變形條紋進行拍攝。這樣就可以把物體表面輪廓的變化情況分析出來。攝像機在拍攝圖像的過程中,把圖像信號轉(zhuǎn)化為模擬信號,再轉(zhuǎn)化為數(shù)字信號,然后經(jīng)過傳送再還原信號到圖形處理系統(tǒng),就得到三維輪廓圖像。

在工業(yè)自動化中計算機視覺技術(shù)的深入廣泛應(yīng)用,不但使工業(yè)產(chǎn)品的生產(chǎn)質(zhì)量得到了保障,而且跨越式的提高了工業(yè)產(chǎn)品的生產(chǎn)速度。如計算機視覺技術(shù)可以很好的檢測產(chǎn)品包裝質(zhì)量,封口質(zhì)量以及印刷質(zhì)量等等,如我國重點指定的印刷造幣機器的南京造幣廠,由于貨幣制造印刷是由印刷造幣機器來實現(xiàn)的,所以要嚴(yán)格要求其生產(chǎn)工藝,一絲一毫的生產(chǎn)差錯都不允許存在,為了保障印刷制造出來的造幣機器質(zhì)量達標(biāo),必須嚴(yán)格檢測生產(chǎn)出來的成品。在印刷造幣機器的過程中要求要有非常高的計算機視覺技術(shù),隨著計算機視覺技術(shù)的不斷進步,計算機視覺技術(shù)已經(jīng)對印刷造幣機器的需求滿足了,實際的應(yīng)用效果也非常理想,印刷造幣機器在實際生產(chǎn)的過程中,南京造幣廠把計算機視覺技術(shù)應(yīng)用在了每個應(yīng)刷造幣機器的生產(chǎn)工序上,硬幣受到重力下落的瞬間,計算機視覺技術(shù)可以瞬間采集圖像的信息,拍攝硬幣在下落過程中的圖像,通過高速光纖傳感器可以把硬幣圖像向計算機系統(tǒng)快速傳輸,利用計算機系統(tǒng)處理信息與識別信息的超強能力,可以及時識別硬幣質(zhì)量,經(jīng)大量實踐研究得出,在印刷造幣機器上應(yīng)用計算機視覺技術(shù)已經(jīng)幾乎沒有檢查差錯現(xiàn)象的發(fā)生,由此可知,在工業(yè)自動化中計算機視覺技術(shù)的應(yīng)用不但可行,而且發(fā)展空間還很大。

2.3 在醫(yī)學(xué)自動化中計算機視覺技術(shù)的應(yīng)用

在醫(yī)學(xué)領(lǐng)域計算機視覺技術(shù)也得到了廣泛應(yīng)用,如醫(yī)學(xué)中經(jīng)常用到的CT圖像以及X射線圖都用到了計算機視覺技術(shù),這些技術(shù)的廣泛應(yīng)用很大程度上方便了醫(yī)生判斷病人病情,另外,在生產(chǎn)藥品的過程中,應(yīng)用計算機視覺技術(shù)可以高效檢測藥品包裝的合格與否,其基本流程是:傳送裝置先運輸藥品到指定位置,傳送裝置自身又可分為檢測與分離兩個區(qū)域,在傳送藥品的過程中藥品的圖像信息會被特定的攝像機采集,采集完成后向計算機系統(tǒng)傳遞采集信息,然后計算機系統(tǒng)會分析與處理這些信息,把沒有包裝好的藥品自動識別出來,并且向分離區(qū)傳遞識別信息,分離區(qū)的自動裝置會依據(jù)傳輸?shù)姆蛛x信息,隔離開沒有包裝好的藥品,這樣就可以有效分類包裝好的藥品與沒有包裝好的藥品,在藥品包裝檢測方面應(yīng)用計算機視覺技術(shù)代替?zhèn)鹘y(tǒng)人工檢測,不但可以實現(xiàn)藥品無誤的檢測,而且還可以大大提高檢測藥品包裝質(zhì)量的效率,完善了藥品生產(chǎn)的自動化,由此可見,在醫(yī)學(xué)自動化中應(yīng)用計算機視覺技術(shù)可以積極促進醫(yī)學(xué)自動化的發(fā)展。

3 結(jié)束語

總之,計算機視覺技術(shù)是一門研究計算機識別能力的高新技術(shù),它涵蓋了很多其他技術(shù),具有一定復(fù)雜性。要想使其在自動化生產(chǎn)中得到更好地推廣與應(yīng)用,我們必須在明白其基本概念、工作原理以及理論框架的基礎(chǔ)上,結(jié)合實際生產(chǎn)情況,不斷進行深入研究,只有這樣才能使計算機視覺技術(shù)得到更好地推廣與應(yīng)用,才能使這項現(xiàn)代化的高新技術(shù)更好的服務(wù)于社會,服務(wù)于人類。

計算機視覺論文:淺議高校計算機視覺課程教學(xué)的創(chuàng)新

摘要:計算機視覺是利用計算機及相關(guān)設(shè)備來模仿生物視覺的技術(shù),計算機視覺課程的建立對學(xué)生的學(xué)習(xí)和互聯(lián)網(wǎng)的發(fā)展有著重要的意義。基于此,本文將著重探討計算機視覺課程的特點和高校計算機視覺課程教學(xué)的創(chuàng)新策略,主要包括教學(xué)內(nèi)容的選取和工程實例的選取,以期為當(dāng)前計算機視覺課程的教學(xué)提供一些指導(dǎo)意見。

關(guān)鍵詞:計算機視覺;課程創(chuàng)新;教學(xué)改革

計算機視覺課程是人工智能學(xué)科的分支學(xué)科,對互聯(lián)網(wǎng)技術(shù)的發(fā)展有著重要的推進作用。隨著時代的飛速變遷,越來越多的學(xué)生對這一領(lǐng)域產(chǎn)生了濃厚的興趣,計算機視覺課程在信息專業(yè)中也開始占據(jù)重要的地位。如何讓學(xué)生對這門課程保持長久的興趣,如何培養(yǎng)學(xué)生的專業(yè)能力和實踐能力,是當(dāng)前高校應(yīng)該考慮的問題。經(jīng)過近幾年的教學(xué)實踐后,很多高校已經(jīng)逐步確定了通過實際應(yīng)用培養(yǎng)學(xué)生興趣的教學(xué)方法,在滿足學(xué)生對計算機視覺應(yīng)用需求的同時,加深了學(xué)生對理論知識的理解,這已經(jīng)成為了當(dāng)前高校計算機視覺課程教學(xué)的重要模式。

一、計算機視覺課程的特點

近年來,隨著計算機網(wǎng)絡(luò)的飛速發(fā)展,計算機視覺的應(yīng)用也越來越廣泛,成為了信息相關(guān)專業(yè)學(xué)生的一門必修課。計算機視覺課程涉及眾多領(lǐng)域,包括人工智能與模式識別、應(yīng)用數(shù)學(xué)等,其覆蓋范圍廣,綜合性較強。具體來說,計算機視覺課程有以下幾個特點:一是內(nèi)容廣泛,理論抽象。計算機視覺是一門新技術(shù),隨著時代的變遷,互聯(lián)網(wǎng)新技術(shù)的更新日新月異,這就使得課程內(nèi)容的更新過快,內(nèi)容廣泛,教師很難在及時時間向?qū)W生輸送所有的課程知識。二是計算機視覺課程涉及多個學(xué)科領(lǐng)域,并且所涉及的領(lǐng)域知識內(nèi)容復(fù)雜,表達抽象,這對學(xué)生的學(xué)習(xí)來說是一個較大的障礙。三是實踐性強。計算機視覺課程的知識內(nèi)容來源于各種專業(yè)不同的領(lǐng)域,操作性極強,學(xué)生只有在具有一定的工程項目綜合能力后,才能進行計算機視覺應(yīng)用和操作。

二、計算機視覺與計算機圖形學(xué)、數(shù)字圖像處理之間的聯(lián)系和區(qū)別

1.計算機視覺與計算機圖形學(xué)的聯(lián)系與區(qū)別。計算機視覺一般輸入的都是圖像或圖像序列,其輸入資料主要來自usb攝像頭或是相機。經(jīng)過處理后,計算機視覺輸出的是對圖像序列和圖像對應(yīng)的對真實世界的一種理解,在這一方面,計算機視覺有識別車牌、人臉的作用。而計算機圖形學(xué)則是一種對虛擬場景的描述。它一般是由多個多邊性數(shù)組組成,每個多邊性有三個頂點,輸出的是二維像素數(shù)組。在增強現(xiàn)實的應(yīng)用中,人們不僅需要用計算機視覺來提高對物體識別和姿態(tài)獲取的效率,還需要用到計算機圖形學(xué)對虛擬三維物體的疊加方法。

2.計算機視覺與數(shù)字圖像處理的聯(lián)系和區(qū)別。首先,計算機視覺與數(shù)字圖像處理之間的聯(lián)系在于數(shù)字圖像處理是計算機視覺處理的基礎(chǔ),而計算機視覺的研究成果也可以作為數(shù)字處理的素材。其次,計算機視覺與數(shù)字圖像處理之間的區(qū)別在于圖形是一種純數(shù)字化、矢量的單位,而圖像則不僅包括圖形,有時還包括來自現(xiàn)實世界的信號,并且圖形的處理不是一種簡單的堆積,計算機視覺的處理要從圖像中找到一些統(tǒng)計數(shù)據(jù)和信息,并做進一步的數(shù)據(jù)分析。

三、高校計算機視覺課程教學(xué)的創(chuàng)新策略

1.以工程應(yīng)用為導(dǎo)向的課程內(nèi)容。鑒于學(xué)習(xí)本課程的學(xué)生在畢業(yè)之后多數(shù)會進入相關(guān)工程企業(yè)或者研究院工作,因此,在對學(xué)生進行培養(yǎng)時,高校一方面要考慮到學(xué)生的知識接受度,另一方面要設(shè)置以工程應(yīng)用為導(dǎo)向的課程內(nèi)容,幫助學(xué)生更好的進入企業(yè)或研究院開展工作。高校在進行計算機視覺課程教學(xué)創(chuàng)新時,首先要創(chuàng)新課程教材,摒棄以往枯燥的理論書籍,多選取一些實踐性和應(yīng)用性強的教材。考慮到國內(nèi)教材的滯后性和學(xué)生基礎(chǔ)的薄弱性,高校應(yīng)該選擇以下兩本書作為學(xué)生的專用教材:一本是我國著名教授賈云得編纂的《機器學(xué)習(xí)》,這部教材深刻體現(xiàn)了時展的教學(xué)要求,書中不僅詳細(xì)講述了計算機視覺中的一些基本知識,包括計算機視覺的基本概念、算法及其應(yīng)用,還有一些經(jīng)典的數(shù)字圖像處理方法和視覺應(yīng)用分析,對學(xué)生了解基礎(chǔ)知識和實踐內(nèi)容有著重要的意義;另外一本是國內(nèi)外十分推崇的計算機視覺著作,它是美國教授Richard Szeliski教授的作品。該書在2010年出版,獲得了眾多業(yè)界人士的好評。Richard Szeliski教授是華盛頓大學(xué)的兼職教授,也是微軟研究院交互視覺與多媒體的主任,他對計算機視覺的發(fā)展和未來走向十分清楚,也深刻了解產(chǎn)業(yè)界和大學(xué)需要什么樣的計算機視覺課程教材。因此,這本教材面向應(yīng)用,與當(dāng)今近期的科技成果緊密相連,綜合論述了計算機視覺在各個領(lǐng)域的發(fā)展,展示了計算機視覺的近期研究成果和未來的發(fā)展趨勢。此外,本書中還有詳細(xì)的國外研究案例和更加深入的應(yīng)用案例,適合學(xué)生開展探究性學(xué)習(xí)。兩本教材都是遵循以工程應(yīng)用為導(dǎo)向的原則,對學(xué)生開放性思維的培養(yǎng)有著重要的意義。

2.面向科技近期成果的課程定位。計算機視覺是一門新技術(shù),科技創(chuàng)新是其發(fā)展的原動力,因此,高校在進行課程安排時,應(yīng)該將當(dāng)今計算機視覺領(lǐng)域的重要的科技成果作為計算機課程的基本教學(xué)內(nèi)容。要想以科技近期成果定位計算機視覺課程,高校要做到以下兩個方面:(1)選取涵蓋近期成果的教材。考慮到不同學(xué)生的數(shù)字圖像處理基礎(chǔ)不一的問題,學(xué)校可以在課程中補充一些有關(guān)數(shù)字圖像處理的基礎(chǔ)內(nèi)容。在選擇教材內(nèi)容時,計算機視覺課程的內(nèi)容應(yīng)該包括數(shù)字圖像處理、視覺學(xué)習(xí)和模式識別這三大部分。數(shù)字圖像處理是視覺課程的基礎(chǔ)內(nèi)容,主要向?qū)W生介紹數(shù)字圖像處理和計算機視覺所涉及的一些基礎(chǔ)知識,包括圖像的分割和檢測、圖像濾波的處理等。數(shù)字圖像處理是整個計算機課程學(xué)習(xí)的重要基礎(chǔ)內(nèi)容,其課時可占總課時的二分之一。其次,視覺部分是近幾年來計算機視覺的近期科技成果,內(nèi)容主要包括攝像機的幾何設(shè)定和計算機攝影機的序列處理等。作為最前沿的科技領(lǐng)域,視覺部分將會是該課程后期的重點內(nèi)容,與實踐作業(yè)緊密結(jié)合。而模式識別則更多的是新技術(shù)的一種工程應(yīng)用,學(xué)生會更多的涉及到實踐操作,更好的培養(yǎng)學(xué)生的實踐能力。(2)強化學(xué)生自學(xué)和調(diào)研能力。課程調(diào)研和實踐是信息專業(yè)學(xué)生強化能力的重要方法之一,高校可以在課程項目中引入新技術(shù)的探究,在使課程在具有基礎(chǔ)性、研究性的同時,具有一定的前沿性,還能讓學(xué)生在及時時間了解到近期的科技成果和互聯(lián)網(wǎng)應(yīng)用技術(shù)。在課程調(diào)研和實踐中,高校必須要強化學(xué)生的自學(xué)和調(diào)研能力,在調(diào)研時給每一個小組安排一位高年級研究生作為指導(dǎo),每組學(xué)生獨立完成任務(wù),高年級研究生只做引導(dǎo)和輔助的作用。學(xué)生在自我設(shè)置調(diào)研程序,查找資料,理解和熟悉相關(guān)程序的時候,能夠更加掌握近期科技成果的內(nèi)容,同時還提高了學(xué)生的自學(xué)能力和團隊協(xié)作能力。

3.工程實踐化的教學(xué)形式。工程項目綜合能力是信息專業(yè)的學(xué)生必須具備的素質(zhì)之一,因此在計算機視覺課程的教學(xué)過程中,培養(yǎng)學(xué)生的工程實踐能力是教學(xué)目標(biāo)之一。高校可以采取以下兩種方法:(1)選取適當(dāng)?shù)墓こ虒嵗τ谛畔I(yè)的學(xué)生而言,計算機視覺課程各個獨立的算法和方法較多,彼此沒有過多的聯(lián)系。這對學(xué)生來說過于抽象,不易理解,因此教師不應(yīng)當(dāng)僅僅限于知識的傳授,還應(yīng)該選取一些適當(dāng)?shù)墓こ虒嵗瑢⒅R體系串聯(lián)在一起,加深學(xué)會對教學(xué)內(nèi)容的理解,從而達到良好的教學(xué)效果。例如,在教學(xué)過程中,教師可以著重介紹手機制造的例子。手機是現(xiàn)在學(xué)生十分熟悉的產(chǎn)品,用手機舉例更加貼近學(xué)生的生活,教師可以詳細(xì)介紹手機鍵盤和主板的制造過程,并在這一過程中將所學(xué)的算法和理論融合進去,加深學(xué)生對知識的理解。其次,教師在手機講解時,還可以引導(dǎo)學(xué)生思考類似的產(chǎn)品制造,從而引出數(shù)碼相機的制造原理,和學(xué)生一起探討其制造算法。這種做法不僅可以幫助學(xué)生學(xué)習(xí),還可以讓學(xué)生拓寬思路,發(fā)散思維,不斷創(chuàng)新計算機視覺領(lǐng)域。(2)選擇合適的實際應(yīng)用。計算機視覺課程是一門實踐性和操作性極強的學(xué)科,因此,為了學(xué)生更好的學(xué)習(xí),教師要將理論工程實踐化,選擇合適的實際應(yīng)用來提高學(xué)生的實踐能力。教師可以安排學(xué)生進入手機制造廠房,給學(xué)生上一堂別開生面的實踐課,詳細(xì)介紹每個制造流程,并向?qū)W生不斷拋出與課程有關(guān)的問題,引發(fā)學(xué)生的思考,比如選擇什么樣的模板匹配法可以更為簡單。學(xué)生在不斷的解答和提問中,對學(xué)科知識的了解也會逐步加深。其次,高校可以建立專門的實訓(xùn)基地,學(xué)生可以在基地里實踐操作,將理論轉(zhuǎn)化為實物,親自嘗試做出模型,這種做法可以極大地提高學(xué)生的實踐能力,使學(xué)生更快的將理論轉(zhuǎn)化為實際。

四、結(jié)語

在新形勢下,高校應(yīng)不斷創(chuàng)新計算機視覺課程的教學(xué)模式,并以此展開教學(xué)活動,培養(yǎng)學(xué)生的實踐能力和創(chuàng)新精神。將工程應(yīng)用和科技近期成果結(jié)合的教學(xué)模式,有利于解決理論和實踐相脫節(jié)的問題,在增強學(xué)生學(xué)習(xí)興趣、提高學(xué)生獨立分析能力的同時,還使學(xué)生接觸了國際近期的研究成果,拓寬了學(xué)生的思路,這對學(xué)生未來的發(fā)展有著重要的意義。