計算機視覺與應用范文
時間:2023-12-25 17:51:06
導語:如何才能寫好一篇計算機視覺與應用,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務員之家整理的十篇范文,供你借鑒。
篇1
關鍵詞: 計算機視覺;快速開發;框架;模塊化;模塊耦合;底層剝離
中圖分類號:TP311 文獻標識碼:A 文章編號:1009-3044(2012)29-7084-04
在視覺分析實際應用項目中,如何通過建立計算機視覺分析快速開發框架,搭建一個分工明確,快捷有效的圖像學應用處理平臺,提高開發效率,縮短開發時間,已成為項目開發人員關注的重點內容之一。本框架從項目應用和實際需求出發,將計算機視覺技術的核心算法從底層研究工作中剝離,可極大的縮短開發時間,提高開發效率。
在本框架下,開發人員可各司其職,分工、構成和職能劃分明確,框架開發人員只專注于框架接口的定義;算法開發人員只專注于圖像處理與識別等算法的開發;上層應用開發人員只負責抽取出一般的處理流程,專注于項目的具體實現和功能模塊的組合應用。
1 研究與應用
1.1背景
計算機視覺是用攝像機和電腦代替人眼對目標進行識別、跟蹤和測量的機器視覺。系統將獲取的視頻或圖像資料,通過計算機處理成為更適合人眼觀察或傳送給儀器檢測的圖像,其中包括圖像處理、模式識別或圖像識別、景物分析、圖像理解等相關內容,它們之間既有差別,又有相互重疊。
在計算機視覺分析技術中,對于一些復雜的問題,往往不是某單一學科能夠解決的,它需要一系列相關技術的支持。例如:對航道中船舶的識別,獲取的視頻流往往要經過平滑、去噪等圖像處理操作后,便于下一步運用基于直方圖分類器的圖像識別算法來區分船舶和水面,通過圖像分割技術來提取檢測目標。而這些方案的實現中,同一個問題的解決又往往需要有一系列的算法來支持。還是以船舶識別為例,圖像平滑有領域平均、低通濾波等算法;圖像去噪有各種濾波器算法;基于直方圖的分類器也存在決策樹、貝葉斯、SVM等等算法。雖然上述的算法本身沒有優劣之分,但在特定的環境下一定會有某個最佳算法。
因此,在實際應用項目中如何找出其最優路徑,除了需要開發者擁有深厚的圖像學功底,更需要的是通過大量的對比實驗來找出該最優路徑的解決方案。即便如此,也只能解決特定環境下的計算機視覺需求,換個應用場景,上述步驟又需要重新進行,此類過程的重復,既增加了開發成本,又延長了開發時間。
本框架從工程化的角度出發,在不同項目中的計算機視覺軟件開發中,研究如何提高開發結果的復用性,盡量降低上述各條件間的相互依賴關系,將視覺技術的核心算法從底層研究中剝離,達到縮短開發時間,提高開發效率的目的。
1.2研究目標
1) 框架系統的扁平化、模塊化;
2) 完成處理過程的任意組合,使圖像處理模塊單一化;
3) 理行為在處理模塊內部完成,處理結果可通過接口方式進行輸出;
4) 處理模塊間的數據流動定義在框架之中,框架負責配置數據流;
5) 置好的數據流,通過指定圖像處理模塊實現對物體的識別、行為的識別。
1.3.5框架的效果演示
從右側功能區中選取兩個輸入模塊:MediaOpen00和MediaOpen01,分別打開視頻文件“.\公司監控視頻.avi”和圖片“.\Lena.jpg”,任意添加一些圖像處理模塊或者圖像識別模塊,這里我們選取了行人檢測算法、基本全局閾值二值算法、人臉檢測算法、輪廓檢測算法,加入輸出展示模塊用于顯示處理結果。最后我們用曲線將模塊間的輸入輸出點連起來,完成數據流向的配置過程。其中一個輸出點可以連接多個輸入點,但一個輸入點只能接入一個輸出點。
2 結論
隨著計算機視覺技術發展的日新月異,算法的更新和積累將會越來越多。計算機視覺快速開發框架從實際應用工程的角度出發,在不同項目計算機視覺軟件的開發過程中,將視覺技術的核心算法從底層研究中剝離,使視覺分析應用項目中的框架開發人員專注于框架接口定義的開發,而項目中的算法、上層應用等開發人員各司其職,分工明確,不但提高了開發結果的復用性,同時,也降低了項目開發中各條件間的相互依賴關系,縮短了開發時間,提高了開發效率。
參考文獻:
[1] Gary bradski,Adrian Kaebler.《Learning OpenCV》[M].O’Reilly Media Inc,2008.
[2] 張廣軍.機器視覺[M].北京:科學出版社,2005.
[3] 張少輝,沈曉蓉,范耀祖.一種基于圖像特征點提取及匹配的方法[J].北京航空航天大學學報,2008,34(5).
[4] 劉立,彭復員,趙坤,萬亞平.采用簡化SIFT算法實現快速圖像匹配[J].紅外與激光工程,2008,37(1).
[5] 戴斌,方宇強,孫振平,王亮.基于光流技術的運動目標檢測和跟蹤方法研究[D].國防科學技術大學機電工程與自動化學院.
[6] 陳勝勇,劉盛.基于OpenCV的計算機視覺技術實現[M].科學出版社.
篇2
【論文摘要】隨著Internet的普及,尤其是寬帶網的盛行,計算機病毒也在向網絡化方向發展,這種病毒就是所謂的蠕蟲病毒。本文利用數據挖掘技術,研究了如何在新的蠕蟲病毒大規模爆發之前就將其檢測到,并采取相應的措施。
一、網絡病毒的特征分析
網絡病毒(蠕蟲病毒)自身就是一個可執行的二進制代碼程序文件。它的傳播途徑、方式與傳統的病毒不同,它具有主動性傳播的特點。它主動掃描網絡上主機操作系統和一些網絡服務的漏洞(大多是利用操作系統的緩沖區溢出漏洞),利用這些漏洞侵入這些主機,將自身的副本植入其中,從而完成傳播過程。被感染后的主機又會用同樣的手法感染網絡上其它的主機,如此反復下去,這樣很快就會傳遍整個網絡,尤其是一個新的操作系統漏洞還沒引起計算機用戶足夠重視的時候。蠕蟲病毒感染主機后往往大量占用主機資源(如CPU資源、內存資源等),使機器運行速度越來越慢,或向網絡上發送巨量的垃圾IP數據包,嚴重阻塞網絡帶寬,甚至造成整個網絡癱瘓。更惡毒的還會盜取用戶的敏感資料,如帳號和密碼等。而且現在的蠕蟲病毒有從以破壞為主要目的向以盜取資料為主要目的轉換的趨勢,因此危害更大。
通過分析蠕蟲病毒的傳播過程可知,蠕蟲病毒要感染網絡上的其它主機,首先必須對網絡上的主機進行掃描。它的這一舉動就暴露了目標,就為檢測蠕蟲病毒提供了途徑,也使蠕蟲病毒預防系統的實現成為可能。通過抓包分析,發現蠕蟲病毒的掃描過程并不像黑客入侵前的掃描那樣詳細,它只是隨機地生成目標主機的IP地址(通常優先生成本網段或相鄰網段的IP地址),然后用攻擊模塊(通常是用緩沖區溢出程序)直接攻擊目標IP地址的主機,而不管該主機是否存在。這個攻擊過程首先要向目標主機的特定端口發起TCP連接請求。例如,沖擊波蠕蟲病毒會在幾秒內兩次向目標主機的135端口發起連接請求,而震蕩波會在幾秒內兩次向目標主機的445端口發起連接請求。因此,通過捕獲數據包,利用數據挖掘技術分析它們的特征,找出異常的數據,從而達到預防的目的。
二、基于數據挖掘的病毒預防系統
基于數據挖掘的蠕蟲病毒預防系統主要由數據源模塊、預處理模塊、數據挖掘模塊、規則庫模塊、決策模塊、預防模塊等組成。
(一)工作原理
1.數據源是由一個抓包程序將所有來自于網絡的、發向本機的數據包截獲下來,交給預處理模塊處理。
2.數據預處理模塊將截獲的數據包進行分析,處理成連接請求記錄的格式。因為蠕蟲病毒傳染網絡上的主機時,會主動地向主機發起連接,這也是預防系統建立的理論依據。連接記錄由時間、源IP地址、源端口、目的IP地址、目的端口組成。這些眾多的連接請求記錄組成了事件的集合。
3.規則庫用于存儲已知的蠕蟲病毒的連接特征和新近數據挖掘形成的規則集。規則集是蠕蟲病毒行為模式的反映,用于指導訓練數據的收集和作為特征選擇的依據。
4.數據挖掘模塊利用數據挖掘算法分析由連接請求記錄組成的事件庫,分析結果交給決策模塊處理。
5.決策模塊將數據挖掘的結果與規則庫中的已知規則進行模式匹配,若與規則庫中的規則匹配,則由預防模塊發出發現已知蠕蟲病毒的警報;若不匹配,則由預防模塊發出發現新蠕蟲病毒的警報,同時將新規則加入到規則庫中。
(二)基于數據挖掘的病毒預防系統
1.分類:把一個數據集映射成定義好的幾個類。這類算法的輸出結果就是分類器,常用決策樹或規則集的形式來表示。
2.關聯分析:決定數據庫記錄中各數據項之間的關系。利用審計數據中系統屬性間的相關性作為構建正常使用模式的基礎。
3.序列分析:獲取序列模式模型。這類算法可以發現審計事件中頻繁發生的時間序列。這些頻繁事件模式為構建預防系統模型時選擇統計特征提供了指導準則。其算法描述為:已知事件數據庫D,其中每次交易T與時間戳關聯,交易按照區間〔t1,t2〕順序從時間戳t1開始到t2結束。對于D中項目集X,如果某區間包含X,而其真子區間不包含X時,稱此區間為X的最小出現區間。X的支持度定義為包括X的最小出現區間數目占D中記錄數目比例。其規則表示為X,Y->Z,[confidence,support,window],式中X,Y,Z為D中項目集,規則支持度為support(X∪Y∪Z),置信度為support(X∪Y∪Z)/support(X∪Y),每個出現的寬度必須小于窗口值。
3.系統中的數據挖掘模塊
首先利用分類算法對連接請求事件庫中的數據進行分類,本系統中分別按源IP地址與目的端口對事件進行分類。然后對這兩類數據進行關聯分析與序列分析,在對相同源IP地址的數據分析中可以發現該臺主機是否感染已知的蠕蟲病毒或異常的舉動(可能是未知的蠕蟲病毒所為);對同目的端口的數據分析中可以發現當前網絡上蠕蟲病毒疫情的嚴重程度。
【參考文獻】
[1]楊玉鋒,夏曉峰.上網用戶安全防范[J].韶關學院學報:自然科學版
篇3
1計算機視覺的概述及基本體系結構
1.1計算機視覺概述
通過使用計算機和相關設備,對生物視覺進行模擬的方式,就是計算機視覺。對采集到的圖片或視頻進行相應的技術處理,從而獲得相應的三維信息場景,是計算機視覺的主要任務。計算機視覺是一門學問,它就如何通過計算機和照相機的運用,使人們獲得被拍攝對象的數據與信息所需等問題進行研究。簡單的說,就是讓計算機通過人們給其安裝上的“大腦”和“眼睛”,對周圍環境進行感知。計算機視覺是一門綜合性學科,在各個領域都有所作為,已經吸引了各個領域的研究者對其研究。同時,計算機視覺也是科學領域中一個具有重要挑戰性的研究。
1.2計算機視覺領域基本體系結構
提出第一個較為完善的視覺系統框架的是Marr,他從信息處理系統角度出發,結合圖像處理、心理物理學等多領域的研究成果,提出被計算機視覺工作者基本接受的計算機視覺系統框架。在此基礎上,研究者們針對視覺系統框架的各個角度、各個階段、各個功能進行分析研究,得出了計算機視覺系統的基本體系結構,如圖1。
2計算機視覺在交通領域的應用
2.1牌照識別
車輛的唯一身份是車輛牌照。在檢測違規車輛、稽查被盜車輛和管理停車場工作中,車輛牌照的有效識別與檢測具有重要的作用和應用價值。然而在實際應用工作中,雖然車牌識別技術相對成熟,但是由于受到拍攝角度、光照、天氣等因素的影響,車牌識別技術仍需改善。車牌定位技術、車牌字符識別技術和車牌字符分割技術是組成車牌識別技術的重要部分。
2.2車輛檢測
目前,城市交通路口處紅綠燈的間隔時間是固定不變的,但是受交通路口的位置不同、時間不同的影響,每個交通路口的交通流量也是持續變化的。此外,對于某些交通區域來說,公共資源的配備,比如交通警察、交通車輛的數量是有限的。如果能根據計算機視覺技術,對交通路口的不同時間、不同位置的交通情況進行分析計算,并對交通流量進行預測,有利于為交通警察縮短出警時間、為交通路口的紅綠燈根據實際情況設置動態變化等技術提供支持。
2.3統計公交乘客人數
城市公共交通的核心內容是城市公交調度問題,一個城市如何合理的解決公交調度問題,是緩解城市運力和運量矛盾,緩解城市交通緊張的有效措施。城市公交調度問題,為公交公司與乘客的平衡利益,為公交公司的經濟利益和社會效益的提高做出了巨大的貢獻。由于在不同的地域、不同的時間,公交客流會存在不均衡性,高峰時段的公交乘客過多,平峰時段的公交乘客過少,造成了公交調度不均衡問題,使有限資源浪費嚴重。在計算機視覺智能公交系統中,自動乘客計數技術是其關鍵技術。自動乘客計數技術,是對乘客上下車的時間和地點自動收集的最有效的技術之一。根據其收集到的數據,從時間和地點兩方面對客流分析,為城市公交調度進行合理的安排。
2.4對車道偏離程度和駕駛員工作狀態判斷
交通事故的發生率隨著車輛數量的增加而增加。引發交通事故的重要因素之一就是駕駛員疲勞駕駛。據相關數據顯示,因車道偏離導致的交通事故在40%以上。其中,駕駛員的疲勞駕駛就是導致車道偏離的主要原因。針對此種現象,為減少交通事故的發生,計算機視覺中車道偏離預警系統被研究開發并被廣泛應用。針對駕駛員眨眼頻率,利用計算機視覺對駕駛員面部進行圖像處理和分析,再根據疲勞駕駛關注度與眨眼頻率的關系,對駕駛員的工作狀態進行判斷。此外,根據道路識別技術,對車輛行駛狀態進行檢測,也是判斷駕駛員工作狀態的方法之一。這兩種方法,是目前基于計算機視覺的基礎上,檢測駕駛員疲勞狀態的有效方法。
2.5路面破損檢測
最常見的路面損壞方式就是裂縫。利用計算機視覺,及時發現路面破損情況,并在其裂縫程度嚴重之前進行修補,有利于節省維護成本,也避免出現路面坍塌,車輛凹陷的情況發生。利用計算機視覺進行路面檢測,相較于之前人工視覺檢測相比,有效提高了視覺檢測的效率,增強了自動化程度,提高了安全性,為市民的出行安全帶來了更高保障。
3結論
本文從計算機視覺的概述,及計算機視覺基本體系結構,和計算機視覺在交通領域中的應用三面進行分析,可見計算機視覺在交通領域中的廣泛應用,在交通領域中應用的有效性、顯著性,以此可得計算機視覺在現展過程中的重要性。隨著計算機視覺技術的越來越成熟,交通領域的檢測管理一定會加嚴格,更加安全。
作者:夏棟 單位:同濟大學軟件學院
參考文獻:
[1]段里仁.智能交通系境在我國道路空通管理中的應用[J].北方工業時報,2015(06).
[2]王豐元.計算機視覺在建筑區間的應用實例分析[J].河北電力學報,2015(04).
[3]李釗稱.主動測距技術在計算機數據分析中的作用探析[J].計算機應用,2015(08).
[4]馬良紅.三維物體影像的攝取與分析[J].中國公路學報,2014(05).
篇4
1 計算機視覺定義
人類天生具有五感,視覺便是其中之一,而計算機視覺,就是讓計算機網絡能夠睜開眼看世界。讓計算機有一定的視覺能力,可以從各個方面幫助人們進行監督、檢驗檢測。利用計算機視覺科學可以使工作變得更加簡便。計算機視覺主要應用于對二維碼、條形碼、照片、視頻資料如片段等進行智能處理。
2 計算機視覺研究在醫療、交通中的作用
隨著醫學成像技術的發展與進步,圖像處理在醫學研究與臨床醫學中的應用越來越廣泛。最常見的有癌細胞顯微圖像分割與識別、基于多特征融合的血紅細胞識別和乳腺癌細胞計算機的自動識別等。計算機視覺技術的迅猛發展,為醫療診斷帶來了很大的方便,同時促進了臨床醫學的發展。另外,在各大綜合醫院慢慢發展起的體檢體系中,計算機視覺技術起到了決定性因素。隨著體檢的人數上升,對醫院體檢的管理、速度、準確性都提出了更高的要求。視覺識別輕而易舉的解決了這個問題,只需要去識別體檢人員的身份證,就可以將體檢人員對號入座,檢查過的項目,沒有檢查的項目一目了然。理化指標的檢驗,只需要在采血試管或采尿瓶上粘貼與體檢者對應的條形碼即可,利用視覺技術對號入座,方便而準確的確定每一位體檢人員的血樣及尿樣。及提高了醫院的工作效率,又將錯誤率降到最低。
計算機視覺在交通上同樣得到了廣泛的應用及發展。交通安全是交通運輸中的重大問題,隨著近年來機動汽車數量的迅猛增長,交通事故的發生也隨之越來越頻繁,給人類社會帶來的危害也日趨嚴重,使很多的家庭失去親人,甚至家破人亡。全國一線城市例如:北京、上海、廣州、深圳等交通道路供需的矛盾日趨嚴重,交通安全、交通堵塞及環境污染已成為困擾我國交通領域的三大難題?;趫D像處理的計算機視覺技術是通過攝像機獲取場景圖像,并借助于計算機軟件構建一個自動化或半自動化的圖像、視頻理解和分析系統,并提供及時準確的圖像、視頻處理結果,以模仿人的視覺功能。主要功能如下:
一是基于計算機視覺技術的車輛牌照自動識別: 車輛牌照是車輛的唯一身份,對車輛牌照的有效檢測與識別在車輛違章檢測、停車場管理、不停車收費、被盜車輛稽查等方面有著重要的應用價值。盡管針對車牌識別技術的研究相對成熟,然而在實際的應用場景中,受到天氣、光照、拍攝視角、車牌扭曲等因素的影響,車牌識別技術仍然有一定的改善空間。
二是基于計算機視覺技術的車輛檢測與流量統計:目前城市交通路口的紅路燈間隔時間是固定的,而不同路段、不同時間段交通流量是隨機變化的。若能根據各個交通路口的交通狀況輔以計算機進行自動分析,并判斷與預測交通流量,無疑為交通警察出警,紅綠燈時間間隔的動態設置等提供技術支持。
三是基于計算機視覺技術的公交專用道路非法占道抓拍:公共交通是每個城市交通的重中之重,城市的公共交通為老百姓提供了便捷的出行方式。公共交通的發展,有利于城市的節能減排,有利于降低城市的空氣污染指數。由于城市公共交通具有運量大、相對投資少、人均占有道路少等優點,解決城市交通問題必須優先發展城市公共交通。然而目前擁擠、緩慢的公交出行方式已成詬病,因此發展“快速公交”將是未來公交的一種運行模式。道路暢通則是發展“快速公交”的前提,相應地,公交專用車道的設定必不可少。為防止其他社會車輛的駛入,并對違規駛入的其他社會違規車輛進行抓拍與懲罰是保證公交車道公交車專駛的一種重要手段。因此在公交車前部裝置攝像頭并輔以其他處理設備,從而可以使得每一輛公交車成為了一個流動的監控設備。
3 計算機視覺在條形碼檢測中的應用
條形碼是將寬度不等的多個黑條和空白,按照一定的編碼規則排列,用以表達一組信息的圖形標識符。在中國,由中國物品編碼中心賦予制造廠商代碼。那么最常見的計算機視覺應用與條形碼檢測就是在超市中。超市中每樣產品都有自己的條形碼,當人們選擇了自己需要的物品后,來到收銀臺進行結賬,我們會看見收銀人員會用掃碼器對物品的條形碼進行掃描,掃描后就會出現產品的信息及價錢。記錄以及掃描條形碼的技術就是計算機視覺技術。
4 計算機視覺重要技術——智能識別
近年來,基于生物特征的鑒別技術得到了廣泛重視,主要集中在對人臉、虹膜、指紋、聲音等特征上,這其中大多都與視覺信息有關。指紋、人臉功能已經大范圍在生活中應用,其中很多單位的打卡制度就是依據面部識別、指紋識別來實現的。社會飛速發展的今天,很多的單位都實行了上下班打卡制度,這一制度已經被作為單位管理制度中的重要一條。購買的打卡機就是采用計算機視覺的重要技術——智能識別來實現的。利用打卡機的儲存功能,記錄每個職工的指紋或面部容貌,規定在某一個時間范圍內對應識別指紋或面部容貌,視為打卡。在上下班打卡的過程中,員工將面部或指紋對應在打卡機的制定位置上,讓打卡機進行識別,當識別的結果與存儲結果相同時,打卡成功。這樣看起來十分簡單的打卡機可以使單位的工作有序化,制度化,而實現這個功能的技術就是計算機視覺技術中的重要技術之一:智能識別。
5 計算機視覺技術的發展過程及未來
計算機視覺技術研究經歷了近40年的過程,20世紀50年代的統計模式識別、60年代的Roberts的三圍積木世界、70年代的Marr為代表的計算理論、80年代的主動視覺,但是仍然面臨許多的問題。主要由于計算機視覺是一個逆問題,視覺信息多種多樣,視覺知識的表達很困難,圖像數據量巨大,信息存儲于檢索困難,對生物學、神經生物學等的研究有待深入。
計算機視覺技術的未來必定會朝著高科技發展,航空遙感測控地形地貌、電影特效制作、工業生產自動化檢測、醫學影像檢測,再到天文領域等,在這些科學領域中計算機視覺將無法取代,成為主流的技術之一。
作者簡介
篇5
關鍵詞:視覺原理;計算機視覺藝術;數字媒體;應用
利用計算機所具有的視覺藝術,大眾僅僅利用需要實施身體動作來直接性的操作以及控制,根本就不需要學習就能夠啟動以及進行一定的操作,這樣更加方便老年人以及兒童的實際操作。在數字媒體當中,應該對計算機視覺藝術進行充分利用,更加方便人們的實際操作,同時還能夠保證其更好的感受藝術方面所具有的魅力,讓群眾在足夠放松的時刻能夠對創作者的實際思想以及意圖進行充分的了解以及掌握,對藝術價值進行充分發揮,進而來有效提升藝術人文的實際價值。
1對計算機視覺原理進行分析
通常來講,計算機視覺還稱為機械視覺,屬于是機械來對人類視覺進行一定的模仿的光學識別系統,利用光學系統、感應器、光源等來實現物體定位、動作的追蹤以及視線的判斷等相關的功能。一般情況下,工程技術所運用的基本都是計算機視覺,當有著一定的環境以及模式時,計算機視覺在進行持續性的工作時,能夠有效保證持續工作有著非常高的正確性以及準確性,還能夠對人工不可以完成的任務進行很好的完成。當計算機視覺在進行實際的工作過程中,最為基本的條件是先對映像進行處理,之后輸入模擬訊號,對數字影像進行一定的處理以及分析。實際的工作流程是:影像在攝入之后,應該對其進行一定的強化,除去噪聲,之后對圖像特征進行一定的壓縮以及獲取。在對數據庫樣本進行一定的對比之后,對程序進行有效的分析以及判斷,做出有效的指令。
2對數字媒體當中計算機視覺藝術的實際應用進行分析
2.1藝術與計算機進行一定的融合時,應該對動畫、聲音以及圖像等因素進行有效結合,在對藝術語言表現形式進行豐富的同時,應該提高作品的感染力
在有些結合視覺藝術以及數字媒體時,應該保證在對畫面進行觀看時,應該有效的欣賞畫面,還可以有效的感受到聲色等。利用高度仿真的聽覺、觸覺以及視覺,保證大眾在進行玩游戲時,可以對虛擬世界進行真實的感受,還能夠利用動作以及肢體語言等來和計算機實現有效的交流。保證大眾不是對電影單獨的進行欣賞,還應該更好的參與到其中,體會藝術的表演。
2.2在數字媒體當中運用計算機視覺藝術能夠對藝術的實際表達形式進行有效的豐富
隨著交互技術的逐漸成熟以及發展,讓該技術得到了有效的拓展以及廣泛的運用。運用交互技術,應該讓人們不受到被動的欣賞,應該積極的參與到視覺藝術當中,保證大眾的積極參與以及做出判斷,同能夠利用各種選擇來呈現出過程以及解決,對觀眾的興趣進行充分的調動,進而來有效提高大眾的參與積極性。
2.3在電子游戲當中,運用計算機視覺藝術,應該在相對比較大型的電子游戲當中進行計算機視覺技術的運用
在實際的游戲過程當中,大部分的玩家基本上不再是僅僅運用鍵盤以及鼠標來實施游戲,大部分都是利用身體行動來移動。通常情況下,機器利用攝像機部來對玩家的具體身體動作進行一定的捕捉,玩家能夠與機器相連接的手槍進行有效的操作,射中屏幕當中的對象。同時,手機上的相對比較小型的電子游戲,僅僅需要手指來滑動屏幕,就能夠實現實物的運動以及跳躍等,進而來躲避障礙。除此之外,僅僅需要稍微的傾斜一些收集,就能夠實現人物兩側的奔跑,同時還能夠保證聲光效果,實現互動,具有非常大的震撼力,會在很大程度上促進大眾參與的積極性。
2.4分析數字媒體中計算機視覺技術的應用,保證數字媒體技術有效表現藝術
同時在實用藝術以及純藝術當中,也會運用到數字媒體,該技術能夠讓相對比較單純的個人視覺實現有效的創造,同時還能夠把藝術箱社會性視覺產品進行轉化,并得到一定的經濟效益。同時,大眾能夠通過剪切以及拷貝等相關的方式來有效獲取視覺技術,之后有效的轉化藝術資源,有效奠定了創作視覺藝術的基礎?,F階段,大眾對于個性化以及獨特性有著逐漸提高的需求,在對相對比較獨特的視覺技術進行追求時,在一定程度上提高了評價視覺作品的標準。在數字媒體當中運用計算機視覺技術,會在很大程度上提高大眾對美的享受,保證大眾能夠充分感受到舒適以及愉快的感覺,同時還能夠得到審美方面的評價,在該過程當中,不能夠參雜任何的因素,應該讓計算機視覺因素僅僅對視覺美感以及視覺形式進行充分的追求,可以有效體現藝術的本質。同時,數字媒體有著美方面的品格,有效結合計算機視覺藝術,保證數字媒體藝術的美以及真。這個實際的運用過程能夠有效提升審美方面的機制,更好的領悟視覺藝術當中所存在的美。
3結語
綜上所述,在數字媒體當中,計算機視覺技術的運用,應該有效結合圖像、動畫、聲音以及文本等多個因素,在對語言表現的具體形式進行一定的豐富時,應該讓作品具有更大的感染力。除此之外,還應該保證視覺技術有何足夠的光聲效果,利用一定的互動,會具有非常大的震撼能力,積極促進大眾的參與程度。還可以在很大程度上滿足大眾對于美方面的追求,進而對其所具有的藝術價值進行充分發揮,有效提升藝術所具有的人文價值。
參考文獻
[1]劉曉,王會霞.計算機視覺藝術在數字媒體領域的應用研究[J].互聯網天地,2015,07:21-24.
[2]叢婧.淺談計算機視覺藝術在數字媒體的應用[J].電子制作,2013,18:75.
篇6
關鍵詞:圖像處理 計算機視覺 立體視覺
在實際工程實踐中,由于受現場條件和測試技術本身的限制,結構動位移的測試往往存在一定的困難和挑戰,這也使動位移并未成為結構動力性能評估中一個常見的評估指標。結構動位移響應是直接反映結構在動力荷載作用下安全性和整體性的重要參考指標。隨著工程結構或構件建造得越來越柔和復雜結構模型試驗研究的發展,如大跨度橋梁、高層建筑、索結構等的現場測試以及結構振動臺試驗、風洞試驗等,結構動位移的測試顯得尤為重要。
計算機視覺是研究計算機模擬生物外顯或宏觀視覺功能的科學與技術,是一個發展十分迅速的研究領域,其研究手段涉及甚廣,如圖像處理、機器視覺、醫學圖像分析、模式識別、計算機圖形學、人工智能等。當計算機通過視覺傳感器(比如相機或攝像機等)試圖分析三維空間的物體時通常只能給出二維圖像,通過計算機分析和處理圖像信息,可以重構實物的三維幾何信息,包括其形狀、位置、姿態、運動等。因此,通過計算機視覺技術實現結構動位移的測量是可行的。上世紀八十年代中期以來,隨著計算機軟、硬件技術的不斷發展,在土木工程領域,國內外很多學者嘗試將計算機視覺技術用于結構的幾何測試,包括結構的位移(靜、動位移)、裂縫、表觀外形等。Aw和Koo采用數碼照相機來進行預設目標的坐標測量,經過基于計算機視覺理論的光束法優化后,其測試精度為2.24mm。Nieder?st和Maas利用數碼攝像機來測試混凝土梁在脫水收縮過程中的變形情況,其在相機視場為80cm時測試精度可達0.03mm。相類似地將計算機視覺技術用于結構特性的測量例子還有很多,比如混凝土管片變形檢測,梁破壞試驗中的變形測量,遠距離橋梁變形測量,軌道梁破損狀況的檢測等。相比于結構靜態幾何特性的測試,結構動態特性的測試應用相對不多。Olaszek利用攝像機來攝錄橋梁的振動情況,并以計算機視覺技術進行結構動位移重構分析,得出的動位移測試精度為1mm左右。Yoshida等采用立體視覺技術來測試一塊薄板的三維振動特性。
一、單相機標定
二、基于立體視覺的兩相機立體標定
三、圖像點跟蹤
圖像點跟蹤是基于立體視覺的結構位移測試手段中的重要環節。在圖像(或視頻)分析過程中,點跟蹤的精度會直接影響位移測試的最終結果。在實際測試中,本文采用兩個黑方格組成的目標模板粘貼在所測結構的表面,方格尺寸均為30×30mm,兩方格的交叉角點作為圖像分析的跟蹤點。
四、三維點重構
篇7
【關鍵詞】計算機視覺;構件;表面特征;檢測
表面缺陷檢測以及特征提取,所涉及的范圍是非常廣泛的,包括了鐵軌表面缺陷、帶鋼表面缺陷以及織物表面缺陷等。因此加強對產品的表面缺陷提取以及質量檢測顯得尤為重要,目前基于計算機視覺的構件缺陷檢測系統已經受到國內外研究人員的重視,如何更好地將計算機視覺技術引入到產品表面質量缺陷檢測中去是未來發展的重點。筆者將在下文中就此展開詳細的闡述。
1.計算機視覺的基本工作原理
1.1系統結構
計算機視覺是一項涉及范圍廣泛的技術,他通過圖像采集裝置將檢測目標轉化為圖像信號,再經過專門性的額圖像處理系統最終生成具體的表面特征。具體來講在圖像處理環節米旭濤根據圖像的具體像素以及圖像分布和顏色、亮度、飽和度等進行目標提取,再比照系統預設的參照值得出最終的檢測結果,例如尺寸大小、顏色等師傅偶合格。計算機視覺處理系統包括了光源、鏡頭、計算機以及圖像采集裝置和處理系統等,這些系統綜合組成共同推動了計算機視覺系統的正常穩定運行。
1.2計算機視覺硬件設計
計算機視覺系統的硬件平臺包括了照明系統、鏡頭相機以及圖像采集裝置和工控機四個部分,這四個部分缺一不可,共同組成了整個計算機視覺系統。
1.2.1照明系統
照明系統是整個計算機視覺系統的關鍵,尤其是在光源和照明方案的配合上更是直接影響了整個系統運行的成敗。因此在照明方案的制定以及光源的選擇上應該盡可能的突出物體特征參量,綜合考慮對比度以及亮度等因素,將計算機視覺系統的光源與照明方案相匹配,選擇需要的幾何形狀以及均勻度等,同時還需要結合被檢測物體的表面特征幾何形狀。針對構件表面缺陷的照明方案,筆者認為應該選擇功率相對較大的LED光源,用低角度的方式進行照明。
1.2.2相機鏡頭
相機系統是成像的關鍵,因此在相機鏡頭的選擇上應該適用于具體的構件。一般來說相機鏡頭包括了兩方面內容,一是線掃,二是面掃。通過二者的綜合運用實現更好地成像效果。
1.2.3圖像采集卡
圖像采集卡主要是指在計算機視覺系統中位于圖像裁剪機設備和圖像處理設備之間的重要接口。是成像的中間環節,發揮著不可或缺的作用。
2.基于計算機視覺的構件表面缺陷特征提取
基于計算機視覺的構件表面缺陷特征提取可以分為為三個重要部分,分別是圖像預處理部分:主要是指針對構件進行區域的定位,將非構件的部分移出計算機視覺的缺陷提取技術中去,從而降低了后續工作的工作難度;其次是進行缺陷定位,主要是指通過特定的技術和算法將缺陷從結果當中直接分離出來。第三部分是缺陷特征的提取,也是系統處理的結果部分,是通過計算缺陷的程度以及缺陷大小,從而為后期的構件維護提供參考依據。具體來說,這三個部分的操作主要體現在以下幾個方面:
2.1區域定位
區域定位是減少構件處理和選擇時間的關鍵,能夠大大提高構件缺陷提取的效率。構件的表面的基本特征和大致集合框架提取是區域定位和的第一步,要將計算機區域定位和缺陷提取結合起來,更好地實現缺陷分析。要做好構件的區域定位首先需要明確構件的基本種類和特征:一是根據構件的重用方式來說,可以分為白匣子、灰匣子、黑匣子從構件的使用范圍來看又可以分為通用構件和專用構件;根據構件的粒度的大小可以分為小。中大三種不同粒度的構件;再次是從構件的功能上來看可以分為系統構件、支撐構件以及領域構件三個部分。四是從構件的基本結構特征來看可以分為原子構件以及組合構件。最后從構件的狀態來說,又可以分為動態和靜態構件。因此從不同種類的構件進行區域定位為視覺系統正常運行創造了優良的條件。
2.2缺陷提取
在進行缺陷提取的過程中,難免會受到客觀的環境影響,比如噪聲、溫度以及濕度等對圖像處理的結果產生影響,因此需要對區域定位中產生的區域進行濾波處理,然后再采用閾值分割的辦法進行缺陷提取。具體操作步驟如下所示:
(1)計算出成像中的最小最大灰度值,并且設置初始閾值。
(2)根據閾值,結合圖像的分割目標,將圖像分割成為目標和背景兩個部分,求導出平均灰度值。
(3)再根據新的平均灰度值計算出新的閾值。
(4)觀察閾值的初始值與新閾值之間的關系,如歌二者相等則整個計算過程就結束,如果不相等,則就需要進一步計算。
通過閾值計算得出啊的最佳閾值分割效果圖,能夠進行初步的缺陷預判,但是初步預判當中還存在較多的不確定因素,主要包括兩類,一是在邊緣部分出現的細小毛刺,由于與缺陷的距離較近,因此在初步缺陷提取中容易形成誤判、再次是在構件表面有一些非常細小的缺陷,這些缺陷的影響較小,不會對構件的性能造成影響,因此在進行缺陷提取的過程中需要將這兩個因素排除在外,具體主要是指采用圖像形態學中開運算和閉運算,從而達到對構件中的明了細節和暗色細節的過濾。具體來說缺陷的分割提取采用的是Sobel算子。主要是利用了圖像像素點的上下左右灰度加權算法,對構件表面的缺陷進行檢測。再采用二值圖像邊界跟蹤法,將缺陷從構件圖像中分離出來。
2.3缺陷特征提取
缺陷特征提取,又可以稱之為缺陷的定量計算和定性過程,是將前期所得的數據結果以更加直觀的形式展現出來,通過對比指標參數判斷構件的表面質量是否合格,符合基本的生產標準。一般來說常用的表示缺陷特征的標準有以下幾種:
(1)周長:周長是對缺陷的邊界長度的描述,在圖像特征上顯示則是指構件成像上的缺陷區域的邊界像素數量。
(2)面積:面積相對于周長能夠更加直觀地反映整體缺陷的大小,它是缺陷區域中的像素的總數,因此更高體現缺陷的影響規模。
(3)致密性:這是一個相對專業的缺陷指標概念主要是指每平方面積上的平方周倉,是一個雙單位描述指標。
(4)區域的質心:區域質心是描述缺陷的影響關鍵也就是缺陷區域內的核心區域,是對整個區域的核心描述。
(5)最小外接矩形。
3.結語
綜上所述,構件表面缺陷直接影響構件的最終使用效果,構件表面缺陷的檢測應用領域也逐漸廣泛,而計算機視覺技術在檢測缺陷中的優越性更體現了基于計算機視覺的構件表面缺陷特征提取的研究價值。本文主要針對構件表面缺陷的檢測,綜合計算機視覺技術提出了具體的檢測方法和檢測工作原理,通過對表面缺陷的檢測,力圖提高構件的整體質量。
【參考文獻】
[1]陳黎,黃心漢,王敏,何永輝,龔世強.帶鋼缺陷圖像的自動閾值分割研究[J].計算機工程與應用,2002,(07).
[2]許豪,孔建益,湯勃,王興東,劉源泂.基于數學形態學的帶鋼表面缺陷邊緣提取[J].機械設計與制造,2012,(06).
篇8
關鍵詞: 食品物流; 運作模式; 計算機視覺; 實時監控
中圖分類號:TP393 文獻標志碼:A 文章編號:1006-8228(2013)08-87-02
0 引言
為了加強食品安全的有效追蹤和監控,山東省自2011年5月以來,建成了黃河三角洲高效生態冷鏈產業物聯網管理運營中心,開通了“冷鏈產業物聯網管理平臺”。黃三角冷鏈產業物聯網管理平臺依托食品產銷對接系統和食品品質安全管理系統,實現了食品全程監控和追溯。然而,目前這一管理平臺只能實現食品運輸流程的監控和出現安全問題之后的追溯,而不能實現食品質量的實時監管。對消費者健康的保障和對社會穩定、經濟發展的需求日益增長,通過一個可視化的食品物流信息化監控體系運作模式來進行食品安全監控的重要性日益突出[1]。
1 監控體系運作模式
監控體系運作模式利用計算機視覺技術,通過圖像分析,提取食品數字圖像中的特征信息,實現食品品質安全信息的快速、客觀、準確檢測,能為食品生產、加工、物流和銷售過程的自動化跟蹤和監管提供信息支持,讓食品行業徹底實施食品的源頭追蹤以及在食品供應鏈中提供完全透明度的能力[2]。
1.1 食品圖像的分析
計算機圖像處理步驟包括圖像預處理、目標邊緣、檢測與圖像分割、特征提取以及模式識別,為后續圖像特征提取提供分析對象。食品圖像質量檢測流程如圖1所示。
[進行食品邊緣檢測][圖像處理和模式識別軟件][獲取食品顏色][食品圖像][食品分析系統]
圖1 食品質量檢測流程
為了在食品物流中實時監控食品的品質,我們利用計算機視覺技術實現直觀可視化的監控。通過計算機視覺技術可以對食品進行像素級的圖像獲取,并能根據食品的形狀變化和表面顏色的識別實現對食品外觀的初步檢測。同時在物流運輸過程中能夠實時對檢測不合格的食品進行篩選和處理,避免了消費者購買到腐爛變質和表面缺陷的食品。實現實時物流跟蹤,建立信息追溯和信息共享機制,成為當前食品物流配送的關鍵。物流可視化運作模式可以大大加快數據的處理速度,使時刻都在產生的海量數據得到有效利用;可以在人與數據、人與人之間實現圖像通信,從而使人們能夠觀察數據中隱含的現象,為發現和理解食品流動過程中出現的問題和及時解決問題提供了有力工具。
1.2 建立智能移動貨倉
在本物流可視化運作模式中,設計了在移動貨倉上安裝攝像頭并連接到信息管理平臺,通過攝像頭對貨倉打開次數及貨物的提取、裝載情況等進行記錄。當在運輸過程中需要對食品進行提取、調換等其他操作時,只有工作人員向物流信息平臺發送請求指令,主管人員確認身份后,指令下達到貨倉,方可進行工作。這樣可以有效避免在運輸過程中遺漏、丟失或者更換貨物,管理流程如圖2所示。
為了在食品生產、加工、運輸、銷售過程中及時了解食品物流的情況,給食品原料中夾帶了RFID標簽;在RFID標簽中對食品的倉儲過程、入庫、出庫情況進行標示,物流信息管理平臺可以根據計算機視覺處理系統得出的數據與RFID信息進行比對,避免了貨物在物流過程中出現異常情況[3]。
2 可視化食品物流功能結構
在食品物流監控體系中,通過攝像頭CCD獲取食品圖像,傳送到計算機視覺系統。系統對圖像進行處理和分析,然后將分析結果提交到物流信息管理平臺。食品質量管理員可以根據信息系統給出的信息通知到貨倉告知物流現有情況;同時,在顧客購買食品時可以通過RFID技術,采用系統提供的終端接口,對貨物的生產、加工、運輸、分發、銷售等情況進行追溯查詢。系統結構圖如圖3所示。
可視化食品物流運作系統基于B/S體系架構,并且利用軟件自動采集圖像信息,并將貨物信息、條碼信息、尺寸信息和重量信息合成到圖片中,同時這些信息也記錄在服務器的關系數據庫中。通過服務器端的Web服務,可以實現用戶在局域網/廣域網內,查詢相應的信息內容[4]。
3 結束語
利用計算機視覺技術可以獲得食品品質的空間位置信息,能夠減少傳統人工檢測帶來的高強度勞動,減少檢測主觀性和人工成本,釋放人力資源。通過獲取食品的數字圖像,可以傳輸給遠距離的分析者或者分析系統,從而實現食品品質信息的區域分析和共享。利用計算機視覺技術無縫地實現對貨物的全程可視化追溯,是今后食品物流方面研究的重點,為實現食品便捷的反向查詢,進一步保證食品的安全奠定了基礎。
參考文獻:
[1] 全英華.我國現代食品物流發展現狀和對策[J].物流科技, 2011.5:67-68
[2] 陳非.物流可視化信息平臺探究[J].科技創新導報,2011.31:198-120
篇9
【關鍵詞】計算機視覺 運動目標 跟蹤算法
在計算機等現代科學技術尚未出現以前,人們在獲取外界信息時往往主要依賴視覺,而在我國計算機技術水平不斷發展提升的背景之下,計算機視覺技術的出現使得人類肉眼視覺得到了進一步的發展延伸,尤其是在各種傳感器技術的幫助之下,使得人們能夠對保持運動狀態的目標進行實時跟蹤,從而準確掌握目標的具體形態屬性。在此背景之下,本文將運動目標設定為運動的人臉,通過探究基于計算機視覺的運動目標跟蹤算法,希望能夠為相關研究人員提供相關參考和幫助。
1 Kalman filter目標跟蹤算法的簡要概述
Kalman filter目標跟蹤算法是當前眾多跟蹤算法當中使用范圍較廣、使用頻率比較集中的一種跟蹤算法,這一算法最早可以追溯至上個世紀六十年代,人們通過將濾波理論與狀態空間模型相集合,從而得到的一種遞推估計的算法也就是卡爾曼濾波理論。其通過利用上一時刻獲取的預估值以及當下獲取的實際觀測值,在信號與噪聲狀態空間模型當中不斷更新狀態變量,進而順利完成估計預測并獲得當前時刻估計預測值。經過不斷的發展,在計算機圖像處理以及其他運動目標跟蹤當中經常會使用Kalman filter算法。如果在k時刻系統下的狀態向量用xk表示,那么在t0時刻下初始化的狀態預測方程為;在tk時刻下更新系統狀態的具體方程為
,其中Hk、Zk分別表示測量矩陣m×n維以及轉移矩陣n×n維的狀態向量。但在跟蹤計算機視覺運動目標譬如說視頻目標時,由于相鄰的兩幀視頻圖像本身時間間隔非常短,因此目標在這一時間內難以發生明顯的運動狀態變化,此時我們可以通過將此間隔時間設定為單位時間,同時目標在單位時間內一直保持勻速運動狀態,這時我們可以得到一個狀態轉移矩陣且
,定義系統觀測矩陣即為
,定義噪聲Wk以及Vk協方差矩陣則可以分別用
和表示。
如果在濾波器在經過若干次卡爾曼濾波后仍然能夠恢復至原始狀態,則其具有較好的穩定性,但如果在進行運動目標跟蹤實驗的過程當中,對于處于運動狀態的被跟蹤目標,一旦出現遮擋行為則將在第一時間內暫停估計參數,并將這一參數估計值直接代入到狀態方程當中,使得運動目標無論是否被遮擋均可以對其進行精確跟蹤。
2 基于計算機視覺的運動目標跟蹤算法
2.1 建立顏色概率模型
顏色囊括了諸多的信息量光柱點,尤其是在人類的視覺世界從本質上來說也是一種用過感知自然界色彩以及明暗變化的世界,因此人們可以通過使用三基色原理獲得RGB顏色空間??紤]到顏色與計算機視覺場景當中各個場景和目標之間有著緊密的關系,同時不同于目標的大小、形態等其他視覺特征,顏色特征鮮少會受到包括觀察視角等在內各因素的干擾影響,從某種角度上來說基于顏色特征的運動目標具有較好的穩定性。為了能夠保障目標跟蹤既穩定又迅速,需要選擇合適的顏色特征,否則將極有可能導致出現跟蹤失敗。在這一環節當中人們通常使用的是RGB顏色空間以及HSI顏色空間,但由于二者均具有一定的局限性,因此本文在對人臉特征尤其是顏色特征進行選取時,選擇了rgI顏色直方圖的方法,在解決兩N顏色空間自身缺陷的同時,盡量避免目標人臉運動位置以及尺寸等變化因素對目標追蹤造成的干擾影響。在rgI顏色直方圖當中
,,,L=r+g+I其中R、G、B就是RGB顏色空間當中的三原色,r、g、I有著相同的取值范圍即在0到1之間。保持間隔相等的情況下劃分L值即可得到rgI顏色直方圖。雖然rgI顏色直方圖與物體相對應,但如果目標只是位置以及尺寸等出現變化,rgI顏色直方圖并不會受到任何實質性影響,因此在理想情況下,利用rgI顏色直方圖能夠對視頻圖像中不同運動位置以及不同尺寸的人臉進行目標追蹤。
2.2 跟蹤算法
運動目標的不斷變化將會使得模板圖像隨之發生相應變化,因此需要不斷更新模板圖像才能夠有效完成對運動目標的連續跟蹤,本文在對運動目標的實際運動范圍進行預測過程中選擇使用卡爾曼濾波,之后利用rgI顏色直方圖在預測運動范圍之內搜索和匹配相應目標,從而通過此舉獲得與目標模板有著最小歐式距離的區域,在此過程當中存在一個特定閾值T,如果兩者的歐氏距離在進行相減時差值沒有超過這個特定閾值,那么此時該區域就是運動目標所在的實際位置,利用在這一區域當中的rgI顏色直方圖并將其充當下一幀運動目標的匹配模板,在不斷重復的過程中模板能夠實現不間斷地更新。由于相鄰的兩幀視頻圖像之間,時間間隔并不長,因此目標人臉在極短的時間間隔當中基本上不會出現突然變化,此時我們可以認為運動目標人臉的運動連續性比較強,此時利用公式
可以進行歐式距離的計算并用以衡量匹配的模板。其中匹配區域和模板的rgI顏色直方圖分別用l和l'表示,而rgI顏色直方圖中的維數則用n進行表示。根據相關視頻圖像顯示,通過不斷更新模板確實可以對目標運動人臉進行實時跟蹤顯示。
3 結束語
總而言之,本文通過選擇當前比較常見的目標跟蹤算法即Kalman filter算法,利用卡爾曼濾波以及rgI顏色直方圖完成對運動人臉的跟蹤。事實證明,Kalman filter算法確實能夠在對各目標之間的干擾進行明確區分的基礎之上,準確描述運動人臉目標,從而較好地跟蹤運動目標,但由于人臉之間本身存在一定的相似性,因此本文只是對理想狀態下的運動人臉進行跟蹤實驗,日后還需要對計算機視覺技術和Kalman filter算法進行進一步優化以妥善解決多人臉目標以及相似性問題。
參考文獻
[1]鄭薇.基于雙目視覺的運動目標跟蹤算法研究及應用[D].哈爾濱:哈爾濱工程大學,2014.
[2]李慧霞,李臨生,閆慶森,周景文.基于Mean Shift算法的目標跟蹤綜述[J].計算機與現代化,2017(01):65-70.
[3]李寰宇,畢篤彥,楊源,查宇飛,覃兵,張立朝.基于計算機視覺的運動目標跟蹤算法研究[J].電子與信息學報,2015(09):2033-2039.
[4]陳曦,殷華博.基于計算機視覺運動目標跟蹤技術分析[J].無線電工程,2014(06):22-24+39.
篇10
生活中,每個人都問過別人“這件衣服是從哪買的?”“這雙鞋是什么牌子的?”這一問題很快會被AI技術解決,只需要拿出手機對著物品拍照,就會得到商品的各種信息,并且能一鍵買買買。這就是美國著名圖片社交網站Pinterest(拼趣)即將推出的應用圖片識別購買業務。
Pinterest總裁Tim Kendall表示,“Pinterest可以即刻在存儲750多億張圖片的巨大網絡空間內進行搜索,從而為用戶找到與所拍攝照片相似的配對圖片,以及查找到哪些地方能夠買到他們所需的商品。”
目前,Pinterest的估值已經達到了110億美元,該公司的專注點正在向營收增長和創收方面轉變。相比Facebook、Twiter等社交網站,Pinterest已經率先找到了一條清晰的創收道路。
從興趣到產品
亞里士多德曾經說過,古往今來人們開始探索,都應起源于對自然萬物的驚異??萍嫉倪M步也是如此,就像微軟研發主管和項目負責人Mitch Goldberg所說:“我們想通過該應用向人們展示識別技術的無限魅力。”
今年2月,微軟旗下的Garage實驗室了一款名為“Fetch!”的應用,它可通過機器學習系統識別照片中寵物狗的品種并用文字對該品種進行簡單的介紹。
隨著計算機視覺領域開始利用深層神經網絡這種模仿人類大腦生物過程的系統來從事機器學習,識別的精確度實現了巨大飛躍。也就是說通過機器學習技術,Fetch!識別的準確度會越來越高,隨著大量圖片的涌入,Fetch! 可以自我修復錯誤,從而更加精確地識別每一只狗的樣貌、形態、動作。除了測試狗類品種以外,你還可以把朋友的照片上傳至平臺,看看他們能夠對應出哪種寵物。
微軟的這款產品基于目前最為熱門的一種圖像識別技術――“深度神經網絡”,同樣基于這種技術,微軟還有另一款有趣的產品:。去年5月,有超過5.75億圖片被提交到,超過8500萬來自世界各地的使用者訪問了這個網站,只為尋找一個簡單問題的答案――顏齡機器人認為我看起來像幾歲?如果是合照,并且顏齡機器人識別出的自己比周圍人年齡小,則更能引發用戶的興趣,這種“損人利己”的識別應用著實在社交媒體上火了一把。
另一讓計算機視覺研究技術人員特別感興趣的領域是生物識別,當下最為火爆的莫過于人臉識別技術了。早期的人臉識別技術多為安防領域,如海關識別走私犯、商店識別小偷等。近年來,深度學習的研究與應用使得人臉識別和人工智能的核心技術得到了極大的提升,攝像頭等圖像硬件的發展為人臉識別提供了很好的圖像基礎,如今人臉識別技術應用更加廣泛,比如公司可以使用刷臉打卡來杜絕代人打卡簽到現象。
其實早在2012年,谷歌就開發出了安卓系統的“刷臉解鎖”技術,但因安全問題未解決,該技術一直未能得到普及。
而今年3月,電商巨頭亞馬遜提交了一項針購物付費的專利技術,即消費者在亞馬遜網站購物時可以通過自拍或者視頻來進行付費,無須再輸入賬號密碼。在消費時系統會提示用戶表現出特定的行為、情緒或手勢來證明消費者就是本人,而不是拿著照片的冒名頂替者。
亞馬遜表示,這項技術能使消費者更加安全地進行網上購物,因為很多用戶為了省事會把所有賬戶都用同一個密碼,或者把密碼記在手機里,一旦遭遇“撞庫”或者手機被盜,后果不堪設想,而刷臉技術則沒有這個風險。
除了識別人臉,在識別其他生物方面也有了突破性進展,比如識別寄生蟲。瘧疾,是一種由瘧原蟲造成的全球性急性寄生蟲傳染病,據統計,2015年有大約有2.14億人受瘧疾的影響。
一直以來,醫療工作者是通過肉眼觀察采樣玻片來確定采樣對象是否被瘧原蟲感染,這不但是對醫療工作者經驗的考驗,而且工作效率也十分低下,而貧困地區一直都缺乏有經驗的醫療工作者。
今年2月,根據MIT Technology Review報道,Intellectual Ventures Laboratory(智能事業實驗室)開發出了能夠檢測和評估瘧疾感染的便攜式顯微鏡。這種顯微鏡采用的是一個名為“Autoscope”的系統,通過計算機視覺和深度神經網絡技術,采用深度學習算法來鑒別瘧原蟲。這款便攜式顯微鏡今年在泰國實地測試,成功鑒別出了 170塊玻片中的瘧原蟲如果這項技術得到普及之后,只要診所有一臺Autoscope顯微鏡和一些載玻片,就可解決瘧疾的診斷問題,這將使瘧疾診斷不再依賴于有限的專業醫療人員。
技術轉化為產品
新技術的出現,讓計算機不但“看見”這個世界,更能“看懂”這個世界,可以代替人眼甚至超越人眼。
人的視野是有限的,并且會受到周邊條件的影響,駕駛員在開車時會有視野盲區,還會受到光線的影響,并且大霧、暴雨等極端天氣也會嚴重影響駕駛員的視線。而計算機視覺技術就不一樣了,視野會更開闊,受限制更小。根據汽車媒體《Leftlane》報道,福特公司最新的無人駕駛汽車研究計劃是由激光感應(LiDAR)和雷達、攝像頭形成一張周圍環境的高清3D地圖,不但讓無人駕駛汽車看到攝像頭視野范圍之外的物體,而且并不受光線限制。在夜間試駕后,福特工程師Wayne Williams說:“坐在汽車里,我能感到它在走,但是我往車外看,只能看到一片漆黑。結果令人驚喜,車輛準確地沿著蜿蜒的道路行駛?!?/p>
識別場景這一領域技術的發展,使得計算機不但能當機器的眼睛,還能變成人類的眼睛。
對于雙目失明的人來說,能親自感知這個世界是夢寐以求的事,而微軟2016 Build開發者大會上Seeing AI項目正是要幫助盲人實現這一愿望。
Seeing AI項目是通過計算機視覺和自然語言去形容一個人的周圍環境、朗讀文本、回答問題以及識別人的面部表情,可以在手機上使用,也可以在Pivothead的智能眼鏡上使用。如果投入使用,將有助于為視障人士營造更公平的環境,是一款能夠真正改變人們生活的產品,就像此項目的高級項目經理Anne Taylor所說的,這是“為真正重要的場景尋求解決方案”。也許不久微軟能開發出一種仿生眼,直接發送視覺信號到大腦,讓盲人真正看到這個世界。