計算機視覺基本原理范文
時間:2023-12-22 18:04:30
導語:如何才能寫好一篇計算機視覺基本原理,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務員之家整理的十篇范文,供你借鑒。
篇1
1、引言
隨著經濟的迅猛發展,汽車的迅速普及,根據社會對汽車產業的要求,車輛的各方面指標都受到人們越來越多地關注,汽車涂裝過程中的瑕疵直接影響汽車的外觀質量,因此如何在生產過程中利用計算機視覺檢測技術檢測出并及時修補汽車涂裝過程中產生的瑕疵就成了首要的任務[1]。本文的研究內容是首先了解計算機視覺檢測系統的工作原理,汽車涂裝瑕疵的種類,然后結合兩者的特點,應用計算機視覺檢測系統檢測汽車涂裝瑕疵。該研究的價值在于兩方面:①對于汽車生產的自動化和過程自動化,計算機視覺是現實真正意義的自動的基礎和一種重要的質量控制的手段;②對于汽車涂裝瑕疵的修補可以提高其修補的精度。
2、汽車涂裝瑕疵的計算機視覺檢測系統
汽車涂裝瑕疵檢測系統主要包括照明系統、圖像采集卡、CCD攝像機、計算機以及軟件處理等幾個主要部分[2]。綜合計算機視覺檢測系統的構成和線結構光測量的原理,基于計算機視覺的汽車涂裝瑕疵的檢測系統大致是這樣構成的:將線結構光投射到被測物上,所形成的光斑作為傳感信號,用CCD攝像機采集光斑圖像,采集到的圖像信號被傳輸到計算機,根據圖像處理和計算機視覺檢測系統的處理產生處理結果,返回到涂裝生產線,對車身的涂裝進行修正,從而提高產品質量。汽車涂裝瑕疵的視覺檢測系統如圖1所示[3]。
3、計算機視覺檢測
計算機視覺是計算機對圖像進行自動處理并報告“圖像中有什么”的過程,也就是說它識別圖像中的內容。圖像中的內容往往是某些機器零件,而處理的目標不僅要能對機器零件定位,還要能對其進行檢驗。計算機視覺系統基本原理:機器視覺系統通常采用CCD相機攝取圖像,將其轉化為數字信號,再采用先進的計算機硬件與軟件技術對圖像數字信號進行處理,從而得到所需要的各種目標圖像特征值,并在此基礎上實現模式識別、坐標計算、灰度分布圖等多種功能。計算機視覺系統能夠根據其檢測結果快速地顯示圖像、輸出數據、指令,執行機構可以配合其完成指令的實施。計算機視覺系統主要由圖像獲取、圖像分析和處理、輸出顯示或控制三個功能模塊組成[4]。視覺檢測按其所處理的數據類型可分為二值圖像、灰度圖像、彩色圖像和深度圖像的視覺檢測。另外,還有X射線檢測、超聲波檢測和紅外線檢測。一個完整視覺檢測系統包括:圖像采集、圖像分割、零件識別、模型匹配和決策判斷。Newman[5]等描述了利用深度圖像進行零件檢測的AVI系統,具有一定的代表性。一個典型的AVI系統如圖2所示。
4、汽車涂裝瑕疵的檢測算法
由于汽車涂膜中一些缺陷的邊界比較模糊,例如:氣泡、爆裂氣泡孔、氣泡針孔、抽縮等等。邊緣處灰度變化很小,直接用傳統的微分邊緣檢測算法無法有效的檢測出來。所以對缺陷模糊邊緣的檢測成為了算法的關鍵[6]。本文介紹了基于線結構光的邊緣檢測方法。汽車涂裝表面被光源投射器發出的線結構光照射,反射出的圖像被CCD攝像機所接收傳輸到計算機視覺檢測系統中。若涂裝表面沒有瑕疵,則產生圖3的圖像。若涂裝表面有瑕疵,則產生圖4的圖像[7]。
篇2
關鍵詞:三維點云;配準;迭代最近點
中圖分類號:TP311 文獻標識碼:A 文章編號:1009-3044(2012)31-7568-03
在計算機應用領域,三維點云數據的配準對解決曲線曲面匹配、圖像拼接、三維重建、計算機輔助文物復原等問題至關重要。以計算機輔助文物碎片拼接為例,在過去十年間有很多研究項目需要獲取文物詳細的三維表示,但是通過三維掃描設備獲取的多個掃描需要采取一定的技術恢復每個掃描的相對視點,然后將多個掃描融合到一個最終的模型。這一過程就是三維點云數據的配準,它是獲取文物準確的三維表示的關鍵步驟。1992年,Besl和Mckay提出了一種基于幾何模型的三維物體配準算法——迭代最近點算法[1]。近年來,伴隨著三維掃描技術的不斷進步,該算法得到了廣泛應用,也吸引了眾多研究者的目光。許多研究者對該算法進行了系統的研究,分析了該算法的特點與不足,提出了各種改進算法。國外學者Michael Wild[2]回顧了2002年到2007年ICP算法的發展;介紹了ICP算法的流程并對幾種改進算法做了詳細的分析和比較;最后介紹了該算法在放射療法中的應用。近幾年,ICP算法的研究改進以及應用仍然是國內外眾多學者熱衷的一個研究方向,這從發表在IEEE上的論文數量即可看出。本文詳細總結了ICP算法的基本原理,然后從數據采樣、特征點選取與點對權重、非重疊區域檢測、兼容性約束四個方面對幾種改進算法進行了系統而詳細的分析與研究。總結了這些算法的基本思想和特點,這些工作對后期的研究將會起到重要的作用。
1 ICP算法的基本原理
篇3
關鍵詞:嵌入式;GUI;QT;OpenCV
中圖分類號:TP368.1
1 目前主流的嵌入式GUI
GUI技術是嵌入式的關鍵技術之一,其直接關系到產品的界面友好性程度,最終影響到產品的競爭力。
目前主流的嵌入式GUI主要有以下幾種:
Microwindows的體系結構由上至下,分別為API層、圖形引擎層、驅動層、硬件層,用戶可以根據具體的應用需求來實現每一個層。
MiniGUI的實現主要依賴于標準C的庫函數,它可以任意在支持標準C的環境上運行,MiniGUI很小巧但也很高效。MiniGUI主要應用在一些中低端設備中。
2 QT的搭建
由于QT具有跨平臺的特性,所以一般開發可以在windows下開發,再移植到Linux中,本文重點介紹QT在Windows下的使用。
QT的開發環境包括以下幾部分:QT的GUI庫,QT creator,windows版本還包含編譯器,可以是Microsoft visual stdio c++,還可以是MinGW,本文中使用的是MinGW。
搭建QT開發環境包括以下幾部分:(1)下載安裝MinGW編譯器,該編譯器支持Gcc和G++。(2)下載安裝qt-creator-win-opensource。(3)為QT、MinGW、qmake添加環境變量。
3 OpenCV的安裝配置
3.1 OpenCV簡介。QT中本身也支持視頻處理,但功能十分有限,如果需要更強大的視頻處理功能,需要引入OpenCV(open source computer vision library),即開源計算機視覺庫。
3.2 OpenCV的優點:(1)開源。OpenCV完全遵循BSD協議(五大開源許可協議之一),具有極高的開放性。(2)跨平臺。OpenCV支持Windows、Linux,Mac,可以輕松實現平臺之間的移植。(3)效率高,速度快。由于OpenCV采用C++實現,并且算法經過優化,效率有較大程度的提高,執行的速度也比較快。(4)涵蓋面廣、功能強大。OpenCV主要有13個模塊構成,涵蓋了計算機視覺的各個方面,在相關方面基本都應用。
3.3 OpenCV的安裝配置:(1)前提是QT已經安裝配置成功。(2)下載OpenCV。下載OpenCV后,解壓即可,實際上并不需要安裝,注意解壓路徑不能有空格,否則會出錯。(3)下載安裝CMake。OpenCV只是一個庫,并不能直接拿來使用,需要借助CMake將其編譯后才可以使用。(4)配置CMake參數,進行編譯。使用CMake,主要是設定OpenCV的輸入路徑、輸出路徑、MinGW的位置等相關信息。運行CMake之后,需要在命令提示符下進入輸出路徑,然后執行mingw32-make命令,由MinGW對OpenCV進行編譯,其間會耗費一定的時間。此步驟成功后,再執行mingw32-make install命令,會把編譯好的所有文放到這個文件夾下,這個就是將來開發要用到的OpenCV全部文件。(5)將上一步驟得到的install目錄bin文件夾,添加到系統的環境變量中,重新啟動電腦。(6)在QT工程中,打開.pro工程屬性文件,將OpenCV添加到INCLUDEPATH和LIBS中后,就可以在QT開發中使用OpenCV計算機視覺庫了。
4 在QT中通過OpenCV實現視頻處理
4.1 實現的基本原理。在視頻處理中主要用到OpenCV的highgui模塊,該模塊,前面已說過,主要完成視頻捕捉、編碼,圖片處理等相關功能。
highgui模塊中已經封裝了視頻、圖像、窗口的所有操作。
首先,利用OpenCV建立窗口,然后打開攝像頭,獲取攝像頭中的幀,然后申請IplImage類型的指針,將幀放入指針指向的內存空間,此時的只是靜止的圖像而已,為了符合我們人眼的觀看習慣,再通過循環,達到每秒鐘顯示30次左右的效果,與放電影的原理基本一樣,最終顯示到窗口,看到就是動態的視頻效果,使用完之后釋放內存,釋放窗口即可。
5 總結
嵌入式技術在當前的大環境下得到了快速發展,隨著硬件設備性能的不斷提高,高性能的嵌入式程序會越來越廣泛地被使用,而QT恰好與這個大環境相吻合,同時OpenCV的出現對QT也是一個促進,QT+OpenCV模式在未來嵌入式視頻處理中會廣泛地被使用。
參考文獻:
[1]彭均鍵,史步海,劉洋.基于Qt的嵌入式GUI開發平臺的搭建[J].微型電腦應用,2010,2.
[2]郭暉,陳光.基于OpenCV的視頻圖像處理應用研究[J].微型機與應用,2010,21.
[3]秦小文,溫志芳,喬維維.基于OpenCV的圖像處理[J].電子測試,2011-7.
[4]許生模,余敏.嵌入式QT的內核分析與優化[J].微計算機信息,2007-10.
[5]陳峰,郭爽,趙欣.基于QT和嵌入式的視頻監控系統[J].通信技術,2011,10.
篇4
【關鍵詞】量子計算;量子計算機;量子算法;量子信息處理
1、引言
在人類剛剛跨入21山_紀的時刻,!日_界科技的重大突破之一就是量子計算機的誕生。德國科學家已在實驗室研制成功5個量子位的量子計算機,而美國LosAlamos國家實驗室正在進行7個量子位的量子計算機的試驗。它預示著人類的信息處理技術將會再一次發生巨大的飛躍,而研究面向量子計算機以量子計算為基礎的量子信息處理技術已成為一項十分緊迫的任務。
2、子計算的物理背景
任何計算裝置都是一個物理系統。量子計算機足根據物理系統的量子力學性質和規律執行計算任務的裝置。量子計算足以量子計算目L為背景的計算。是在量了力。4個公設(postulate)下做出的代數抽象。Feylllilitn認為,量子足一種既不具有經典耗子性,亦不具有經典渡動性的物理客體(例如光子)。亦有人將量子解釋為一種量,它反映了一些物理量(如軌道能級)的取值的離散性。其離散值之問的差值(未必為定值)定義為量子。按照量子力學原理,某些粒子存在若干離散的能量分布。稱為能級。而某個物理客體(如電子)在另一個客體(姻原子棱)的離散能級之間躍遷(transition。粒子在不同能量級分布中的能級轉移過程)時將會吸收或發出另一種物理客體(如光子),該物理客體所攜帶的能量的值恰好是發生躍遷的兩個能級的差值。這使得物理“客體”和物理“量”之問產生了一個相互溝通和轉化的橋梁;愛因斯坦的質能轉換關系也提示了物質和能量在一定條件下是可以相互轉化的因此。量子的這兩種定義方式是對市統并可以相互轉化的。量子的某些獨特的性質為量了計算的優越性提供了基礎。
3、量子計算機的特征
量子計算機,首先是能實現量子計算的機器,是以原子量子態為記憶單元、開關電路和信息儲存形式,以量子動力學演化為信息傳遞與加工基礎的量子通訊與量子計算,是指組成計算機硬件的各種元件達到原子級尺寸,其體積不到現在同類元件的1%。量子計算機是一物理系統,它能存儲和處理關于量子力學變量的信息。量子計算機遵從的基本原理是量子力學原理:量子力學變量的分立特性、態迭加原理和量子相干性。信息的量子就是量子位,一位信息不是0就是1,量子力學變量的分立特性使它們可以記錄信息:即能存儲、寫入、讀出信息,信息的一個量子位是一個二能級(或二態)系統,所以一個量子位可用一自旋為1/2的粒子來表示,即粒子的自旋向上表示1,自旋向下表示0;或者用一光子的兩個極化方向來表示0和1;或用一原子的基態代表0第一激發態代表1。就是說在量子計算機中,量子信息是存儲在單個的自旋’、光子或原子上的。對光子來說,可以利用Kerr非線性作用來轉動一光束使之線性極化,以獲取寫入、讀出;對自旋來說,則是把電子(或核)置于磁場中,通過磁共振技術來獲取量子信息的讀出、寫入;而寫入和讀出一個原子存儲的信息位則是用一激光脈沖照射此原子來完成的。量子計算機使用兩個量子寄存器,第一個為輸入寄存器,第二個為輸出寄存器。函數的演化由幺正演化算符通過量子邏輯門的操作來實現。單量子位算符實現一個量子位的翻轉。兩量子位算符,其中一個是控制位,它確定在什么情況下目標位才發生改變;另一個是目標位,它確定目標位如何改變;翻轉或相位移動。還有多位量子邏輯門,種類很多。要說清楚量子計算,首先看經典計算。經典計算機從物理上可以被描述為對輸入信號序列按一定算法進行交換的機器,其算法由計算機的內部邏輯電路來實現。經典計算機具有如下特點:
a)其輸入態和輸出態都是經典信號,用量子力學的語言來描述,也即是:其輸入態和輸出態都是某一力學量的本征態。如輸入二進制序列0110110,用量子記號,即10110110>。所有的輸入態均相互正交。對經典計算機不可能輸入如下疊加Cl10110110>+C2I1001001>。
b)經典計算機內部的每一步變換都將正交態演化為正交態,而一般的量子變換沒有這個性質,因此,經典計算機中的變換(或計算)只對應一類特殊集。
相應于經典計算機的以上兩個限制,量子計算機分別作了推廣。量子計算機的輸入用一個具有有限能級的量子系統來描述,如二能級系統(稱為量子比特),量子計算機的變換(即量子計算)包括所有可能的幺正變換。因此量子計算機的特點為:
a)量子計算機的輸入態和輸出態為一般的疊加態,其相互之間通常不正交;
b)量子計算機中的變換為所有可能的幺正變換。得出輸出態之后,量子計算機對輸出態進行一定的測量,給出計算結果。由此可見,量子計算對經典計算作了極大的擴充,經典計算是一類特殊的量子計算。量子計算最本質的特征為量子疊加性和相干性。量子計算機對每一個疊加分量實現的變換相當于一種經典計算,所有這些經典計算同時完成,并按一定的概率振幅疊加起來,給出量子計算的輸出結果。這種計算稱為量子并行計算,量子并行處理大大提高了量子計算機的效率,使得其可以完成經典計算機無法完成的工作,這是量子計算機的優越性之一。
4、量子計算機的應用
量子計算機驚人的運算能使其能夠應用于電子、航空、航人、人文、地質、生物、材料等幾乎各個學科領域,尤其是信息領域更是迫切需要量子計算機來完成大量數據處理的工作。信息技術與量子計算必然走向結合,形成新興的量子信息處理技術。目前,在信息技術領域有許多理論上非常有效的信息處理方法和技術,由于運算量龐大,導致實時性差,不能滿足實際需要,因此制約了信息技術的發展。量子計算機自然成為繼續推動計算速度提高,進而引導各個學科全面進步的有效途徑之一。在目前量子計算機還未進入實際應用的情況下,深入地研究量子算法是量子信息處理領域中的主要發展方向,其研究重點有以下三個方面;
(1)深刻領悟現有量子算法的木質,從中提取能夠完成特定功能的量子算法模塊,用其代替經典算法中的相應部分,以便盡可能地減少現有算法的運算量;
(2)以現有的量子算法為基礎,著手研究新型的應用面更廣的信息處理量子算法;
(3)利用現有的計算條件,盡量模擬量子計算機的真實運算環境,用來驗證和開發新的算法。
5、量子計算機的應用前景
目前經典的計算機可以進行復雜計算,解決很多難題。但依然存在一些難解問題,它們的計算需要耗費大量的時間和資源,以致在宇宙時間內無法完成。量子計算研究的一個重要方向就是致力于這類問題的量子算法研究。量子計算機首先可用于因子分解。因子分解對于經典計算機而言是難解問題,以至于它成為共鑰加密算法的理論基礎。按照Shor的量子算法,量子計算機能夠以多項式時間完成大數質因子的分解。量子計算機還可用于數據庫的搜索。1996年,Grover發現了未加整理數據庫搜索的Grover迭代量子算法。使用這種算法,在量子計算機上可以實現對未加整理數據庫Ⅳ的平方根量級加速搜索,而且用這種加速搜索有可能解決經典上所謂的NP問題。量子計算機另一個重要的應用是計算機視覺,計算機視覺是一種通過二維圖像理解三維世界的結構和特性的人工智能。計算機視覺的一個重要領域是圖像處理和模式識別。由于圖像包含的數據量很大,以致不得不對圖像數據進行壓縮。這種壓縮必然會損失一部分原始信息。
作者簡介:
篇5
[關鍵詞] 數字圖像、編碼編碼方法
中圖分類號:TN131+.4 文獻標識碼:A 文章編號:
1 引言
數字圖像處理又稱為計算機圖像處理,它是指將圖像信號轉換成數字信號并利用計算機對其進行處理的過程。早期圖像處理的目的是改善圖像的質量,它以人為對象,以改善人的視覺效果為目的。圖像處理中,輸入的是質量低的圖像,輸出的是改善質量后的圖像。常見的圖像處理有圖像數字化、圖像編碼、圖像增強、圖像復原、圖像分割與圖像分析等。圖像編碼是對圖像信息進行編碼,可以壓縮圖像的信息量,以便滿足傳輸與存儲的要求。本文主要介紹了圖像編碼的基本原理和技術方法。
一幅二維數字圖像可以由一個二維亮度函數通過采樣和量化后而得到的一個二維數組表示。這樣一個二維數組的數據量通常很大,從而對存儲、處理和傳輸都帶來了許多問題,提出了許多新的要求。為此人們試圖采用對圖像新的表達方法以減少表示一幅圖像需要的數據量,這就是圖像編碼所要解決的主要問題。壓縮數據量的主要方法是消除冗余數據,從數學角度來講是要將原始圖像轉化為從統計角度看盡可能不相關的數據集。這個轉換要在圖像進行存儲、處理和傳輸之前進行,然后將壓縮了的圖像解壓縮以重建原始圖像,即通常所稱的圖像編碼和圖像解碼。
2 傳統編碼方法
傳統的編碼方法可以分成兩大類,預測編碼方法(對應空域方法)和變換編碼方法(對應頻域編碼方法)。預測編碼方法的優點是:算法一般較簡單,易于用硬件實現;缺點是:壓縮比不夠大,承受誤碼的能力較差。由于它采用的最小均方誤差準則不能反映人眼的視覺心理特性,近年來已較少單獨采用,而是與其他方法混合使用。另外,由于DPCM編碼系統會引起斜率過載、界線繁忙、顆粒噪聲和輪廓噪聲,在使用中應加以考慮。變換編碼方法的優點是:壓縮比高、承受誤碼能力強;缺點是:算法較復雜。
3 現代編碼方法
31 第二代圖像編碼方法
第二代圖像編碼方法[2]是針對傳統編碼方法中沒有考慮人眼對輪廓、邊緣的特殊敏感性和方向感知特性而提出的。它認為傳統的第一代編碼技術以信息論和數字信號處理技術為理論基礎,出發點是消除圖像數據的統計冗余信息,包括信息熵冗余、空間冗余和時間冗余。其編碼壓縮圖像數據的能力已接近極限,壓縮比難以提高。第二代圖像編碼方法充分利用人眼視覺系統的生理和心理視覺冗余特性以及信源的各種性質以期獲得高壓縮比,這類方法一般要對圖像進行預處理,將圖像數據根據視覺敏感性進行分割。
按處理方法的不同,第二代圖像編碼方法可分為兩種典型的編碼技術[3]:一種是基于分裂合并的方法,先將圖像分為紋理和邊緣輪廓,然后各自采用不同的方法編碼;另一種是基于各向異性濾波器的方法,先對圖像進行方向性濾波,得到不同方向的圖像信息,再根據人眼的方向敏感性對各個通道采用特定的方法單獨編碼。
32 分形圖像編碼
分形圖像編碼是在分形幾何理論的基礎上發展起來的一種編碼方法。分形理論是歐氏幾何相關理論的擴展,是研究不規則圖形和混沌運動的一門新科學。它描述了自然界物體的自相似性,這種自相似性可以是確定的,也可以是統計意義上的。這一理論基礎決定了它只有對具備明顯自相似性或統計自相似性的圖像,例如海岸線、云彩、大樹等才有較高的編碼效率。而一般圖像不具有這一特性,因此編碼效率與圖像性質學特性有關,而且分形圖像編碼方法實質上是通過消除圖像的幾何冗余來壓縮數據的,根本沒有考慮人眼視覺特性的作用。
33 基于模型的圖像編碼
基于模型的圖像編碼技術[4]是近幾年發展起來的一種很有前途的編碼方法。它利用了計算機視覺和計算機圖形學中的方法和理論,其基本出發點是在編、解碼兩端分別建立起相同的模型,針對輸入的圖像提取模型參數,或根據模型參數重建圖像。模型編碼方法的核心是建模和提取模型參數,其中模型的選取、描述和建立是決定模型編碼質量的關鍵因素。為了對圖像數據建模,一般要求對輸入圖像要有某些先驗知識。
基于模型的圖像編碼方法是利用先驗模型來抽取圖像中的主要信息,并以模型參數的形式表示它們,因此可以獲得很高的壓縮比。然而在模型編碼方法的研究中還存在很多問題,例如:①模型法需要先驗知識,不適合一般的應用;②對不同的應用所建模型是不一樣的;③在線框模型中控制點的個數不易確定,還未找到有效的方法能根據圖像內容來選??;④由于利用模型法壓縮后復原圖像的大部分是用圖形學的方法產生的,因此看起來不夠自然;⑤傳統的誤差評估準則不適合用于對模型編碼的評價。
34小波圖像編碼
一維連續小波變換可看成原始信號和一組不同尺度的小波帶通濾波器的濾波運算,從而可把信號分解到一系列頻帶上進行分析處理。將其離散化后即為離散小波變換。小波變換圖像編碼壓縮[6]的核心問題是要對子帶圖像進行小波分解系數的量化和編碼。低頻子帶圖像包含原圖像的大部分能量,即包含圖像的基本特性。它在圖像重構算法中起主導作用,對重建圖像的質量有很大影響,因此這部分信號應精確保留。
高頻子圖像的系數分布符合廣義高斯分布,對其系數進行粗量化編碼較為有效。這也完全符合人的視覺特性,根據對人眼視覺系統的研究可知,人眼視覺靈敏度具有明顯的低通特性,而且對不同方向上的敏感度也不一樣,尤其是對傾斜方向的刺激不太敏感,如人眼對對角線方向子圖像系數誤差敏感度較低,因此可對對角線方向子圖像進行粗量化高壓縮。
小波變換后的能量主要集中在低頻系數分量,而其他高頻系數分量大多為零值,這為高倍率壓縮提供了可能。通過選擇合適的具有平滑特性小波基,就可消除重建圖像中出現的方塊效應,減小量化噪聲,獲得較好的重建圖像質量。
小波變換圖像編碼壓縮方法可分為如下兩大類:基于傳統的圖像編碼方法和基于分形理論的小波變換圖像編碼方法。
基于傳統的圖像編碼方法[7]包括:零樹小波編碼、基于塔式網絡矢量量化的小波變換編碼、基于LBG算法的小波變換編碼、基于標量量化的小波變換編碼等。
由于不同分辨率級子圖像之間存在著相似性,因此,利用此相似性,可提高壓縮比[8]。J.M.Shapiro采用零樹自嵌套編碼方法,對小波分解系數進行壓縮,在PSNR=27.54dB的情況下,獲得壓縮比為128∶1。這是最著名的一種小波變換圖像編碼壓縮方法。該方法的優點是:與傳統的DCT編碼相比,它既可以克服方塊效應,又可以在低比特率下獲得較好的圖像主觀質量。缺點是:由于它對各子帶采用相同的門限量化,因此不能充分利用人眼的視覺特性,限制了圖像壓縮比的進一步提高。對此,A.Said等人提出了改進算法。
針對分形圖像編碼尚存在的缺點,如編碼算法的耗時、自然圖像不一定具有嚴格的分形結構而無法達到預期的高壓縮比、高壓縮倍率時的方塊效應等,有人提出了基于小波變換的分形編碼[9]。它具有以下特點:①采用平滑小波可去除傳統分形變換中存在的方塊效應;②小波表示使圖像的四叉樹分割十分自然;③可將零樹算法看成是該算法的一個特例。圖像經過金字塔形離散小波變換后的系數在小波域內可組成分層樹狀數據結構小波樹。這些跨越不同分辨率的小波樹之間存在一定的相似性,可通過分形變換來描述。基于小波變換的分形壓縮過程就是一個由分層樹狀結構的頂部開始一層層地向下預測其余系統的過程,而這個由上至下、由粗至細的預測過程是通過分形編碼來實現的。基于小波變換的圖像編碼壓縮的特點是[10]:壓縮比高、壓縮速度快,壓縮后能保持信號與圖像的特征不變,且在傳遞過程中就可以抗干擾。從現在的研究結果可看到,該方法已獲得了較好的編碼效果,是現代圖像壓縮技術研究的熱點之一,也是十分有前途的一種方法。
4結束語
本研究介紹了圖像編碼的基本原理,傳統的圖像編碼方法和幾種比較新的編碼方法。第二代圖像編碼將視覺特性引入到圖像編碼技術,分形圖像編碼是以分形幾何理論為基礎,基于模型的圖像編碼是利用了計算機視覺和計算機圖形學中的理論,而小波變換圖像編碼則引入了小波分析理論。盡管它們理論基礎不同,但它們均在不同情況下不同程度地提高了編碼質量。相比之下,小波變換圖像編碼是一種性能更佳的圖像編碼方法,僅從去除冗余信息的角度而言,它的性能就遠遠優于其他幾種編碼方法。另外,將小波變換與其他的新型編碼方法結合,也是小波圖像編碼方法的重要研究方向。
參考文獻
1 萬建偉,黃埔堪,周良柱,梁甸農圖像編碼技術的發展系統工程與電子技術,1996,5:31~38
2 張雪松,倪國強,周立偉,金偉其圖像編碼技術發展綜述光學技術,1997,3:37~41
3 曹寧,吳琰,馮曄模型基方法在圖像編碼中的應用與改進河海大學學報,1997,25(6):97~102
4 陳紅麗幾種新型的圖像編碼技術淮北煤師院學報,2001,22(2):28~30
5 吳謹圖像編碼與小波變換圖像編碼武漢科技大學學報(自然科學版),2000,23(3):289~292
6 陳雷霆,吉家成,傅志中,梁福成小波圖像編碼與JPEG圖像編碼的比較研究計算機應用,2000,20(增刊):273~277
7 唐良瑞小波圖像編碼技術的研究北方工業大學學報,2001,13(3):9~13
篇6
關鍵詞:雙目立體視覺;立體匹配;光流
中圖分類號:TP391.41 文獻標識碼:A 文章編號:1674-7712 (2013) 20-0000-02
一、引言
雙目立體視覺在機器人導航、微操作系統的參數檢測、三維測量和虛擬現實等領域都有廣泛的應用,它是計算機視覺的一個重要分支。它主要是由不同位置的左右兩個攝像機同時獲得同一場景的兩幅圖,通過計算空間點在兩幅圖像中的視差,獲得該點的三維信息。立體匹配算法的目的就是找出左右圖像對中的匹配點,進而獲得距離信息,其基本原理就是從兩個視點同時觀察同一景物以獲取立體像對,并匹配出相應像點,從而計算出視差并獲得三維信息。
考慮到光流這種運動速度,不僅包含了二維瞬時速度場,還可以反映可見點的三維速度矢量在成像表面得投影,提出了一種融合光流的立體匹配算法。該方法在基于區域相關匹配的基礎上,求取左右運動目標的光流,用光流作為一種外加限制條件進行立體匹配。首先分別求取左右圖像序列中垂直和水平方向上的光流,然后通過對右圖像序列中候選點的光流的計算與左圖像序列中的種子點進行匹配,進而提高了匹配的精度和準確度;而且該算法只選用邊緣點進行匹配,這樣簡化了運算,提高了算法的運行速度。
二、求取光流
三、實驗
圖1顯示了在連續時間幀里獲得的兩對立體圖像對,圖2顯示了在50幀時邊緣檢測結果。然后用這兩幅圖像中的邊緣點作為種子點在第二個立體圖像對(也就是下一幀)中尋找相關點,這樣就可以在連續的圖像序列中進行相關性研究。圖3中給出了光流的計算,把每個邊緣點的光流都分解為水平(X)和垂直(Y)方向的位移,其中(a),(b)圖顯示了左右圖像的水平位移,而(c),(d)顯示了垂直位移。
采用融入光流的匹配方法,不僅測量了互相關系數,還測量了待估計的兩點水平及垂直位移,這樣就可以避免光照和攝像機本身移動的問題。視差圖反應的是目標離攝像機的遠近,離攝像機越近,視差越大,表現在灰度圖中越亮,反之,離攝像機越遠,視差越小,表現在灰度圖中越暗。圖4中的(a),(b)分別為沒有融合光流和融合光流之后的視差圖,從圖中可以明顯的發現,沒有融合的視差圖中有很多地方出現誤匹配,而融合光流之后的視差圖更為清晰,消除了偽匹配點。
四、總結
本文通過對傳統匹配算法的分析,提出了一種融合光流的立體匹配算法,該算法是在區域相關立體匹配的基礎上附加上了光流作為限制條件,使得匹配更為準確迅速。實驗結果表明了該算法的有效性,不僅縮小了匹配搜索空間,提高了匹配的速度與準確度,而且可以有效的克服光照等外部環境的干擾,消除誤匹配點。
參考文獻:
[1]劉金頌.雙目立體視覺中的攝像機標定技術研究[J].計算機工程與應用,2008,44(6).
[2]梁元月.基于雙目立體視覺的工件識別定位方法研究[D].西安理工大學,2008.
[3]白明,莊嚴,王偉.雙目立體匹配算法研究與進展[J].控制與決策,2008.
篇7
關鍵詞: 目標檢測; 全局運動估計; 角點; 奇異值分解
中圖分類號: TN911.73?34 文獻標識碼: A 文章編號: 1004?373X(2016)07?0066?05
Abstract: To resolve the indistinct background problem caused by dynamic camera behavior, and in combination with the global motion estimation algorithm of angular point distance feature, the maximum interclass variance method is introduced into the RANSAC estimation algorithm to improve the common RANSAC algorithm. The moving object detection algorithm based on difference multiply principle is used to detect and locate the moving object in object detection process. Aiming at the object detection of follow?up frame sequence of the obtained object location, the moving target detection algorithm based on angular point marching of improved singular value decomposition is proposed. The experimental results demonstrate that the proposed algorithm has good background motion compensation effect in dynamic background, and can accurately detect the moving target of the follow?up frame sequence in the subsequent measured dynamic background measurement. The algorithm has good robustness.
Keywords: target detection; global motion estimation; angular point; singular value decomposition
0 引 言
運動目標檢測是計算機視覺最主要的研究方向和難點之一[1?2],主要涉及到圖像理解、模式識別、人工智能、自動控制和機器視覺等有關專業學科和領域的知識,并且已經被廣泛地應用到很多場合 [3]。運動目標檢測為后續的目標跟蹤和目標識別奠定了良好的基礎。在現實生活中,大量有意義的視覺信息包含在運動之中,人類可以憑借自身強大的視覺系統獲取80%的信息[4],通過大腦的分析判斷出運動目標,而對于計算機視覺而言,從獲取視頻到分析出運動的物體成為關鍵問題。
基于視頻的目標檢測系統具有結構簡單、隱蔽性好、抗干擾能力強的優點,而且視頻檢測系統采用價格低廉的攝像機和光學成像結構,具有更高的性價比。通過攝像機采集回來的圖像信息,可以獲得關于運動目標的豐富信息,具有很高的直觀性和可靠性。因此,研究運動目標檢測的有關問題,在理論上和應用價值上都具有重要的意義。
1 基于角點矩特征的背景運動補償算法
1.1 基于Harris算子的角點矩特征的提取及匹配設計
Harris[5]算子是在 Moravec算子的基礎上進行改進的。因此,它也是一種基于信號的特征點提取算子。通過在圖像位置建立局部窗口,監測窗口各個方向的能量數值和變化。對圖像亮度改變具有無關性,算法只關注梯度。因此系統運動后只發生了方向的改變,系統具有旋轉穩定性。同時,Harris特征點提取算子適用于角點數目較多并且光源復雜的情況。但是,Harris角點不具有尺度不變性。因此本文引入不變矩特征對其進行改良。Hu最早提出了幾何矩特征,1962年,他在幾何不變量理論的基礎上提出了幾何矩的概念[6]。Hu構造了7個不變矩并證明了相應的矩組對于平移、旋轉和縮放變換的不變性。
本文將角點和矩特征進行結合,以彌補Harris角點不具備縮放不變性的缺點,提高角點的穩定性,從而可以實現在視頻序列中存在平移、旋轉和縮放時,具有一種穩定的特征進行全局運動估計和補償,最終實現準確的運動目標檢測。在視頻序列中角點矩特征的提取步驟主要分為:
(1) 在每一幀圖像中提取Harris角點;
(2) 在獲得角點的[W×W]的鄰域內進行矩特征的計算,即得到一個7維的圖像特征向量。
在實現角點矩特征向量的提取后,需要對已提取的特征向量進行幀間的匹配。角點矩特征向量的匹配原理是:視頻序列中存在仿射變換時,矩特征對仿射變換具有不變性,因此對應角點特征向量的矩值是相等的或者是相近的,對于誤匹配的角點向量的矩值存在較大變化。
本文中采用計算特征向量之間的歐式距離進行角點矩特征的匹配。即尋找特征向量在待匹配向量集中與其歐式距離最小的向量且該距離小于設定閾值[T,]如果滿足條件則該特征向量對相互匹配,否則從初匹配特征向量集中刪除該特征向量。將匹配的特征點集作為運動信息的表達,便于進行參數估計的計算。在角點矩特征點集中既包含有背景點,又有前景點,也就是進行魯棒的參數估計所指的內點和外點。把提取出的角點矩特征點集作為待估計點集,如何將該點集中的外點去除,是進行全局運動估計的關鍵。
1.2 基于改進的RANSAC全局運動估計算法
傳統的RANSAC算法是將所有的點都代入參數估計模型,將估計殘差大于所選閾值的點作為外點,迭代[N]次,最終求得所有的內點。但是外點數據在迭代過程中對估計精度會造成影響,而且在攝像機存在旋轉運動時,仿射模型對外點的敏感加強[7]。因此,為了提高全局運動估計的精度,本文將最大類間方差引入RANSAC。
首先,利用RANSAC算法進行全局運動參數的初始值估計。然后,計算每個點的估計殘差[r:]
在本文中,把從圖像中提取出的[n]個角點矩的特征點作為全局運動估計的點,設其殘差點集為[R={r1,r2,…,rn}]。令閾值[Tr∈R,]根據殘差值的大小將點集殘差分為兩類:
本節詳細闡述了角點矩特征的提取及匹配、基于角點矩特征改進的RANSAC全局運動估計及補償的過程,其流程圖如圖1所示。
2 運動背景下基于特征的運動目標檢測
2.1 角點匹配的基本原理
角點匹配的基本原理通過確定圖像[J]和圖像[I]的單獨相應的組點,在無誤確定相應的點特征的情況下,算法可以進一步進行最優匹配,完成圖像最終的匹配。
相匹配的特征點對由于矩陣[P]和[G]具有一致的結構被進一步突出,這種結構具有抑制非對應的特征。
當矩陣[P]中的元素[Pi,j]既是所在列所有元素中的最大值,同時也是所在行所有元素中的最大值,相互對應的特征點則為特征點[Ii]和[Jj,]當元素[Pi,j]不具備上述特征時,則說明[Ii]和[Jj]不匹配[8]。
2.2 改進的角點匹配的運動目標檢測算法
本文提出的改進的基于奇異值分解的角點匹配算法,核心思想是通過改變該算法中涉及到的相似矩陣構造相關系數,達到適用于運動目標角點匹配的目標,解決了由于運動目標位置變化導致待匹配的兩組角點中正確配對的角點之間距離相關性降低,造成誤匹配角點對的問題。其核心流程如圖1所示。
由式(9)可以看出,在相似矩陣構造過程中,上述的核心匹配方法考慮了距離的影響。然而,誤匹配角點的數量增加,多數由于運動目標位置的變化導致待匹配的兩組角點中正確配對的角點之間距離相關性降低。正確描述這些對應的特征點是研究的關鍵所在。在式(9)中,基于奇異值分解的角點匹配算法使用公式[r2i,j=Ii-Jj]描述兩點之間距離的相關性,即兩個特征點[Ii]和[Jj]之間的歐氏距離。然后,針對運動目標,兩個特征點之間的歐式距離不能準確描述兩點之間的距離相關性。
式中:目標運動的距離估計通過目標運動區域預測中心與模板中心在[y]軸和[x]軸的差值分別用[Δcenter x]和[Δcenter y]表征。系統針對目標運動中心位移及區域的預測使用Kalman濾波算法進行。
通過四個主要步驟,基于奇異值分解的角點匹配算法可以改善運動目標的檢測:
(1) 確定目標模板。通過上一節全局運動補償后,且經過基于差分相乘原理的運動目標檢測獲取形心位置來捕獲得到目標區域。將視頻序列中測量的運動目標的矩形區域作為目標模板,然后檢測目標角點。
(2) 確定目標預測區域。使用Kalman濾波預測下一幀目標位置的特征點作為目標模板的中心,從而得到目標預測區域,最終獲取檢測角點。
(3) 確定偏移距離。通過步驟(1)和步驟(2)計算得到的角點進行匹配,再去除其誤匹配角點,目標位置預測的特征點是由正確角點的聚類中心構成,由此計算目標預測中心與目標模板中心的偏移距離。
(4) 檢測運動目標。利用改進的角點匹配算法進行角點匹配,同時檢測當前幀中目標預測區域的角點,最后檢測到運動目標并用矩形框標將其標注出來。具體的算法流程框圖如圖2所示。
運動目標檢測流程圖
3 算法仿真試驗
3.1 基于改進的RANSAC全局運動估計算法驗證分析
實驗1:實驗中對河流中船只運動的視頻序列中連續的兩幀進行全局運動估計和補償。圖3給出了視頻序列上相鄰兩幀在完成全局運動估計和補償前后的幀差。從圖3中可以看出本文提出的全局運動估計和補償算法能夠將幀間的運動背景準確對齊。
實驗2:為了證明基于RANSAC改進算法的效果,通過對比實驗,詳細分析了RANSAC算法和改進RANSAC算法的全局運動精度。通常采用相鄰兩幀完成全局運動估計和補償后的峰值信噪比來衡量全局運動估計的精度,圖中所示,在背景區域內隨著差分圖像[Id]非零像素點的不斷降低,系統的信噪比PSNR不斷升高的情況下,系統非零值不斷減小,進一步證明了運動補償算法的效果顯著。本實驗在視頻序列1和視頻序列2中分別提取了30幀圖像進行信噪比的計算,圖4為兩種方法的信噪比對比圖。
3.2 基于改進的奇異值分解的角點匹配的運動目標檢測算法驗證分析
實驗是在3.1節中對相鄰兩幀進行了全局運動估計與補償的基礎上實現的。在對相鄰幀進行了全局運動的估計和補償后,可以按照靜態背景下的運動目標檢測算法檢測并定位出運動目標,試驗采用基于差分相乘原理的運動目標檢測算法進行運動目標的檢測和定位。然后,根據獲得的運動目標形心,采用基于改進奇異值分解的角點匹配的運動目標算法進行后續幀的目標檢測。
實驗中對船只的視頻序列進行后續的檢測。首先對視頻序列中連續的四幀進行全局運動估計和補償,即在連續的四幀第10幀、第11幀、第12幀、第13幀中,估計第10幀和第11幀的全局運動,并進行全局補償;同理,對第12幀和第13幀進行處理。圖5(a)~(c)分別表示第10幀原始圖像、第11幀原始圖像、全局運動補償結果。
圖5(d)~(f)分別表示第12幀原始圖像、第13幀原始圖像、全局運動補償結果。圖5(g)~(i)分別表示第11幀與補償幀的幀差二值圖、第13幀與補償幀的幀差二值圖、差分相乘結果。圖5(j),圖5(k)分別表示對圖5(i)進行形態學濾波處理、連通域分析,最終確定目標范圍獲取形心圖。
圖6中顯示了獲取形心后,利用改進的基于奇異值分解的角點匹配的運動目標檢測算法對運動目標檢測的6幀圖像??梢钥闯鲈撍惴梢苑€定的檢測出運動目標,當背景中出現其他運動目標時,該算法依然能夠保持良好的檢測效果。
4 結 論
本文提出了基于角點矩特征的全局運動估計算法。此外,本文將最大類間方差的方法引入了隨機抽樣一致性估計算法中,改善了參數估計的精度,且在計算速度上有所提高。針對全局運動估計和補償的復雜性,實際運動目標檢測的實時性檢測難以滿足。本文提出了一種基于改進的奇異值分解的角點匹配的運動目標檢測算法,該算法具有計算簡單的特點,為運動目標檢測系統的實時性實現奠定了基礎。
參考文獻
[1] FUJIMOTO L, YAMADA Y, MORIZONO T, et al. Development of artificial finger skin to detect incipient slip for realization of static friction sensation [C]// Proceedings of 2003 IEEE Conference on Multisensor Fusion and Integration for Intelligent System. [S.l.]: IEEE, 2003: 15?21.
[2] AZARBAYEJANI A, WREN C, PENTLAND A. Real?time 3?d tracking of the human body [J]. IEEE transactions on pattern analysis and machine intelligence, 1996, 19(7): 780?785.
[3] 謝文輝.動態場景下運動目標檢測與跟蹤算法研究[D].武漢:華中科技大學,2011.
[4] 章毓晉.圖像工程(上冊)[M].2版.北京:清華大學出版社,2005:1?10.
[5] HARRIS C, STEPHENS M.A combined corner and edge detector [C]// Proceedings of the 4th Alvey Vision Conference. Manchester: ACM, 1988: 147?151.
[6] HU M K. Visual pattern recognition by moment invariants [J].IRE transactions on information theory, 1962: 8(2): 179?187.
篇8
(上海市計算技術研究所上海 200040)
摘 要 針對公共交通資源浪費和分配的不勻,導致公共交通承載體出現過度擁擠,甚至嚴重超載現象,提出利用智能視頻檢索分析技術,通過將場景中背景和目標分離進而分析并追蹤在攝像機場景內出現的目標,可以實時分析車內上下車人數,提供有力客流數據分析,有效的控制超載超員,實驗證明這些方法可以為策略的制定者提供客觀公正的數據。
關鍵詞 人像,智能,檢索,分析
中圖分類號:TP391 文獻標識碼:Adoi:10.3969/j.issn.1674-7933.2015.05.008
作者簡介:胡竹平,男,1964 年生,碩士,工程師,主要從事及研究領域:計算機應用,Email:huzpcast@sina.com。
0 引言
近十年來,平安城市的數字化進程中,數字視頻錄像機(DVR)、數字視頻服務器(DVS)得到了長足發展。特別是近兩年,隨著平安城市項目的推進,各個城市的大街小巷已經布滿了攝像頭。存儲技術的不斷更新,也為大量案件積存了海量視頻信息,這給公安破案帶來極大的便利。這時,如何在海量視頻中快速提取有價值的線索便顯得尤為重要。隨著安防智能化需求越來越強烈,視頻檢索技術也得以快速發展。下面主要討論智能視頻檢索技術在公交客流數據分析中的發展與應用。
在社會公共安全領域,視頻監控系統成為維護社會治安,加強社會管理的一個重要組成部分。傳統視頻檢索的模式下,需要從頭到尾順序播放,需要大量人員進行視頻審看,實際應用過程中,視頻錄像存在存儲數據量大,存儲時間長等特點,通過錄像尋找線索,獲取證據傳統的做法是要耗費大量人力、物力以及時間,效率極其低下,以至于錯過最佳時機。因此必須在視頻監控系統中,對原始視頻進行處理和分析,使其可以快速瀏覽,鎖定檢索對象,能夠滿足用戶的各種需求及應用。
視頻監控檢索關注的人數據以視頻為主,目的是查找某一事件的起因和關聯的發展過程,相關信息數據包含:發生事件的時間、發生事件的地點、相關的人和物體、相關的圖像和聲音等信息的一系列數據。當檢索條件包含的信息越多,定位就越精準,檢索的算法也就容易;反之,檢索條件傳遞包含的信息越少,定位就越模糊,這時如要精確定位相應的檢索算法的難度也就越高。不過對用戶來說總是期望檢索條件最簡單時,定位也要能精準。
智能視頻檢索技術就是要滿足人們的這種需求把用戶從單一、繁瑣的任務中解放出來。通過的智能分析預處理分析,將無序無章無邏輯的視頻監控內容進行梳理,獲取目標的關鍵信息,從而生成目標視頻及索引。智能視頻檢索,以圖像處理、圖像識別、圖像理解等知識為基礎,利用了內容自動關聯,視頻結構化,視頻分割、鏡頭檢測、關鍵幀抽取、自動數字化、語音識別等相關技術,采用了集群方式,實現了快速分析處理,并可根據實際使用中的需要進行擴展,大大提高了計算能力,節省了鎖定目標的時間。
在智能視頻檢索過程中,用戶可以根據自己所需要的檢索條件,通過智能視頻分析技術,從海量視頻中獲取想要的關鍵信息。
1 智能視頻檢索現狀
智能視頻分析技術源自計算機視覺技術,是人工智能研究的分支之一,它能夠在圖像及圖像內容描述之間建立映射關系,從而使計算機能夠通過數字圖像處理和分析來有限理解視頻畫面中的內容[1]。
基于內容的圖像檢索是近年來的熱門研究內容,涉及圖像處理、計算機視覺和數據庫系統等方面的學科。其中,高效實時的大規模圖像庫的檢索是關鍵技術。目前的技術主要是將監控視頻中的人臉進行整理聚集,通過智能分析處理以及人臉檢測算法,對目標的人臉信息生成索引。有關人員通過查看人臉圖示,就能快速查看視頻中的所有目標,并迅速確定嫌疑目標,察看該目標在整個視頻圖像中的片段和軌跡,如圖1。
運動目標屬性包括目標的速度、幅度、軌跡及規律等因素。目標軌跡的檢索是指通過在視頻中選定一個特定的區域,目標進入或離開該區域、以及滯留該區域,視頻檢索算法可以快速關注所有時間內在該區域出現過的目標,還可以過濾目標圖例或排查結果,如圖2。在目標結果較多的情形下,系統還可以將目標的類型進一步分離,縮小關注范圍,比如車輛、人、樹木等。
在系統中輸入待查詢的人臉照片,選擇需要檢索的人臉后進行相似度等參數設置后開始檢索,最后檢索出的相似人臉的結果會在界面上顯示出來。
2 公交視頻應用需求
長期以來公交線路覆蓋率低、重疊系數大、車輛運行效率不高、調度指揮全憑人力和手工、不能及時了解公共汽車在線路上的運行情況從而造成又“聾”又“瞎”(公交調度部門即不知道公交車輛行駛位置又得不到公交車輛的信息)[2],更無法實時了解客流信息。
近幾年,隨著車載視頻設備在城市巴士、長途大巴、長途貨運車輛上的應用越來越廣泛,并且逐漸擴展到了火車、船舶、救護車、消防車、執法車等特種車輛領域。車載視頻的普及為人民出行安全起到十分重要的保護作用,為國家平安城市建設、社會穩定和諧發展做出了重要貢獻。
與此同時,隨著“智慧城市”“物聯網”“公交優先”“快速公交”等政策的實施,為公交車輛智能調度系統的實施也帶來了契機。
根據《安全生產法》的有關要求,2011年交通運輸部會同公安部、安監總局、工信部下發了《關于加強道路運輸車輛動態監管工作的通知》,要求公交客車必須安裝車載視頻監控裝置,國內大部分大中型城市的公交車和長途運輸車輛也迅速地完成了車載視頻設備的安裝工作。
公共交通領域的車載視頻監控的發展逐步經歷了以下幾個階段:
第一階段:主要是以車輛本地錄像為主,由于防震方面的原因導致存儲設備以SD卡、CF卡等低容量介質為代表。受存儲設備容量的限制,這一階段的設備往往視頻通道數少,視頻分辨率也以標準化圖像格式(CIF,320×288像素)為主,視頻文件存儲時間較短,由于不帶顯示終端,對錄像資料查閱基本通過拔取存儲卡至PC觀看為主。此階段的車載錄像機基本完成了從無到有的過程。
第二階段:由于大容量硬盤的價格迅速下跌以及硬盤減震技術的發展,以使用硬盤作為存儲設備的車載錄像機誕生了。由于存儲設備容量的顯著增加,導致視頻分辨率從CIF向D1(720×576像素)轉化,視頻文件存儲時間也顯著延長。但由于此時的硬盤減震技術尚不成熟,導致硬盤故障率居高不下。
第三階段:隨著gps衛星定位系統與3G無線通信系統的廣泛應用,具有網絡化特征的車載錄像機誕生了,此時的設備逐漸體現出公交行業的應用特點,初步實現視頻遠程傳輸,基本實現了平臺化的遠程視頻監控。此階段的車載錄像機開始體現出系統化、網絡化、平臺化的特點,但與公交行業的調度系統尚屬兩套相對獨立的系統,兩者的融合度不高,導致部分設備出現重復投資的局面。
第四階段:隨著各個城市ITS智能公交調度管理系統的建設逐步成熟,調度管理平臺初具規模,調度平臺與視頻監控平臺進行整合勢在必行,這也要求車載錄像機與車載調度終端必須進行融合。但是由于車載錄像機的生產廠家與車載調度終端的生產廠家眾多,設備型號不一,也沒有一套通用的數據交互協議,設備的整合特別是已有設備的整合顯得非常困難。
隨著“智慧城市”“物聯網”“大數據”“云計算”等技術的發展以及4G通信的普及,未來的公共交通領域的車載視頻監控設備必然向高清晰度、人臉識別、客流統計、數據高收集率、WIFI覆蓋等方面發展,調度平臺也必將與移動互聯網進行深入融合。
目前,客流數據分析,就是基于這種需求被廣泛應用到眾多人流密集場所,客流量的統計分析、活動評估和安全管理預警等方面發揮了極為重要的作用。特別是商業零售業,越來越多的企業在開店前和營業后,都需要先進的客流統計系統,結合POS、erp、CRM等其他相關數據為其商業經營活動提供科學高效的決策依據。通過視頻智能分析實時分析車內上下車人數,提供有力數據分析,有效的控制超載超員,為策略的制定者提供客觀公正的數據。
3 公交視頻應用解決方案
雙目立體視覺是指通過對同一物體從不同角度獲得的兩幅圖像來復原被攝物體的三維信息的過程。這是一種模擬人的雙眼獲得視覺信息的過程。攝像機標定是雙目立體測量系統不可缺少的前提和基礎,并且標定精度直接影響最終測量精度[3]。雙目立體視覺技術主要包括圖像獲取,攝像機標定,特征點匹配以及三維信息復原個方面。最主要的部分是確定同一目標的兩個圖像中的投影點間的對應關系即特征點匹配。這兩個投影點之間的距離稱為視差。視差圖反映了物體的深度信息。物體距離攝像機越近,視差越大;物體距離攝像機越遠,視差越小。
特征匹配算法的基本原理就是通過提取圖像特征的灰圖信息取代圖像灰圖值的直接利用而進行的匹配,該算法是由的D.G.LOWE于1999年提出的,2004年進一步完善[4]。我們求取視差采用的是高效的單相匹配算法,該方法的目的是使用計算復雜度更高更有效的方法,來檢測不可靠的點的深度值。主要原理是通過區域灰度相關性匹配,在左右兩幅圖像中尋找對應點,從而計算視差圖像,獲得深度信息。對應點匹配滿足唯一性約束,極線約束,以及視差搜索范圍的限定等。這些約束條件不僅可以減少計算量,也可以提高計算精度。在單相位匹配中,保存最好的那個匹配結果,同時拋棄剩下不好的匹配結果,在減少了計算量的同時,也保證了算法的精度。
車載客流統計系統通過分析安裝在垂直于大巴進門口的視頻攝像頭,分析過往人數的頭部特征和肩部輔助特征,通過計算運動軌跡,從而獲知不同運動方向的人數,即進出車內的實時人數。通過分析統計進出人數的數據,達到控制車內乘客數量和調控車輛調度的目的。
通過對進出通道客流量的雙向統計,得到每輛車上下站的客流量和客流變化的情況。通過客流量狀況,可以對進出通道的設置進行優化調整。對不同時間段的客流進行統計,得到客流分布圖。統計各個區域客流量大小及變化,客觀決定發車密度和車輛調度安排。根據客流變化,可以有效分配管理、維護人員的配備,降低營運成本,提高服務質量和服務效率。根據客顯示當前客流狀態和變化趨勢,實施判斷當前的實際人數,預防突發安全事件發生。可通對單獨安裝統計攝像頭或利用原有攝像頭,采集客流信息,上傳到相關服務器進行處理。
GPS是基于衛星技術的全球定位系統。GPS的技術基礎是同時觀測接收機到幾顆衛星的距離。衛星的位置和GPS信號一起發播給用戶,利用幾個衛星的已知位置以及接收機與衛星間測得的距離,就可以確定接收機的位置。接收機位置的變化即速度也可確定。GPS最重要的應用是定位和導航[5]。經過幾十年的發展,GPS已經廣泛地應用于各領域,已經成為日常生活、工業、研究和教育的必需。
通過多通道雙向統計功能,可以實時統計車內乘客人數。實時分析前后門進出人數,并依此分析車內滯留乘客人數。加載GPS(北斗)模塊,實現普通的車輛信息管理功能。通過與車上的行車記錄、GPS(北斗)設備等聯動,實現視頻監控平臺與車輛調度管理平臺的整合,構造完整的車輛視頻調度指揮綜合監控系統。加載無線3G網絡模塊,實現車輛調度管理中心對車輛的視頻監控和調度管理,并可利用WLAN模塊和場站布置的熱點,實現對錄像和多媒體文件的網絡化下載管理。上下車人數視頻監控,支持遠程IE瀏覽器登錄,直接查看現場的視頻畫面(需3G網絡),查看客流數量。同時智能客流統計主機支持存儲功能可保存客流視頻錄像。
圖3是智能客流統計主機工作原理。
4 應用與實踐
在公共交通行業應用人臉視頻監控流量后,首先可以實現公交車輛線路調度通過車載客流統計,系統可以獲得實時的車載人數,具體到每個時段,每個公交站臺,對車內人數了如指掌,方便公交線路調度,以便公交資源達到優化配置。其次可以實現公交車輛票款評估,通過精準的車載客流統計系統,結合票務系統,可以評估出每天的票款數,起到票務監督的作用。第三可以實現公共車輛,校車等人員超載監管,對有明文嚴格限載人數的車輛,實時監控客流數據,如發現超載行為前端報警提示,后臺系統同時會提醒監管單位,采取措施糾正超載行為。再有可以實現長途大巴票務監督,對于長途大巴業務,對司機和售票員中途私自載客的行為起到很好的監督作用。同時實現交管等第三方監管,車載客流統計系統對交警、交管、教育等三方監管單位,對公交車,大巴車,校車實時監控客流數據,這種創新型的技術監督手段,給公車載客安全帶來極大便利。
通過雙目攝像機捕捉到視頻圖像,分析經過圖像中的所有物體的高度、形狀、方向,從而精確的判斷這個物體是否是人,和人的進出方向,精確的累加進出的人數,并疊加日期和時間,生成一條進出記錄。雙目攝像機內置的紅外LED燈照明能適應任何光線環境,即使全黑的情況也能正常工作。進出人數的數據可以通過RS485、RS232、TCP/IP、USB盤進行傳輸。內置的獨立數字I/O口可以方便的和其它設備或開關門的設備相連接。如連接DVR,則可以標記有人經過時的視頻段,便于事后回放檢索,可彌補計數儀的精度不足。如連接門的開關,則可設置當門關閉時,計數儀停止計數。
VPC是一款基于雙目立體視覺技術的小巧、自動、非接觸式的高科技智能視覺產品。能在公交車、大巴車、和建筑物的各種門/通道下進行人數統計和計數。VPC能區分進/出的人數或者是停留在某個封閉的區域內部的人數。
VPC是通過檢測和分析經過雙目攝像機視野下物體的高度、大小和方向,來判斷出物體的移動方向是“進”還是“出”,從而將該物體的“進”“出”信息實時記錄,并以時間順序保存到VPC中的可擦寫存儲器,這些“進”“出”記錄可以被下載和做進一步的報表分析。
雙目立體視覺匹配一直是計算機視覺領域研究的熱點問題,人們一直熱追于物體的三維恢復,獲得效果不錯的視覺感受,立體視覺中立體匹配是最重要最困難的問題[6]。雙目視覺的基本原理就是模擬人眼利用照像設備從不同的位置獲取被測量物體的兩幅圖像,然后通過計算圖像對應點之間的位置偏差,獲取物體三維幾何信息和深度信息。這兩個存在距離差別的圖像,即稱作視差圖像。雙目立體視覺技術主要包括圖像獲取,攝像機標定,特征點匹配以及三維信息恢復幾個方面。立體視覺的雙目攝像機比起平面(二維)視覺的單個攝像機而言,在分析可視范圍內各物體之間相對距離(深度/高度信息)上具有更高的精度,如圖4。
為了能實時監看乘客上下車的情況,VPC可以通過RS485/232接口連接在隨車的其它設備上,進行實時人數數據傳輸,如圖5。采用雙目視頻客流統計產品,實時采集上/下車客流,并通過RS232串口與GPS報站器的通信,確定每個時間段、每個站點上/下客流,統計車內實時總人數,確定不同時段的乘客擁擠程度,向決策層提供公交行業客流分析、分布數據,最終為公交線路運力調整提供科學依據。例如嵌入式DVR或GPS/GPRS通過GPRS/3G網絡實時將上下乘客數據上傳到后臺,便于查看。
VPC上集成的帶有隔離的數字I/O接口,可連接車門開關時的信號,以保證VPC在開門時計數。
該產品目前已經在上海、廣州等地區實際安裝使用,準確率達到95%左右。
5 結語
智能視頻檢索技術已經得到了快速發展,提升了智能視頻檢索產品的應用準確率及效率,在完善核心算法的同時,現階段將繼續向以下幾個方面努力:首先,與智能視頻監控技術、云計算、物聯網等新一代技術相結合,擴展更大的智能視頻應用范圍。其次,要立足行業用戶需求,推出細分化市場服務,研發出更有針對性的產品,以符合現場環境的需求,提高產品的判別能力。第三,要加強研發力量,繼續完善產品性能指標。
參考文獻
[1]王睿林. 智能分析助力大數據時代視頻檢索技術發展. 中國安防網, 2014-10-14.
[2]張國伍. 北京市公共交通總公司, 北方交通大學. 城市公共交通運營調度管理[M]. 北京:中國鐵道出版社, 2011.
[3]張鑫. 雙目立體測量系統標定及精度評價. 計算機應用與軟件 2014,(7):160.
[4]Lowe D. G.Distinctive image features from scaleinvariantkeypoints[J]. International Journal of ComputerVision, 2004,(60):91.
篇9
關鍵詞:雙目視覺,特征提取,特征匹配,三維混合地圖
中圖分類號:G255.4 文獻標識碼:A文章編號:1007-9599 (2010) 09-0000-01
Construction of Three-dimensional Mixed Feature Map
Liu Hongbo
(Dezhou Vocational and Technical College,Dezhou253034,China)
Abstract:This paper introduces the basic principles of binocular vision and space point reconstruction.Use of binocular vision sensor for the environmental characteristics of three-dimensional coordinates of points,established a three-dimensional geometric features of the environment map,the same time,these features corner windows local gray level information be saved as image feature information,geometric features including built environment and image characteristics of mixed map.
Keywords:Binocular vision,Feature extraction;Feature matching;Three-dimensional hybrid map
立體成像的方式主要由光源、采集器和景物三者的位置決定。如果采用兩個采集器分別在一個位置對同一場景取像就是雙目成像。
環境地圖構建地越精確,對服務機器人的運動越有利。目前大多數研究是采用聲納等距離傳感器來構建地圖,但是這些距離傳感器的分辨率較低,且存在高度不確定性,在復雜的環境中由于觀測數據的高度不確定性很難取得理想的效果,本文將介紹利用雙目視覺傳感器,構建三維立體混合特征地圖。
一、雙目立體視覺實現原理
(一)雙目立體視覺實現步驟
雙目立體視覺技術的實現可分為以下步驟:圖像獲取、攝像機標定、特征提取、立體匹配和三維重建。
(二)三維混合地圖的提出
環境地圖的表示方法對于SLAM的性能至關重要。在構建混合特征地圖的過程中,利用立體視覺傳感器提取環境的Harris角點特征,通過立體匹配算法獲得這些角點精確的坐標值,通過坐標轉換,建立起米制坐標的三維立體模型,同時獲取這些幾何特征對應的圖像特征信息,并將這些混合信息進行綁定,作為實時更新信息存入智能空間信息庫中。利用混合特征構建地圖可以有效提高機器人定位的精度。
二、雙目視覺傳感器模型
求物體的深度,主要問題在于從立體圖像中找到對應點。兩部攝像機安裝于不同的位置,對同一物體或目標同時拍攝兩幅圖片,構成一組立體圖像。同一物體的某一點在兩幅圖像中的位置差稱為視差,該視差與對應點在空間中的位置、方位以及攝像機的物理特性有關,若攝像機的參數已知,則可以得出物體的深度。
假設兩部攝像機的光學中心線平行,間距為 ,目標物 與兩部CCD光學中心線的距離分別為 和 ,其投影到兩部CCD圖像。
平面上與光學中心線的距離分別為 和 ,視差,由幾何系得:
(1)
則: (2)
三、構建局部三維地圖
空間點是構成三維空間結構的最基本單元,理論上可以由點形成線,由線形成面,再由各種面構成三維立體結構。假如能得到物體表面上所有點的空間坐標,那么三維物體的形狀與位置就是唯一確定的,因此,空間點的重建是計算機視覺三維重建的最基本的要素。
考慮非平行雙目系統的計算量比較大,因此采取特殊布置的雙目視覺系統。選取兩個內部參數完全相同的攝相機,平行放置,使它們的光軸相互平行,另有一對坐標軸共線,使得兩個成像平面共面,兩相機的光心有一個固定距離。這樣求解圖像點的世界坐標時僅涉及到相機的內部參數,降低了目標點計算的難度。
經過特征點匹配對應以后,可以求取對應點之間的視差 ,根據前面提到的立體視覺原理,可以獲得特征點的深度(depth),進而求出場景征點相對于攝像機坐標系的三維坐標值,如下:
(3)
其中, 、 為圖像中心坐標, 和焦距 屬于攝像機的參數。
實驗中利用左右攝像機獲取了兩幅圖像,采集的圖像像素為320×240,根據計算得出三維立體圖。運用Harris角點檢測方法提取環境中物體的基元特征,通過立體匹配算法實現對應特征點的匹配,根據成像關系計算出角點的三維幾何信息,獲取的數據較為準確。
四、智能空間中的混合特征地圖
在智能空間的信息數據庫中,混合地圖信息作為實時更新的信息存入其中,可用以下形式表示:
(4)
(5)
其中, 為實時更新信息庫, 為混合地圖信息, 為環境特征的幾何信息集合, 為環境的圖像特征信息集合, 和 為具體信息,“ ”表示相關性。
提取環境中的一特征角點,該點的序號是5,它的三維幾何坐標為(36.15,18.72,103.43),將角點5的這些信息進行綁定,即可以得到該點的混合地圖信息 ,包含了三維幾何信息 和圖像特征灰度信息 。
五、深度圖的表示
形狀是三維物體的最基本性質,利用它能夠推導出許多其他特性,例如:表面結構,物體的邊界等。形狀是組成物體外輪廓或外表面的所有點的相對位置所決定的性質,因此表示景物中的形狀可通過灰度/深度圖和灰度/表面方向表示。
篇10
關鍵詞:目標檢測和跟蹤; 背景差分; CamShift; OpenCV; OGRE
中圖分類號:TP391 文獻標識碼:A 文章編號:1009-3044(2013)22-5156-05
1 概述
人類和電腦的交流從打孔機到屏幕,從文字到圖形,從鼠標到觸摸板,計算機用更符合直覺和人性的方法讓人機交互方式更加快捷方便。那么以后的人機交互會怎樣?
從另一方面,隨著圖形學和硬件計算能力的發展,計算機能夠實時獲取和記錄人體動作。計算機將人體動作參數轉化為計算機中的物理模型,并且將其在虛擬環境中再現,同時3D人體模型動作目前成為最熱門的研究課題之一?,F在人體運動主要通過各種傳感器進行捕獲和測量,并通過傳感器將相關的人體信息記錄為虛擬動作。這種方法更加精確,但是由于其成本較高,計算量較大且需要特定的實驗場合,因此無法廣泛應用。
目前基于OpenCV的第六感交互技術和3D圖形處理技術正在迅速發展之中,該文討論如何通過這些技術完成基于計算機視覺的人體運動3D模型動作記錄器,嘗試將人機交互推向更深的層次。
2 系統分析
3 獲取背景
攝像機首先獲取靜態場景,從而作為運動目標檢測判斷的依據,因此需要對背景不斷進行更新。常用的背景更新方法有包括多幀平均法,選擇更新法,隨機更新法等。多幀平均法簡單而且準確,但是計算量大,并且在運動物體多且運動速度緩慢的情況下也不能達到滿意的效果;選擇更新法對于光線的變化有較強的適應性,但是環境光線變化強烈時容易檢測錯誤,并且受人為因素較大。
本課題采用將多幀圖像分別和背景圖像做差,并用幀間差來判斷光線的變化。該方法通過多幀的聯合判斷,能夠較準確判斷監視場景中是否有運動的物體或者是否應該進行背景更新。該方法融入了背景差分法對于物體的準確分割,又運用了幀差法較強的適應性。
為了不受背景的影響,人物捕捉采用了人物進入捕捉方法。首先實現對人物進入的實時判斷監測,在沒人的時候進行背景更新,而當有人進入領域時則實現了動作實時監測功能。為了緩沖圖像采集速度并配合3D模型輸出,每幀間間隔20ms保證系統運行流暢。而運動目標檢車跟蹤部分和3D模塊部分則通過全局的條件變量實現同步和互斥的操作。
4 運動目標檢測
運動目標檢測是指在序列圖像中檢測出變化區域并將運動目標從背景圖像中提取出來。一般后處理過程僅僅考慮圖像中對應于運動目標的像素區域,因此運動目標檢測與分割對于后期處理起決定性作用。運動目標檢測方法有很多,包括幀差法、光流法、背景差分法等,該文選擇背景差分法對靜態背景下的目標進行分析。
通過上述原理可知,首先獲取背景圖像,將背景圖像和當前圖像轉化為灰度圖像并進行高斯濾波以平滑圖像;之后將當前圖像和背景圖像相減,差值圖像二值化,再進行形態學濾波,消除噪聲;最后將二值圖像掃描并查看是否有非零值像素點,從而獲取目標像素。在此差分圖像中,若像素的值大于一個特定的閾值,則認為視頻圖像中在相同位置的像素屬于運動目標區域,若像素的值小于特定的閾值,則認為視頻圖像中在相同位置的像素屬于背景區域。
在本課題中,當人物進入靜態場景時,程序處理捕捉到的圖像,檢測出人物部分的像素差大于設定的閾值從而檢測出目標人體。如圖2所示,黑色部分是差分之后的背景,白色部分是通過背景檢測出的人體。從圖中可以看出,背景差分法可以正確的檢測出運動目標,但是由于算法只用亮度值做為檢測依據,因此當運動目標的亮度與背景亮度相似時,就難以檢測出目標。
5 運動目標跟蹤
運動目標檢測之后,計算機則需要跟蹤提取出來的檢測目標。運動目標跟蹤方法包括meanshift、camshift、kalman濾波等。其中Camshift的全稱是 “ContinuouslyApative Meanshift”算法,基本原理是將跟蹤目標的色彩信息做為特征,并將這些信息計算處理后投影到下一幀圖像中,計算出這幅圖像中的目標,并用這幅圖像作為新的源圖,分析下一幀圖像,重復這個過程就可以實現對目標的連續跟蹤。在每次搜尋前將搜尋窗口的初始值設置為移動目標當前的位置和大小,由于搜尋窗就在移動目標可能出現的區域附近,搜索時就可以節省大量的搜尋時間,因此Camshift 算法實時性較好,另外Camshift 算法是通過顏色匹配找到移動目標,而在目標移動過程中顏色信息變化不大,所以Camshift 算法具有良好的可靠性??紤]到以上因素,故采用camshift算法。
Camshift方法首先將RGB空間轉換為HSV空間并提取H顏色分量hue;然后提取跟蹤窗口并得到需要跟蹤的區域selection,之后根據獲得的色彩直方圖將原始圖像轉化成色彩概率分布圖像。處理前目標圖像中的每一個像素值描述該點的顏色信息,而處理后每一個像素值則成為該顏色信息出現在此處的可能性離散化度量;之后對目標直方圖的反向投影backproject進行搜索,并返回下一幀的跟蹤窗口;最后畫出跟蹤結果的位置并循環執行。
6 3D建模
7 測試
由表2可知,背景固定、光照滿足一定強度以及背景不能有運動雜質即可滿足系統要求。最后系統在不同的平臺上進行測試。基于X86的計算機系統(CPU主頻2G,內存2G)反應時間不超過1秒,而基于ARM9的嵌入式平臺(CPU主頻203.3MHZ,內存64M)系統反應時間不超過2秒,滿足了實時性的需求。
綜上,本系統并通過了開發階段的測試。系統設計較好地實現了通過攝像頭捕捉跟蹤人物動作來操作女孩做基本動作的功能,在功能上還可以再添加更多動作已期更好實現動作記錄功能。由于采用高實時性和低消耗的算法設計,因此系統擁有較好的同步操作,動作記錄延遲較小。另外系統在經過捕捉圖像預處理下能夠適應更多的環境,在多次的測試與修改之后,本課題最終獲得了良好的測試結果。
8 總結
本系統通過攝像頭獲取人體運動視頻并檢測跟蹤,之后通過處理數據控制3D模型,從而將人體動作進行記錄保存。系統要求首先提取靜態背景建立背景模型,之后采用背景差分和Camshift方法對運動目標進行檢測跟蹤,因此要求光線穩定、運動物體較少的環境條件。除此之外,Camshift方法對跟蹤目標的選擇也是有一定的限制:鮮艷的目標物體跟蹤起來很容易,但是由于白色物體H分量太低很容易跟丟。
在實時性方面,視頻流數據送入系統處理之后將處理結果顯示在屏幕上。通過觀察視頻處理結果,發生視頻流能夠流暢的顯示,并沒有出現停滯和跳幀的情況,這就說明本文的跟蹤系統已經達到了實時性的要求。
參考文獻:
[1] 毛劍飛,鄒細勇,諸靜.改進的平面模板兩步法標定攝像機[J].中國圖像圖形學報,2004,9(7):846-852.
[2] 張春田,蘇育挺.數字圖像壓縮編碼[M].北京:清華大學出版社,2006:20-23.
[3] Park J S.Interactive 3D reconstruction from multiple images:a primitive-based approach[J].Pattern Recognition Letters,2005,26(16):2558-2571.
[4] Intel Corporation. Open Source Computer Vision Library Reference Manual[S].2001-12.
[5] Fernando de la Torre Frade, Elisa Martínez Marroquín,MaEugenia Santamaría Pérez,Jose Antonio Morán Moreno. Moving object detection and tracking system:a real-time implementation.1997.