計算機視覺技術原理范文
時間:2024-01-11 17:41:14
導語:如何才能寫好一篇計算機視覺技術原理,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務員之家整理的十篇范文,供你借鑒。
篇1
關鍵詞: 旅游流調控; 時空分流導航; 決策支持系統; 計算機推理技術; 時空一體化
0 引言
隨著我國經濟持續發展和居民收入穩步增加,旅游休閑日益成為我國居民生活的重要內容。近年來,中國旅游業增長的勢頭尤其迅猛,不少著名景區不得不面對大量游客入園而導致景區滿載的局面。景區一旦過度擁擠,就會對旅游業的可持續發展造成威脅。以主題公園為例,一方面,游客過多有可能對游樂設施造成破壞,甚至會引起安全事故;另一方面,游客在游玩過程中的長時間等待也嚴重影響游客的游憩質量。因此,關注景區內客流時空分布,并使景區內各景點負載均衡便成為了保證旅游景區經濟效益、社會效益和生態效益協調發展的核心。
時空分流,正是利用隨時間推移形成的相對“閑置”的空間對游客進行分散疏導,使景區內各景點負載均衡的一種解決方案。對此,目前國內研究者主要從排隊論和導航管理技術兩個分支開展探討。排隊論是以運籌學作為基礎研究服務機構中排隊問題的規律(Erlang,1909),在旅游學科領域的研究成果并不算多,主要包括:張凌云(1988)對旅游用餐行業的排隊隊長、逗留時間和等待時間的期望值進行了估計,并在服務員數量和顧客等待時間兩方面做了比較和權衡,用于指導餐廳(酒吧)在座位數量、服務人員安排和經濟成本效益上綜合考慮;陳治佳等(2005)提出了一種基于概率的快速排隊優化模型,以使大型游樂場的游樂設施達到最大使用程度,減少游客等待時間;王仁志和苗維亞(2012)對大型景區的平均隊長和平均等待時間進行了估計,并提出把順序單服務臺旅游模式改變為無序全服務臺旅游模式的思想。這些研究都是為了解決游客太多而導致某個服務機構(餐廳、游樂設施或景點)需要長時間排隊而提出的,主要涉及排隊系統的性狀研究和最優化配置兩大類,多采用M/M/n排隊理論建立數學模型并結合多目標線性規劃來求解。
國內的另外一個分支則是時空分流導航管理技術,是任佩瑜團隊于2009年提出的一項新技術(馮剛,等,2009),旨在根據空間的相對靜態性和時間的動態性,借助最新的信息監控技術,設計出若干優化的游覽路線,使游客在景區內均衡分布、有序交換。自2009年以來,該團隊針對風景名勝區(或自然保護區)做出了不少貢獻,包括:邱厭慶等(2010a)提出了基于九寨溝景點負荷均衡的時空分流導航數學規劃模型,并從動態預測中得到車輛調度方案;馮剛等(2010)引入管理熵與RFID技術,對邱厭慶提到的上述模型進行效果模擬;邱厭慶等(2010b)從復雜系統控制的角度構建游客分流導航管理的耗散結構體系,并分別對初態分流(邱厭慶,等,2010b)和穩態分流(邱厭慶,等,2011)兩個階段的動態離散系統進行探索性分析;姜向陽和任佩瑜(2012)把Hamilton 回路和多旅行商的思想引入時空分流導航管理中,并給出了一般數學模型和精確求解方法;戈鵬等(2013)通過比較、分析和仿真,提出了在初始分流中采用平均分流的靜態調度策略,在穩態分流中采用基于區域時空負荷率的動態調度策略的改進方案;肖雄輝等(2013)構建了景區景點需求與調度資源的引力分流調度模型和算法,既能滿足需求景點的負荷均衡,同時也考慮了游客的滿意度;任競斐和鄭偉民(2013)通過建立綜合游客偏好、擁擠度、等待時間和行走時間等指標的旅游效用函數,并借助Logit模型,將游客分配到不同路線上,以減少旅游高峰期景區游客擁擠和等待的情況。可以看出,除了肖雄輝(2013)和任競斐(2013)的研究外,任佩瑜團隊主要從景區管理的角度來開展時空分流導航分析,其重點在于考查景區內客流的分布情況和超負荷景點,以景區內各景點的負荷均衡為目標建立數學模型并進行求解。此外,還有從游客服務或體驗的角度來展開研究的,例如鄭天翔(2012)以游客等待時間最短為目標對主題公園游客導航分流問題構建了動態調度算法的雛形。
在國外研究中,沒有專門用以表達時空分流的術語,與此相關的研究包括虛擬排隊服務和游線設計問題。虛擬排隊服務,包括虛擬排隊系統(Lovejoy,et al.,2004;Lutz,2008)、排隊管理方法(Button,2006)和排隊區設計(Heger,et al.,2009)等,并在管理實踐中被廣泛應用于主題公園的開發和運營中,其中,以Multi Motion主題公園管理系統(Universal City Studios INC,2002)和迪士尼的FASTPASSTM(Cope Iii,et al.,2008)排隊管理系統最具代表性,這類系統設計的方案是增加一條虛擬排隊隊列,能使游客花費相同的時間但多體驗一個項目。另一個研究領域是游線設計問題(Tourist Trip Design Problems)(Garcia,et al.,2010;Garcia,et al.,2013;Souffriau,et al.,2008;Sylejmani,et al.,2012;Vansteenwegen,et al.,2009b;Vansteenwegen,et al.,2009a;Vansteenwegen,Van Oudheusden,2007),這類研究延伸出一系列的分支,包括游客移動引導(Mobile Tourist Guides)(Souffriau,et al.,2008;Vansteenwegen,Van Oudheusden,2007)、電子游客引導(Electronic Tourist Guides)(Garcia,et al.,2009;Garcia,et al.,2013;Vansteenwegen,et al.,2009b;Vansteenwegen,et al.,2009a)、個人導航系統(Personal Navigation Systems for Tourism)(Akasaka,Onisawa,2008;Maruyama,et al.,2004;Shiraishi,et al.,2005)、個性化路線規劃(Personalized Route Planning)(Nadi,Delavar,2011;Yiakoumettis,et al.,2013;Yu,Chang,2009;Zhang,et al.,2011)、個性化路線引導(Personalized Route Guidance)(Panou,2012)和個性化路線推薦(Personalized Route Recommendation)(Tsai,Chung,2012),等。這些分支當中,涉及旅途中路線選擇、導航或引導的文獻主要包括:Maruyama等(2004)提出一個有效導航多重目的地的個人導航系統,系統根據游客到達時刻、停留時間以及目的地偏好度計算出使游客滿意的旅游路線并實現導航;Shiraishi等(2005)根據游客的費用預算和滿意程度定制出不同的旅游時間表讓游客自主選擇,并為其按時到達下一站提供導航;Vansteenwegen等(2009a)把旅游線路設計歸結為TOPTW(Team Orienteering Problem with Time Windows)問題,并提出迭代局部求解算法,以實時求出個性化旅游路線;Garcia等(2009)在Vansteenwegen研究的基礎上,把旅游線路設計進一步歸結為MCTOPTW(Multi Constrained Team Orienteering Problem with Time Windows)問題,并提出一個包含旅行往返時間、旅行節奏和旅游興趣點的智能個性化電子導游系統;Yu和Chang(2009)根據游客的個人喜好,結合游客的當前位置對其附近的游覽景點、餐飲和住宿等做出簡單的行程安排;Zhang等(2011)試圖利用衛星地圖和移動設備來解決交通換乘問題,能結合實時交通情況、停車信息搜索列車到達時刻表,并提供自駕、鐵路、公交或步行等多種路線信息;Nadi和Delavar(2011)提出了多種不同方案的路徑選擇系統,以滿足用戶的靈活需求;Tsai和Chung(2012)根據以往相似游客的歷史路徑,結合當前排隊信息作判斷,以便讓游客游覽更多的景點。
縱觀國內外文獻,國外在旅游路線選擇的問題上似乎更多是從游客出發前的計劃安排上開展研究,而針對游客在游覽過程中的干預、引導和管理則較少涉及,而國內針對景區內部小尺度的時空分流研究還剛剛起步,多采用數學和運籌學的方法建模求解,能同時考慮游客的個性化需求和現場環境信息、形成時空一體的旅游個性化推介服務(李仁杰,路紫,2011)的時空分流模式還鮮見(鄭天翔,等,2015)。因此,現實中對于景區在個別景點人流過于集中、游客因等待時間過長而游憩質量下降的難題,目前還缺乏行之有效的方案,而這卻是智慧景區的建設核心之一(梁倩,張宏梅,2013)。由于時空分流問題涉及游客游憩行為,有研究指出,這種旅游系統難以采用傳統數學分析方法建模,而計算機仿真正是研究這種復雜社會系統的較好方法(黎j,2013;黎j,杜栓柱,2011)。因此,本文針對景區游客時空分流的決策支持系統(陳建斌,等,2014),借助計算機推理技術提出一種具有時空一體化特征的游憩方向決策算法,并通過計算機仿真系統與傳統的最短距離算法進行實驗模擬和比較分析,以驗證本文算法的優越性。
1 研究設計
1.1 研究對象
由于旅游管理決策實際上是一種復雜事件的推理過程,對問題觀察而導致的建模也只能是一種近似描述(杜軍平,周亦鵬,2009),因此,本文選擇較為簡單的主題公園作為研究對象。與其他風景區相比,主題公園的“簡單性”主要有以下表現。
(1) 景點的承載力可以預先確定――風景區的景點以名勝古跡、山水生物為主,具有共享性,同一時刻可供游覽的人數不定;主題公園的景點主要以游樂設施為主,游樂設施具有獨占性,同一時刻可供游玩的人數相對固定。
(2) 景點的游覽時間可以預先確定――游客在風景區的景點停留時長不定,拍照留念、欣賞、休憩、飲食、消費等因人而異;而游客在主題公園的游樂設施上的停留時長相對固定。
(3) 單步求解而非全路線求解(詳見1.3節)――風景為主的景區,堅決避免走回頭路,應當使所有的景點串聯成環形游線,通常采用全路線求解方案,在游客游覽前確定所有路線;而游樂設施為主的主題公園,相鄰景點之間距離不會太遠,很多時候為了減少等候時間,同一路徑游客會重復往返,因此適合單步求解,能在游客游覽過程中逐次獲得下一步路線。
1.2 基本假設
在主題公園(下簡稱景區)的特定案例下,我們假設:
?不同游客在同一游樂設施(下簡稱景點)的游覽時間相同,且在景點設計時已經確定,稱為景點游覽時間。
?每個景點的承載力(景點容量)在景點設計時已經確定。
?相鄰兩個景點之間的路徑長度在景點設計時已經確定。
?在不考慮乘車的前提下,每個游客的游憩速度(下簡稱步速)一樣。
?每個游客在一次完整的旅游經歷過程中(從進入景區門口開始直到離開景區),不會重復游覽已經游玩過的景點,但允許多次來回經過相鄰兩景點之間的路徑。
1.3 模型分析
無論是“給定景點求路徑不重復的全路線最短成本”的旅行商問題(Traveling Salesman Problem,TSP)(吳凱,2004),還是“盡可能多的游覽景點,路徑不重復且全路線成本最小”的定向越野問題(Orienteering Problem,OP)(Tsiligirides,1984),都屬于圖論中的NP完全問題,不存在多項式時間的算法(王曉東,2004)。因此,本文針對游客在同一個景區中的單日游行程安排問題,試圖在“給定景點求單步最少成本”上尋找解決方案,借此讓不同游客從時間和空間(景點)上分離開來,達到時空分流的效果。
借鑒前人研究成果(黎j,2013)并進行簡化后,本文假定景區涉及的對象僅包含兩個:景點和游客。對于景點來說,具有景點位置、景點容量、景點游覽時間、景點開放時刻和景點關閉時刻等靜態屬性,也具有景點下次提供服務時刻、景點外排隊等候人數等動態屬性。對于游客來說,具有游客編號、到達時刻、預計離開時刻和游覽偏好(感興趣景點)等靜態屬性,也具有步速、游憩方向(黎j,2013)和等待時間等動態屬性。其中,游客動態屬性隨游憩行為而取不同值(黎j,2013),圖1和圖2展示了其自身在景區中的一次完整游憩行為,可以歸納為8個要素和3個狀態。
圖2 游客的狀態切換圖
首先,我們來看看這3個狀態:(1) 棧道行走等待游玩:狀態的切換由當前游客“到達景點”觸發,這時候可以確定游客需要等候的時間(詳見1.4節);(2) 等待游玩正在游玩:狀態的切換由前一個(批)游客“離開景點”觸發,當前游客進入游覽,這時候可以確定景點下次提供服務時刻=當前時刻+景點游覽時間;(3) 正在游玩棧道行走:狀態的切換由當前游客“離開景點”觸發,此時需要對下一個游玩景點(游憩方向)進行決策,這就要求設計一種擇優選擇的機制來逐次確定(詳見1.4節)。
其次,我們來看看這8個要素。對它們進行歸類,可以得知:(1) 屬于動作:到達景區、到達景點、離開景點、離開景區;(2) 屬于活動:前往景點、游玩景點;(3) 屬于判定:尋找下一個景點、能否游玩。其中,“動作”使用計算機科學技術領域中的“離散事件驅動”(劉衛東,等,1998)來模擬,“活動”使用虛擬時鐘來實現,“判定”使用計算機推理算法來判斷(詳見1.4節)。
對這8個要素的進一步分析,可以得知這些要素的模擬關鍵:(1) 到達景區:記錄游客的到達時刻、預計離開時刻、步速和感興趣的景點等信息;(2) 前往景點:使用虛擬時鐘來模擬,每隔一定時間游客移動一步,這時候游客處于棧道行走狀態;(3) 到達景點:由于 “前往景點”存在不確定因素(游憩方向有可能是景點或景點外排隊隊列,或者步行過程中其他游客可能更早一步到達同一景點),使得該事件沒有固定的發生時刻,因此無法通過“事件驅動”來模擬,只能作為“前往景點”這個活動的結束標志。而此時,游客的等待時間可以確定下來,同時由于離開景點的時刻能確定(景點游覽時間+等待時間),因此可以產生“離開景點”事件;(4) 能否游玩:如果等待時間+景點下次提供服務時刻 > 景點關閉時刻,則游客無法游玩,只能離開景點;(5) 游玩景點:這部分主要由等待游玩和正在游玩兩個狀態構成;(6) 離開景點:根據景點容量把排隊靠前的游客設為正在游玩狀態,其他游客在隊列的位置相應前移;(7) 離開景區:為了簡化模型,僅輸出與整個游覽過程相關的信息,而不作為事件來模擬;(8) 尋找下一個景點:需要構造游憩方向的決策算法,根據算法的返回結果判斷是否找到。
1.4 算法和仿真設計
1.4.1 算法設計
根據上一節的分析,我們需要確定游客的等待時間和游憩方向的決策算法。表1展示了游客等待時間的計算方法。
注:所有景點的下次提供服務時刻,其初始值均為景點開始時刻,下同。當景點處于關閉期間,游客的等待時間設為0,意味著游客必須離開當前景點,重新選擇其他景點。
上述算法中,“景點下次提供服務時刻”是“等待游玩正在游玩”狀態切換的時候確定的;“排隊等候人數”在仿真中可以采用“隊列”結構(劉衛東,等,1998)來模擬,所以根據隊列元素個數便可獲知等候人數。
接下來我們需要確定游憩方向(下一個景點)的算法,該算法必須是一個自適應的推理決策過程,能根據現場環境信息和游客需求,共同確定游客當前時刻的目標選擇,最后推送給游客。構造的關鍵在于既要考慮游客自身的個性化信息,也要考慮現場環境信息,例如景點本身的運營情況(包括景點游覽時間、景點下次提供服務時刻和景點開放時間)、其他游客的位置(主要指他們在各景點的排隊等候情況)和游客本身的位置,最后從若干個候選景點中選擇單步成本最少的一個。表2展示了構建的算法。
1.4.2 仿真設計
為了檢驗上述算法的有效性,我們必須模擬多名游客在景區的整個游玩過程,并借助仿真實驗進行比較分析。如1.3節所述,我們使用“離散事件驅動”來模擬“到達景區”和“離開景點”這兩個事件,并使用虛擬時鐘來模擬“前往景點”和“游玩景點”這兩個活動。虛擬時鐘本質上是游客在景區停留和游玩過程中的時間粒度(Tick)(黎j,2013)。由于兩個事件的發生時刻均可由系統自動確定,故可放在虛擬時鐘一并處理。借助“最小堆”結構(劉衛東,等,1998),不但可以以時間遞增即時光流逝的順序逐一模擬所有事件的發生,而且每次僅需檢查堆頂元素的事件發生時刻即可。
利用虛擬時鐘周期性觸發的特性(時鐘每增加一個步長,系統自動執行事件一次,重新決策下一個Tick的行為),我們構造的仿真方案如表3所示。
2 實驗模擬與結果分析
2.1 系統運行參數
仿真系統采用 Borland C++ Builder 6.0 開發,運行于 Windows 7平臺。系統將根據仿真輸入數據自動生成游客在景區中的游憩行為,并對游憩過程進行跟蹤、記錄。當一個仿真結束后,系統將對所記錄的數據進行分析并輸出分析結果。在本文的例子中,系統的輸入包括:景區的空間布局圖(含各景點之間的路徑長度);各景點的基本情況(開始時刻、關閉時刻、景點游覽時間和景點容量);游客的信息(到達時刻、預計離開時刻和感興趣的景點)。系統的輸出包括游客的游玩次序、等待時間和實際離開時刻。
仿真方案
1. 事件的判斷――檢查堆頂事件的發生時刻,如果等于當前時刻,則彈出堆頂事件,直到最小堆為空:
如果是“到達景區”事件
游客出現在景區門口
記錄游客的到達時刻、預計離開時刻、感興趣的景點和步速等信息
利用 “游憩方向決策算法”尋找下一個景點,如果沒有找到(返回值為空值),則游客離開景區
如果是“離開景點”事件
游客離開景點,利用 “游憩方向決策算法”尋找下一個景點,如果沒有找到(返回值為空),則游客離開景區
排隊靠前的游客設為正在游玩狀態,設置景點下次提供服務時刻=當前時刻+景點游覽時間
隊列的其他游客依次前移
2. 游客的移動――對每個游客進行判斷:
如果該游客處于等待游玩或正在游玩狀態,則保持不動
否則,該游客向目標(“游憩方向決策算法”的返回值)移動一步,此時游客處于棧道行走狀態
如果游客已到達景點或景點外排隊等候隊列末尾,則:
按照表1的方法計算游客的等待時間
如果景點下次提供服務時刻+等待時間>景點關閉時刻,則此景點無法游玩,游客繼續尋找下一個景點。否則,游客根據排隊情況等待游玩或進入游玩
如果景點空閑,則該游客進入景點游玩,此時游客處于正在游玩狀態。設置景點下次提供服務時刻=當前時刻+景點游覽時間
否則,游客必須排隊等候,此時游客處于等待游玩狀態
生成“離開景點”事件,事件發生時刻=景點游覽時間+游客等待時間
2.2 算法比較
為了方便比較,本文引入前人研究(任競斐,鄭偉民,2013;肖雄輝,等,2013;鄭天翔,2012)中使用的基于距離的決策方案做分析。在本文的特定因素下,基于最短距離的決策算法(下簡稱距離算法)如表4所示。
B=g(A)
輸入:A是當前游覽完畢的景點或到達的景區門口
輸出:B是經決策后的下一個待游覽景點(下一步的游憩方向)
1. 在感興趣的所有未游玩景點中,對每個景點C進行下面的判斷:
計算所需成本=A與C之間的路徑長度/步速,并把景點C加入候選景點集合
如果 所需成本+當前時刻
如果景點C處于關閉期間
如果景點C的開始時刻已經過了(當前時刻 > 景點C關閉時刻),則從候選景點集合中剔除景點C
否則,如果 所需成本+當前時刻
如果景點C處于開放期間
如果 所需成本+當前時刻 > 景點C關閉時刻,則從候選景點集合中剔除景點C
否則,從候選景點集合中剔除景點C
2. 如果候選景點集合為空,則返回“空值”;否則,從候選景點集合中選擇成本最少的一個,作為B返回
2.3 實驗數據
假定景區的空間布局圖如圖3所示。
其中,復選鈕代表景點和門口,其中以V開頭標記的是景點(如V1,…,V5),以G開頭標記的是門口(如G1,G2,G3)。景點與景點、景點與門口之間的數字代表路徑長度。仿真系統的輸入包括:
?系統參數:為方便起見,假設虛擬時鐘的時間粒度(Tick)為1秒。
?景點的基本情況:所有景點的游覽時間統一設置為20秒,所有景點容量統一設置為1。至于景點的開始時刻和關閉時刻,景點V1、V2和V3跟隨景區開放而開放,景點V4的開始時刻隨機設為景區開放后1分54秒,持續時間為2分17秒,景點V5的開始時刻為景區開放后1分44秒,持續時間為2分30秒。
?游客信息:為了使游客數據在兩種算法的仿真實驗中保持一致,我們首先隨機生成所有游客的信息,然后把這些信息錄入系統,并對每個游客生成“到達事件”,最后全部加入到最小堆中。其中,各游客的預計離開時刻參見2.4.1節,感興趣的景點參見2.4.2節,至于各游客的到達時刻,由于前后兩次仿真時刻不可能相同,因此只需保證相對時間(相鄰兩個游客的到達時間間隔)一致即可。限于篇幅,僅保留其編號信息,編號規則是按照其到達景區的時間先后進行依次編號的。此外,為簡單起見,假設所有游客都從G2到達。
?仿真系統的輸出:與整個游覽過程相關的信息,包括游客的游玩次序、等待時間和實際離開時刻。
2.4 結果分析
2.4.1 游客等待時間
兩組算法在游客等待時間上的結果如表5和圖4所示。
從表5和圖4可以清楚看到,本文算法的等待時間在各游客上差別不大(趨勢線的斜率為0.89),表明游客的等待基本不受其到達景區的時刻先后所影響,而對于距離算法,到達時刻較早的游客等待時間較短,到達時刻較晚的游客等待時間較長,因此趨勢線的斜率較大(4.89)。此外,有研究者指出,游客滿意度是與等待時間占逗留時間的比例(張影莎,等,2012)(下簡稱等逗比)密切相關的,從表5和圖 5的結果來看,本文算法的等逗比在各個游客上趨于平均,而距離算法則波動較大,到達時刻較早的游客其等逗比普通較低,到達較晚的游客等逗比普遍較高,對編號為12、13和14的游客來說,花費在景點上的等待時間甚至占據了在景區逗留時間的60%或更多。
2.4.2 游客游玩的景點數量
收集游客實際游覽(成功游玩)的景點數據,整理后結果如表6所示。
注:“提前”是指在“尋找下一個景點”的決策中,選擇任一候選景點都將超過游客預計離開時刻,算法返回值為空,游客提前離開景區。“錯過”是指在“尋找下一個景點”的決策中,選擇任一候選景點都將超過了景點關閉時刻,算法返回值為空,游客未能前往游玩?!斑z憾”是指當游客到達景點后,發現景點來不及游玩(已關閉,或者等候人數太多超過景點關閉時刻,或者超過游客預計離開時刻),無奈地重新選擇下一個景點。
從表6可以看到,本文算法與距離算法相比,能夠讓游客成功游玩更多的景點(見表6陰影部分)。此外,從游客所付出的代價來看,“提前”和“錯過”要比“遺憾”要小。本文算法能提前告知游客候選景點能否游玩,因此沒有出現當游客到達景點后才發現景點不能游玩的情況;而距離算法則由于無法提前預知,因此在模擬過程中出現3次游客到達景點后才發現該景點不能游玩的情況:游客11和14(見表5)分別到達景點V5后、游客16(見表5)到達景點V4后,詳見下文表8。
2.4.3 景點容量利用率
為了計算景點容量利用率(張影莎,等,2012),把各景點人數變動的時刻一一記錄下來,也就是說,記錄游客到達該景點的時刻(游玩或等候)或在該景點上游玩結束離開景點的時刻,然后記下接待人次和統計等候人數。結果分別如表7和表8所示。
首先,由表7和表8可知,對于景點V1V5,本文算法分別接待了9、9、11、7、7人次,而距離算法分別接待了6、11、11、6、7人次,由此可見各景點的接待能力大致相同。然而,表7和表8反映了兩個截然不同的事實:在本文算法下,各景點的負荷比較接近,排隊等候人數峰值大概為3~4人,而在距離算法下,每個景點的負荷非常不均衡,景點V1、V3、V4的排隊等候人數峰值在1~2人之間,而景點V5的峰值在4人左右,景點V2的峰值甚至達到了7人。
注:根據2.3節假設,景點V4的開放時刻為23:25:58,關閉時刻為23:28:15;景點V5的開放時刻為23:25:48,關閉時刻為23:28:18。在23:28:03上,游客16到達V4后發現景點快要接近關閉,不能游玩導致景點V4的接待人次/等候人數并沒有增加。在23:26:48上,游客11到達V5后發現景點外排隊等候有3人,屆時輪到自己的時候景點已經關閉,不能游玩導致景點V5的接待次數/等候人數并沒有增加。在23:27:49上,游客14到達V5后發現若選擇游玩則將會超過預計離開景區時刻,而其他未游覽景點(V1和V4)根據決策算法也將超時,因此只能離開景區。
其次,各景點容量利用率可以借助容量剩余來間接反映:當游客到達景點后,如果能進入游玩而無需等候,則說明該景點處于閑置中,有大量的容量剩余;反之,說明該景點處于忙碌中,沒有容量剩余。在表7和表8中,這對應于接待人次(有具體數值)所在行的等候人數:如果等候人數為0,則說明景點處于閑置中,反之則處于忙碌中。可見,本文算法下各景點的剩余容量大致相同,景點容量利用率基本一致。而距離算法下,景點V1、V3、V4有大量的容量剩余,說明這些景點很多時候處于閑置狀態,景點容量利用率較低,而景點V2和V5則沒有足夠的容量剩余,說明這兩個景點長期處于繁忙狀態,景點容量利用率很高。
2.4.4 景點平均等待時間
從表5可以計算出在本文算法和距離算法下游客的平均等待時間(總等待時間和總人數的比值)(Lovejoy,et al.,2004)分別為66.63秒和72.44秒,顯然,本文算法更占優。本節中,我們將進一步比較每個景點的游客平均等待時間。
首先定義每個景點的游客平均等待時間,其計算方法為在該景點上的等待時間之和與在該景點需要等待的游客人數之比值。該指標可以計算出游客在某個景點上的等待成本,能客觀反映景區中各景點的實際運營情況。
從表9的結果來看,在本文算法下,各景點的平均等待時間基本一致,表明沒有出現游客在個別景點高度集中的情況,人群分布較均勻,擁擠程度較低。而在距離算法下,各景點的平均等待時間存在明顯差異,游客在景點V2和V5所需等待時間較長,而在其他景點所需等待時間則較短,表明游客在景點V2和V5高度集中,擁擠程度嚴重,而其他景點則隨到隨玩。
表9 兩種算法在“景點平均等待時間”上的結果
等待時間之和(秒)
本文算法距離算法
等待人數
本文算法距離算法
景點平均等待時間(秒)
本文算法距離算法
V1289628436.115.5
V218166271025.966.2
V3206818525.816.2
V4196337428.08.3
V51943216832.340.1
3 結論與討論
本文針對主題公園游客時空分流的決策支持系統問題,借助計算機推理技術提出一種基于現場環境的游憩方向決策算法,并設計了一個計算機仿真系統進行實驗模擬。與傳統的最短距離算法相比,本文算法在游客等待時間、游客游玩景點數量、景點容量利用率和景點平均等待時間4個指標上均顯示出良好的性能,具有時空一體化的特性。從實驗結果來看,本文所創建的時空分流模型,讓游客自動分流并導航到較少擁擠的景點上,既能均衡各景點的接待能力,同時能降低游客的等待成本,有助于主題公園的客流時空分布調控。與以往時空分流模型或算法的不同之處在于,它既充分考慮了各景點的開放和運營情況,也考慮了游客本身的多種需求,同時還考慮其他游客的位置,從而獲得單步最少成本的路徑。
本文提出的游憩方向決策支持算法,其研究雖然目前停留在模擬階段,但從實驗效果來看,有助于景區客流運轉的可控性和有序化,對景區管理者、景點設施和游客來說都是大有裨益的。首先,對景區管理者來說,景區旅游擁擠加劇和生態環境破壞等問題需要對旅游客流和景區內資源的使用情況進行監控,以便必要時進行現場疏導,其最大的障礙莫過于無法掌握游客在景區內的游憩行為。本文算法可以讓景區管理者了解游客的行蹤(實踐中需借助物聯網技術),算法產生的推薦路線能讓游客自動分流并導航到較少擁擠的景點上,不用擔心熱門景點由于游客過多而出現局部擁堵或混亂的局面,有望節省用于現場疏導的人力資源。其次,對景點設施來說,本文算法能夠均衡各景點的接待能力和承受能力,既不會造成資源閑置浪費,也不會造成景區局部擁擠。再者,對游客來說,在景區的游憩過程中,擁擠的人群和錯綜復雜的地圖讓他們很難通過目測或者經驗獲得最佳旅游線路,本文算法可輔助游客個性化定制感興趣的景點,并在確定游憩方向(景點的游歷次序)上把繁瑣的自行搜索篩選變為了主動推送,減少游客在景區的等待時間,并有可能增加游客體驗項目數(張影莎,等,2012),從而提高游客的游玩效率。
致謝 感謝暨南大學深圳旅游學院吳圳杰對本文仿真系統的測試所做的諸多工作。
參考文獻:
[1] 陳建斌,鄭麗,張凌云.智慧景區IT能力模型及其核心構成研究[J].旅游科學,2014(1):1421.
[2] 陳治佳,王曦,何苗.大型游樂場快速通道優化模型與仿真模擬[J].哈爾濱工業大學學報,2005(9):12611263.
[3] 杜軍平,周亦鵬.基于數據的旅游管理決策支持系統研究[J].自動化學報,2009(6):834840.
[4] 馮剛,任佩瑜,戈鵬,朱忠福,冉建華.基于管理熵與RFID的九寨溝游客高峰期“時空分流”導航管理模式研究[J].旅游科學,2010(2):717.
[5] 馮剛,任佩瑜,肖維陽,鄧貴平,蹇代君.基于RFID模式對景區生態保護的研究――以九寨溝諾日朗餐廳就餐分流為例[J].西南民族大學學報 (人文社科版),2009(11):151154.
[6] 戈鵬,鄭偉民,肖雄輝,邱厭慶,任佩瑜.基于九寨溝區域時空負荷均衡的仿真研究[J].管理工程學報,2013(2):99106.
[7] 姜向陽,任佩瑜.自然保護區旅游高峰期時空分流導航管理的模型構建與分析[J].旅游科學,2012(4):1725.
[8] 黎j.景區游客游憩行為計算機仿真模型[J].旅游科學,2013(5):4251.
[9] 黎j,杜栓柱.景區游憩行為計算機仿真系統研究綜述[J].旅游學刊,2011(7):8594.
[10] 李仁杰,路紫.旅游個性化推介服務的未來發展:時空一體化[J].旅游學刊,2011(10):8288.
[11] 梁倩,張宏梅.智慧景區發展狀況研究綜述[J].西安石油大學學報( 社會科學版),2013(5):5256.
[12] 劉衛東,沈官林,嚴蔚敏.數據結構C++語言描述[M].北京:清華大學出版社,1998.
[13] 邱厭慶,戈鵬,賴力,吳艷,任佩瑜.九寨溝景區初態聚類分流實證研究[J].資源科學,2010(10):19871992.
[14] 邱厭慶,戈鵬,劉柱勝,任佩瑜.基于復雜系統控制的景區游客時空分流導航管理研究[J].軟科學,2011(9):5457.
[15] 邱厭慶,戈鵬,任佩瑜.基于九寨溝景點負荷均衡的時空分流導航研究[J].資源科學,2010(1):118123.
[16] 任競斐,鄭偉民.景區旅游高峰期游客旅游路線動態實時調度仿真研究[J].統計與決策,2013(8):4245.
[17] 王仁志,苗維亞.基于M/M/n排隊論的大型旅游景區內部排隊現象研究[J].經濟體制改革,2012(3):177180.
[18] 王曉東.計算機算法設計與分析[M].第二版.北京:電子工業出版社,2004.
[19] 吳凱.旅游線路設計與優化中的運籌學問題[J].旅游科學,2004(1):4144.
[20] 肖雄輝,戈鵬,朱虹明,任佩瑜,鄭偉民,章小平.旅游高峰期景區游客引力分流調度模型研究――以九寨溝風景區為例[J].旅游科學,2013(6):3951.
[21] 張凌云.試論排隊論在旅游業中的應用――兼析餐廳服務員的最優配置[J].社會科學家,1988(1):4754.
[22] 張影莎,蘇勤,胡興報,盧松.基于排隊論的方特歡樂世界主題公園容量研究[J].旅游學刊,2012(1):6672.
[23] 鄭天翔.基于動態實時調度的主題公園游客時空分流導航管理研究[J].旅游科學,2012(4):816.
[24] 鄭天翔,吳蓉,羅海媛.國內景區旅游流調控研究綜述[J].地理與地理信息科學,2015(5):9096.
[25] Akasaka Y,Onisawa T(2008).Personalized pedestrian navigation system with subjective preference based route selection[M]//Intelligent Decision and Policy Making Support Systems.Berlin Heidelberg:SpringerVerlag,7391.
[26] Button K(2006).The Disney Queue Line Survival Guidebook[M].Scottsdale:Infinity Publishing.
[27] Cope Iii R F,Cope R F,Davis H E(2008).Disney’s Virtual Queues:A Strategic Opportunity To CoBrand Services?[J].Journal of Business & Economics Research,6(10),1320.
[28] Erlang A K(1909).The theory of probabilities and telephone conversations[J].Nyt Tidsskrift for Matematik B,20(16),3339.
[29] Garcia A,Arbelaitz O,Linaza M T,Vansteenwegen P,Souffriau W(2010).Personalized tourist route generation[M]//Current Trends in Web Engineering.Springer,486497.
[30] Garcia A,Linaza M T,Arbelaitz O,Vansteenwegen P(2009).Intelligent Routing System for a Personalised Electronic Tourist Guide:Proceedings of the International Conference on Information and Communication Technologies in Tourism,Amsterdam,The Netherlands[C].
[31] Garcia A,Vansteenwegen P,Arbelaitz O,Souffriau W,Linaza M T(2013).Integrating public transportation in personalised electronic tourist guides[J].Computers & Operations Research,40(3),758774.
[32] Heger C,Offermans S,Frens J(2009).Waiting as part of the fun:Interactive gaming in theme park queues:Proceedings of the fifth Student Interaction Design Research Conference,Eindhoven University of Technology,the Netherlands[C].
[33] Lovejoy T C,Aravkin A Y,SchneiderMizell C(2004).Kalman Queue:An Adaptive Approach to Virtual Queueing[J].The UMAP Journal,25(3),337352.
[34] Lutz H(2008).The impact of virtual queues for amusement parks:Proceedings of the 39th Annual Meeting of the Decision Sciences Institute,Atlanta,Georgia State University[C].
[35] Maruyama A,Shibata N,Murata Y,Yasumoto K,Ito M(2004).A personal tourism navigation system to support traveling multiple destinations with time restrictions:Proceedings of the 18th International Conference on Advanced Information Networking and Applications,Fukuoka,Japan[C].IEEE.
[36] Nadi S,Delavar M R(2011).Multicriteria,personalized route planning using quantifierguided ordered weighted averaging operators[J].International Journal of Applied Earth Observation and Geoinformation,13(3),322335.
[37] Panou M(2012).Personalized application for multimodal route guidance for travellers[J].European Transport Research Review,4(1),1926.
[38] Shiraishi T,Shibata M N N,Nagata M,Shibata N,Murata Y,Yasumoto K,Ito M(2005).A personal navigation system with a schedule planning facility based on multiobjective criteria:Proc.of 2nd International Conference on Mobile Computing and Ubiquitous Networking[C].Citeseer.
[39] Souffriau W,Vansteenwegen P,Vertommen J,Berghe G V,Oudheusden D V(2008).A personalized tourist trip design algorithm for mobile tourist guides[J].Applied Artificial Intelligence,22(10),964985.
[40] Sylejmani K,Dorn J,Musliu N(2012).A Tabu Search approach for Multi Constrained Team Orienteering Problem and its application in touristic trip planning:12th International Conference on Hybrid Intelligent Systems[C].IEEE.
[41] Tsai C Y,Chung S H(2012).A personalized route recommendation service for theme parks using RFID information and tourist behavior[J].Decision Support Systems,52(2),514527.
[42] Tsiligirides T(1984).Heuristic methods applied to orienteering[J].Journal of the Operational Research Society,35,797809.
[43] Universal City Studios INC(2002).Reservation system and methods for theme parks:USA,US2002116235 A1[P].20020822.
[44] Vansteenwegen P,Souffriau W,Berghe G V,Van Oudheusden D(2009b).Metaheuristics for tourist trip planning[M]//Metaheuristics in the service industry.Berlin Heidelberg:SpringerVerlag,1531.
[45] Vansteenwegen P,Souffriau W,Vanden Berghe G,Van Oudheusden D(2009a).Iterated local search for the team orienteering problem with time windows[J].Computers & Operations Research,36(12),32813290.
[46] Vansteenwegen P,Van Oudheusden D(2007).The mobile tourist guide:an OR opportunity[J].OR Insight,20(3),2127.
[47] Yiakoumettis C,Doulamis N,Miaoulis G,Ghazanfarpour D(2013).Active learning of user’s preferences estimation towards a personalized 3D navigation of georeferenced scenes[J].GeoInformatica,136.
[48] Yu C,Chang H(2009).Personalized locationbased recommendation services for tour planning in mobile tourism applications[M]//ECommerce and Web Technologies.Berlin Heidelberg:SpringerVerlag,3849.
[49] Zhang L,Li J,Zhou K,Gupta S D,Li M,Zhang W,Miller M A,Misener J A(2011).Traveler information tool with integrated realtime transit information and multimodal trip planning[J].Transportation Research Record,(2215),110.
Decision Support System to Personalized Route
Guidance Service for Tourists in Theme Parks Based on
Computer Reasoning Technology:Design,Simulation and Comparison
ZHENG Tianxiang1, WU Rong2
(1.Shenzhen Tourism College, Jinan University, Shenzhen 518053, China;
2.Geography and Planning School, Sun YatSen University, Guangzhou 510275, China)
Abstract:
The paper is a study of the decision support system concerning personalized route guidance service for tourists in theme parks. It first outlined a single complete recreational behavior of a tourist while visiting at the park, thus summarizing the components and states related to this behavior. To simulate these components and accomplish the switching states, it presented, using computer reasoning technology, a stateofart model (recreation direction) finding algorithm via contextual environment, which integrated the tourist’s preferences, the availability of the targeted recreation facility (amusement ride) and the queuing situation of other facilities, so as to get the singlestep optimal direction. A computerized simulation system based on discrete event modeling was then implemented and experiment was conducted on an analog dataset as compared with the traditional shortestpath algorithm. The findings show that the proposed model outperforms its competitor in four evaluating indicators including tourist waiting time, amount of nonvisited rides, utilization of each ride and average waiting cost on each ride. The validity of this study depends on its temporalspatial integration by generating an appropriate visiting route for each tourist to follow, which in turn, theoretically, guides him/her to those vacant rides or less congested areas. All these indicate that this work caters to modulating the spatial and temporal distribution of tourist flow in theme parks, where queuing problem generally occurs, by balancing the capacity of each park ride as well as reducing the waiting cost of the tourists.
篇2
關鍵詞:計算機視覺圖像 精密測量 構造幾何模型 信號源的接收
中圖分類號:TP391 文獻標識碼:A 文章編號:1009-3044(2013)05-1211-02
新型計算機視覺圖像精密測量是一種基于計算機程序設計以及圖像顯示的高精度的關鍵技術,它廣泛用于測量的領域,對于測量的準確性有很好的保證。這種關鍵技術是幾何了光學的特性,發揮了圖像學的顯影性,把普通的測量技術瞬間提升到了一個新的高度。在這項關鍵技術中包含了物理學中光的效應,圖像中的傳感器以及計算機中的編程軟件,這還不完全,還有一些其他科學領域知識的輔助,可以說這項關鍵技術是一個非常有技術含量的技術,很值得學者進行研究。
1 計算機視覺圖像精密測量的關鍵技術的具體形式
在以往的測量中,選擇的測量方式還是完全采用機械的形式,但是在使用了計算機視覺圖像精密測量后,完成了許多以往技術所不能達到的任務。在我們的研究中,計算機視覺圖像測量的原理是通過攝像機將被處理的對象采集進行影像采集,在多個控制點的數據采集完成后,系統會自動將這些圖像進行整合,得出相關的幾何多變參數,再在計算機上以具體的數據顯示出來,以供技術人員使用參照。
在上面所說的攝像機并不是我們通常意義上生活中使用的攝像機。它是一種可視化較強,表針比較敏感的測試儀??梢詫⒁曈X中的二維形態通過顯影,記錄在機械的光譜儀上,再將這種的二維圖像做數學處理,有二階矩陣轉換為三階矩陣,通過播放儀呈現出三維的影像。這時的圖像變為立體化,更有層次感,效果上也有了明顯的變化,這是一種顯示方法。此外還有一種造價較高的儀器,我們不常使用,就是圖像提取器。同樣是采集控制點的數據,將數據整合在系統之內,然后對于原始的圖像進行預處理,不再經過有曝光這個程序,將圖像中關鍵點的坐標在整個內部軸面上體現出來,提取數據幀數,再運用機器的智能識別系統,對控制點的坐標進行數據分析,自動生成圖形,這也可以用于精密測量。它的優點就是使用上極其的方面,基本只要架立儀器和打開開關,其他的工作機械系統都會自動的完成。使用的困難就是造價極其的高,不適合一般企業使用。在基于計算機視覺圖像測量中使用上的原理如下:
1) 計算出觀察控制點到計算機視覺圖像測量儀器的有效距離;
2) 得出觀察點到目標控制點之間的三維的運動幾何參數;
3) 推斷出目標控制點在整個平面上的表面特征( 大多時候要求形成立體視覺);
4) 還通過觀察可以判斷出目標物體的幾何坐標方位。
在整個計算機視覺圖像精密測量的關鍵技術中最關鍵的元件就是壓力應變電阻儀,這也是傳感器的一部分。壓力應變電阻儀的使用方式是將應力片粘貼在控制點位上,事先在物體表面打磨平整,清理干凈后,涂抹丙酮試劑,在液體完全風干后就可以黏貼應力片,通過導線的聯接,形成了一小段閉合的電路,時刻讓計算機視覺圖像系統可以感應到并作跟蹤觀察。因受到來自不同方面諧波的影響后,應力片會產生一定數值的電阻,在電路中,這些電阻會轉化為電流,視覺圖像系統接收到了電流后就會顯示在儀表盤上相應的數據,我們就可以根據儀表盤中的數據記錄測量中的數據,很好的解決了原始機械在使用過程中大量的做無用功所消耗資源的現象。傳感器對每個應點都進行動態的測量,將數據模轉換成現實中的圖像,精確的成像可以測算出控制點的位置,用計算機視覺圖像精密測量結合數據方面的相關的分析,得出施工中的可行性報告分析,減低了施工中的成本,將施工的預算控制在一個合理的范圍之內。
當無法觀察到控制點是,計算機視覺圖像精密測量可以通過接收信號或是相關的頻率波段來收集數據,不會因為以往測量的環境不好,距離太遠,誤差太大的影響。
2 計算機視覺圖像精密測量的關鍵技術分析
在計算機視覺圖像精密測量的關鍵技術中解決了很多以往很難完成的任務,但是在使用過程中還是發生了很多的問題。尤其在視覺圖像的選擇中,無法使用高幀數的圖片顯示,無法將計算機視覺圖像精密測量的關鍵技術的優點發揮出來。我們就計算機視覺圖像精密測量的關鍵技術中常見的問題進行討論。
2.1 降低失誤的概率
在很多的數據誤差中,有一部分是出現在人為的因素上面。對于機器的不熟悉和操作中的疏忽都會在一定程度上對圖像的視覺感模擬帶來麻煩。對于網絡設備的配置上,要經常性的學習,將配置在可能的情況下設置的更加合理和使用,保證網絡連接系統的安全性。為防止更多因操作帶來的誤差,選用系統登入的制度,用戶在通過識別后進入系統,在采集數據后,確定最終數據上又相關的再次確定的標識,系統對本身有的登錄服務器和路由器有相關的資料解釋,記錄好實用操作的時間,及時備份。
2.2 對于權限的控制
權限控制是針對測量關鍵所提出的一種安全保護措施,它是在使用計算機視覺圖像精密測量的關鍵技術中對用戶和用戶組賦予一定的權限,可以限制用戶和用戶組對目錄、子目錄、文件、打印機和其他共享資源的瀏覽和更改。圖像中的運行服務器在停止的情況下可以做出不應答的操作指令,立刻關閉當前不適用的界面,加快系統的運行速度,對于每天的日志文件實時監控,一旦發現問題及時解決。對于數據終端的數據可采用可三維加密的方法,定時進行安全檢測等手段來進一步加強系統的安全性。如果通過了加密通道,系統可以將數據自動的保存和轉換為視圖模式,對于數據的審計和運行可以同時進行,這樣就可以很好的保證大地測量中的圖像數據安全,利用防護墻將采集中廢棄的數據革除在外,避免數值之間發生紊亂的現象,進一步改善計算機視覺圖像精密測量的關鍵技術。
2.3 開啟自動建立備份系統
計算機視覺圖像精密測量的關鍵技術的完善中會常遇到系統突然崩潰或是圖像受到嚴重干擾導致無法轉換的一系列情況,發生這種情況最大的可能性就是系統在處理多組數據后無法重新還原成進入界面。這時為保證圖片轉換成數字的系統數據不丟失,我們對系統進行備份。選定固定的磁盤保存數據,定期將產生的數據(轉換前的圖像和轉換后的數值)導出,保證程序的正常運行。當系統一旦發生錯誤,可以盡快的恢復數據的初始狀態,為測量任務的完成爭取更多的時間。我們還要減少信號源周圍的干擾,定期的更新系統數據庫,保持數據采集的穩定性,把攝像機記錄出的數據節點保存在相應的技術圖紙上,用這樣的方式來知道測量工作。系統備份的數據還可以用于數據的對比,重復測量后得出的數據,系統會自動也備份的數據進行比對,發現誤差值在規定以外,就會做出相應的預警,這樣也能在工作中降低出現誤差的概率。
3 計算機視覺圖像精密測量的關鍵技術遇到的困難和使用前景
計算機視覺圖像精密測量的關鍵技術作為一種新興技術在使用時間上不過十幾年,其使用的程度已經無法估算。正是因為它的簡單、使用、精度高以及自動化能力卓越的特點受到了測量單位的廣泛青睞。在測量方面的這些可靠性和穩定性也是有目共睹的。在土木和機械測量的行業計算機視覺圖像精密測量的關鍵技術都會有廣泛和良好的使用,前景也是十分的廣闊。但是不容忽視該技術也有一些弊端。這項關鍵技術中涵蓋的學科非常的多,涉及到的知識也很全面,一旦出現了機器的故障,在維修上還是一個很大的問題,如何很好的解決計算機視覺圖像技術的相關核心問題就是當下亟待解決的。
我們都知道,人的眼睛是可以受到吱聲的控制,想要完成觀測是十分簡單的,但是在計算機視覺圖像技術中,畢竟是采取攝像機取景的模式,在取得的點位有的時候不是特別的有代表性,很難將這些問題具體化、形象化。達不到我們設計時的初衷。所以在這些模型的構建中和數據的轉換上必須有嚴格的規定和要求,切不可盲目的實施測量,每項技術操作都要按規程來實施。
上文中也談到了,計算機視覺圖像精密測量的關鍵技術中最主要的構建是傳感器,一個合理的傳感器是體統的“心臟”,我們在儀器的操作中,不能時時刻刻對傳感器進行檢查,甚至這種高精度的元件在檢查上也并不是一件簡單的事情,通過不斷的研究,將傳感器的等級和使用方法上進行一定的創新也是一項科研任務。
4 結束語
在測量工程發展的今天,很多的測量技術已經離不了計算機視覺圖像技術的輔助,該文中詳細的談到了基于計算機視覺圖像精密測量的關鍵技術方面的研究,對于之中可能出現的一些問題也提出了相應的解決方案。測量工程中計算機視覺圖像精密測量的關鍵技術可以很好的解決和完善測量中遇到的一些問題,但是也暴露出了很多的問題。
將基于計算機視覺圖像精密測量的關鍵技術引入到測量工程中來,也是加強了工程建設的信息化水平。可以預見的是,在未來使用計算機視覺圖像技術建立的測量模型會得到更多、更好的應用。但作為一個長期復雜的技術工程,在這個建設過程中定會有一些困難的出現。希望通過不斷的發現問題、總結經驗,讓計算機視覺圖像精密測量的關鍵技術在測量中作用發揮的更好。
參考文獻:
[1] 湯劍,周芳芹,楊繼隆.計算機視覺圖像系統的技術改造[J].機電產品開發與創新周刊,2005,14(18):33-36.
[2] 段發階,等. 拔絲??仔斡嬎銠C視覺檢測技術[J]. 光電工程時報, 1996,23(13):189-190.
篇3
關鍵詞:計算機視覺技術 鐵路檢測 應用
中圖分類號:TP391 文獻標識碼:A 文章編號:1007-3973(2012)002-075-03
1 前言
自1825年世界第一條鐵路在英國出現以來,鐵路已經成為人們不可或缺的交通工具,越來越多的人在使用鐵路出行,由于近年來鐵路事故頻頻發生,促使了計算機視覺技術在鐵路檢測上的廣泛使用并大力發展。
傳統的鐵路檢測一直是靠人工和靜態檢測,這種檢測缺乏實時性和準確性,并且效率低下,根本無法滿足鐵路的發展。這就要求研究一種新的檢測方法來適應環境的發展,人們就試圖將計算機視覺技術應用于鐵路檢測上,并取得了很好的效果。將計算機視覺技術應用在鐵路檢測上顯著提高了鐵路檢測的實時性、準確性,有效的減輕了人工檢測中工作條件惡劣,工作量大等缺點。它能在列車行駛的過程中就能對鐵路和列車狀況進行檢測,并及時的做出預警,防止安全事故的發生。目前有關鐵路檢測主要集中在鐵路信號檢測、軌道檢測、接觸網檢測、電力機車檢測及站臺環境監測等五個方面。
2 計算機視覺技術
計算機視覺,也稱機器視覺。它是利用一個代替人眼的圖像傳感器獲取物體的圖像,將圖像轉換成數字圖像,并利用計算機模擬人的判別準則去理解和識別圖像,達到分析圖像和作出結論的目的。
計算機視覺是多學科的交叉和結合,涉及到數學、光學、人工智能、神經生物學、心理物理學、計算機科學、圖像處理、圖像理解、模式識別等多個領域。計算機視覺已有多年的發展歷程。隨著計算機、控制理論、模式識別、人工智能和生物技術的發展,計算機視覺在機器人、工業檢測、物體識別的應用越來越廣,研究方向也從二維到三維,從串行到并行,從直接依賴于輸入信號的低層處理到依賴于特征、結構、關系和知識的高層處理。
一般的計算機視覺系統是有CCD(電荷耦合器件)攝像機、裝備有圖像采集板的計算機、光照系統以及專用圖像處理軟件等組成。CCD攝像機將所要研究的對象和背景以圖像的形式記錄下來,這其實是一個光電傳感器,將光學信號轉成電信號,圖像采集板把采集的電信號轉為數字信號,即數字化,一般情況下在攝取圖像時都需要一個照明系統提供光照,然后再用專用的圖像處理軟件對圖像進行處理,輸出分析結果。
3 計算機視覺技術在鐵路信號中的應用
鐵路信號燈和現在的交通公路上的紅綠燈是一個功能,但鐵路和公路不同,鐵路有限定的道路,列車必須在限定的股道上行駛,所以一旦與其他車輛相遇的話根本沒有辦法避讓,如果發生車禍將會對國家和人民的生命和財產造成嚴重的損失,因此列車必須嚴格按照信號燈的指示行駛。
鐵路信號燈識別主要是利用了信號燈在不同情況下會發出特定色彩光的特點。文獻[1]在HSV空間中對S分量圖像邊緣檢測和膨脹等,結合各種信號燈色調H分量的取值范圍得到信號燈區域,然后多次腐蝕直到消除孤立點得到信號燈的邊緣,最后填充信號燈區域,從而實現了信號燈的識別。在文獻[2]也與此類似。文獻[3]將彩色圖像由RGB模式轉化為HSI模式,用彩色特征聚類分析法來對圖像進行分割,文中提出了基于顏色和形狀相結合的復雜環境中目標檢測與識別方法,用Hough變化來提取目標邊界,從而提取出特定目標,而后得到指示燈區域所有像素的H,S統計值確定信號燈的顏色。在文獻[4]提出一種基于改進的Hough變化的吊車信號燈識別算法。Roberto將攝取的圖片轉換到HIS顏色空間,用基于形狀特征和模板匹配的方法探測到相關的鐵路標志而放棄無關的基礎設施。
為了部分消除因為光照條件、背景和拍攝角度對目標識別的影響,文獻[5]提出使用一種利用sift特征的方法,它首先建立已知樣本模型的特征集,然后將視頻流每幀灰度圖像的sift特征與之比較,從而實現對目標的檢測或跟蹤。實驗表明該方法不僅能避免目標的錯誤識別,而且也明顯優于基于邊緣檢測的算法,在識別準確率上達到了90%。
4 計算機視覺技術在軌道檢測中的應用
隨著世界鐵路運營速度的不斷提高,列車在行駛時對軌道的撞擊、摩擦加劇,這就會造成軌道的變形、零件松動、磨損乃至缺失等,這些都會對列車的安全性造成嚴重影響,極有可能會造成鐵路安全事故的發生。因此軌道設備具備良好的狀態是鐵路運輸安全的重要保證。
隨著電子技術和檢測技術的發展,軌道檢測技術也經歷了翻天覆地的變化,其中也有不少研究機構將計算機視覺技術應用于軌道檢測上,且取得了若干有效的檢測方法。
軌道表面缺陷對列車行駛的質量和鐵路系統的安全性會造成嚴重的影響,文獻[7]提出了一種軌道表面缺陷檢測的實時視覺檢測系統。利用跟蹤提取算法分割出軌道的灰度圖像,然后用局部歸一化法增強軌道圖像的對比度,最后用基于投影輪廓的缺陷定位法檢測缺陷。該算法對噪聲有較強的魯棒性和計算速度快,在一定程度上克服了光照不均和軌道表面反射性質不同對圖像的影響,但對局部歸一化過程中參數的選擇有待進一步研究,以使該系統有更強的魯棒性。該系統在216km/h速度下能進行實時檢測,但隨著檢測速度的提高檢測的準確度會明顯下降且缺乏實時性。
文獻[8]利用一排結構光視覺傳感器,將鋼軌輪廓的大圓周和小圓周的中心作為檢查點。首先結構光視覺傳感器拍攝鐵軌側面并且將其標記 在參考坐標幀中,最后通過比較測量的鋼軌輪廓與參考輪廓的比較計算出鐵軌磨損程度。該方法簡單快速精確且不需要特殊的圖像處理設備,在列車較高速度時仍然能達到良好效果。
5 計算機視覺技術在接觸網檢測中的應用
接觸網是沿鐵路線上空架設的向電力機車供電的特殊形式的輸電線路。其由接觸懸掛、支持裝置、定位裝置、支柱與基礎幾部分組成。它是軌道交通的主要組成部分,主要為機車提供動力,接觸網的連接件由于受外界因素的影響容易產生過熱現象,嚴重時會導致供電中斷,引發列車停運事故。
我國的計算機視覺技術的接觸網檢測系統是基于德國相關技術而建立起來的,目前基于計算機視覺技術的接觸網磨耗檢測主要有兩種方案:(1)基于鏡面反射,激光照射接觸線,線性CCD照相機捕獲反射圖像;(2)基于漫反射原理和CMOS(互補金屬氧化物半導體)照相機。由于長期的頻繁摩擦,接觸網與受電弓接觸部分很少被空氣氧化,所以用光進行照射時該部分光反射率明顯高于其他部分,因此這也為計算機視覺技術用于接觸網檢測提供了可能。
基于機器視覺的接觸網檢測系統主要是建立在圖像識別和圖像處理等視覺技術基礎之上的,檢測的內容涵蓋接觸網的所有基本幾何參數。隨著鐵路的發展,原有的檢測系統已經暴露出了一些問題,已無法滿足需求,所以研究人員在系統硬件設備不變的情況下提出了許多改進的算法,如文獻[9]針對現行的接觸網定位器傾斜度檢測方法效率低下、精確度不高的缺點,提出了一種基于計算機視覺的接觸網定位器傾斜度自動測量裝置,應用圖像分割、剔除干擾線、圖像細化等算法,對采集的圖像進行處理,然后利用改進的霍夫(Hough)變換檢測細化后的圖像,對相鄰的特征像素點進行聚類并感知編組,最后用隨機Hough變換使感知編組后的每條線段更接近直線,進而計算裝置中定位器的傾斜度,實驗證明該算法精度高、速度快。
6 計算機視覺技術在電力機車檢測中的應用
在列車的行進過程中,機車車輪與鋼軌接觸面不斷發生摩擦,也就是輪緣與踏面的摩擦。從而會造成踏面的擦傷或剝離,而剝離會嚴重影響列車運行的安全性和平穩性以及軌道設施的使用壽命,因此需要對輪緣進行定期的檢測和維修。
傳統的檢測方法需要人工逐項檢測,存在費時費力、工作量大、工作環境差、效率低等缺點,所以人們就提出了一種基于計算機視覺技術的檢測技術,該技術是一種非接觸式檢測方法,它能檢測出所有關于火車輪緣輪廓的幾何參數,從而計算出火車輪緣的磨損情況。這種檢測方法檢測速度快、準確率高且大大減輕了勞動強度,在實驗中取得了滿意的效果,并且在實際檢測中也得到了廣泛的應用。
文獻[10]中研發設計了一種利用CCD成像測量技術、圖像處理理論和計算機控制等相關技術,提出了一種非接觸式的在線測量系統。采用二元多項式方法對由于硬件裝置引起的誤差的圖像進行幾何校正,用統計均值法對圖像進行分割,從而求出車輪踏面的各項參數,通過在實驗室對標準物進行測試實驗而得到的測量數據結果進行分析而得出。此系統能夠完成對火車輪對幾何參數的測量,并且可得到相對準確的測量結果。
為了解決檢測輪緣高度和寬度存在精度難以保證及穩定性不高的問題,文獻[11]提出了一種基于三角法測量的在線監測系統,該系統由CCD高速攝像機和結構光發射器完成數據的采集,然后利用三角測量原理導出測量模型和計算模型,根據輪緣高度和寬度的定義完成對高度和寬度的測量,最終對輪緣磨損程度進行量化,實驗表明該算法測量精度高,結果穩定可靠。
7 計算機視覺技術在站臺環境監測中的應用
近年來鐵路交通事業發展迅速,鐵路客流量也不斷增大,如中國每年的春運期間都有上億人次通過火車返鄉,各種危害乘客安全的事故也時有發生,因此世界各國特別是中國站臺監控就顯得越來越重要,目前的站臺監控主要是依靠安裝在各個角落的閉路電視或專業技術人員,這不僅需要專業技術知識還需要大量的人力物力。隨著計算機、圖像處理等技術的快速發展,對站臺的自動監控也逐漸成為發展趨勢。
近年來人們做了許多關于站臺人群檢測的研究,這些研究大都使用鐵路站臺中的閉路電視(CCTV)系統,在現代的CCTV系統中基本上使用的是數字化圖像,在人群監測過程中大量使用了數字圖像處理技術,如邊緣檢測、細化、像素計算等,通過圖像的處理可以輕易的得到想要的結果。
文獻[12]仍采用原有的CCTV監控系統拍攝的灰度圖像作為處理對象,利用基于視覺的經過最小二乘法和全局搜索的混合算法訓練的工業的額神經網絡來估算站臺的擁擠程度,該系統在實際的運行中獲得了較高的精確度,雖然不能計算人數但卻能實時的預測人群的密度。
文獻[13]所設計的系統就較為復雜,它利用多臺攝像頭對站臺進行檢測。首先判斷站臺上列車的四種狀態,如:沒有列車、有列車、列車正在出站、列車正在入站等,然后對物體或行人檢測及跟蹤,最后對所檢測的結果綜合分析,做出合理的預警或警告。
8 計算機視覺技術在鐵路檢測上的發展趨勢
隨著計算機視覺技術的鐵路檢測中的應用越來越廣泛和深入,并且隨著計算機視覺技術等關鍵技術的不斷發展,計算機視覺技術在鐵路檢測上應用發揮更大的作用,它就目前而言在鐵路檢測的應用上仍然存在技術難題需要研究:
篇4
關鍵詞:動態場景;自適應預測;多特征融合;計算機視覺;運動目標
接受信息的關鍵手段之一就是視覺系統,隨著科學技術水平的不斷發展,以及計算機和信號處理理論的誕生,讓機器擁有人類視覺功能已經不再是夢。對所采集視頻中的運動目標進行跟蹤、檢測,并對其目標行為進行分析,就是運動目標分析的內容,運動目標分析是計算機視覺領域關鍵內容之一,其屬于圖像理解與圖像分析的范疇。而在運動目標分析系統中,跟蹤與檢測運動目標則為中級和低級處理部分,是分析與理解行為的高等層分析模塊的基礎。檢測與跟蹤運動目標技術主要包括了:機器人視覺導航、軍事領域、運動圖像編碼、交通管制、視覺監視等。
1目標檢測算法
連續圖像序列由視頻中提取出,由前景區域與背景區域共同組成了整個畫面。前景區域包含了如運動的人體、車輛等動態要素,它是指人們較為感興趣的區域。而背景區域主要包含例如樹木、建筑物等靜態要素,它的像素值僅發生微弱變化或者不產生變化。在連續圖像序列中,采用一系列算法分隔開背景區域和前景區域,將運動目標信息有效提取,則為運動目標檢測。以靜態場景為基礎的運動目標檢測算法包括了光流法、背景差分法、幀間查分法等,文章主要針對背景差分法進行介紹。
背景差分法通常適用于靜態場景,其是將背景圖像與當前幀圖像進行差分,運動目標依靠閥值化進行檢測,因為該算法僅能夠在背景變化緩慢或者不發生變化的情況下應用,因此就有著一定的局限性。假設當前幀圖像為fk(x,y),背景圖像B(x,y)可通過一定的方法得出,而這時背景差分圖像則為:
(1)
而假設二值化閥值為Th,二值化圖像B(x,y)則為:
(2)
運動目標檢測結果可通過數學形態學處理獲得。
2 背景模型的實時更新
要更新背景圖像可采用一階KALMAN濾波來實現,為了克服氣候變化、光照變化等外部環境變化對運動檢測產生的影響,采用一階KALMAN濾波更新背景圖像公式如下:
Bk+1(p)=Bk(p)+g(Ik(p)-Bk(p)) (3)
而增益因子則為:g=?琢1(1-Mk(p))+?琢2Mk(p) (4)
公式中?琢1和?琢2是權值系數;M是第k時刻二值化后目標圖像中p像素的值;B為背景圖像;I為當前幀圖像。要想將運動目標從背景序列圖像中有效分割出來,就必須要達到?琢2足夠小的條件,且?琢1應等于或者大于10?琢2,若?琢1值過大,就會將算法自身的去噪特性喪失,在序列背景圖像中也會存儲越來越多的運動變化。
3 更新車輛目標模型
核與活動輪廓算法具有效率高、技術復雜度低等特點,它以非參數核概率密度估計理論為基礎,在視頻運動目標跟蹤中廣泛應用。彩色圖像序列通過攝像機獲取,人臉目標模型可以采用RGB顏色空間來進行描述。在跟蹤車輛的過程中,噪聲、遮擋、光照等干擾或多或少存在,因干擾因素的存在,車輛像素特征也會發生相應的微弱變化。若不對目標模型進行更新,會對跟蹤精度產生影響,所以,采用的矩形模板會包括一定背景。而在實施跟蹤的過程中,要對車輛目標模型進行更換。如果其過程物遮擋,當BHATTACHARYYA系數滿足?籽>Tudm條件時,更新車輛目標模型,更新模型為:
(5)
公式中Tudm是模板更新閥值;qk-1是更新之前的車輛目標模型。通過視頻跟蹤,在近場景和遠場景拍攝到的視頻中,多尺度圖像空間由各個幀圖像構成。例如:將將書本作為跟蹤對象,由遠及近從書本的正上方拍攝六十幀圖像,為了能使矩形框正好能夠包含書本,對每幀圖像張書本手工劃定矩形框,并對框內圖像的信息量進行統計。最后,隨書本尺度的變化,給出圖像信息量變化曲線。
4 計算機視覺原理
計算機視覺是一門研究怎樣使機器進行觀察的科學,更切確地說,就是指利用電腦和攝影機代替人眼對目標進行識別、跟蹤和測量等機器視覺,并進一步做圖形處理,用電腦處理成為傳送給儀器檢測或更適合人眼觀察的圖像。計算機視覺研究相關的理論和技術作為一個科學學科,嘗試創建能夠從圖像或者多維數據中獲取信息的人工智能系統。這里所指的信息指Shannon定義的,可以用來幫助做一個決定的信息。因為感知可以看作是從感官信號中提取信息,所以計算機視覺也可以看作是研究如何使人工系統從圖像或多維數據中感知的科學。
計算機視覺就是由計算機來代替大腦完成處理和解釋,用各種成象系統代替視覺器官作為輸入敏感手段。使計算機能象人那樣通過視覺觀察和理解世界,具有自主適應環境的能力就是計算機視覺的最終研究目標,而需要經過長期的努力才能達到這個目標。所以,在實現最終目標以前,通過努力的中期目標是建立一種視覺系統,這個系統能依靠反饋的某種程度的智能和視覺敏感完成一定的任務。例如:計算機視覺的一個重要應用領域就是自主車輛的視覺導航,但要實現自主導航的系統,卻還沒有條件實現象人那樣能識別和理解任何環境。所以,人們通過不懈的努力,研究在高速公路上具有道路跟蹤能力,有效避免與前方車輛碰撞的視覺輔助駕駛系統。人類視覺系統是有史以來,人們所知道的功能最強大和完善的視覺系統。這里要指出的一點是在計算機視覺系統中計算機起代替人腦的作用。計算機視覺可以而且應該根據計算機系統的特點來進行視覺信息的處理,但并不等于計算機必須按人類視覺的方法完成視覺信息的處理??梢哉f,對人類視覺處理機制的研究將給計算機視覺的研究提供指導和啟發,所以,用計算機信息處理的方法研究人類視覺的機理,建立人類視覺的計算理論,與此同時也是一個十分重要和讓人感興趣的研究領域。這方面的研究被稱為計算視覺。計算視覺可被認為是計算機視覺中的一個研究領域。計算機視覺領域的不完善性與多樣性為其突出特點。
5 結束語
對視頻中的運動目標進行跟蹤、識別、檢測,并對目標行為進行研究、分析,這就是基于視覺運動目標分析。以計算機視覺為基礎,分析運動目標,包括了目標行為的理解與分析、目標跟蹤、運動目標檢測、預處理圖像等,它是計算機視覺領域重要內容之一。理解與分析運動目標的行為,既是計算機視覺的根本目的之一,也是檢測與跟蹤運動目標的最終目標。從理論層考慮,理解與分析運動目標的行為可以分為人工智能理論研究與模式識別。簡要闡述基于計算機視覺的運動目標分析,而所面臨的是對運動目標行為的理解。
參考文獻
[1]楊可,劉明軍,毛欣,夏維建,劉偉,周旋,吳煒,周凱.基于計算機視覺的電纜終端表面溫升分析系統[J].電視技術,2013(7).
[2]葉闖,沈益青,李豪,曹思汗,王柏祥.基于人類視覺特性(HVS)的離散小波變換(DWT)數字水印算法[J].浙江大學學報:理學版,2013(2).
[3]何青海,馬本學,瞿端陽,李宏偉,王寶.基于機器視覺棉葉螨自動監測與分級方法研究[J].農機化研究,2013(4).
[4]賈挺猛,茍一,鮑官軍,董茂,楊慶華.基于機器視覺的葡萄樹枝骨架提取算法研究[J].機電工程,2013(4).
篇5
關鍵詞 陶瓷設計,計算機視覺、觸覺設計
1前 言
歷經數十年發展,CAD/CAM技術已取得了巨大成功,并迎來了數字化設計、數字化制造的時代。NURBS曲線曲面(非均勻有理B樣條)以其強大的形狀表示能力和配套的計算、編輯算法,已成為事實上的產品表示標準。細分曲面、隱式曲面是近年曲面造型研究的熱點,它們突破了NURBS在拓撲結構上的局限性,更容易表達某些復雜的形狀。
在陶瓷設計領域,經常需要設計人體、動物等自然雕塑形體,現有的CAD系統可采用NURBS曲面、細分曲面、隱式曲面等來描述這些復雜對象[1],但如何能快速、精確地設計出來,目前尚無有效的數字化工具。人們認識、改變外在事物時,主要利用視覺與觸覺的感官功能,通過手眼協調來設計出新的事物,設計師在設計新的對象時,也可如此操作。
近些年出現了一些價格較為便宜的觸覺式設計系統,如FreeForm系統,它抽取了大型虛擬現實系統的單一觸覺功能,可提供真實感的數字雕塑工具。但一般設計人員使用后的效果并不理想,雖可以在局部修修補補,但缺乏對整體形態的把握[2]。
本文提出了一套視覺與觸覺相結合的數字設計系統,以數碼相機和力感觸覺系統為工具,快速實現復雜形體的數字建模。首先利用數碼相機拍照,攝取參考對象的圖像,通過一個專門設計的攝影測量與計算機視覺集成系統重構出參考對象的三維數字模型;然后將此模型輸入到觸覺設計系統,經局部的修正,得到新的設計模型。以下詳述系統組成及原理,并給出設計實例予以驗證。
2造型設計系統的組成
本文所提出的系統主要分為兩個模塊:視覺子系統與觸覺子系統。其中觸覺子系統是購置的,視覺子系統是獨立開發的[3]。相機采用奧林巴斯CL5050,拍攝的照片經視覺反求系統處理后,得到VRML格式的三維模型,然后輸入FreeForm觸覺設計系統,進行再設計,最終輸出改型設計后的數字模型。圖1所示是視覺系統實物,圖2是觸覺系統的實物照片。
2.1 視覺系統[4]
本文提出的系統中,視覺系統為自主開發的,先講述相關的主要原理。
本文采用的視覺系統結合了攝影測量法的高精度與計算機視覺法的靈活性。近年來由圖片生成3D模型是一個熱門的計算機視覺研究領域,并相應提出了諸多的研究方法,其核心問題包括:相機標定、對應點匹配及3D重構等;針對每個問題均有大量的研究算法,特別是相機標定技術幾乎成為一個關鍵環節。
類似于測量系統控制網的概念,我們設計了一套控制特征點,相機直接根據控制特征點進行標定,可得到精度較高的相機內外參數。圖3所示是控制點分布的實物圖。
我們對控制點分布采取了特殊設計,使任意角度下拍照,均有10個(通常要求至少6個)以上特征點被攝取。對特征點,采用了高精度的專業攝影測量系統Aicon加以標定,其空間坐標保存于一個數據文件中,以備相機標定時采用。
有了高精度的相機參數,就可以利用成熟的計算機視覺方法重構3D模型。我們采用了遮擋輪廓法[1]及空間剝離法[2]這兩種對環境要求較低、算法較為穩定的方法,處理標定過的圖像,得到三維模型主要形態,可作為觸覺設計的基礎。
2.2 觸覺系統
觸覺子系統采用FreeForm觸覺式虛擬設計系統,通常也亦稱為3D Touch系統,采用了力回饋技術,手握觸覺筆在空間旋轉移動,屏幕里相應的雕刻刀便隨之移動;當雕刻刀接觸到模型時,會有力回饋到握筆的手上,讓使用者感受到接觸時的力量。在雕刻時可設定模型的軟硬度,進而調整雕刻所需的力。常規的實物雕刻操作,在系統內均有對應的虛擬工具,無論是雕刻效果,還是虛擬雕刻過程中的感受,與實際雕刻幾乎一樣,提供了十分逼真的雕刻環境。
3陶瓷狗的造型設計
在陶瓷設計中,經常需要參考某種實物樣品。本實驗以圖1中的玩具狗作為參考對象,借助視覺、觸覺集成系統進行了兩次造型、建模試驗。視覺系統從不同角度攝取了10幅圖片,由這10幅圖片生成一個三維模型(見圖4)。整個建模過程僅需十幾分鐘,方便快捷。輸出的模型包含了參考對象的主要形態,稍加修整,即可得到新的改型設計。
以視覺系統的輸出為骨架,在FreeForm系統中進行細部的修整與再設計,并可添加修飾色彩,得到新的設計結果,見圖5。
在試驗中,如果僅依靠觸覺設計系統,即使熟練的操作人員,要設計出比例協調、結構合理的模型,也需要花費一天或數天時間。視覺系統的輸入極大地簡化了主體形態的構造,使不太熟練的設計人員也能利用觸覺系統,很快設計出新的作品。
4總 結
本文提出了視覺、觸覺相結合的方法,利用計算機視覺系統幫助設計人員觀察、感知設計對象,并把結果以數字形式保存起來;觸覺系統直接利用已有的觀察結果,通過手眼協調完成最終設計。這種混合系統彌補了非專業人員所缺乏的空間形體洞察力及操縱力,使他們不用經過長期的專業訓練,也可快速地設計出新的作品。本文給出的實例已驗證了這一觀點。
本文揭示了虛擬雕刻過程所忽略的視覺思維環節,并設計出計算機視覺系統來加以彌補,取得了良好的結果,這套視、觸覺結合的設計系統可用于陶瓷產品的設計制造,可大幅度提高設計效率和設計質量。
參考文獻
1 Potemesil M.Generating octree model of 3D objects from their silhouetttes in a sequence of
images[J].Computer Vision&Graphics Image Processing,1987,40(1):1~29
2 K.Kutulakos and S.Seitz. A theory of shape by space carving[J]. International Journal of Computer
Vision,2000, 38(3):199~218
篇6
關鍵詞關鍵詞:OpenCV;人臉檢測;微笑檢測;JNI
DOIDOI:10.11907/rjdk.162330
中圖分類號:TP319文獻標識碼:A文章編號文章編號:16727800(2017)001011502
隨著人工智能技術的發展,機器學習、計算機視覺等領域也逐漸成為計算機科學中的熱點問題,人臉檢測便是計算機視覺中的一個分支。OpenCV作為一個開源的視覺庫,提供了不少關于人臉檢測的模型與處理接口,而大部分接口與算法均采用C/C++語言編寫。Java雖有其跨平臺的巨大優勢,但是這種特性也給Java帶來了局限性,在調用動態數據庫文件時存在不便。因此,通過JNI工具,可以利用C/C++語言的特性彌補Java的不足[13]。
1相關技術原理
1.1JNI技術分析
JNI(Java Native Interface)提供了若干API 實現Java與其它語言的通信(主要是C/C++)。從Java 1.1開始,JNI標準成為Java平臺的一部分,它允許Java和其它語言編寫的代碼進行交互。然而使用Java與本地已編譯的代碼交互,通常會喪失平臺可移植性[45]。
通常遇到以下幾種情況需要使用JNI:①所開發的程序需要用到其它平臺屬性,但在Java的標準庫中不支持此屬性;②程序對于運行效率要求較高,因此希望能用較低級的語言(如C/C++)來實現;③Java已經擁有實現需要的程序和庫,希望C/C++對其直接進行調用[67]。
1.2JNI技術架構
JNI允許運行在Java虛擬機上的應用程序調用其它語言(如C/C++語言)來編寫需要的方法或類庫,也能將Java虛擬機嵌入到本地應用程序中。
圖1是JNI在本地應用程序與Java應用之間各自扮演的角色圖。從圖中可以看出,JNI作為Java與C/C++函悼庵間的橋梁,可以實現Java代碼與C/C++庫函數當中本地代碼之間的交互。然而JNI沒有改變Java語言的屬性,只是讓Java語言擁有一種能夠對外調用的形式[89]。
1.3OpenCV介紹
OpenCV(Open Source Computer Vision Library)是一個基于BSD許可發行的跨平臺計算機視覺庫。它輕量而且高效,由C函數與C++類構成,同時提供了Python、Java等語言的接口,可實現圖像處理和計算機視覺方面的很多通用算法。OpenCV中對于人臉的檢測方法是基于處理成的灰度圖像的弱特征檢測方法。該方法建立在Haar特征[10]檢測方法基礎上,可以獲得檢測人臉的實時處理速度。
OpenCV中也提供了訓練分類器[1112]的程序及方法來檢測特征。使用者可以將此方法應用于一些項目中的二次開發,比如雙目視覺的三維重構、物體識別,協助機器人完成復雜任務,以及在智能監控中的人臉檢測、智能交通中的行人檢測等。
2開發工具選擇
選用的工具是eclipse,Java版本為JDK1.7,C++使用的是VS2010。另外PC端需要具備內置或外置攝像頭,PC機配置為Inter Core i5-3230M CPU 2.6GHz。
3實現過程
從圖2中編寫JNI代碼的大致步驟可以看出Java需要將字節碼文件通過javah生成頭文件,再與C代碼共同生成動態鏈接庫,進而與Java中的代碼進行交互。
3.4人臉檢測實驗結果
篇7
關鍵詞:印制電路板;圖像處理;機器視覺;PCB裸板;自動光學檢測;缺陷檢測 文獻標識碼:A
中圖分類號:TP391 文章編號:1009-2374(2016)09-0010-05 DOI:10.13535/ki.11-4406/n.2016.09.005
我國是全球第一大PCB生產基地,作為電子產品承載體的電路板,其集成度和產量不斷在提高。為了保證電子產品的性能,電路板缺陷檢測技術已經成為電子行業中非常關鍵的技術。建立在圖像處理算法基礎上的機器視覺檢測技術與傳統的人工檢測技術相比,提高了缺陷檢測的效率和準確度。因此,設計一種高效精準的機器視覺檢測電路板缺陷的系統,具有非常重要的現實意義。評估印刷電路板質量的一個重要因素就是表觀檢測,PCB的表觀質量對產品性能及成品使用安全有著極大的重要性。而伴隨著近年來在工業生產領域崛起的計算機視覺,當前表觀缺陷檢測和分類識別的研究方向已經轉向了利用計算機視覺技術來實現。計算機圖像處理識別技術這種基于計算機視覺的檢測技術成功取代了傳統的PCB缺陷檢測方法,在自動光學檢測系統眾多應用中占據了相對重要的地位,一躍成為PCB生產業表觀缺陷的主要檢測方法。
圖1 系統框圖
因此本文通過設計AOI自動光學檢測系統,搭建較為簡單的PCB缺陷自動檢測系統的實驗平臺,對PCB中四類較為關鍵、常見的缺陷進行檢測、分析、識別、判定,為研究推廣PCB缺陷自動檢測系統開拓應用前景,如能實現工業上的產業化檢測,將有高額的經濟收益。本文側重對PCB中的四類較為關鍵、常見的缺陷進行檢測、分析、識別、判定,并且僅搭建了較為簡單的PCB缺陷自動檢測系統的實驗平臺,即通過復雜算法對采集到的圖像進行處理、配準、對比,從而得出PCB缺陷類型及對其進行標識。如圖1所示。
1 硬件設計方案
PCB缺陷檢測的總體系統設計方案主要是基于自動光學檢測技術來搭建PCB缺陷檢測系統,硬件設計是使用CNC-T程控光源高精度影像測試系統操作臺,對待測電路板進行圖像采集,再通過VS2010軟件所編寫程序處理,得出待測電路板的缺陷種類。整個系統主要分為運動控制、光源、圖像采集、圖像處理四個模塊,分模塊簡要闡述了實驗過程、所需設備以及軟件算法,搭建了一個相對完整的系統工作平臺。
圖2 CNC-T程控光源影像操作臺
該設備具有測量元素種類齊全、手動測量、自動對焦等多種功能,使用該設備采集圖像進行二維檢測,測量軟體為YR-CNC,將圖像儲存至電腦后便由VS軟件進行圖像處理。實驗組成如圖3所示:
圖3 實驗系統框圖
1.1 運動控制模塊
本系統運動流程為:被檢測的PCB在檢測臺上,通過步進電機XY軸運動到攝像機拍攝區域,CCD攝像機固定在工作臺上方(Z軸),通過Z軸的運動實現聚焦。如圖4所示:
圖4 平臺運動示意圖
設備工作臺臺面尺寸為746mm×506mm,承載玻璃面尺寸為452mm×354mm,有效測量行程為400×300×200。本裝置既可通過軟件驅動自動采集圖像,也可以通過手動控制,移動并聚焦采集待測PCB的圖像。
1.2 光源模塊
輔助光照――采用的是正向和背向光源這兩種輔助光照。其中正光源和攝像頭同側,均位于Z軸上,正光源主要用于檢測待測物體的表面特征。背光源位于檢測臺面下方,與正光源處于同軸反向關系,背光源能突出待測物體的輪廓特征,常用于檢測物體輪廓尺寸。
圖像采集:分別利用正光源突出PCB表面如走線、過孔和焊盤等主要特征,而下光源主要使PCB的輪廓尺寸和過孔產生強烈的輪廓對比。
光源:使用的是高度集中照明光源中心的LDR系列,由于該光源的傘狀結構緊密排列著LED且采用了CCS獨創的柔性板,使之成為LED照明系統的標準模式。照明系統如圖5所示:
圖5 照明系統
1.3 圖像采集模塊
圖像采集模塊是由圖像采集卡、相機和鏡頭組成的,該模塊是圖像配準階段的硬件基礎。計算機采集圖像的媒介就是相機,而相機按照不同原理又分為多種,常見的有CCD(Charge Coupled Device)和CMOS(Complementary Metal Oxide Semiconductor)兩類。本系統采用的是CCD 1/2英寸43萬像素彩色攝像頭和高清晰度0.7~4.5X變焦倍率鏡頭,顯示分辨率為0.001mm。
1.4 圖像處理模塊
通常獲得的圖像將受到工業現場環境、光照等條件的干擾,計算機所獲得的圖像質量多數參差不齊,圖像的清晰度不一致,大大增加了PCB缺陷檢測的難度,所以在利用復雜算法檢測、識別PCB缺陷前要先對圖像進行預處理。
本圖像處理模塊主要通過VS軟件在OpenCV計算機視覺庫的基礎上,通過一系列算法對圖像進行處理對比。
2 系統軟件設計
2.1 OpenCV
OpenCV(Open Source Computer Vision Library)是一個跨平臺的可以運行在Linux、Windows和Mac OS操作系統上的基于(開源)發行的計算機視覺庫。它重量輕而高效,開放了多種接口如MATLAB、Ruby和Python等,并且在計算機視覺和圖像處理中大多數通用的算法都是被允許的。OpenCV可用于開發實時圖像處理、計算機視覺和模式識別方案,它提供了多種函數,實現了大量的計算機視覺算法,算法涵蓋了從最基礎的濾波至以高級的物體檢測。OpenCV實際上是一堆C和C++語言源代碼文件,許多常見的計算機視覺算法由這些源代碼文件實現。如C接口函數cvCanny()實現Canny邊緣檢測算法。它可直接加入到我們自己的軟件項目編程中,而無需去編寫自己的Canny算子代碼,就是沒有必要重復“造輪子”。
根據OpenCV中源代碼文件巨多的特點,以算法的功能為基準,將這些源文件分到多個模塊中,如core、imgproc、highgui等。將每個模塊中的源文件編譯成一個庫文件(如opencv_core.lib、opencv_imgproc.lib、opencv_highgui.lib等),用戶在使用時,僅需在自己的項目中添加要用的庫文件,與自己的源文件一起連接成可執行程序即可。
OpenCV計算機視覺庫的出現,是為了使人們利用方便快捷的計算機視覺框架,在計算機視覺領域可以更加輕松地設計出更為復雜的應用程序。OpenCV涵蓋了多種計算機視覺應用區域,如用戶界面、信息安全、醫學影像學、工廠產品檢驗、立體視覺、機器人和攝像機標定等,約有500多個函數。因為計算機視覺與機器學習是相輔相成的,所以OpenCV也開放了MLL(Machine Learning Library)機器學習庫。MLL除了在視覺任務相關中使用,也可以很容易地應用到其他機器學習中。
2.2 Microsoft Visual Studio2010
Visual Studio是微軟公司推出的開發環境,是同行業中目前最流行的Windows平臺應用程序開發環境。Visual Studio 2010于2010年4月12日,其集成開發環境(IDE)已被重新設計和組織,變得更簡單了。
Visual Studio 2010同時帶來了NET Framework 4.0、Microsoft Visual Studio 2010 CTP(Community Technology Preview――CTP),并且支持開發面向Windows 7的應用程序。除了Microsoft SQL Server外,它還支持IBM DB2和Oracle數據庫。目前有專業版、高級版、旗艦版、學習版和測試版五個版本。Visual Studio的用處十分廣泛,不僅可被用來基于Windows平臺創建Windows應用程序和Web應用程序,還可被用來創建智能設備、Office插件和Web服務等應用程序。微軟的Visual Studio 2010將成為一個版本的經典,這是相當于6.0版本。該版本可以自定義開始頁,新功能還包括:(1)C# 4.0中的動態類型和動態編程;(2)多顯示器支持;(3)使用Visual Studio 2010的特性支持TDD;(4)支持Office;(5)Quick Search特性;(6)C++ 0x新特性;(7)IDE增強;(8)使用Visual C++ 2010創建Ribbon界面;(9)新增基于.NET平臺的語言F#。本課題將基于OpenCV計算機視覺庫使用Microsoft Visual Studio2010開發環境,通過編輯算法實現PCB缺陷檢測。
3 圖像預處理
要使用計算機對圖像進行處理,所得到的連續圖像就必須被轉換為離散的數據集,這是因為計算機只能處理離散度數據,這一過程我們稱之為圖像采集。圖像采集由圖像采集系統實現,如圖6所示。圖像采集系統的三個主要模塊是成像系統、采樣系統和量化器。
圖6
將整理出的字符圖像交予識別模塊來識別,被稱為圖像的預處理。PCB的圖像預處理包括灰度化、增強、濾波、二值化、配準等,處理后的PCB輸出的圖像質量將得到改善,在很大程度上使得該圖像特征更直觀,方便計算機分析和處理。PCB的圖像預處理為整個PCB缺陷檢測系統的核心部件,很大程度上決定了檢測的準確性。圖像預處理流程如圖7所示:
圖7 圖像預處理流程圖
4 PCB缺陷檢測
本文針對四種常見缺陷:斷路、短路、毛刺(凸起)、缺損(凹陷)進行檢測研究。在這四種缺陷中,最為嚴重的缺陷類型是斷路和短路,它們將會使整塊板子失去本來的功能;而凸起、凹陷也可能影響到PCB在使用過程中的穩定性能。如圖8所示為幾種常見的缺陷:
圖8 常見電路板缺陷
4.1 PCB缺陷的檢測方法
常用的PCB缺陷檢測方法有參考法和非參考法兩種。要是從概念理解和電路難易程度看,參考法明顯更加具有概念直觀、電路簡單的優勢;要是從檢測所需要的條件來看,非參考法則在不需要待測PCB與標準PCB進行準確對準這一點上優于參考法。
本課題采用參考法進行PCB缺陷檢測。
使用參考法對PCB缺陷進行檢測的流程為:(1)確定標準的PCB圖像并放入參考庫;(2)通過成像設備采集待測PCB圖像,進行圖像預處理之后,再二值化PCB待測圖像,并對其進行連通域提取;(3)然后將處理結果與標準圖像進行對比,利用圖像相減來判斷PCB可能存在的缺陷;(4)進行分類,確定缺陷類型。
4.2 圖像連通域
像素是圖像中最小的單位,每個像素周圍有8個鄰接像素,常見的鄰接關系有兩種:4鄰接與8鄰接。4鄰接一共4個點,即上下左右。包括對角線位置的點,8鄰接的點一共有8個,如圖9所示:
圖9 領域示圖
如果像素點A與B鄰接,我們稱A與B連通,即有如下的結論:
如果A與B連通、B與C連通,則A與C連通。在視覺上看來,點與點相互連通,形成一個區域,而不是連通的點形成不同的區域。這種相互立體的所有的點,我們稱為連通區域。連通區域標記常用的方法有Two-Pass(兩遍掃描法)和Seed Filling(種子填充法)兩種方法,本課題主要介紹第二種。
Seed Filling來源于計算機圖形學,通常應用在填充圖形上。思路:以一個前景像素當作種子,而后在處于同一像素值且位置相鄰的連通區域,把和種子相鄰的前景像素融合到同一組像素中,結果將是獲得一個像素集,即連通區域。接下來介紹使用種子填充法實現的連通區域分析法:
第一,重復掃描圖像,當得到當前像素點B(x,y)=1時停止:(1)賦予B(x,y)一個label,并將像素位置作為種子,接著將所有位于該種子周圍的前景像素都壓入棧中;(2)將棧頂像素賦以相同的label值并彈出,接著將全部位于棧頂像素周邊的前景像素都壓入棧中;(3)重復(2)步驟,直到棧為空。此時,圖像B中的一個像素值被標記為label的連通區域便被找到了。
第二,在掃描結束前,重復第一個步驟,由此可以獲得圖像B中所有的連通區域在掃描結束后。
掃描所得的連通域如圖10所示:
圖10 圖像連通域提取
4.3 缺陷識別
缺陷識別具體特征如表1所示:
表1 缺陷特征
缺陷種類 二值圖像面積 連通區域數
斷路 減少 增加
短路 增加 減少
凸起 增加 不變
凹陷 減少 不變
第一,短路和斷路。在出現短路缺陷時,待測圖像與標準圖像相比,其所包含的連通區域數將會減少。同理可得,在出現斷路缺陷時,待測圖像與標準圖像相比,其所包含的連通區域數將會增多。因此,斷路和短路缺陷便可利用比較連通區域數來判定和識別。
第二,凸起和凹陷。凸起缺陷將導致導線和導線、導線和其他導體間的間隙變小,而凹陷缺陷將導致導線和導線、導線和其他導體間的間隙變大,二者均會導致PCB使用過程中出現不穩定狀態。而觀察可知,這兩種缺陷的連通區域相同,差別在于各自二值化面積的大小,所以可以通過計算該待測圖像的連通區域面積來識別凸起、凹陷缺陷。
識別過程:將經過圖像預處理的待測PCB圖像與標準圖像進行對比后,通過算法找出缺陷。比較二者的連通區域數,若前者大于后者,則標定該缺陷點為斷路,反之則為短路;若二者連通區域數相同,則比較二值化圖像面積,若前者大于后者,則標定該缺陷點為凸起,反之則為凹陷。檢測流程如圖11所示:
圖11 PCB缺陷檢測流程圖
5 系統實驗
本文使用CNC-T程控光源高精度影像測試系統操作臺,結合VS2010軟件基于OpenCV計算機視覺庫的算法編程來實現PCB的缺陷檢測。整體實驗過程為:手動控制操作臺捕捉、聚焦、采集待測PCB的圖像,采集到的圖像與標準圖像進行對比、識別,得出缺陷種類并顯示結果。
本課題一共就所研究缺陷類型,做了40組實驗,通過實驗結果計算正確率。如表2所示:
表2 實驗結果統計
缺陷類型 實驗次數 正確率
斷路 10 100%
短路 10 100%
凸起 10 100%
凹陷 10 100%
針對不同電路板圖中出現的同種斷路類型進行檢測,效果如圖12a、圖12b、圖12c所示,可準確檢測出缺陷存在。
圖12
針對不同電路板圖中出現的同種短路類型進行檢測,效果如圖13a、圖13b、圖13c所示,可準確檢測出缺陷存在。
圖13
針對不同電路板圖中出現的同種凸起類型進行檢測,效果如圖14a、圖14b、圖14c所示,可準確檢測出缺陷存在。
圖14
針對不同電路板圖中出現的同種凹陷類型進行檢測,效果如圖15a、圖15b、圖15c所示,可準確檢測出缺陷存在。
圖15
6 結語
PCB板面向體積越來越小、密度越來越高的方向發展。在檢測產品價格方面,國外AOI檢測產品價格普遍偏高,而由于經濟原因,在國內PCB板生產制造商多數仍采用人工目測等傳統檢測方法檢測。隨著經濟的發展,數字圖像處理研究的深入,自動光學檢測系統也開始頻繁活躍在人們視線中,但在PCB缺陷檢測方面的應用卻還有待完善。因此,本論文建立在深入掌握工控系統結構并從PCB板的質量標準、圖像特點、缺陷特征及檢測要求的分析基礎上,對以圖像處理為基礎的PCB缺陷檢測技術進行了深入研究。由于PCB缺陷自動檢測系統的研究涉及多個領域的知識,其研究過程十分耗時、繁瑣,由此,本論文僅僅對PCB缺陷檢測中較為常見的問題進行了較深入研究,并且僅搭建了較為簡單的PCB缺陷自動檢測系統的實驗平臺,對PCB中的四類較為關鍵、常見的缺陷進行檢測、分析、識別、判定。雖然還未實現真正實現工業上產業化檢測,但是在未來幾十年中,研究推廣的PCB缺陷自動檢測系統將有十分良好的應用前景,也將有高額的經濟收益。
參考文獻
[1] 陳勝勇,劉盛,等.基于OpenCV的計算機視覺技術實現[M].北京:科學出版社,2008.
[2] Gary Bradski,Adrian Kaebler,于仕琪,等.學習OpenCV[M].北京:清華大學出版社,2009.
[3] 周長發.精通Visual C++圖像處理編程(第3版)
[M].北京:電子工業出版社,2006.
[4] 黨振.中國大陸PCB產業的現狀與未來[J].印制電路信息,2006,32(1).
[5] 胡躍明,譚穎.自動光學檢測在中國的應用現狀和發展[J].微計算機信息,2006,(4).
[6] 李漢,何星,等.印刷電路板的自動光學檢測系統
[J].無損檢測,2004,26(6).
[7] 張利,高永英,等.PCB板檢測中的定位研究[J].中國圖像圖形學,1999,4(8).
[8] 姚立新,張武學,等.AOI系統在PCB中的應用[J].電子工業專用備,2004,(5).
[9] 范小濤,夏雨人.一種基于圖像處理的PCB檢測算法研究[J].計算機工程與應用,2004,(13).
[10] 傅莉.印制電路板的發展及前景[J].電腦與電信,2010,(5).
[11] 張明軒.基于視頻序列的人臉檢測與跟蹤算法研究[D].中北大學,2011.
[12] 張馳.基于機器視覺的智能控制與圖像識別問題研究[D].蘭州理工大學,2009.
[13] 謝飛.基于計算機視覺的自動光學檢測關鍵技術與應用研究[D].南京大學,2013.
[14] 張靜.PCB表觀缺陷的自動光學檢測理論與技術
[D].電子科技大學,2013.
[15] 俞瑋.AOI技術在PCB缺陷檢測中的應用研究[D].電子科技大學,2007.
篇8
摘要:研究基于計算機視覺的實時動態手勢識別技術,并利用OpenCV計算機視覺庫在VS2010平臺上設計一個基于該技術在多媒體教學中PPT演示控制方面的應用。首先,利用背景差分法進行手勢檢測,在背景更新的基礎上,通過背景差分圖和顏色直方圖的反投影圖來檢測運動手勢區域,可以達到較為滿意的實時運動手勢檢測效果;其次,采用基于顏色直方圖的粒子跟蹤算法進行手勢跟蹤,基本能滿足跟蹤的實時性;最后,在手勢識別階段,采用基于Hu不變矩的輪廓匹配算法,得到較好的手勢識別效果;使用六種手勢,來實現演示文稿中的控制應用。
關鍵詞:計算機視覺;背景差分;粒子跟蹤;手勢識別;Hu矩
中圖分類號:TP391.41文獻標識碼:A
1引言
隨著計算機軟硬件技術的發展,人機交互已經由過去的鼠標、鍵盤方式逐漸向更加靈活生動的語音、姿勢等新穎交互方式發展。由于基于視覺方式具有便捷和開銷低等優點,因此,利用計算機視覺技術來使計算機理解用戶的命令,從而做出控制動作,這一領域的研究得到越來越多的重視。其中,人的手勢作為日常生活中最為廣泛使用的一種交流方式;因此,國內外許多研究機構開始對手勢識別技術進行研究,并已經取得了一些階段性的成果。較早的有:Freeman和Roth等人提出的基于方向直方圖的手勢識別系統;國內的高文教授等人于1994年提出了一種靜態復雜背景手勢目標的捕獲與識別。經過二三十年的發展,
人們對運動目標檢測及跟蹤進行了大量深入的研究:美國MIT實驗室通過提取左右手質心的運動軌跡以及手勢形狀特征參數,結合語法規則識別40個美國手語,準確率達到97%;另外,Microsoft Korea的HyeonKyu Lee,采用HMM的閾值模型,識別9種動態手勢命令,平均識別率高達98.19%;國內的任海兵提出了基于DTW的手勢識別算法,該算法能準確識別12種手勢。
現在,基于視覺的手勢識別技術更多的是應用在娛樂、游戲方面,比如微軟前段時間推出的Xbox360游戲機體的體感外設Kinect及多款相配套的體感游戲,玩家可以通過手勢在游戲中進行操作和互動,使得人機互動娛樂進入了一個新紀元。與此同時,還沒有比較成熟的手勢識別技術應用在現代教學系統中。因此,本文的研究重點是基于視覺的實時手勢識別技術在多媒體教學演示控制中的應用。在基于視覺的手勢識別研究中,需要解決的問題主要有兩個:一是實時檢測運動手勢的信息,二是識別運動手勢的信息并做出響應。對運動手勢檢測,本文采用背景差分結合改進顏色直方圖特征的運動檢測方法[1];對運動手勢跟蹤,本文采用粒子濾波算法[2]結合改進顏色直方圖信息的方法;手勢識別階段,本文采用了基于Hu不變矩特征[3]的輪廓匹配算法[4];本文研究基于計算機視覺的手勢識別系統,實現了在播放控制中運用手勢進行開始、翻頁、退出等功能,極大的提高了課堂教學的靈活性。
2手勢檢測
實時視頻圖像中的運動手勢檢測所需要完成的任務是:能夠快且準的檢測出手勢在實時圖像中的主要位置,并且能將位置所在的特定區域作為后續跟蹤、識別的感興趣區域。手勢檢測算法的好壞,直接影響整個系統的跟蹤以及識別的效果。
目前,運動目標檢測[5]的算法比較常用的有三種方法:光流法、幀間差分法和背景差分法。本文考慮實現環境為固定攝像頭采集實時視頻圖像,背景基本不動,因此采用背景差分結合改進顏色直方圖信息的運動檢測方法。
2.1背景差分法
本文研究中,選取攝像頭啟動后的前10幀圖像的平均作為最初的背景圖像,把以后的實時序列圖像當前幀和背景圖像相減,進行背景消去??梢缘玫剑\動手勢區域的像素點的差分值比較大,背景區域的像素點的差分值比較小。另外,由于真實場景中的背景會因光線等外部條件產生微小的變化,長期的誤差積累會造成最后得不到理想的手勢區域,因此背景需要進行實時更新,從而能及時反映當前幀的背景圖像,背景更新[6]的公式如下:
背景更新操作以后,對當前幀進行背景差分,大于閾值th1的圖像點即為運動手勢區域的點,并將得到的運動手勢區域圖像進行二值化操作,公式如下:
3手勢跟蹤
現在常用的一些跟蹤算法主要有:卡爾曼預測算法、粒子濾波算法、均值偏移算法以及Camshift跟蹤算法等??紤]到卡爾曼預測算法和均值偏移算法等都是線性跟蹤算法,不能很好的應對目標運動的隨機性,本文采用了粒子濾波算法。
3.1粒子濾波算法原理
粒子濾波法是指通過用一組帶有權值的隨機樣本,以及基于這些樣本的估算來表示動態系統的后驗概率密度。當樣本很大的時候,這種估計就等同于后驗概率密度。這些樣本就稱為“粒子”。假設在t=0時刻每個粒子都有一個解,每個解與真實解都有一定的相似度,這個相似度可以表示為權重,隨著時間的增加,相似度越大的粒子權重越大,而相似度越小的粒子權重就越小,最后趨于0,從而找到真實解(如圖2)。
3.2基于改進顏色直方圖信息的粒子跟蹤
視頻圖像跟蹤方面,目標的運動模型主要表現為目標位置、速度隨時間改變的狀態轉移過程,目標的觀測模型主要表現為每幀圖像中運動目標的特征(如顏色、輪廓等)與真實目標的相似度的似然過程。在粒子濾波算法中,運動模型可以稱為粒子傳播或者粒子采樣,它是一種隨機過程[11]。粒子在經過傳播以后,狀態會發生改變,但權值沒有跟著改變,這就需要系統的觀測模型對當前粒子的狀態進行計算從而更新粒子的權值。本文的研究中,觀測值由目標區域的顏色直方圖決定。
基于顏色直方圖信息的粒子濾波就是將圖像顏色特征的相似度作為粒子濾波算法要求解的后驗概率,利用巴氏距離(Bhattacharyya)來計算相似度,得到粒子的權重。巴氏系數[12]如公式(9):
4.2識別算法過程
本文研究中,首先建立手勢模板庫,然后通過實時提取手勢幀,經過前面第2部分的結合改進顏色直方圖信息的手勢檢測,然后再經過形態學處理之后,得到效果良好手勢區域的二值圖,再用輪廓提取及跟蹤來得到手勢的輪廓圖,然后計算其7Hu矩特征,最后運用歐氏距離將其與模板庫中定義的手勢進行特征匹配,完成手勢識別。
輪廓提取就是要掏空內部的點:如果其八個相鄰的點都是黑色,則可以判定為內部點,然后刪除改點。
輪廓跟蹤方法:首先找出輪廓中最左下方的點作為搜索的起點,然后按照一定規則來搜索手勢輪廓上的其他像素點。由于輪廓是連續的,因此每個輪廓上的點的位置都可以用其前一個點的所張的角度來表示。研究中采用如下跟蹤準則,第一個點開始定義搜索方向為左上,如果左上方的點是黑點,則它也是輪廓上的點;如果不是,那么順時針旋轉,直到找到第一個黑點,即輪廓上的下一個點。繼續同樣的方法搜索,直到返回最初的起點,搜索結束。
下圖是輪廓跟蹤算法[15]的示意圖,搜索方向用箭頭表示。
5系統實現
本文的系統是在微軟的VS2010平臺上,使用C++語言進行軟件開發,在圖像處理相關方面是基于計算機視覺庫(OpenCV)進行研究的。程序界面如下圖:
左邊底層區的按鈕可以觀察實時手勢跟蹤和識別效果的功能(如圖4和圖7)。
手勢識別的結果可以定義成一個變量,不同
的識別結果對應的變量值不同,然后根據變量值調用不同的API接口函數,這樣就可以實現實時手勢識別技術在演示控制中的應用。本文研究在控制部分挑選了六種手勢,分別控制PPT播放中的開始、退出、上下翻頁、跳轉首末頁等功能。手勢命令定義如下:手勢4控制開始播放;手勢3控制退出播放;手勢1控制跳轉首頁;手勢2為跳轉尾頁;手勢10為向下翻頁頁;手勢5控制向前翻頁。對電腦中某一PPT進行實際的播放控制(列舉其中4個手勢的控制狀態),效果如下:
1)識別手勢4,開始播放:
2)識別手勢10,向下翻頁:
3)識別手勢1,跳轉到首頁:
4)識別手勢3,退出:
系統通過筆記本自帶30W像素的攝像頭,采用DirectShow技術進行實時視頻的獲取,圖像尺寸是320*240,fps可以達到30-60幀/秒,可以很好的滿足實時性的要求。
6結語
本文通過研究設計了一個基于視覺的手勢識別技術在演示控制中的應用系統,可以看出背景差分結合顏色直方圖的運動檢測可以得到較好的手勢區域效果;采用的基于顏色直方圖的粒子跟蹤也能基本實現實時跟蹤的任務;在識別過程中,基于Hu不變矩的輪廓匹配算法具有很好的魯棒性,可以得到較好手勢識別效果;在應用階段,使用手勢來完成控制命令,基本實現了在播放控制中的應用。
同時,仍存在一些問題:對于光照和人臉微小晃動等外部因素引起的噪聲,只能降低而無法消除,這對于手勢跟蹤與識別的效果還是有一定的影響,在應用時會產生一定的誤操作。這些問題仍需繼續研究,才能使得基于視覺的手勢識別技術得到更成熟的應用。
參考文獻
[1]吳曉陽.基于OpenCV的運動目標檢測與跟蹤[D].杭州:浙江大學,2008.
[2]CHO J U, JIN S H, PHAM X D. Object tracking circuit using particle filter with multiple features [C] / / SICE-ICASE: International Joint Conference. Las Vegas: IEEE, 2006: 1431-1436.
[3]甘志杰.基于Hu矩和支持向量機的靜態手勢識別及應用[D].青島:青島科技大學,2008.
[4]華斌,夏利娜.基于中值濾波和Hu矩向量的手語識別[J].計算機工程與設計,2011,32(2): 615- 618.
[5]伏思華,張小虎.基于序列圖像的運動目標實時檢測方法[J].光學術,2004,30(2): 215- 217.
[6]LINDEBERC T. Scale-space theory: a basic tool for analyzing structures at different scales [J]. Joumal of Applied Statistics. 1994, 21(2):224-270.
[7]于華平.視頻序列中的手勢檢測與跟蹤[D].南寧:廣西大學,2010.
[8]QIN WEN, PENG QICONG. An improved particle filter algorithm based on neural network for visual tracking [C] / / International Conference on Communications, Circuits and Systems. Las Vegas: IEEE, 2007:765-768.
[9]龔翔. 基于粒子濾波的視覺跟蹤算法研究[D]. 南京:南京理工大學,2009.
[10]YU JIAXIA, LIU WENJING, YANG Y. Improved particle filter algorithms based on partial systematic resambling [C]/ /IEEE International Conference on Intelligent Computing and Intelligent Systems. Las Vegas: IEEE, 2010: 483-487.
[11]朱志宇.粒子濾波算法及其應用[M].北京:北京科學出版社,2010.
[12]FAZLI S, POUR H M, BOUZARI H. Particle filter based object tracking with sift and color feature [C] / / Second International Conference on Machine Vision. Las Vegas: IEEE, 2009:89-93.
[13]侯一明,郭雷,倫向敏,等.運動背景下基于粒子濾波的目標跟蹤[J].計算機工程與應用,2007,43(8): 62- 64.
篇9
關鍵詞:果品;無損檢測;品質
我國水果產量居世界第一,果品出口成為我國外貿的重要組成部分。但是我國大多數農產品國際市場競爭力弱,出口價格低廉。其中品質因素是重要原因之一,這是由于檢測技術、評判標準等限制,所以對果品進行合適的品質檢測對提高經濟效益和市場競爭力具有重要意義。對農產品品質的無損檢測,已引起國內外廣泛關注。
所謂無損檢測,又稱非破壞檢測,是不破壞被檢對象卻能評價其品質的方法。它利用自身力學、光學、電學及聲學等物理性質對評價對象品質進行非破壞檢測,并按照一定標準進行分級分選的新興技術,廣泛應用于工業和農業。農業中的無損檢測技術是利用農產品的物理性質如光學性質、聲學性質、電磁學性質和熱學性質等的變化而實現。目前,無損檢測技術主要包括:近紅外技術、聲學檢測技術、軟X射線技術、計算機視覺技術、核磁共振檢測技術、力學特性檢測技術等。
1.果品無損檢測技術
1.1新型可見、近紅外光譜無損檢測技術
可見、近紅外光譜法是農產品內部成分無損檢測的有效方法,是利用農產品吸收、散射、反射和透射光的特性,進而確定內部成分的方法。近紅外分析技術作為一種高新分析技術,能改造我國傳統農業,提高農產品質量,尤其是農產品加工的質量控制,將產生巨大作用。為改造我國的傳統行業,企業迫切需要對原料進行質量監測、生產過程監控的設備和技術。國際經驗來看,近紅外技術是首選。
韓東海等[1]利用柑橘正常及損傷部位在紫外光源下的差異發射性,可有效確定柑橘損傷果。Slaugther DC[2]鑒于近紅外和可見光的分光光度技術,建立完好的桃及油桃內部品質的無損關系式,能夠預測完好無損的桃與油桃的山梨糖醇含量、蔗糖和可溶性固形物等。Lammertyn J[3]通過研究近紅外光譜和可見光譜對紅玉蘋果質量的無損測量,進而得到雙叉光纖記錄的反射光譜與蘋果參數之間的關系。Ali Moghimi[4]等用近紅外光譜技術結合化學計量學建立獼猴桃SSC和pH的校正模型,比較多元散射校正、變量標準化、中值濾波和一階導數光譜預處理對所建獼猴桃SSC和pH校正模型的影響,表明變量標準化結合中值濾波和一階倒數預處理光譜后,用PCR-PLS法建立的SSC和pH的校正模型精度較高。
目前,分光檢測技術在果蔬品質檢測中的應用廣泛,因為這種方法具有適應性強、高檢測靈敏度、人體無害性、靈活使用性、成本低廉和自動化易實現性等優勢。利用這種技術能自動分級果品,而合理的分級標準,便于果品深加工和遠銷售。近紅外光譜的研究雖起步較晚,但是其應用廣,特別是在農產品的品質檢測和分級領域取得較大的進展,開發應用前景廣闊。
1.2聲學無損檢測技術
聲學無損檢測技術是利用果品聲學特性與內部組織變化的關系,例如結構、成分、物理狀態等物化特性信息來檢測果品品質。聲學特性是指在聲波作用下農產品的反射、散射和吸收特性、衰減系數和傳播速度及其本身的聲阻抗與固有頻率等,它們均反映聲波與農產品相互作用的規律,這些特性隨農產品內部組織變化而變化。一般使用低能超聲波來檢測,因為低能超聲波在被檢測物中傳播不會引起物理或化學特性變化。超聲方法檢測果品品質始于近年,國內外研究集中針對水果成熟度、硬度和內部質量缺陷等無損檢測。
與光學、電學及其他無損檢測技術相比,聲學無損檢測技術具有適應性強、投資較低、操作簡便快捷等有死,特別適用于在線檢測,在農產品檢測領域應用前景良好[5]。
1.3軟X射線技術
適用性極強的X射線成像能夠與圖像識別、人工智能、現代通信技術等相聯系。若待檢測物體的密度和厚度不同,則不同的透射X射線量產生。鑒于分析穿透量,進而判斷果品內部品質。軟X射線擁有巨大優勢,特別是在農產品的內部品質檢測上,因軟X射線具有穿透物料的特性,所以檢測那種易損壞的農產品,能無損檢測內部的品質。所需X射線強度方面,農產品檢測弱于工業,所以稱為低能X射線或軟X射線。這種X射線成像技術來檢測農產品內部品質方法已經受到研究者關注,例如基于X射線成像技術的檢測核桃果核與果肉厚度,基于X射線圖像的評價牛肉嫩度,以及評價紅毛丹內部品質等。韓東海[6]用X射線來檢測柑橘皺皮果,結果表明射線與激光分析法在果實品質檢測中的可行性。然而目前國內此方面的技術開發較落后,期待學者們進一步的研究和探索。
1.4計算機視覺技術
伴隨專業化的圖像處理技術以及下降的計算機硬件成本和高速度特性,計算機視覺技術對農產品品質自動識別和分級的應用日益廣泛。計算機視覺技術即以各種成象系統代替視覺器官作為輸入敏感手段,借助于計算機替代大腦完成處理和解釋。計算機視覺的最終研究目標是使計算機可以像人一樣,通過視覺觀察來理解世界,具有自主適應環境的能力。
基于機器視覺的果品無損檢測的技術,一般是借助于CCD攝像頭獲取果品圖像,圖像信息輸入計算機,進而應用檢測方法和算法得到果品在大小、缺陷、外部損傷、內部品質等方面的特質值,從而來分級果品[7]。這種方法通常是由CCD攝像頭、配備圖像采集卡的計算機、光照系統和專用圖像處理軟件組成。在一定光源照射情況下,利用CCD攝像頭得到水果形狀、顏色、缺陷等視覺方面的圖像信息,憑借圖像采集卡轉換為數字信號傳輸到電腦,分隔圖像、提取特征值,從而得到特征值參數和水果顏色、質量狀況、破損程度等品質指標間模型關系,進而確定內外品質等級。這種方法快速、準確、無損,使用一次能同時檢測多項品質指標,方便設計自動分級流水線,自動識別水果外在品質(外形、缺陷、顏色、大小等)和內在品質(成熟度、堅實度、含糖量、含水率等),因此具有廣闊的應用前景[8]。
我國利用計算機視覺系統,檢測農產品品質和分類農產品的研究方法開展較晚,始于20世紀90年代,但逐漸受到重視。與國際先進水平相比,在農業領域的應用我國計算機視覺技術研究具有一定程度的差距,我國目前處于實驗研究以及理論探索階段,實用化和商品化的程度還未達到。這項項目基于數碼攝像技術,通過電腦直接處理圖像信息,其研發促使使我國獲得最快速、最便利的視覺技術。
1.5核磁共振檢測技術
1946年,核磁共振現象由美國科學家F.Bloch和E.M.Purcell發現,這一技術廣泛應用于研究物質結構。核磁共振可以便利地生成果實內部組織結構的高清圖像。方便檢測果品壓傷、蟲害以及成熟度,因此在檢測蘋果、香蕉糖度等方面潛在價值極高。而那些因采收成熟度而影響品質的品種,鑒于核磁共振技術,能提高收獲和運輸可靠性。現階段,這種技術要想真正應用于果品檢測和評價果品質量,還存在諸多問題,然而其優勢明顯,這種技術無疑是一種良好的果品無損檢測方法[9]。
1.6力學特性檢測技術
基于動力學原理測度農產品硬度的檢測方法是力學特性檢測技術。采用振動頻率分析法以及沖擊力檢測法,檢測果品堅實度來判斷果實成熟度。力學特性檢測技術方便判斷果品的采收期,依照成熟度分級、貯藏果品,確定果品的保鮮期和貯存期。盡管這種技術具有較為堅實的實踐應用基礎及歷史,但介于果品品質和物理參數間的復雜關系,實際應用是一個漫長的研究過程[10]。
篇10
【關鍵詞】計算機視覺;屏蔽罩;共面度
【Abstract】Computer vision is a branch of science that studies how to make the machine to "see" .Based on this, we developed a set of visual inspection equipment, and applied to the assembly line, to enable it to detect the mobile phone shielding cover coplanar degree and make it quickly and accurately.
【Key words】Computer vision;Shield;Coplanar degrees
0 前言
工業生產中流水線技術已經成熟,但是機器的工作效率并不能使產品的合格率完全得到保障。我們需要將檢測裝置添加到流水線系統中,實現產品合格與否的信息反饋。通過檢測產品合格與否,不合格的收回改進,來進一步提高生產過程中產品的合格率。而且一個簡單的檢測裝置可以替代大量人工勞動,整體上提高生產效率和利潤。
屏蔽罩(框)是手機的重要部件,傳統的屏蔽罩在沖壓成型和超聲清洗過程中會導致個別產品的四邊平面度不達標(需小于0.1mm),屏蔽罩平面度的不達標會影響下一工序的包裝和焊接。因此公司需要一大批工人進行平面度人工目測和人工半自動包裝,生產效率較低,檢測+包裝約650片/人?小時)。
本項目擬研制一個自動檢測設備,用機器視覺檢測代替人工檢測,每臺機器可以替換4-5人,生產效率提高5-7倍。
1 總體系統設計方案
1.1 檢測平臺的搭建
首先根據需要對相機,鏡頭進行選型,合理搭配,要求圖像抓取效果要好。其次合理利用光學原理,給目標合適角度合適光照強度,能給相機抓取最優圖像。最后通過驅動設置相機參數進一步對抓取的圖像質量進行微調。
1.2 圖像處理
將相機抓取的圖像傳送到計算機利用計算機高效運算速度進行處理。
第一步:圖像預處理。顏色空間的轉換,顏色分量通道提取,圖像銳化,圖像平滑,圖像增強等,都在預處理范圍。這一步主要目的是增強目標區域,降低噪聲,削弱背景。
第二步:圖像分割。顏色區域提取,閾值提取,邊緣提取等。這一步目的在于將我們的目標信息進行降維處理,減少運算量。
第三步:特征統計,模板匹配。
2 待測物承載平臺的搭建
整個平臺由Basler acA2500 14gm相機和外部供電電源,亞克力板搭建的平臺,偉郎可調節紅色環形光源和光源控制器組成。
Basler工業相機性能上遠超普通相機,可以達到工業測量的高精度要求;亞克力板表面能夠保證較高平滑,這對于共面的檢測而言至關重要;可調光源可以根據環境變化給平臺進行任意需求量的補光,對于長時間工作的工業測量必不可少。
平臺的搭建要方便相機采集我們所關心的目標的最為清晰的圖像。利用光的折射性質,我們就讓光源、目標物和相機成一定角度,剛好光源的光照射到目標物上,發生反射后的放射光剛好射入相機內。這個時候感光片能采集到最為理想的圖像,對于后面的程序中的圖像預處理也是相當方便的。光源的強度調節能夠在光源相機固定后,改變相機采集到的圖像的亮暗程度,從而對目標景物進行適當的突出與削弱。
3 數字圖像處理
3.1 數字圖像處理軟件
數字圖象處理軟件的總體設計決定整個可視化界面的視覺效果。軟件的功能必須能很方便快捷的完成測量與決策的任務。
軟件設計主要內容:可視化界面布局設計、圖像處理和決策菜單、處理軟件框架編寫、編寫、各個按鈕功能實現和菜單功能編輯等。
功能菜單中包含:圖像預處理、包含圖像銳化、圖像灰度化、圖像反色、圖像二值化、中值濾波、Sobel邊緣檢測、Prewitt邊緣檢測、Robert邊緣檢測、Kirsch邊緣檢測、Laplace邊緣檢測;R轉G、R轉B、G轉R、G轉B、B轉R、B轉G、RG交換、RB交換、BG交換,包含的顏色空間有CMY、HSI、HSV、YU、YIQ,這里提供各種顏色空間的雙向轉換。
3.2 設計計算和校核
3.2.1 手機屏蔽罩邊緣與校準面縫隙計算
K=C*N
式中:K:縫隙寬度(mm);N:縫隙寬度對應的像素個數;C:單位像素對應的實際尺寸(mm)
N=Imax-Imin
式中:N:縫隙對應的像素個數;Imax:縫隙最大處對應的縱坐標較大點的坐標值;
Imin :縫隙最大處對應的縱坐標較小點的坐標值。
3.2.2 攝像系統的尺寸比例的計算
攝像系統的尺寸比例包括光源和目標物的距離,鏡頭和目標物的距離,相機內感光片和鏡頭間的距離,標準目標物的實際尺寸。
因為我們這里的鏡頭和相機完全擰合時,焦距為3m左右,而實際中需要的焦距為15cm。為了調整焦距,只能將鏡頭往外擰出3mm才能達到要求。但是這個時候,鏡頭出現向下偏折。這個時候利用理論方法計算存在較大誤差。我們用合格產品作為測量校準如圖,合格品側面厚度為1.2mm。采集多次數據,得出單位像素實際對應的尺寸值,然后作為標準值測量,如圖1。
圖1 用合格產品進行尺寸校準
1)攝像頭與目標距離的計算
攝像頭和目標物的距離在光源和相機固定后用直尺便可以測出。我們的平工后,測的的實際距離是200mm。
2)攝像圖片尺寸與實際尺寸比例的計算
攝像圖片尺寸和實際尺寸的比例有兩種方法可以求得:
方法一:將一個已經經過校準后的知道具體尺寸的物體放在目標物的位置上,采集圖像并計算對應尺寸的像素個數,便可以知道單位像素個數代表著實際尺寸的大小。
計算公式如下: C=L/N 式中:C:單位像素個數代表的實際尺寸大小(mm);L:物體的實際尺寸(mm);N:在采集的圖像中,L對應的像素個數。
方法二:根據鏡頭的焦距,相機內感光片到鏡頭的距離和鏡頭到目標物的距離,然后根據光學原理進行演算,得出采集的圖像中一個像素對應的實際尺寸大小。
3.2.3 數字圖像處理算法的設計
數字圖像處理算法包括圖像預處理、圖像濾波、邊緣提取和最終決策。
1)圖像預處理算法的設計
(1)圖像銳化,效果如圖2
這里用目標像素點的灰度值與相鄰像素點進行差值運算,最后結果和0,255進行比較,不同結果進行不同操作。
(2)圖像反色,效果如圖3
圖2 圖像銳化
圖3 圖像反色
3.2.4 圖像濾波算法的設計
由于成像系統、傳輸介質和記錄設備等的不完善,數字圖像在其形成、傳輸記錄過程中往往會受到多種噪聲的污染。另外,在圖像處理的一些環節輸入的對象不理想時也會在結果圖像中引入噪聲。
它們常常表現為一些較強視覺效果的孤立象素點或者是象素塊。破壞圖像的正確性。通過圖像濾波能很好地保護圖像目標的形狀、大小及特定的幾何和拓撲結構特征。
本項目中使用的濾波手段有:中值濾波、圖像閾值二值化(效果如圖4)。
3.2.5 邊緣提取算法的設計
1、Sobel算子如下
W1=[-1,-2,-1;0,0,0;1,2,1];W2=[-1,0,1;-2,0,2;-1,0,1];
2、Robert算子如下
W1=[-1,0;0,1];W2=[0,-1;1,0];效果如圖5。
圖4 圖像閾值二值化
圖5 Sobel算子邊緣提取
代碼實現如下;
for (i = 1; i < Height-1; i ++)
{
for (j = 1; j < Width-1; j ++)
{
R=-ImageArray[2][i-1][j-1]-2*ImageArray[2][i-1][j]-ImageArray[2][i-1][j+1]+0*ImageArray[2][i][j-1]+0*ImageArray[2][i][j]+0*ImageArray[2][i][j+1]+ImageArray[2][i+1][j-1]+2*ImageArray[2][i+1][j]+ImageArray[2][i+1][j+1];
G=-ImageArray[1][i-1][j-1]-2*ImageArray[1][i-1][j]-ImageArray[1][i-1][j+1]+0*ImageArray[1][i][j-1]+0*ImageArray[1][i][j]+0*ImageArray[1][i][j+1]+ImageArray[1][i+1][j-1]+2*ImageArray[1][i+1][j]+ImageArray[1][i+1][j+1];
B=-ImageArray[0][i-1][j-1]-2*ImageArray[0][i-1][j]-ImageArray[0][i-1][j+1]+0*ImageArray[0][i][j-1]+0*ImageArray[0][i][j]+0*ImageArray[0][i][j+1]+ImageArray[0][i+1][j-1]+2*ImageArray[0][i+1][j]+ImageArray[0][i+1][j+1];
r=-ImageArray[2][i-1][j-1]+0*ImageArray[2][i-1][j]+ImageArray[2][i-1][j+1]-2*ImageArray[2][i][j-1]+0*ImageArray[2][i][j]+2*ImageArray[2][i][j+1]-ImageArray[2][i+1][j-1]+0*ImageArray[2][i+1][j]+ImageArray[2][i+1][j+1];
g=-ImageArray[1][i-1][j-1]+0*ImageArray[1][i-1][j]+ImageArray[1][i-1][j+1]-2*ImageArray[1][i][j-1]+0*ImageArray[1][i][j]+2*ImageArray[1][i][j+1]-ImageArray[1][i+1][j-1]+0*ImageArray[1][i+1][j]+ImageArray[1][i+1][j+1];
b=-ImageArray[0][i-1][j-1]+0*ImageArray[0][i-1][j]+ImageArray[0][i-1][j+1]-2*ImageArray[0][i][j-1]+0*ImageArray[0][i][j]+2*ImageArray[0][i][j+1]-ImageArray[0][i+1][j-1]+0*ImageArray[0][i+1][j]+ImageArray[0][i+1][j+1];
ImageArray1[2][i][j]=MIN(255,MAX(0,MAX(abs(R),abs(r))));
ImageArray1[1][i][j]=MIN(255,MAX(0,MAX(abs(G),abs(g))));
ImageArray1[0][i][j]=MIN(255,MAX(0,MAX(abs(B),abs(b))));
3.2.5 最終決策
通過一系列的計算之后,決策將對計算結果進行判斷,得出手機屏蔽罩是否合格的結論,并通過亮燈來顯示結果。
4 視覺檢測系統測試數據
通過選擇合格樣品進行多次測量(如圖6),我們就可以建立一個標準。樣品與相機距離保持一致,鏡頭保持焦距不變,這個時候合格樣品在檢測中的數值為164px,而樣品在合格情況下,這個像素值對應2.4mm。
因此,單位像素對應實際尺寸大小為2.4/164=0.0146341mm。
那么,不合格樣品1號(如圖7)的誤差為(191-164)*0.0146341=0.395mm,即不合格樣品1號,邊角不共面而且偏差為0.52/2=0.1975mm。
5 結束語
機器視覺用機器代替人眼來做測量和判斷,不僅提高了準確性還提高了效率,這在已經成為全球制造業的加工中心的國內市場,特別是高要求的零部件加工及其相應的先進生產線越來越有存在意義。本設備作為這方面的一個產品,能夠真真切切的為相關公司帶來顯著的經濟效益。
【參考文獻】
[1]徐貴力,毛罕平,胡永光.基于計算機視覺技術參考物法測量葉片面積[J].農業工程學報,2002,01:154-157+3.
[2]孔斌.人類視覺與計算機視覺的比較[J].自然雜志,2002,01:51-55.