人工智能化的機器視覺技術

           

我們常說,眼睛是人類心靈的窗戶,那麼給機器裝一雙眼睛,賦予它感知能力,使得它看懂世界,這便是計算機視覺作為人工智能最重要的環節之一。

機器視覺系統

機器視覺系統是指利用機器替代人眼做出各種測量和判斷。機器視覺是工程領域和科學領域中的一個非常重要的研究領域,它是一門涉及光學、機械、計算機、模式識别、圖像處理、人工智能、信号處理以及光電一體化等多個領域的綜合性學科,其功能以及應用範圍随着工業自動化的發展逐漸完善和推廣,其中母子圖像傳感器、CMOS和CCD攝像機、DSP、ARM嵌入式技術、圖像處理和模式識别等技術的快速發展,有力地推動了機器視覺的發展。

機器視覺是一種比較複雜的系統。因為大多數系統監控對象都是運動物體,系統與運動物體的匹配和協調動作尤為重要,所以給系統各部分的動作時間和處理速度帶來了嚴格的要求。在某些應用領域,例如機器人、飛行物體導制等,對整個系統或者系統的一部分的重量、體積和功耗都會有嚴格的要求。

機器視覺系統的構成和工作過程

一個完整的機器視覺系統包括:照明光源、光學鏡頭、 CCD 攝相機、圖像采集卡、圖像檢測軟件、監視器、通訊單元等。

工業機器視覺系統的工作過程主要如下:

1、當傳感器探測到被撿測物體接近運動至攝像機的拍攝中心,将觸發脈沖發送給圖像采集卡;

2、圖像采集卡根據已設定的程序和延時,将啟動脈沖分别發送給照明系統和攝像機;

3、一個啟動脈沖送給攝像機,攝像機結束當前的拍照,重新開始一副新的拍照,或者在啟動脈沖到來前攝像機處于等待狀态,檢測到啟動脈沖後啟動,在開始新的一副拍照前攝像機打開曝光構件(曝光時間事先設定好);另一個啟動脈沖送給光源,光源的打開時間需要與攝像機的曝光時間匹配;攝像機掃描和輸出一副圖像;

4、圖像采集卡接收信号并通過A/D轉換将模拟信号數字化,或者是直接接收攝像機數字化後的數字視頻數據;

5、圖像采集卡将數字圖像存儲在計算機的内存中;

6、計算機對圖像進行處理、分析和識别,獲得檢測結果;

7、處理結果控制流水線的動作、進行定位、糾正運動的誤差等。

(機器視覺系統的工作過程)

機器視覺相關技術

1、圖像采集技術——機器視覺的基礎

圖像采集部分一般由光源、鏡頭、數字攝像機和圖像采集卡構成。采集過程可簡單描述為在光源提供照明的條件下,數字攝像機拍攝目标物體并将其轉化為圖像信号,最後通過圖像采集卡傳輸給圖像處理部分。在設計圖像采集部分時,要考慮到多方面的問題,主要是關于數字攝像機、圖像采集卡和光源方面的問題。

(1)光源照明

照明是影響機器視覺系統輸入的重要因素,其直接影響輸入數據的質量和應用效果。到目前為止,還未有哪種機器視覺照明設備能通用各種應用,因此在實際應用中,需針對應用選擇相應的照明設備以滿足特定需求。 

照明系統按其照射方法可分為:背向照明、前向照明、結構光和頻閃光照明等。其中,背向照明是指将被測物放在光源和攝像機之間,以提高圖像的對比度。前向照明是光源和攝像機位于被測物的同側,其優點是便于安裝。結構光照明是将光栅或線光源等投射到被測物上,并根據其産生的畸變,解調出被測物的三維信息。頻閃光照明是将高頻率的光脈沖照射到物體上,攝像機拍攝要求與光源同。

(2)光學攝像頭

光學攝像頭的任務就是進行光學成像,一般在測量領域都又專門的用于測量的攝像鏡頭,因為其對成像質量有着關鍵性的作用。攝像頭需要注意的一個問題是畸變。這個就需要使用相應的畸變校正方法,目前也開發出了很多自動畸變自動校正系統。

(3)CCD 攝像機及圖像采集卡

CCD( Charge Coupled Device) 攝像機及圖像采集卡共同完成對目标圖像的采集與數字化。目前 CCD,CMOS等固體器件的應用技術,線陣圖型敏感器件,像元尺寸不斷減小,陣列像元數量不斷增加,像元電荷傳輸速率也得到大幅提高。在基于PC機的機器視覺系統中,圖像采集卡是控制攝像機拍照來完成圖像的采集與數字化,并協調整個系統的重要設備。

圖像采集卡直接決定了攝像頭的接口為:黑白、彩色、模拟、數字等形式。

2、圖像處理與分析——機器視覺的核心

用于機器視覺的圖像處理與分析方法的核心是,解決目标的檢測識别問題。當所需要識别的目标比較複雜時,就需要通過幾個環節,從不同的側面綜合來實現。

對目标進行識别提取的時候,首先是要考慮如何自動地将目标物從背景中分離出來。目标物提取的複雜性一般就在于目标物與非目标物的特征差異不是很大,在确定了目标提取方案後,就需要對目标特征進行增強。 

随着計算機技術、微電子技術以及大規模集成電路的發展,圖像信息處理工作越來越多地借助硬件完成,如 DSP 芯片、專用的圖像信号處理卡等。軟件部分主要用來完成算法中并不成熟又較複雜或需不斷完善改進的部分。這一方面提高了系統的實時性,同時又降低了系統的複雜度。

機器視覺技術遇到的問題

對于人類來說,識别和理解周圍場景是一件非常容易的事,但對于機器人來說,卻是一件很困難的事。主要困難有一下幾個方面:

(1)穩定性問題

現實中的環境因素是多變的,場景中的諸多因素,包括照明、物體形狀、表面顔色、攝像機以及空間關系變化都會對生成的圖像有影響。比如用于智能交通檢測的設備,如何保證其在惡劣天氣下依舊保持較高的穩定性就是一個很難解決的問題。

(2)構造出性能良好的識别算法

圖像處理與分析技術是機器視覺的核心,所以構造出一個良好的、适應相關領域應用的識别算法顯得尤為重要。而且現在的應用領域越來越要求檢測設備具有準确、高速地識别出目标的能力,如果我們不能構造出一個更好的識别算法,就不能适應不斷增長的需求。

(3)數據量大

機器視覺所獲取的數據量非常非常大的。比如用于手機上的人臉識别功能,識别一次要投射多大幾萬個紅外線點,這是一個龐大的數據。再比如交通檢測方面看,一天累積下來的數據量也是驚人的。所以如何處理如此大的信息量是個難題。不過随着硬件技術的發展,這個問題将來會逐步得到解決。

機器視覺發展曆史

機器視覺技術是計算機學科的一個重要分支,自起步發展至今,機器視覺已經有20多年的曆史,其功能以及應用範圍随着工業自動化的發展逐漸完善和推廣。

20世紀50年代開始研究二維圖像的統計模式識别。

60年代Roberts開始進行三維機器視覺的研究。

70年代中,MIT人工智能實驗室正式開設“機器視覺”的課程。

80年代開始,開始了全球性的研究熱潮,機器視覺獲得了蓬勃發展,新概念、新理論不斷湧現。

初級階段為1990~1998年,期間真正的機器視覺系統市場銷售額微乎其微。主要的國際機器視覺廠商還沒有進入中國市場。1990年以前,僅僅在大學和研究所中有一些研究圖像處理和模式識别的實驗室。在20世紀90年代初,一些來自這些研究機構的工程師成立了他們自己的視覺公司,開發了第一代圖像處理産品,人們能夠做一些基本的圖像處理和分析工作。盡管這些公司用視覺技術成功地解決了一些實際問題,例如多媒體處理,印刷品表面檢測,車牌識别等,但由于産品本身軟硬件方面的功能和可靠性還不夠好,限制了他們在工業應用中的發展潛力。另外,一個重要的因素是市場需求不大,工業界的很多工程師對機器視覺沒有概念,另外很多企業也沒有認識到質量控制的重要性。

第二階段1998~2002年定義為機器視覺概念引入期。自從1998年,越來越多的電子和半導體工廠,包括香港和台灣投資的工廠,落戶廣東和上海。帶有機器視覺的整套的生産線和高級設備被引入中國。随着這股潮流,一些廠商和制造商開始希望發展自己的視覺檢測設備,這是真正的機器視覺市場需求的開始。設備制造商或OEM廠商需要更多來自外部的技術開發支持和産品選型指導,一些自動化公司抓住了這個機遇,走了不同于上面提到的圖像公司的發展道路——做國際機器視覺供應商的代理商和系統集成商。他們從美國和日本引入最先進的成熟産品,給終端用戶提供專業培訓咨詢服務,有時也和他們的商業夥伴一起開發整套的視覺檢測設備。

經過長期市場開拓和培育,不僅僅是半導體和電子行業,而且在汽車、食品、飲料、包裝等行業中,一些頂級廠商開始認識到機器視覺對提升産品品質的重要作用。在此階段,許多著名視覺設備供應商,如:Cognex, Basler , Data TranslaTIon, TEO,SONY開始接觸中國市場尋求本地合作夥伴,但符合要求的本地合作夥伴寥若晨星。

第三階段從2002年至今,我們稱之為機器視覺發展期,從下面幾點我們可以看到中國機器視覺的快速增長趨勢:

1、在各個行業,越來越多的客戶開始尋求視覺檢測方案,機器視覺可以解決精确的測量問題和更好地提高他們的産品質量,一些客戶甚至建立了自己的視覺部門。

2、越來越多的本地公司開始在他們的業務中引入機器視覺,一些是普通工控産品代理商,一些是自動化系統集成商,一些是新的視覺公司。雖然他們絕大多數尚沒有充分的回報,但都一緻認為機器視覺市場潛力很大。資深視覺工程師和實際項目經驗的缺乏是他們面臨的最主要的問題。

3、一些有幾年實際經驗的公司逐漸給自己定位,以便更好的發展機器視覺業務。他們或者繼續提高采集卡、圖像軟件開發能力,或者試圖成為提供工業現場方案或視覺檢查設備的領袖廠商。單純的代理仍然是他們業務的一部分,但他們已經開始開發自己的技術或者訣竅,在元件和系統的層次上。

4、經過幾年尋找代理的過程,許多跨國公司開始在中國建立自己的分支機構。通常他們在北京、上海、廣東、深圳等建立自己在中國的分支機構,來管理關鍵的客戶以及向合作夥伴提供技術和商務支持。

機器視覺發展趨勢

機器視覺可以說是人工智能的最下層的基礎設施層, 在人工智能産業行業應用最主要幾個應用領域中,機器視覺的應用領域非常深、非常多,從整個産業鍊的全景圖來講,中國的人工智能産業處在快速的生态的構建期。

從整個機器視覺的領域來講,它是處在快速的重構期,通過市場分析來看,機器視覺并不是特别新興的領域,這從最早圖像處理衍生到現在,市場上有很多大的廠商對智能安防和交通做了很久的深耕,他們最開始不是做機器視覺、人臉識别起家的,在這幾個行業中很多廠商都處于并駕齊驅、快速發展階段。

賽迪顧問預測到2018年中國人工智能市場規模會超過406億,這個複合增長率會達到25.8%,增速是快于全球的整個增長率的。在市場結構上來講,也是存在着整體的情況。投資規模來講,在去年一年,從投資的整個額度包括投資筆數都呈快速增加的态勢,而且很多從事人工智能和機器視覺的企業數量也在快速地增加。

第一是現在巨頭做機器視覺,包括人工智能演進,他們都是呈開元化,這在中國來講比如華為,對他們來說開源的思路,到底開源怎麼用,有很多理念上跟國外還是有一定的差距,很多開源做完代碼自己封裝自己用了,其實從整個思路來講,國外開源理念上是更先進的。當然有其背後的原因,很多企業基本上在提交人工智能代碼上走着開源化部署道路。

最後就是在目前中國整個市場發展,包括政府的規劃中,智慧城市這個話題又重新火熱起來了,很多年前建設了很多,但是發展都不是特别順利,現在随着人工智能整個産業發展,這個動力和熱潮,主要原因就是技術實力能夠解決真正的剛需和真正的問題,在數據方面我們預測今年中國智慧城市建設數量超過500個,在整個智慧城市的産業定義上來講,機器視覺領域需求量特别大的,很多的包括智慧城市的定義就是說,什麼叫智慧城市,就是攝象頭數量多少個,這是一個很剛性的标準,對智能,包括具備人臉識别功能攝象頭需求量未來是非常大的。

機器視覺的應用

目前,最先進的機器視覺技術仍然由歐美、日本等國家掌握,發達國家針對工業現場的應用開發出了相應的機器視覺軟硬件産品。中國目前正處于由勞動密集型向技術密集型轉型的時期,對提高生成效率、降低人工成本的機器視覺方案有着旺盛的需求,中國正在成為機器視覺技術發展最為活躍的地區之一。長三角和珠三角成為國際電子和半導體技術的轉移地,同時也就成為了機器視覺技術的聚集地。許多具有國際先進水平的機器視覺系統進入了中國,國内的機器視覺企業也在與國際機器視覺企業的良性競争中不斷茁壯成長,許多大學和研究所都在緻力于機器視覺技術的研究。

在國外,機器視覺主要應用在半導體及電子行業,其中,半導體行業占 40% ~ 50%。例如,PCB 印刷電路、SMT表面貼裝、電子生産加工設備等。此外機器視覺還在質量檢測的各方面及其他領域均有着廣泛應用。

(1)在工業檢測方面

近幾十年來,在工業檢測中利用視覺系統的非接觸、速度快、精度合适、現場抗幹擾能力強等突出的優點,使機器視覺技術得到了廣泛的應用,取得了巨大的經濟與社會效益。

自動視覺識别檢測目前已經用于産品外形和表面缺陷檢驗,如木材加工檢測、金屬表面視覺檢測、二極管基片檢查、印刷電路闆缺陷檢查、焊縫缺陷自動識别等。這些檢測識别系統屬于二維機器視覺,技術已經較為成熟,其基本流程是用一個攝像機獲取圖像,對所獲取的圖像進行處理及模式識别,檢測出所需的内容。

(2)在醫學上的應用

在醫學領域,機器視覺主要用于醫學輔助診斷。首先采集核磁共振、超聲波、激光、X射線、γ射線等對人體檢查記錄的圖像,再利用數字圖像處理技術、信息融合技術對這些醫學圖像進行分析、描述和識别,最後得出相關信息,對輔助醫生診斷人體病源大小、形狀和異常,并進行有效治療發揮了重要的作用。不同醫學影像設備得到的是不同特性的生物組織圖像,如X射線反映的是骨骼組織,核磁共振影像反映的是有機組織圖像,而醫生往往需要考慮骨骼有機組織的關系,因而需要利用數字圖像處理技術将兩種圖像适當地疊加起來,以便于醫學分析。

(3)交通監控領域中的應用

智能交通監控領域中,在重要的十字路口安放攝像頭,就可以利用攝像頭的快速拍照功能,實現對違章、逆行等車牌的車牌進行自動識别、存貯,以便相關的工作人員進行查看。

(4)在橋梁檢測領域中的應用

人工檢測法和橋檢車法都是依靠人工用肉眼對橋梁表面進行檢測,其速度慢,效率低,漏檢率高,實時性差,影響交通,存在安全隐患,很難大幅應用;無損檢測包括激光檢測、超聲波檢測以及聲發射檢測等多種檢測技術,它們儀器昂貴,測量範圍小,不能滿足日益發展的橋梁檢測要求;智能化檢測有基于導電性材料的混凝土裂縫分布式自動檢測系統和智能混凝土技術,也有最前沿的基于機器視覺的檢測方法。導電性材料技術雖然使用方便,設備簡單,成本低廉,但是均需要事先在混凝土結構上塗刷或者埋設導電性材料進行檢測,而且智能混凝土技術還無法确定裂縫位置、裂縫寬度等一系列問題距實用化還有較長的距離;而基于機器視覺的檢測方法是利用CCD相機獲取橋梁表觀圖片,然後運用計算機處理後自動識别出裂縫圖像,并從背景中分離出來然後進行裂縫參數的計算的方法,它具有便捷、直觀、精确、非接觸、再現性好、适應性強、靈活性高、成本低廉的優點,能解放勞動力,排除人為幹擾,具有很好的應用前景。

據統計,混凝土橋梁的損壞有90%以上都是由裂縫引起的,因此對橋梁的健康檢測主要是對橋梁表觀的裂縫進行檢測與測量。基于機器視覺的橋梁檢測技術主要包括三部分内容:橋梁表觀圖像的獲取技術、基于圖像的裂縫自動識别理論與算法以及基于圖像的裂縫寬度等病害程度定量化測量方法。

基于機器視覺的自動化、智能化檢測技術已經在道路、隧道上得到了成功應用,在橋梁上也得到了初步的應用,但主要集中在視線開闊的高空混凝土構件表觀圖像獲取技術上,在病害的自動識别方面仍停留在理論研究階段,還無法應用于實際工程當中。

針對量大面廣的混凝土梁體,智能化視頻橋梁檢測車進入理論與關鍵部件模型的研制階段,但是受到橋梁細小裂縫自動識别與清晰圖像快速化獲取難度大的限制,目前離達到實用化程度的要求還相距甚遠。

機器視覺的誕生和應用,大幅解放了人類勞動力,同時提高了生産自動化水平,裝備的使用效率、可靠性及穩定性等。随着新技術、新理論在機器視覺系統中的應用,機器視覺将在國民經濟的各領域申發揮更大作用,其應用前景廣闊,并為社會的發展帶來了新的技術革命。

來源:傳遙感技術(版權歸原作者及刊載媒體所有)