要談3D視覺應(yīng)用方案,就必須先弄清楚光學(xué)測量分類以及其原理。光學(xué)測量分為主動測距法和被動測距法。
主動測距方法的基本思想是利用特定的、人為控制光源和聲源對物體目標進行照射,根據(jù)物體表面的反射特性及光學(xué)、聲學(xué)特性來獲取目標的三維信息。其特點是具有較高的測距精度、抗干擾能力和實時性,具有代表性的主動測距方法有結(jié)構(gòu)光法、飛行時間法、和三角測距法。
1. 主動測距法
(1)結(jié)構(gòu)光法
根據(jù)投影光束形態(tài)的不同,結(jié)構(gòu)光法又可分為光點式結(jié)構(gòu)光法、光條式結(jié)構(gòu)光法和光面式結(jié)構(gòu)光法等。
目前應(yīng)用中較廣,且在深度測量中具有明顯優(yōu)勢的方法是面結(jié)構(gòu)光測量法。面結(jié)構(gòu)光測量將各種模式的面結(jié)構(gòu)投影到被測物體上,例如將分布較密集的均勻光柵投影到被測物體上面,由于被測物體表面凹凸不平,具有不同的深度,所以表面反射回來的光柵條紋會隨著表面不同的深度發(fā)生畸變,這個過程可以看作是由物體表面的深度信息對光柵的條紋進行調(diào)制。所以被測物體的表面信息也就被調(diào)制在反射回來的光柵之中。通過被測物體反射回來的光柵與參考光柵之間的幾何關(guān)系,分析得到每一個被測點之間的高度差和深度信息。
結(jié)構(gòu)光的優(yōu)點是計算簡單,測量精度較高,對于平坦的、無明顯紋理和形狀變化的表面區(qū)域都可進行精密的測量。其缺點是對設(shè)備和外界光線要求高,造價昂貴。目前,結(jié)構(gòu)光法主要應(yīng)用在條件良好的室內(nèi)。
(2)飛行時間法(ToF)
飛行時間(Time of Flight,簡稱ToF)法,又叫做激光雷達(LiDAR)測距法。它將脈沖激光信號投射到物體表面,反射信號沿幾乎相同路徑反向傳至接收器,利用發(fā)射和接收脈沖激光信號的時間差可實現(xiàn)被測量表面每個像素的距離測量。
飛行時間(ToF)深度測量法的原理示意圖
ToF直接利用光傳播特性,不需要進行灰度圖像的獲取與分析,因此距離的獲取不受物體表面性質(zhì)的影響,可快速準確地獲取景物表面完整的三維信息。缺點則是需要較復(fù)雜的光電設(shè)備,價格偏貴。
(3)三角測距法
三角測距法又稱主動三角法,是基于光學(xué)三角原理,根據(jù)光源、物體和檢測器三者之間的幾何成像關(guān)系來確定空間物體各點的三維坐標。在實際測量過程中,它常用激光作為光源,用CCD相機作為檢測器。這種方式主要用于工業(yè)勘探、工件表面粗糙度檢測、輪胎檢測、飛機檢測等工業(yè)、軍事領(lǐng)域,在消費電子類產(chǎn)品還不曾涉及。
基于激光三角法測量系統(tǒng)簡圖
2. 被動測距法
被動測距技術(shù)不需要人為地設(shè)置輻射源,只利用場景在自然光照下的二維圖像來重建景物的三維信息,具有適應(yīng)性強、實現(xiàn)手段靈活、造價低的優(yōu)點。但是這種方法是用低維信號來計算高維信號的,所以其使用的算法復(fù)雜。被動測距按照使用的視覺傳感器數(shù)量可分為單目視覺、雙目立體視覺和多目視覺三大類。
(1)單目視覺
單目視覺是指僅利用一臺照相機拍攝一張相片來進行測量。因僅需要一臺相機,所以該方法的優(yōu)點是結(jié)構(gòu)簡單、相機標定容易,同時還避免了立體視覺的小視場問題和匹配困難問題。
單目視覺測量示意圖
單目視覺方法又可分聚焦法和離焦法兩類。聚焦法是指首先使相機相對于被測點處于聚焦位置,然后根據(jù)透鏡成像公式求得被測點相對于相機的距離。相機偏離聚焦位置會帶來測量誤差,因此尋求精確的聚焦位置是關(guān)鍵所在。而離焦法不要求相機相對于被測點處于聚焦位置,而是根據(jù)標定出的離焦模型計算被測點相對于相機的距離,這樣就避免了由于尋求精確的聚焦位置而降低測量效率的問題,但離焦模型的準確標定是該方法的主要難點。
(2)雙目立體視覺
雙目立體視覺的基本原理是從兩個視點觀察同一景物,以獲取在不同視角下的感知圖像,然后通過三角測量原理計算圖像像素間的位置偏差(視差)來獲取景物的三維信息。這一過程與人類視覺感知過程是類似的。
雙目立體視覺測量示意圖
在雙目立體視覺系統(tǒng)的硬件結(jié)構(gòu)中,通常采用兩個攝像機作為視覺信號的采集設(shè)備,通過雙輸入通道圖像采集卡與計算機連接,把攝像機采集到的模擬信號經(jīng)過采樣、濾波、強化、模數(shù)轉(zhuǎn)換,向計算機提供圖像數(shù)據(jù)。一個完整的雙目立體視覺系統(tǒng)通常可分為數(shù)字圖像采集、相機標定、圖像預(yù)處理與特征提取、圖像校正、立體匹配、三維重建六大部分。
(3)多目立體視覺
多目立體視覺系統(tǒng)是對雙目視覺系統(tǒng)的一種拓展。所謂多目立體視覺系統(tǒng),就是采用多個攝像機設(shè)置于多個視點,或者由一個攝像機從多個視點觀測三維景物的視覺系統(tǒng)。
多目視覺測量示意圖
對多目系統(tǒng)所采集到的景物圖像進行感知、識別和理解的技術(shù)被稱為多目立體視覺系統(tǒng)技術(shù)。在雙目立體視覺中,對于給定的物體距離,視差與基線長度成正比,基線越長,對距離的計算越精確。但是當基線過長時,需要在相對較大的視覺范圍內(nèi)進行搜索,從而增加計算量。利用多基線立體匹配是消除誤匹配、提高視差測量準確性的有效方法之?;€數(shù)目的增加可以通過增加相機來實現(xiàn)。
來源:新機器視覺