123,123

基于SAD算法的立体匹配的实现

来源：微型机与应用2013年第6期

岳陈平, 孟丽娅

(重庆大学光电工程学院，重庆400030)

摘要： 利用FPGA并行性计算和合理的流水线设计完成了立体视觉中最核心的部分——立体匹配以及硬件结构，选取SAD区域立体匹配算法，利用补码来实现SAD算法，在算法流程中采用窗口并行和像素串行来完成。在获得视差图时，采用128×128图像对，窗口大小为3×3，视差为24，在系统时钟为50 MHz情况下，实现了每秒425帧的处理速度，最后给出了视差图。实验证明，选用FPGA来实现立体匹配系统的设计是可行的，具有一定的鲁棒性。

關(guān)鍵詞： FPGA 立体匹配区域匹配 SAD

Abstract：

Key words :

摘要: 利用FPGA并行性計(jì)算和合理的流水線設(shè)計(jì)完成了立體視覺中最核心的部分——立體匹配以及硬件結(jié)構(gòu)，選取SAD區(qū)域立體匹配算法，利用補(bǔ)碼來實(shí)現(xiàn)SAD算法，在算法流程中采用窗口并行和像素串行來完成。在獲得視差圖時(shí)，采用128×128圖像對(duì)，窗口大小為3×3，視差為24，在系統(tǒng)時(shí)鐘為50 MHz情況下，實(shí)現(xiàn)了每秒425幀的處理速度，最后給出了視差圖。實(shí)驗(yàn)證明，選用FPGA來實(shí)現(xiàn)立體匹配系統(tǒng)的設(shè)計(jì)是可行的，具有一定的魯棒性。
關(guān)鍵詞: 立體匹配；區(qū)域匹配；SAD；FPGA

    立體視覺理論的提出和美國MIT的Robert完成的三維景物分析工作把過去的二維圖像分析推廣到了三維景物[1]。利用立體視覺來恢復(fù)物體的三維立體信息可以應(yīng)用在工業(yè)自動(dòng)化生產(chǎn)線等檢測領(lǐng)域，如產(chǎn)品檢測、工業(yè)探傷、PCB印制板檢查以及各種危險(xiǎn)場合工作的機(jī)器人等。而一個(gè)完整的立體視覺系統(tǒng)的核心工作就是立體匹配。立體匹配算法需要處理大量復(fù)雜數(shù)據(jù)，采用PC來實(shí)現(xiàn)數(shù)據(jù)的快速處理不僅會(huì)占用CPU的大量時(shí)間，而且在功耗方面也難以承受。而利用現(xiàn)場可編程門陣列FPGA(Field Programmable Gate Array)等硬件的方法來進(jìn)行立體視覺的研究，有益于實(shí)現(xiàn)系統(tǒng)的實(shí)時(shí)性并降低功耗。本文采用FPGA，利用補(bǔ)碼實(shí)現(xiàn)SAD匹配算法，基于窗口并行和像素串行完成匹配算法的流程，這種算法流程不僅效果好、速度快，而且具有較強(qiáng)的魯棒性，很適合采用硬件方式來實(shí)現(xiàn)。
1 立體匹配算法
   立體匹配算法中基于區(qū)域匹配的算法其性能在很大程度上要依賴于相似性測度因子的選取，而最常用的測度因子有像素灰度差的絕對(duì)值和SAD(Sum of Absolute Differences)、像素灰度差的平方和SSD(Sum of Squared Differences)、歸一化相關(guān)方法NCC(Normalized Cross Correlation)[2]。SSD算法有平方運(yùn)算，NCC有除法和開方的運(yùn)算，而SAD只有加法運(yùn)算，從算法的復(fù)雜度和硬件實(shí)現(xiàn)的難易度來看，SSD和NCC將會(huì)占用FPGA大量的邏輯單元并且耗時(shí)量大。SAD算法表達(dá)式為[3]：

其中，disp為左攝像機(jī)拍攝的圖像上窗口在外極線上移動(dòng)的距離，即視差；PL(i，j)表示基準(zhǔn)圖中的待匹配像素的灰度值， PR(i，j)表示配準(zhǔn)圖中的匹配點(diǎn)的灰度值。計(jì)算不同視差情況下的SAD值，選取SAD的最小值，此時(shí)，PR為PL點(diǎn)在配準(zhǔn)圖中的最佳匹配點(diǎn)。

2 算法流程及硬件實(shí)現(xiàn)
2.1 算法流程
    為了能夠?qū)崿F(xiàn)快速實(shí)時(shí)的圖像處理，硬件結(jié)構(gòu)通常選擇并行操作來實(shí)現(xiàn)具有高效率和實(shí)時(shí)性的圖像處理算法。立體匹配算法有像素并行運(yùn)算(pixel-parallel)和窗口并行運(yùn)算(window-parallel)[2-3]兩種。在硬件資源的約束下，像素并行運(yùn)算方式只適用于窗口大小固定的立體匹配，窗口大小可變以及要考慮硬件資源的利用率時(shí)，像素并行運(yùn)算方法就不適用。因此，在一般的硬件實(shí)現(xiàn)立體匹配運(yùn)算中，為了獲得高效率的匹配值，這兩種并行結(jié)構(gòu)可適當(dāng)?shù)亟Y(jié)合使用或是有選擇地使用。當(dāng)把兩種并行結(jié)構(gòu)結(jié)合起來運(yùn)算時(shí)，可以分為像素并行和窗口串行PPWS(Pixel-Parallel and Window-Serial)以及像素串行和窗口并行PSWP(Pixel-Serial and Window-Parallel)[4-5]。綜合考慮，本文中采用了圖3所示的PSWP算法流程。圖3中共有n個(gè)匹配窗口，CWn表示第n個(gè)匹配窗口，Ri表示基準(zhǔn)圖中匹配窗口的像素值，表示配準(zhǔn)圖中第n個(gè)匹配窗口中的像素值，AD表示求取兩個(gè)像素值絕對(duì)值差，在每個(gè)窗口中采用像素值串行的運(yùn)算方式,并同時(shí)計(jì)算n個(gè)窗口的數(shù)據(jù)。

2.2 硬件實(shí)現(xiàn)
利用FPGA實(shí)現(xiàn)立體匹配算法。設(shè)計(jì)的關(guān)鍵在于，在片內(nèi)RAM帶寬和容量制約的前提下，充分利用FPGA并行性計(jì)算和合理的流水線設(shè)計(jì)來實(shí)現(xiàn)并行計(jì)算，并且能夠把算法直接映射到結(jié)構(gòu)上[6]。在FPGA上實(shí)現(xiàn)的具體流程如圖4所示。將采集到的圖像數(shù)據(jù)首先經(jīng)過圖像的中值濾波預(yù)處理，左圖像數(shù)據(jù)經(jīng)過緩存單元輸送至SAD計(jì)算單元，右圖數(shù)據(jù)輸送到由FIFO構(gòu)成的移位寄存器組，通過移位寄存器組后，在控制單元的作用下與左圖像緩存后的數(shù)據(jù)同時(shí)輸送到SAD計(jì)算單元，在SAD計(jì)算單元計(jì)算不同視差值情況下的SAD值，經(jīng)比較得出最小的SAD值，輸出最小SAD值所對(duì)應(yīng)的視差值。

采用Altera公司的Stratix系列EP2S15F672C3器件，利用Verilog HDL語言編寫了程序代碼，并且在QUARTUSII和Modelsim 6.0中進(jìn)行功能和時(shí)序仿真。本文以圖像大小128×128為例，窗口大小設(shè)置為3×3，視差為24，通過對(duì)算法的簡化，實(shí)現(xiàn)SAD算法。所需的資源如表1所示。圖5所示為最后的結(jié)果圖。表2為本算法與其他算法性能對(duì)比。

本文完成了一個(gè)基于FPGA實(shí)現(xiàn)立體匹配的算法過程，結(jié)合硬件結(jié)構(gòu)的存儲(chǔ)和資源的限制，在實(shí)現(xiàn)SAD算法過程中采用了并行計(jì)算和流水線結(jié)構(gòu)，并且在具體的運(yùn)算中選取了PSWP的運(yùn)算流程。本方案共消耗該系列FPGA 3 620個(gè)邏輯單元，約相當(dāng)于總數(shù)的29%；消耗FPGA內(nèi)部容量為263 424 bit，約為總?cè)萘康?3%。將本文方案與其他方案進(jìn)行比較，由于采用的匹配算法不同，獲得的視差圖也是不同的，因此直接比較每個(gè)方案占用的邏輯單元來判斷幀率的大小是不可取的，但是可得到這樣的結(jié)論：在簡化算法和合理地采用并行流水線結(jié)構(gòu)的條件下,選擇SAD算法運(yùn)用硬件方法來實(shí)現(xiàn)匹配比用軟件方法更勝一籌。因此，在搭建一個(gè)低功耗的立體視覺系統(tǒng)時(shí)，F(xiàn)PGA器件是最佳的選擇。
參考文獻(xiàn)
[1] STEGER C， ULRICH M， WIEDEMANN C.機(jī)器視覺算法與應(yīng)用[M].楊少榮,等譯.北京:清華大學(xué)出版社，2008.
[2] MARR D. 視覺計(jì)算理論[M]. 姚國正，劉磊，汪云久,譯.北京:科技出版社，1998.
[3] AMBROSCH K, HUMENBERGER M, KUBINGER W,et al. Hardware implementation of an SAD based stereo vision algorithm [C].Proceedings of the Conference on Computer Vision and Pattern Recognition Workshops,Minneapolis,2007:1-6.
[4] CHEN L, Jia Yunde. A parallel reconfigurable architecture for real-time stereo vision [C]. Proceedings of the International Conference on Embedded Software and Systems, 2009: 32-39.
[5] HARIYAMA M, KAMEYAMA M. VLSI Processor for Reliable stereo matching based on window-parallel logic-inmemory architecture[C]. Proceedings of the Symp on VLSI Circuits Digital of Technology Papers, 2004.
[6] HARIYAMA M, YOKOYAMA N, KAMEYAMA M, et al. FPGA implemetation of a stereo matching processor bas on window-parallel-and-pixel-parallel architecture[C].Proceedings of the IEEE Int.Midwest Symp. on Circ. And Syst, 2005.

原創(chuàng)聲明：此內(nèi)容為AET網(wǎng)站原創(chuàng)，未經(jīng)授權(quán)禁止轉(zhuǎn)載。

相關(guān)內(nèi)容