《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 可编程逻辑 > 设计应用 > 基于FPGA的多源数据融合目标检测的研究与实现
基于FPGA的多源数据融合目标检测的研究与实现
电子技术应用
韩德强,闫钊,杨淇善
北京工业大学 计算机学院
摘要: 随着智能驾驶、机器人等技术的高速发展,在这些场景下常规的二维检测算法并不能满足环境感知的要求,需要三维目标检测去获得精准的环境信息。但是,目前大多主流的多源数据融合的三维目标检测模型都依赖于高算力、高功耗的平台,难以在性能较低的嵌入式平台实现。针对这些问题提出了一种在低功耗的FPGA平台上实现多源融合的三维目标检测的方法,通过融合激光雷达点云与摄像头图像数据,来弥补点云特征信息的不足,以实现更高的准确率和检测的稳定性。同时结合FPGA平台的特点,对融合的特征进行筛选及处理,并结合量化策略对模型进行压缩。经过实验,融合方式明显提升小物体的准确度,量化后的模型在三维检测平均精度损失小于3%的情况下在端侧FPGA平台成功运行。
中圖分類(lèi)號(hào):TP183 文獻(xiàn)標(biāo)志碼:A DOI: 10.16157/j.issn.0258-7998.256663
中文引用格式: 韓德強(qiáng),閆釗,楊淇善. 基于FPGA的多源數(shù)據(jù)融合目標(biāo)檢測(cè)的研究與實(shí)現(xiàn)[J]. 電子技術(shù)應(yīng)用,2025,51(11):17-24.
英文引用格式: Han Deqiang,Yan Zhao,Yang Qishan. Research and implementation of multi-source data fusion target detection based on FPGA[J]. Application of Electronic Technique,2025,51(11):17-24.
Research and implementation of multi-source data fusion target detection based on FPGA
Han Deqiang,Yan Zhao,Yang Qishan
School of Computer Science,Beijing University of Technology
Abstract: With the rapid development of technologies such as intelligent driving and robots, conventional 2D detection algorithms cannot meet the requirements of environmental perception in these scenarios, and 3D target detection is required to obtain accurate environmental information. However, the current mainstream 3D target detection models based on multi-source data fusion rely on high-computing and high-power platforms, and are difficult to implement on low-performance embedded platforms. In response to these problems, a method for implementing multi-source fusion 3D target detection on a low-power FPGA platform is proposed. By fusing the LiDAR point cloud and camera image data, the lack of point cloud feature information is compensated to achieve higher accuracy and detection stability. At the same time, combined with the characteristics of the FPGA platform, the fused features are screened and processed, and the model is compressed in combination with a quantization strategy. After experiments, the fusion method significantly improves the accuracy of small objects, and the quantized model runs successfully on the end-side FPGA platform with an average 3D accuracy loss of less than 3%.
Key words : LiDAR;3D object detection;FPGA;embedded;multi-sensor fusion

引言

隨著人工智能技術(shù)的突飛猛進(jìn),人工智能相關(guān)的應(yīng)用已經(jīng)和人們的生活息息相關(guān)。機(jī)器人以及自動(dòng)駕駛的相關(guān)應(yīng)用和研究也越來(lái)越頻繁地出現(xiàn)在公眾視角之內(nèi)。然而,隨著應(yīng)用場(chǎng)景日益復(fù)雜,人們需要更加優(yōu)秀的環(huán)境感知算法。環(huán)境感知算法不僅直接影響著機(jī)器人和自動(dòng)駕駛運(yùn)行的性能,更是在復(fù)雜環(huán)境下作出正確決策的基礎(chǔ)[1]。

感知算法的目的是從環(huán)境中獲得物體的位置、類(lèi)別和運(yùn)動(dòng)趨勢(shì)等信息。與傳統(tǒng)的二維感知算法相比,三維的環(huán)境感知算法能夠更加準(zhǔn)確地獲得真實(shí)環(huán)境的信息,滿足高精度檢測(cè)的需求[2]。同時(shí),隨著各類(lèi)算法的不斷成熟與硬件性能的快速發(fā)展,多種傳感器的協(xié)同工作已經(jīng)成為研究者提升感知系統(tǒng)整體性能的一種重要手段[3]?;跀z像頭的目標(biāo)檢測(cè)技術(shù)隨著深度學(xué)習(xí)技術(shù)的發(fā)展和應(yīng)用,在多數(shù)場(chǎng)景下取得了很理想的檢測(cè)效果[4]。然而,基于攝像頭的成像的原理,普通單目攝像頭缺少對(duì)三維空間中深度信息的精確感知,使用深度相機(jī)或者采用多目相機(jī)的方式可以獲得近距離精度較高的深度信息,但結(jié)果也會(huì)受到運(yùn)動(dòng)和距離等因素的影響;毫米波雷達(dá)雖然能直接獲取目標(biāo)的相對(duì)速度與距離,但是檢測(cè)范圍較小,無(wú)法覆蓋遠(yuǎn)距離的目標(biāo)[5]。相比之下,激光雷達(dá)可以通過(guò)主動(dòng)掃描獲得高精度的點(diǎn)云數(shù)據(jù),不僅能精確捕捉物體表面信息,相較于其他傳感器還具備較強(qiáng)的抗干擾能力和不同環(huán)境的適應(yīng)能力[6]。但是,點(diǎn)云數(shù)據(jù)存在無(wú)序性,不能在空間中均勻地分布[7],處理難度較高。同時(shí)由于激光雷達(dá)技術(shù)起步較晚,相關(guān)算法尚未完全成熟,其在目標(biāo)分類(lèi)等關(guān)鍵環(huán)節(jié)仍存在不足之處。

鑒于此,采用多源信息融合的策略,將激光雷達(dá)與攝像頭的數(shù)據(jù)有機(jī)結(jié)合,通過(guò)圖像檢測(cè)來(lái)補(bǔ)充點(diǎn)云數(shù)據(jù)中難以捕捉的細(xì)節(jié)信息,實(shí)現(xiàn)信息的互補(bǔ),是當(dāng)前三維目標(biāo)檢測(cè)最重要的研究方向[8]。


本文詳細(xì)內(nèi)容請(qǐng)下載:

http://ihrv.cn/resource/share/2000006835


作者信息:

韓德強(qiáng),閆釗,楊淇善

(北京工業(yè)大學(xué) 計(jì)算機(jī)學(xué)院,北京 100124)


subscribe.jpg

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。