《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 人工智能 > 设计应用 > Lite-VAFNet:面向无人机边缘计算的多模态3D目标检测
Lite-VAFNet:面向无人机边缘计算的多模态3D目标检测
电子技术应用
李家鑫1,王韵涵1,2,潘果1,张熙雨1
1.华北计算机系统工程研究所;2.山东大学 网络空间安全学院
摘要: 针对无人机边缘算力受限与多模态3D检测高精度需求间的矛盾,基于VAF-Net提出一种面向机载平台的轻量化检测网络Lite-VAFNet。该网络首先通过构建网格降维检测头压缩约63%的参数量,以缓解设备存储压力;其次,设计Linear-Bottleneck融合模块实现线性复杂度的特征交互,消除显存峰值瓶颈;最后,引入空间重采样与Logit蒸馏协同加速框架,在突破访存限制的同时有效补偿量化带来的精度损失。KITTI基准实验表明,Lite-VAFNet仅以14.60 M的参数量即取得85.24%的3D AP(Mod.),性能显著优于BEVFusion等前沿模型。该研究在大幅降低资源消耗的同时实现了精度与效率的最佳平衡,极具边缘端部署潜力。
中圖分類號:TP391.41 文獻(xiàn)標(biāo)志碼:A DOI: 10.16157/j.issn.0258-7998.267951
中文引用格式: 李家鑫,王韻涵,潘果,等. Lite-VAFNet:面向無人機(jī)邊緣計算的多模態(tài)3D目標(biāo)檢測[J]. 電子技術(shù)應(yīng)用,2026,52(4):10-17.
英文引用格式: Li Jiaxin,Wang Yunhan,Pan Guo,et al. Lite-VAFNet: efficient multi-modal 3D object detection for UAV edge computing[J]. Application of Electronic Technique,2026,52(4):10-17.
Lite-VAFNet: efficient multi-modal 3D object detection for UAV edge computing
Li Jiaxin1,Wang Yunhan1,2,Pan Guo1,Zhang Xiyu1
1.National Computer System Enginering Research Institute of China;2.School of Cyber Science and Technology,Shandong University
Abstract: To address the conflict between the limited edge computing capacity of Unmanned Aerial Vehicles (UAVs) and the demand for high-precision multi-modal 3D detection, this paper proposes a lightweight detection network tailored for airborne platforms, termed Lite-VAFNet, building upon VAF-Net. A grid dimensionality-reduction detection head is constructed to compress the parameter volume by approximately 63%, thereby alleviating device storage constraints. A Linear-Bottleneck fusion module is designed to execute feature interaction with linear complexity, effectively eliminating the peak memory bottleneck. Furthermore, a collaborative acceleration framework integrating spatial resampling and logit distillation is introduced to overcome memory access limitations while compensating for the accuracy degradation induced by quantization. Experiments on the KITTI benchmark demonstrate that Lite-VAFNet achieves a 3D AP (Mod.) of 85.24% with merely 14.60 M parameters, significantly outperforming state-of-the-art models such as BEVFusion. This research strikes an optimal balance between accuracy and efficiency while substantially reducing resource consumption, exhibiting exceptional potential for edge deployment.
Key words : drone perception;multimodal 3D object detection;model lightweighting;knowledge distillation;edge computing

引言

隨著無人機(jī)在低空經(jīng)濟(jì)中的廣泛部署,融合LiDAR幾何精確性與Camera語義豐富性的多模態(tài)感知技術(shù)已成為克服單一傳感器環(huán)境適應(yīng)性差、實(shí)現(xiàn)全天候魯棒感知的關(guān)鍵范式[1-3]。在此背景下,以VAF-Net[4]為代表的高性能融合模型,憑借其深度特征交互機(jī)制顯著提升了檢測精度,確立了當(dāng)前無人機(jī)三維目標(biāo)檢測的性能基準(zhǔn)[5]。

盡管多模態(tài)融合模型在服務(wù)器端表現(xiàn)卓越,但遷移至NVIDIA Jetson等機(jī)載平臺時面臨嚴(yán)峻的資源失配挑戰(zhàn)。邊緣模組通常受限于15 W~60 W功耗,F(xiàn)P32算力不足桌面級1/10,且共享內(nèi)存帶寬低于200 GB/s[6-7]。實(shí)測表明,SOTA模型VAF-Net[4]參數(shù)量高達(dá)39.99 M,單幀延遲超300 ms,具體痛點(diǎn)如下。

(1)存儲資源與限制:VAF-Net近40 M的參數(shù)規(guī)模嚴(yán)重擠占機(jī)載存儲資源。在依賴低帶寬通信的場景下,其龐大的權(quán)重文件顯著增加了傳輸時延,制約了空中下載(Over-the-Air, OTA)的遠(yuǎn)程更新效率[8]。

(2)顯存容量與計算瓶頸:邊緣端顯存帶寬有限,標(biāo)準(zhǔn)Transformer融合模塊的復(fù)雜度極易引發(fā)顯存溢出[9]。同時,稀疏卷積網(wǎng)絡(luò)在嵌入式GPU上受限于訪存帶寬,導(dǎo)致常規(guī)通道剪枝陷入減參不提速的效率悖論[10-12]。

針對上述挑戰(zhàn),本文提出了一種面向邊緣計算環(huán)境的輕量化多模態(tài) 3D 檢測網(wǎng)絡(luò)——Lite-VAFNet。本文致力于在極低的計算預(yù)算下實(shí)現(xiàn)檢測精度與推理速度的最佳平衡,主要貢獻(xiàn)如下。

(1)提出基于網(wǎng)格降維的參數(shù)解耦設(shè)計。對檢測頭(ROI Head)的參數(shù)冗余,提出網(wǎng)格降維策略。該策略通過解耦特征粒度與全連接層維度,在物理層引入低通濾波抑制高頻噪聲,成功將模型參數(shù)量壓縮約63%,顯著降低了邊緣端的存儲開銷與OTA更新成本。設(shè)計面向資源受限的Linear-Bottleneck融合模塊。

(2)針對標(biāo)準(zhǔn)Transformer的顯存瓶頸,提出線性瓶頸注意力機(jī)制。通過通道壓縮與核函數(shù)近似,將計算復(fù)雜度由二次方降低至線性,在保持多模態(tài)全局特征交互能力的同時,消除顯存溢出風(fēng)險。

(3)構(gòu)建“重采樣-蒸餾”協(xié)同加速框架。揭示并解決了稀疏卷積的訪存效率問題,提出空間重采樣策略以減少非空體素索引開銷,突破物理計算瓶頸。同時,結(jié)合Logit知識蒸餾技術(shù),有效補(bǔ)償了因粗粒度量化帶來的幾何信息損失,實(shí)現(xiàn)了在邊緣設(shè)備上推理速度與檢測精度的雙重突破。


本文詳細(xì)內(nèi)容請下載:

http://ihrv.cn/resource/share/2000007032


作者信息:

李家鑫1,王韻涵1,2,潘果1,張熙雨1

(1.華北計算機(jī)系統(tǒng)工程研究所,北京 100000;2.山東大學(xué) 網(wǎng)絡(luò)空間安全學(xué)院,山東 青島 266237)

2.jpg

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。