《電子技術應用》
您所在的位置:首頁 > 其他 > 设计应用 > 基于优化多视角图像采集的点云分类
基于优化多视角图像采集的点云分类
2021年电子技术应用第10期
何瑞函1,2,蔡 勇1,2,张建生1,2
1.西南科技大学 制造科学与工程学院,四川 绵阳621010; 2.制造过程测试技术省部共建教育部重点实验室,四川 绵阳621010
摘要: 基于二维多视角3D识别方法中,可使用多个2D投影图表示三维模型特征信息,但不同视角投影图像的特征不同,神经网络对其学习效率也有所差异。卷积神经网络能够映射图像的特征,可用此方法分析这个问题。混合视角数据集分析不同视角投影特征在卷积神经网络中的重要性,根据重要性的不同优化混合视角数据集的采集密度。最终实验结果表明,不同视角产生的二维图像分类准确率不一样,其中俯视角度投影的分类准确率最差,优化后的数据集在相同神经网络模型下达到了最优分类准确率。
中圖分類號: TP391.7
文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.200892
中文引用格式: 何瑞函,蔡勇,張建生. 基于優(yōu)化多視角圖像采集的點云分類[J].電子技術應用,2021,47(10):82-85.
英文引用格式: He Ruihan,Cai Yong,Zhang Jiansheng. Point cloud classification based on optimized multi-view image acquisition[J]. Application of Electronic Technique,2021,47(10):82-85.
Point cloud classification based on optimized multi-view image acquisition
He Ruihan1,2,Cai Yong1,2,Zhang Jiansheng1,2
1.School of Manufacturing Science and Engineering,Southwest University of Science and Technology,Mianyang 621010,China; 2.Key Laboratory of Testing Technology for Manufacturing Process,Mianyang 621010,China
Abstract: In the 3D recognition method based on 2D multi-perspective, multiple 2D projected images can be used to represent the feature information of 3D model. However, the features of projected images from different perspectives are different, and the learning efficiency of the neural network is also different. The convolutional neural network can map the features of images, and this method can be used to analyze this problem. The importance of projection features of different perspectives in the convolutional neural network was analyzed in the mix-view data set, and the collection density of the mix-view data set was optimized according to the different importance. The final experimental results show that the classification accuracy of 2D images generated from different perspectives is different, among which the classification accuracy of overhead projection is the worst, and the optimized data set achieves the optimal classification accuracy in the same neural networks model.
Key words : 3D point cloud;multi-view image;convolution neural network;image classification

0 引言

    隨著激光掃描技術的發(fā)展,點云作為最能表現(xiàn)物體三維特征的數(shù)據(jù)深受研究者熱愛。深度學習、卷積神經網絡(Convolutional Neural Network,CNN)[1-2]近幾年引領計算機視覺領域的研究趨勢,并且CNN網絡在二維圖像分類與識別上顯得高效。點云在空間中的無序性、旋轉不變性、非結構化數(shù)據(jù),導致其不能直接作為CNN網絡的輸入[3]。因此,使用深度學習對點云進行研究的方法有3種:多視圖[4]、體素法[5]、直接對點云[6-7]。

    基于二維多視角3D識別的方法,本文通過優(yōu)化采集數(shù)據(jù)集的方式提升CNN神經網絡[8]的分類效果。本文對點云模型進行不同視角投影,得到多組2D圖像數(shù)據(jù)集。首先用多個VGG16卷積模型[9-10]提取單獨視角數(shù)據(jù)集,得到多個映射了圖像特征的卷積神經網絡模型;然后將多個包含特征的VGG16模塊加上自定義層后“并聯(lián)”連接分類層作為分析網絡模型,混合視角圖像數(shù)據(jù)集作為網絡輸入;最后通過分析多個特征提取模塊的權重,優(yōu)化多視角圖像的采集密度,提升二維多視角3D識別效率,即分類效果。




本文詳細內容請下載:http://ihrv.cn/resource/share/2000003788。




作者信息:

何瑞函1,2,蔡  勇1,2,張建生1,2

(1.西南科技大學 制造科學與工程學院,四川 綿陽621010;

2.制造過程測試技術省部共建教育部重點實驗室,四川 綿陽621010)




wd.jpg

此內容為AET網站原創(chuàng),未經授權禁止轉載。