必看综述!中科院带你彻底了解基于深度学习的三维点云分类

必看综述!中科院带你彻底了解基于深度学习的三维点云分类

添加小助理:dddvision,备注:方向+学校/公司+昵称,拉你入群。文末附行业细分群

扫描下方二维码,加入3D视觉知识星球,星球内凝聚了众多3D视觉实战问题,以及各个模块的学习资料:近20门视频课程(星球成员免费学习)、最新顶会论文、计算机视觉书籍、优质3D视觉算法源码等。想要入门3D视觉、做项目、搞科研,欢迎扫码加入!

下面一起来阅读一下这项工作~

论文题目:DeepLearning-based3DPointCloudClassification:ASystematicSurveyandOutlook

作者:HuangZhang,ChangshuoWang等

作者机构:新疆大学、中国科学院等

近年来,点云表示已成为计算机视觉领域的研究热点之一,并广泛应用于自动驾驶、虚拟现实、机器人等许多领域。虽然深度学习技术在处理常规结构化的二维网格图像数据方面取得了巨大成功,但在处理不规则、非结构化的点云数据方面仍面临着巨大挑战。点云分类是点云分析的基础,许多基于深度学习的方法已被广泛应用于此任务。因此,本文旨在为该领域的研究人员提供最新的研究进展和未来趋势。首先,我们介绍点云获取、特征和挑战。其次,我们回顾了用于点云分类的3D数据表示、存储格式和常用数据集。然后,我们总结了基于深度学习的点云分类方法,并补充了最近的研究工作。接下来,我们比较和分析了主要方法的性能。最后,我们讨论了点云分类的一些挑战和未来方向。

A.3D数据表示

3D数据有各种表示形式,例如点云、网格和体素。

B.点云数据存储格式

点云有数百种文件格式可用,不同的扫描仪会以许多格式生成原始数据。点云数据文件之间的最大区别在于使用ASCII和二进制。二进制系统直接将数据存储在二进制代码中。常见的点云二进制格式包括FLS、PCD、LAS等。其他几种常见文件类型可以同时支持ASCII和二进制格式。其中包括PLY、FBX。E57以ASCII和二进制代码存储数据,并将许多ASCII和二进制的优点结合在一个文件类型中。以下是一些常用的点云数据存储格式:

C.3D点云公共数据集

今天,许多工业和大学提供了许多点云数据集。不同方法在这些数据集上的表现反映了方法的可靠性和准确性。这些数据集包含虚拟或真实场景,可以为网络训练提供地面真实标签。在本节中,我们将介绍一些常用的点云分类数据集,每个数据集的划分如表I所示。

A.基于多视图的方法

基于多视图的方法利用多个视角的信息来描述和识别3D形状。这种方法的优势在于可以从不同的角度获取丰富的特征信息,从而提高了形状识别的准确性。然而,基于多视图的方法在处理大规模场景和利用3D数据的固有几何关系方面仍然存在挑战。例如,在将多个视图特征转换为全局特征时,会忽略其他非最大元素的信息,导致信息丢失。因此,改进基于多视图的方法以充分利用信息,并解决大规模场景和几何关系的挑战是未来研究的方向。

B.基于体素的方法

C.基于点云的方法

局部特征聚合

基于卷积的方法

基于卷积的方法将传统的卷积神经网络(CNN)扩展到处理不规则的三维点云数据上,是处理点云分类的重要方法。这些方法主要包括以下方面的研究:

这些方法的设计旨在有效地处理点云的不规则性、稀疏性和无序性,从而提高点云分类的准确性和效率。

基于图的方法

基于图的方法利用图神经网络(GNN)等技术处理点云数据。这些方法主要包括以下几种类型:

基于图的方法能够有效地处理点云数据,提取特征并解决分类、分割等任务,为点云分析领域的研究提供了重要的技术支持。

基于注意力机制的方法

全局特征聚合

基于Transformer的方法

基于Transformer的方法在点云处理领域取得了显著的进展。这些方法通过将点云作为输入,并利用Transformer结构中的自注意力机制,实现了对点云的全局特征建模和关联学习。具体而言,这些方法包括以下关键点:

这些方法利用Transformer的优势,在点云处理中取得了令人瞩目的成果,为点云的全局特征建模和关联学习提供了新的思路和方法。

基于全局模块的方法

基于全局模块的方法旨在处理点云中的全局特征聚合问题。这些方法通过设计特定的模块或网络结构,能够有效地捕获整个点云的全局信息,从而提高了点云处理任务的性能。一些方法包括:

基于RNN或LSTM的方法RNN(循环神经网络)

基于RNN或LSTM的方法通常利用这些循环结构处理序列信息或全局上下文信息,以提高点云处理任务的性能和准确性。Engelmann等人提出了扩展了PointNet的PointNet++,以处理大规模场景,并通过引入额外的上下文信息提高了性能。Liu等人提出的3DCNN-DQN-RNN方法融合了多种网络结构,通过这种融合提高了处理大规模点云的准确性。其他方法如RSNet、3P-RNN和Point2Sequence等也通过结合RNN或LSTM等循环结构,有效地利用了上下文信息,提高了点云处理的性能。

D.多态融合方法

多态融合方法将不同的数据表示方式融合在一起,以综合利用它们的优势。Le等人提出了一种将点云和网格结合的策略,通过卷积块和最大池化来表示不同层次的特征,能够更好地识别细粒度模型和表示局部形状。Zhang等人的PVT方法结合了稀疏窗口注意模块和相对注意模块,将体素和点云的思想相结合,在点云分类的准确性方面表现出色。PointCLIP利用预训练的CLIP学习点云,通过投影到多视图深度图中进行编码,实现了从2D预训练知识到3D域的零样本识别。CrossPoint通过最大化点云和对应渲染的2D图像在不变空间中的表现,实现了2D到3D的对应。与传统方法相比,多态融合方法能够更好地利用不同表示方式的信息,有望成为未来点云处理的重要方向。

除了上述指标外,还可以使用整体准确度(OA)、平均准确度(MA)和平均交并比(mIoU)等综合指标来评估方法的性能。这些指标可以帮助研究人员全面了解方法在不同数据集上的表现,并为进一步改进提供参考。

在点云分类领域,深度学习方法不断创新,为3D应用带来新的可能性。本文综述了近年来基于深度学习的点云分类方法,包括多视图、体素、点云和多态融合等不同类型的方法。通过对比分析,可以看出各种方法在准确性、效率和适用场景等方面存在差异。

未来的研究方向包括提高准确性和效率的平衡、针对室外场景进一步优化方法、简化点云处理流程等。创新型方法的研究也是未来的重点,需要不断探索新的思路和技术。

总的来说,基于深度学习的点云分类方法在不断发展,未来有望取得更大的突破,为3D应用带来更多可能性。

3D视觉工坊交流群

目前我们已经建立了3D视觉方向多个社群,包括2D计算机视觉、大模型、工业3D视觉、SLAM、自动驾驶、三维重建、无人机等方向,细分群包括:

2D计算机视觉:图像分类/分割、目标/检测、医学影像、GAN、OCR、2D缺陷检测、遥感测绘、超分辨率、人脸检测、行为识别、模型量化剪枝、迁移学习、人体姿态估计等

大模型:NLP、CV、ASR、生成对抗大模型、强化学习大模型、对话大模型等

工业3D视觉:相机标定、立体匹配、三维点云、结构光、机械臂抓取、缺陷检测、6D位姿估计、相位偏折术、Halcon、摄影测量、阵列相机、光度立体视觉等。

SLAM:视觉SLAM、激光SLAM、语义SLAM、滤波算法、多传感器融合、多传感器标定、动态SLAM、MOTSLAM、NeRFSLAM、机器人导航等。

自动驾驶:深度估计、Transformer、毫米波|激光雷达|视觉摄像头传感器、多传感器标定、多传感器融合、自动驾驶综合群等、3D目标检测、路径规划、轨迹预测、3D点云分割、模型部署、车道线检测、Occupancy、目标跟踪等。

三维重建:3DGS、NeRF、多视图几何、OpenMVS、MVSNet、colmap、纹理贴图等

无人机:四旋翼建模、无人机飞控等

除了这些,还有求职、硬件选型、视觉产品落地、最新论文、3D视觉最新产品、3D视觉行业新闻等交流群

添加小助理:dddvision,备注:研究方向+学校/公司+昵称(如3D点云+清华+小草莓),拉你入群。

▲长按扫码添加助理

3D视觉工坊知识星球

3DGS、NeRF、结构光、相位偏折术、机械臂抓取、点云实战、Open3D、缺陷检测、BEV感知、Occupancy、Transformer、模型部署、3D目标检测、深度估计、多传感器标定、规划与控制、无人机仿真、三维视觉C++、三维视觉python、dToF、相机标定、ROS2、机器人控制规划、LeGo-LAOM、多模态融合SLAM、LOAM-SLAM、室内室外SLAM、VINS-Fusion、ORB-SLAM3、MVSNet三维重建、colmap、线面结构光、硬件结构光扫描仪,无人机等。

THE END
1.三维点云深度学习算法综述【综述】三维点云深度学习算法综述,sota pointcloud - 知乎 (zhihu.com) 码上AI 关注 weixin_70923796的博客 137 3D视觉工坊 2027 作者丨小白@知乎来源丨https://zhuanlan.zhihu.com/p/157791868编辑丨深蓝学院本文是对<Deep Learning for 3D Point Clohttps://blog.csdn.net/weixin_45295333/article/details/138523452
2.基于深度学习的三维点云处理方法研究进展第51 卷第 5 期/2024 年 3 月/中国激光 综述 基于深度学习的三维点云处理方法研究进展 吴一全*,陈慧娴,张耀 南京航空航天大学电子信息工程学院,江苏 南京 211106 摘要 随着传感器技术的不断发展,三维点云被广泛应用于自动驾驶,机器人,遥感,文物修复,增强现实,虚拟现实 等领域的视觉任务中 . 然而 ,直接应用收集https://www.opticsjournal.net/Articles/GetArticlePDF/OJeb4150232c7fa1bc
3.「3D点云深度学习」综述:三维形状分类目标检测与跟踪点云分割等这篇论文是第一个专门针对点云的深度学习方法的综述。此外,论文全面涵盖了分类,检测,跟踪和分割等不同应用。图1显示了三维点云的现有深度学习方法的分类。 图1:三维点云深度学习方法分类。 这项工作的主要贡献可以概括如下: 1)据我们所知,这是第一篇全面涵盖多个重要点云相关任务的深度学习方法的综述论文,包括三https://cloud.tencent.com/developer/article/1639485
4.基于深度学习的点云语义分割综述点云语义分割作为三维场景理解和分析的关键步骤,受到了研究者的广泛关注。深度学习具有优良的高层语义理解能力,基于深度学习的点云语义分割已成为当前研究的热点。首先,从语义分割的概念出发,简要叙述了点云语义分割的优势和现存的挑战;进而详细介绍了点云分割算法和常见的数据集,重点对点云语义分割领域中基于点排序、https://www.cnki.com.cn/Article/CJFDTotal-JGDJ202004002.htm
5.一文尽览基于点云多模态的3D目标检测算法综述!(Point/Voxel/论文将三维点云划分为一定数量的Voxel,经过点的随机采样以及归一化后,对每一个非空Voxel使用若干个VFE(Voxel Feature Encoding)层进行局部特征提取,得到Voxel-wise Feature,然后经过3D Convolutional Middle Layers进一步抽象特征(增大感受野并学习几何空间表示),最后使用RPN(Region Proposal Network)对物体进行分类检测与https://developer.aliyun.com/article/1142967
6.自动驾驶高清地图生成技术综述汽车技术基于三维点云的道路或车道提取已广泛应用于高精地图的生成过程中。激光雷达点云具有很高的精度,通常达到毫米级精度,并包含被扫描物体的几何信息。三维点云的道路提取是利用分割完成的。Ibrahim等人指出,二维道路网络不能提供任何物体相对位置的深度线索,而且二维道路网络中较小的基础设施变化也不是最新的[70]。Ibrahim等https://www.auto-testing.net/mobile/21-0-117098-1.html
7.基于深度学习的三维目标检测算法综述算法语言 基于深度学习的三维目标检测算法综述 邵昀岑 (东南大学 软件学院,江苏 南京 211189)摘 要:随着自动驾驶行业的快速发展,基于深度学习的三维目标检测技术也得到了快速发展,目前自动驾驶汽车主要依赖图像与激光雷达点云进行环境感知。基于这两种数据的三维目标检测技术可提取出物体的空间结构信息,包括物体的https://wenku.baidu.com/view/4666c94e757f5acfa1c7aa00b52acfc789eb9f20.html
8.史上最全基于深度学习的3D分割综述(RGB为了避免这些复杂性,研究人员将整个点云投影到一个球体上(见图6底部)。例如,Wu等人[152]提出了一个名为SqueezeSeg的端到端管道,其灵感来自SqueezeNet[53],用于从球形图像中学习特征,然后由CRF将其细化为循环层。类似地,PointSeg[148]通过整合特征和通道注意力来扩展SqueezeNet,以学习鲁棒表示。其他相关算法还有[153]https://www.shangyexinzhi.com/article/5397310.html
9.深度学习中的三维点云数据分类算法研究其中自动驾驶的车辆常常使用LiDAR作为传感器获取周边点云数据,点云分类算法赋予原始点云的语义信息有助于车辆行驶速度的调整和行驶方向的选择。近年来基于深度学习的点云数据分类技术在模拟点云数据上取得了长足的发展,但在具有噪声和背景的真实点云数据的分类任务上仍是一个具有挑战的问题。首先,本文探讨了如何将孪生http://cnki.nbsti.net/KCMS/detail/detail.aspx?filename=1021095363.nh&dbcode=CMFD
10.自动驾驶视觉感知算法技术综述自动驾驶视觉感知算法技术综述 近些年,深度学习进入到视觉感知的各个领域,取得不错的成绩,因此,我们梳理了一些经典的深度学习算法。 环境感知 是自动驾驶的第一环,是车辆和环境交互的纽带。一个自动驾驶系统整体表现的好坏,很大程度上都取决于感知系统的好坏。目前,环境感知技术有两大主流技术路线:https://www.51cto.com/article/753817.html
11.基于计算机视觉的施工现场工人不安全行为识别方法研究.pdf(4)深度学习算法综述小结 计算机领域的目标检测与对象识别算法、人体姿态估计算法、动作识别算法 均为本研究中不安全行为的识别提供有效支持。考虑到不安全行为识别所需的细 度、实时性等要求,实现精细化分割与更精准定位的Mask R-CNN、人体骨骼细 部特征以及效率更高OpenPose算法、能有效处理长时间序列的LSTM 网络等https://max.book118.com/html/2021/0203/8070116076003045.shtm
12.深度学习技术在自动驾驶中的应用AET深度学习方法特别适合于从摄像机和lidar(光探测和测距)设备获取的2d图像和3d点云中检测和识别对象。在自动驾驶中,三维感知主要基于激光雷达传感器,它以三维点云的形式提供对周围环境的直接三维表示。激光雷达的性能是根据视场、距离、分辨率和旋转/帧速率来衡量的。3D传感器,如Velodyne?通常具有360度水平视野。为了高速行http://www.chinaaet.com/article/3000110152
13.三维点云数据超分辨率技术基于深度学习的三维点云处理方法研究进展. 中国激光. 2024(05): 143-165 . 2. 朱婧怡,杨鹏程,孟杰,张津京,崔嘉宝,代阳. 基于曲率特征的文物点云分类降采样与配准方法. 中国光学(中英文). 2024(03): 572-579 . 3. 龙佳乐,杜梓浩,张建民,陈富健,关浩源,黄克森,孙瑞. 基于图像分割的点云去噪方法. http://www.chineseoptics.net.cn/en/article/doi/10.37188/CO.2021-0176
14.博创基金微展示第28期张志远:基于深度学习的三维点云配准研究但是,由于基于深度学习的三维点云配准技术发展时间较短,仍有许多棘手的问题未能很好的解决,如配准精度较低,对外点鲁棒性较差等。针对上述问题,在科技部科技创新2030“新一代人工智能”重点项目子课题、国家自然科学基金等项目支持下,从鲁棒特征描述子学习、配准网络框架改进、虚拟匹配点分布修正、两阶段硬匹配策略设计等https://gs.nwpu.edu.cn/info/2490/18307.htm
15.基于自注意力机制的点云分类分割摘要:3D点云由于其无序性以及缺少拓扑信息使得点云的分类与分割仍具有挑战性. 针对上述问题, 我们设计了一种基于自注意力机制的3D点云分类算法, 可学习点云的特征信息, 用于目标分类与分割. 首先, 设计适用于点云的自注意力模块, 用于点云的特征提取. 通过构建领域图来加强输入嵌入, 使用自注意力机制进行局部https://c-s-a.org.cn/html/2024/1/9341.html