入门:3D视觉技术和3D传感器初探AET

2D视觉技术借助强大的计算机视觉和深度学习算法取得了超越人类认知的成就,而3D视觉则因为算法建模和环境依赖等问题,一直处于正在研究的前沿。

3D视觉同样为传统研究领域,但最近5年内得到快速发展。与深度学习算法结合,在智能制造/机器人、自动驾驶、AR/VR、SLAM、无人机、三维重建、人脸识别等领域取得了优异的效果。

3D视觉主要研究内容包括:

3D感知:点云获取及处理,应用于机器人/机械臂、自动驾驶、无人机等场景。

位姿估计(视觉SLAM):应用于机器人定位导航、VPS等场景。

3D重建:

大规模场景的3D重建、动态实景融合和3D理解(与3D感知趋于一致等),应用于数字城市/园区、数字文旅、混合现实等场景。

人脸、人体、手部3D重建和关键点检测识别,应用于游戏娱乐、动漫影视内容制作等领域。

近年来,学术界和工业界推出了一系列优秀的算法和产品,被广泛应用到各个领域。

学术界:

工业界:

3D视觉广泛应用到人脸识别、智能机器人、自动驾驶、ARVR等领域;比如,OPPO、华为和苹果等公司推出的3D+AI识别功能,通过扫描人脸三维结构完成手机解锁;自动驾驶领域通过分析3D人脸信息,判断司机驾驶时的情绪状态;SLAM方式通过重建周边环境,完成建图与感知;AR领域通过三维重建技术完成目标的重现,等等。

传感器/相机作为3D视觉的眼睛,其在3D技术演进及落地应用过程中所占的位置十分重要,甚至一定程度上决定了3D视觉技术的发展了应用。本文概要分析3D传感器/相机技术,并对当前业界硬件厂商和产品进行简单介绍。

3D传感器/相机,不仅能够获得平面图像,还可以获得拍摄对象的深度信息,即三维位置及尺寸等。3D传感器/相机通常有多个摄像头+深度传感器组成。可以实现三维信息采集,且三维数据可以转成点云。

根据基础原理的不同,目前市面上的3D传感器主要包括以下几种:

(1)双目相机

双目视觉是机器视觉的一种重要形式,基于视差原理并利用成像设备从不同的位置获取被测物体的两幅图像,通过计算图像对应点间的位置偏差,来获取物体三维几何信息的方法。目前有主动双目,被动双目之分,被动双目就是采用可见光,好处是不需要额外光源,但是晚上无法使用,主动双目就是主动发射红外激光做补光,光线暗的场景也能正常使用。

双目相机优缺点:

硬件要求和成本低,普通CMOS相机即可。

可适用室内外场景。

对环境光照非常敏感。光线变化导致图像偏差大,进而会导致匹配失败或精度低。

不适用单调缺乏纹理的场景。双目视觉根据视觉特征进行图像匹配,没有特征会导致匹配失败。

计算复杂度高。纯视觉的方法对算法要求高,计算量较大。

基线限制了测量范围。测量范围和基线(两个摄像头间距)成正比,导致无法小型化。

(2)结构光

结构光(Structuredlight):通常采用特定波长的不可见的红外激光作为光源,发射出来的光经过一定的编码投影在物体上,通过一定算法来计算返回的编码图案的畸变来得到物体的位置和深度信息。

根据编码图案不同,机构光相机可分为:

一般有条纹结构光---enshape

编码结构光---MantisVision,Realsense(F200)

散斑结构光--apple(primesense)

结构光相机优缺点包括:

方案成熟,相机基线可以做的比较小,方便小型化。

资源消耗较低,单帧IR图即可计算深度信息,功耗低。

主动光源,暗光线场景也可使用。

在一定范围内精度高,分辨率高,分辨率可达1280x1024,帧率可达到60FPS。

容易受环境光干扰,室外体验差。

随检测距离增加,精度会变差。

(3)ToF相机

TOF法根据调制方法的不同,一般可以分为两种:脉冲调制(PulsedModulation)和连续波调制(ContinuousWaveModulation)。脉冲调制需要非常高精度时钟进行测量,且需要发出高频高强度激光,目前大多采用检测相位偏移办法来实现TOF功能。

下面图片描述了TOF相机(连续波)的基本原理,实际应用中,通常采用的是正弦波调制。由于接收端和发射端正弦波的相位偏移和物体距离摄像头的距离成正比,因此可以利用相位偏移来测量距离。

TOF的优缺点包括:

检测距离远。在激光能量够的情况下可达几十米。

受环境光干扰比较小。

资源消耗大。该方案在检测相位偏移时需要多次采样积分,运算量大。

边缘精度低。

限于资源消耗和滤波,帧率和分辨率都没办法做到较高。目前消费类最大也就VGA。

毫米波是指波长在1mm到10mm之间的电磁波,换算成频率后,毫米波的频率位于30GHz到300GHz之间。毫米波的波长介于厘米波和光波之间,因此毫米波兼有微波制导和光电制导的优点。

激光雷达(LightDetectionAndRanging,LiDAR),即光探测与测量,是一种集激光、全球定位系统(GPS)和惯性测量设备(IMU)于一身的系统,用于获得数据并生成精确的DEM(数字高程模型)。LiDAR可以高度准确地定位激光束打在物体上的光斑,测距精度可达厘米级,其优势包括“精准”、“快速”。下图为自动驾驶领域常用的VelodyneLiDAR。

近几年,无人驾驶技术兴起并快速发展。无人驾驶技术研发公司,包括谷歌、百度、Uber等主流无人驾驶汽车研发团队,都在使用激光雷达作为传感器之一,与图像识别等技术搭配使用,实现三维环境感知,为自动驾驶保驾护航。

THE END
1.深度学习揭秘:不懂技术也能秒懂AI的学习秘籍!想象一下,你手里拿着一本厚厚的书,封面上写着“深度学习”四个大字。你翻开书页,里面全是密密麻麻的公式和代码,看得你眼花缭乱。你是不是觉得,这玩意儿太高深了,我肯定看不懂?别急,今天我就带你一起揭开深度学习的神秘面纱,让你这个“技术小白”也能轻松理解它到底是什么。一、深度学习:AI界的“https://baijiahao.baidu.com/s?id=1807716840178914168&wfr=spider&for=pc
2.每日科普深度学习——模仿人脑的算法深度学习作为新一代人工智能(AI)的技术支柱,为机器装上了“超级大脑”,让机器变得非常聪明,甚至能做一些人类都觉得困难的事情。下面,让我们一起揭开深度学习的神秘面纱吧! 什么是深度学习? 简单来说,深度学习是一种模仿人脑神经系统的算法。算法是指完成一个任务所https://mp.weixin.qq.com/s?__biz=MzA5NTc2NzI3Mw==&mid=2650222621&idx=4&sn=ab53731cb1b41e19efef10768e2ecc11&chksm=895d3e7315f12c41899bcd5e32070bf8f14f3a9caa2209234de6ea239ed53122ab42093ba1fc&scene=27
3.深度学习入门,一文讲解神经网络的构成训练和算法深度学习入门,一文讲解神经网络的构成、训练和算法 神经网络的构成、训练和算法 什么是神经网络 人工神经网络(Artificial Neural Network,ANN),简称神经网络(Neural Network,NN),是一种模仿生物神经网络的结构和功能的数学/计算模型,用于拟合各种函数。 一个神经网络,有两个基本要素:神经元和连接。https://cloud.tencent.com/developer/article/1518746?areaSource=102001.5&traceId=qq7DcMnNSWaY5OAZi0FEp
4.深度学习(Deeplearning)入门导读深度学习是利用不断地学习组合底层特征形成更加抽象的高层特征,来发现数据的分布式特征。在深度学习中,计算机可以自行观测学习数据和结果来实现自动解决问题。在深度学习算法的发展过程中,Caffe受到广大研究和开发人员的欢迎,是一款优秀的神经网络深度学习框架。https://www.51cto.com/article/657022.html
5.人工智能:深度学习入门到精通实战深度卷积神经网络视频《人工智能:深度学习入门到精通实战》课程主要就人工智能领域相关的深度学习基础、深度学习计算、卷积神经网络+经典网络、循环神经网络+RNN进阶、优化算法、计算机视觉和自然语言处理等,配套实战案例与项目全部基于真实数据集与实际任务展开,结合深度学习框架进行建模实战。 https://edu.csdn.net/course/detail/31822/483017
6.推荐「深度学习入门与实践」公开课陪你过大年新闻动态本课程是由北京大学前沿计算研究中心的董豪老师带来的深度学习入门课程,包含深度学习基础知识与代码实战。 课程简介 “深度学习入门与实践”课程的主要目标,是希望学习者通过该课程初步掌握深度学习的理论知识、常用算法原理并且具备一定的应用开发能力。本课程特色一方面是兼顾理论和实践,既讲解了深度学习的底层算法原理,又https://cfcs.pku.edu.cn/news/241174.htm
7.2深度学习入门自然语言处理v.pdf深度学习入门(自然语言处理) 科学院大学 目录 1 深度学习概述 发展历程、领域应用 2 为什么使用深度学习 从图像识别说起: 为什么使用深度学习 全连接神经网络 3 如何使用深度学习 卷积神经网络 4 课程实践 实践:手写数字识别 目录 1 深度学习概述 发展历程、领域应用 2 为什么使用深度学习 从图像识别说起: 为什么https://max.book118.com/html/2021/1123/8107047065004043.shtm
8.GitHub机器学习与深度学习书单 深度学习基础 快速入门 深度学习思维导图 && 深度学习算法地图 《斯坦福大学深度学习基础教程》 Andrew Ng(吴恩达) 深度学习 吴恩达 个人笔记 && 视频 MIT深度学习基础-2019视频课程 台湾大学(NTU)李宏毅教授课程 && [leeml-notes 图解深度学习_Grokking-Deep-Learning 《神经网络与深度学习》 https://github.com/Mikoto10032/DeepLearning
9.深度学习之神经网络(CNN/RNN/GAN)算法原理+实战本课程使用原理讲解加实战的方式学习卷积神经网络(CNN)、循环神经网络(RNN)、对抗神经网络(GAN),通过图像分类、文本分类、图像风格转换、图像文本生成、图像翻译等项目,深度掌握算法调参以及使用Tensorflow进行编程的能力。 正十七 讲师 Google资深算法工程师 https://coding.imooc.com/class/259.html
10.awesome前沿分享 :定期分享顶会最新论文解读和代码复现,开发者可以实时掌握最新的深度学习算法。 二、 零基础实践深度学习入门课 AI Studio在线课程:《零基础实践深度学习》:理论和代码结合、实践与平台结合,包含20小时视频课程,由百度杰出架构师、飞桨产品负责人和资深研发人员共同打造。 《零基础实践深度学习》书籍:本课程配https://gitee.com/nimabi2321wrq-fgwesdfhuy3q/awesome-DeepLearning
11.深度学习入门深度学习的过程就是使用多个处理层对数据进行高层抽象,得到多重非线性变换函数的过程。就目前而言,深度学习主要是与人工神经网络相结合的,因此这里的深度学习算法框架也可以成为深度神经网络算法框架。 深度学习通过构建深层神经网络,来模拟人类大脑的工作原理。如下图所示,深层神经网络由一个输入层,数个隐层,以及一个输https://www.jianshu.com/p/194a22c747b2
12.一文看懂机器学习「3种学习方法+7个实操步骤+15种常见算法」机器学习研究和构建的是一种特殊算法(而非某一个特定的算法),能够让计算机自己在数据中学习从而进行预测。 所以,机器学习不是某种具体的算法,而是很多算法的统称。 机器学习包含了很多种不同的算法,深度学习就是其中之一,其他方法包括决策树,聚类,贝叶斯等。 https://easyai.tech/ai-definition/machine-learning/
13.深度学习有什么好的入门书籍?核心知识点:Scikit-Learn和TensorFlow的实践应用、机器学习算法、深度学习算法等。适合读者:机器学习实战者https://www.zhihu.com/question/55228464/answer/3448557684
14.深度学习:卷积神经网络从入门到精通带目录完整pdf[92MB]电子书下本书专注讨论深度学习中应用非常广泛的模型——卷积神经网络,该模型特别适用于图像分类和识别、目标分割和检测以及人工智能游戏方面,受众对象包括计算机、自动化、信号处理、机电工程、应用数学等相关专业的研究生、教师以及算法工程师和科研工作者。本书的最大特色是对卷积神经网络进行由浅入深的分类描述,依次包括:现代雏https://www.jb51.net/books/684151.html