三位大神HintonYannLeCun和Bengio分析入门深度学习

本文上半部分深入浅出介绍深度学习的基本原理和核心优势,下半部分则详解CNN、分布式特征表示、RNN及其不同的应用,并对深度学习技术的未来发展进行展望。

论文摘要

几十年来,想要构建一个模式识别系统或者机器学习系统,需要一个精致的引擎和相当专业的知识来设计一个特征提取器,把原始数据(如图像的像素值)转换成一个适当的内部特征表示或特征向量,子学习系统,通常是一个分类器,对输入的样本进行检测或分类。特征表示学习是一套给机器灌入原始数据,然后能自动发现需要进行检测和分类的表达的方法。

深度学习就是一种特征学习方法,把原始数据通过一些简单的但是非线性的模型转变成为更高层次的,更加抽象的表达。通过足够多的转换的组合,非常复杂的函数也可以被学习。

深度学习的核心方面是,上述各层的特征都不是利用人工工程来设计的,而是使用一种通用的学习过程从数据中学到的。

深度学习正在取得重大进展,解决了人工智能界的尽最大努力很多年仍没有进展的问题。它已经被证明,它能够擅长发现高维数据中的复杂结构,因此它能够被应用于科学、商业和政府等领域。除了在图像识别、语音识别等领域打破了纪录,它还在另外的领域击败了其他机器学习技术,包括预测潜在的药物分子的活性、分析粒子加速器数据、重建大脑回路、预测在非编码DNA突变对基因表达和疾病的影响。

机器学习中,不论是否是深层,最常见的形式是监督学习。

在实际应用中,大部分从业者都使用一种称作随机梯度下降的算法(SGD)。它包含了提供一些输入向量样本,计算输出和误差,计算这些样本的平均梯度,然后相应的调整权值。通过提供小的样本集合来重复这个过程用以训练网络,直到目标函数停止增长。它被称为随机的是因为小的样本集对于全体样本的平均梯度来说会有噪声估计。这个简单过程通常会找到一组不错的权值,同其他精心设计的优化技术相比,它的速度让人惊奇。训练结束之后,系统会通过不同的数据样本——测试集来显示系统的性能。这用于测试机器的泛化能力——对于未训练过的新样本的识别能力。

当前应用中的许多机器学习技术使用的是线性分类器来对人工提取的特征进行分类。一个2类线性分类器会计算特征向量的加权和。当加权和超过一个阈值之后,输入样本就会被分配到一个特定的类别中。从20世纪60年代开始,我们就知道了线性分类器只能够把样本分成非常简单的区域,也就是说通过一个超平面把空间分成两部分。

图1多层神经网络和BP算法

链式法则告诉我们两个小的变化(x和y的微小变化,以及y和z的微小变化)是怎样组织到一起的。x的微小变化量Δx首先会通过乘以y/x(偏导数)转变成y的变化量Δy。类似的,Δy会给z带来改变Δz。通过链式法则可以将一个方程转化到另外的一个——也就是Δx通过乘以y/x和z/x得到Δz的过程。当x,y,z是向量的时候,可以同样处理(使用雅克比矩阵)。

具有两个隐层一个输出层的神经网络中计算前向传播的公式。每个都有一个模块构成,用于反向传播梯度。在每一层上,我们首先计算每个节点的总输入z,z是前一层输出的加权和。然后利用一个非线性函数f(.)来计算节点的输出。简单期间,我们忽略掉了阈值项。神经网络中常用的非线性函数包括了最近几年常用的校正线性单元(ReLU)f(z)=max(0,z),和传统的sigmoids,比如f(z)=(exp(z)exp(z))/(exp(z)+exp(z))和f(z)=1/(1+exp(z))。

计算反向传播的公式。在隐层,我们计算每个输出单元产生的误差,这是由上一层产生的误差的加权和。然后我们将输出层的误差通过乘以梯度f(z)转换到输入层。在输出层上,每个节点的误差会用成本函数的微分来计算。如果节点l的成本函数是0.5*(yl-tl)^2,那么节点的误差就是yl-tl,其中tl是期望值。一旦知道了E/zk的值,节点j的内星权向量wjk就可以通过yjE/zk来进行调整。

一个线性分类器或者其他操作在原始像素上的浅层分类器不能够区分后两者,虽然能够将前者归为同一类。这就是为什么浅分类要求有良好的特征提取器用于解决选择性不变性困境——提取器会挑选出图像中能够区分目标的那些重要因素,但是这些因素对于分辨动物的位置就无能为力了。为了加强分类能力,可以使用泛化的非线性特性,如核方法,但这些泛化特征,比如通过高斯核得到的,并不能够使得学习器从学习样本中产生较好的泛化效果。

传统的方法是手工设计良好的特征提取器,这需要大量的工程技术和专业领域知识。但是如果通过使用通用学习过程而得到良好的特征,那么这些都是可以避免的了。这就是深度学习的关键优势。

深度学习的体系结构是简单模块的多层栈,所有(或大部分)模块的目标是学习,还有许多计算非线性输入输出的映射。栈中的每个模块将其输入进行转换,以增加表达的可选择性和不变性。比如说,具有一个5到20层的非线性多层系统能够实现非常复杂的功能,比如输入数据对细节非常敏感——能够区分白狼和萨莫耶德犬,同时又具有强大的抗干扰能力,比如可以忽略掉不同的背景、姿势、光照和周围的物体等。

在最早期的模式识别任务中,研究者的目标一直是使用可以训练的多层网络来替代经过人工选择的特征,虽然使用多层神经网络很简单,但是得出来的解很糟糕。直到20世纪80年代,使用简单的随机梯度下降来训练多层神经网络,这种糟糕的情况才有所改变。只要网络的输入和内部权值之间的函数相对平滑,使用梯度下降就凑效,梯度下降方法是在70年代到80年代期间由不同的研究团队独立发明的。

用来求解目标函数关于多层神经网络权值梯度的反向传播算法(BP)只是一个用来求导的链式法则的具体应用而已。反向传播算法的核心思想是:目标函数对于某层输入的导数(或者梯度)可以通过向后传播对该层输出(或者下一层输入)的导数求得(如图1)。反向传播算法可以被重复的用于传播梯度通过多层神经网络的每一层:从该多层神经网络的最顶层的输出(也就是改网络产生预测的那一层)一直到该多层神经网络的最底层(也就是被接受外部输入的那一层),一旦这些关于(目标函数对)每层输入的导数求解完,我们就可以求解每一层上面的(目标函数对)权值的梯度了。

达到之前那种有pre-train的效果。通常情况下,输入层和输出层以外的神经单元被称为隐藏单元。隐藏层的作用可以看成是使用一个非线性的方式打乱输入数据,来让输入数据对应的类别在最后一层变得线性可分。

实践中,如果在大的网络中,不管使用什么样的初始化条件,局部最小解并不算什么大问题,系统总是得到效果差不多的解。最近的理论和实验表明,局部最小解还真不是啥大问题。相反,解空间中充满了大量的鞍点(梯度为0的点),同时鞍点周围大部分曲面都是往上的。所以这些算法就算是陷入了这些局部最小值,关系也不太大。

2006年前后,CIFAR(加拿大高级研究院)把一些研究者聚集在一起,人们对深度前馈式神经网络重新燃起了兴趣。研究者们提出了一种非监督的学习方法,这种方法可以创建一些网络层来检测特征而不使用带标签的数据,这些网络层可以用来重构或者对特征检测器的活动进行建模。通过预训练过程,深度网络的权值可以被初始化为有意思的值。然后一个输出层被添加到该网络的顶部,并且使用标准的反向传播算法进行微调。这个工作对手写体数字的识别以及行人预测任务产生了显著的效果,尤其是带标签的数据非常少的时候。

然后,还有一种深度前馈式神经网络,这种网络更易于训练并且比那种全连接的神经网络的泛化性能更好。这就是卷积神经网络(CNN)。当人们对神经网络不感兴趣的时候,卷积神经网络在实践中却取得了很多成功,如今它被计算机视觉团队广泛使用。

图2卷积神经网络内部

卷积层的作用是探测上一层特征的局部连接,然而池化层的作用是在语义上把相似的特征合并起来,这是因为形成一个主题的特征的相对位置不太一样。一般地,池化单元计算特征图中的一个局部块的最大值,相邻的池化单元通过移动一行或者一列来从小块上读取数据,因为这样做就减少的表达的维度以及对数据的平移不变性。两三个这种的卷积、非线性变换以及池化被串起来,后面再加上一个更多卷积和全连接层。在卷积神经网络上进行反向传播算法和在一般的深度网络上是一样的,可以让所有的在过滤器中的权值得到训练。

20世纪90年代以来,基于卷积神经网络出现了大量的应用。最开始是用时延神经网络来做语音识别以及文档阅读。这个文档阅读系统使用一个被训练好的卷积神经网络和一个概率模型,这个概率模型实现了语言方面的一些约束。20世纪90年代末,这个系统被用来美国超过10%的支票阅读上。后来,微软开发了基于卷积神经网络的字符识别系统以及手写体识别系统。20世纪90年代早期,卷积神经网络也被用来自然图形中的物体识别,比如脸、手以及人脸识别(facerecognition)。

图3从图像到文字

尽管卷积神经网络应用的很成功,但是它被计算机视觉以及机器学习团队开始重视是在2012年的ImageNet竞赛。在该竞赛中,深度卷积神经网络被用在上百万张网络图片数据集,这个数据集包含了1000个不同的类。该结果达到了前所未有的好,几乎比当时最好的方法降低了一半的错误率。这个成功来自有效地利用了GPU、ReLU、一个新的被称为dropout的正则技术,以及通过分解现有样本产生更多训练样本的技术。这个成功给计算机视觉带来一个革命。如今,卷积神经网络用于几乎全部的识别和探测任务中。最近一个更好的成果是,利用卷积神经网络结合回馈神经网络用来产生图像标题。

图4词向量学习可视化

图5递归神经网络

类比于将法语句子的意思翻译成英语句子,同样可以学习将图片内容“翻译”为英语句子(如图3)。这种编码器是可以在最后的隐层将像素转换为活动向量的深度卷积网络(ConvNet)。解码器与RNNs用于机器翻译和神经网络语言模型的类似。近来,已经掀起了一股深度学习的巨大兴趣热潮(参见文献[86]提到的例子)。

RNNs一旦展开(如图5),可以将之视为一个所有层共享同样权值的深度前馈神经网络。虽然它们的目的是学习长期的依赖性,但理论的和经验的证据表明很难学习并长期保存信息。

除了简单的记忆化,神经图灵机和记忆网络正在被用于那些通常需要推理和符号操作的任务,还可以教神经图灵机“算法”。除此以外,他们可以从未排序的输入符号序列(其中每个符号都有与其在列表中对应的表明优先级的真实值)中,学习输出一个排序的符号序列。可以训练记忆网络用来追踪一个设定与文字冒险游戏和故事的世界的状态,回答一些需要复杂推理的问题。在一个测试例子中,网络能够正确回答15句版的《指环王》中诸如“Frodo现在在哪?”的问题。

无监督学习对于重新点燃深度学习的热潮起到了促进的作用,但是纯粹的有监督学习的成功盖过了无监督学习。在本篇综述中虽然这不是我们的重点,我们还是期望无监督学习在长期内越来越重要。无监督学习在人类和动物的学习中占据主导地位:我们通过观察能够发现世界的内在结构,而不是被告知每一个客观事物的名称。

在未来几年,自然语言理解将是深度学习做出巨大影响的另一个领域。我们预测那些利用了RNNs的系统将会更好地理解句子或者整个文档,当它们选择性地学习了某时刻部分加入的策略。

原文标题:深度学习综述:Hinton、YannLeCun和Bengio经典重读

长沙市望城经济技术开发区航空路6号手机智能终端产业园2号厂房3层(0731-88081133)

THE END
1.重塑互联网体验的未来之路,在线点网页的革新与发展摘要:在线点网页正成为重塑互联网体验的未来之路。它通过提供便捷、个性化的网络服务,为用户带来全新的浏览体验。在线点网页致力于优化网页操作,提升用户交互体验,让互联网更加智能、高效。随着技术的不断进步,在线点网页将继续引领互联网发展,为用户创造更美好的网络世界。 http://www.cnlhdq.cn/post/1739.html
2.震撼来袭!500有效粉丝一小时搞定:一小时内Le线:瞬间获取500位真实一小时内Le线:瞬间获取500位真实粉丝技巧分享!在当今社交媒体时代,粉丝数量已成为衡量一个个人或品牌影响力的重要指标。然而,想要在短时间内获得大量粉丝并非易事。本文将分享http://www.jiuyu8.com/post/52459.html
3.在线什么意思2. 在多种场景中的应用:在线这个词在不同的场合有不同的含义。例如,在线学习指的是通过网络进行的学习活动;在线游戏则是指通过网络进行的游戏;在线支付则是指通过电子支付手段完成的支付行为。其核心特点是都可以通过网络进行连接和操作。3. 与离线相对:在线与离线是一对相对的概念。离线指的是设备https://zhidao.baidu.com/question/821068128447516892.html
4.modelscope离线区别在modelscope-funasr,离线和在线的版本在处理音频时有什么区别吗? 在modelscope-funasr同样是paraformer-large模型,离线和在线的版本在处理音频时有什么区别吗? 问答 2024-07-31 来自:开发者社区 modelscope-funasr离线版和实时版有什么区别呀?我看都支持文件和实时语音呀? modelscope-funasr离线版和实时版有https://www.aliyun.com/sswb/1153927.html
5.LE旧闻:0.91版本开放看新帖最后纪元在最后纪元中有了一个全新的方式来获得传奇物品,以及在这个补丁中不断扩大的独特物品名单,我们很高兴看到每个人都能想出什么样的构建! 明天我们会再回来,看看一些新的可怕的敌人和模型将在Beta补丁0.9.1烈焰升腾。 091-幻化商店改进 介绍 旅行者,你可能已经意识到,昨天的公告给了我们另一个机会来赢得我们作为社区https://www.caimogu.cc/post/369360.html
6.浙江天齐电气有限公司(TIBOX防水盒,防水接线盒,九折型材机箱机柜浙江天齐电气有限公司(TIBOX)是一家集研发、生产、工程、销售为一体的中外合资企业。产品远销东南亚、欧洲、美洲等国家和地区,遍布世界各地。主要经营:成套电器、金属机柜、挂式机柜、落地式机柜、网络机柜、总线接线盒、塑料机柜、塑料防水防尘接线盒、塑料密封盒、工业接插装置、温控、充电桩、成套、光伏汇流箱等产品http://www.tibox.cn/xxxr69131131.html
7.testopenback.axbinsur.com/kta30986364.html对此,一位项目周边居民在接受《证券日报》记者采访时表示:“这里的房子就算降到5000元(每平方米)也不敢买,谁知道什么时候能动工,什么时候能交房?”——。 多人被困在地铁站内?。 艾特出你身边需要这种知识的朋友 区块链协会高级顾问MarisaT.Coppel表示,Gensler不顾业界让SEC发布明确的规则制定和指导意见的呼吁,http://testopenback.axbinsur.com/kta30986364.html
8.如何采用离线的GgleMapAPI加载离线谷歌地图的方法.docx1如何采用离线的GoogleMapAPI加载离线谷歌地图的方法一、下载示例数据这里以《水经注万能地图下载器》为你说明如何下载谷歌卫星地图。安装万能地图下载器以后,软件启动时会显示选择在线地图的对话框,请选择“卫星.谷歌”即会显示在线的谷歌卫星地图窗口,如下图所示。卫理读批下致亚控产品梅法由于只是为了作演示说明如何用https://m.renrendoc.com/paper/268310115.html
9.最后纪元LE1.0版本完全离线模式简介最后纪元 离线版 最高画质 最后纪元-萌新通用过滤器使用方法 【Last Epoch最后纪元】死灵法 1-10级 在线模式 开荒实况 P1 【最后纪元/ Last Epoch 】-(4K画质丨全10章丨主线丨完结) 【免费分享】最后纪元下载安装教程 最新v1.0.2.1豪华中文离线版 带全新资料片优化电脑兼容 学习版凝聚力白嫖解压即玩 https://xbeibeix.com/video/BV1qm411U7rT
10.[新人求助]poe的玩家来评价一下隔壁le到底是个什么级别的游戏le目前103小时,其中35小时左右是1.0之前的,30小时是离线玩术士的,剩下是在线模式玩了弩炮训鹰。如果http://g.nga.cn/read.php?tid=39487299&page=2
11.双离线支付概念jiftle据央行介绍, DC/EP 可以实现“双离线支付”,即便付款方和收款方双方都处于离线状态,一样能完成交易。 其实离线支付的功能并不新鲜,微信和支付宝都已经实现了,这可以让我们在一些场景“先享后付”。但这种离线支付一般只能让付款方离线,而收款方必须在线,并将离线的付款信息传到平台服务器端进行校验。 https://www.cnblogs.com/jiftle/p/14681744.html
12.乐檬K3Note(天籁版/双4G)UC浏览器下载联想LEMENGK3NOTEUCZOL手机软件免费提供最新的联想LEMENGK3NOTEUC浏览器下载,包括联想LEMENGK3NOTEUC浏览器介绍、点评、使用详情等,让您便捷下载,放心使用https://sj.zol.com.cn/lenovomobile/lemengk3note/detail_20018.shtml
13.和利时推出LE系列PLC新品汽车设计与制造资讯引言LE系列PLC可以胜任任何领域的应用。https://partners.zaoche168.com/detail/_01-ABC00000000000212984.shtml
14.科学网—最佳46款免费软件(同步精译版)34最佳免费离线浏览软件 35最佳免费上传/下载监视工具 36最佳免费TCP设置优化工具 37最佳免费文件清理工具 38最佳免费资源监视工具 39最佳免费桌面便笺工具 40最佳免费安全删除工具 41最佳免费注册表编辑器 42最佳免费进程查看工具 43最佳免费系统信息查看工具 https://blog.sciencenet.cn/blog-66445-40404.html
15.塔科夫le辅助有什么用逃离塔科夫离线辅助TT没效果功能多什么是塔科夫le辅助? 塔科夫le辅助是一款可以帮助玩家更好地进行塔防游戏的工具。它可以提供各种有用的功能,从更好地理解游戏机制,到实时帮助你制定更好的游戏策略。使用塔科夫le辅助,可以帮助你更轻松地通关不同的游戏关卡。 塔科夫le辅助有哪些功能? 塔科夫le辅助提供了多种有用的功能,包括: http://wjq123.com/youxi/zixun/19550.html
16.行业新星:和利时LE系列PLC震撼上市国际工业自动化网4、在线监控和离线模拟功能: LE系列编程软件可以在线实时监控PLC的运行情况,在离线状态下可以模拟程序的运行,调试程序的逻辑。 5、密码保护功能 LE编程软件支持程序上传功能,同时可以设定密码保护,保证程序文件的安全性。 功能强大 应用广泛 LE系列PLC可以应用于绝大多数项目,如恒压供水、暖通空调、纺织机械、包装机械、https://www.iianews.com/ca/_01-ABC00000000000212947.shtml
17.大数据面试题集数据治理面试题7.你们最大的表是什么表,数据量多少 ng日志表,三端(app,web,h5)中app端日志量最大,清洗入库后的数据一天大概xxxxW 8.数仓架构体系 根据实际情况回答 离线:datax,hive,hadoop,spark,kylin 实时:lotstash,kafka,sparkstreaming,flink,hbase,es 9.数据平台是怎样的,用到了阿里的那一套吗? https://blog.csdn.net/hzp666/article/details/121602332
18.Le+app软件下载Le+最新版Le+是一款非常好用的家居智能软件需要的可以下载Le+远程操作一下的,包括Le+球泡、随意开关、语音小乐、智能遥控器、无线网关等设备,每时每刻都可以对家里的智能家居管控,一起的模式都可以选择,非常方便智能哦。https://www.lanrentuku.com/soft/129934.html
19.mobilelegendsbangbang手游2024下载mobilele gends bang bang官方版中文名称:传奇对决是一款风靡全球的模拟对战手游。玩家可以通过快速匹配选择不同的英雄完成对决,还可以实时开启语音进行在线交流和对战!全新的英雄极限和装备组合,绝对让你感受到触手可及的绝对快感!如果你喜欢的话,千万不要错过! https://www.shangfenbao.com/game/9563.html
20.谁住过加利波利LeSuitedelDormiglione,是否推荐?要去了,请问有人住过Le Suite del Dormiglione吗?附近的交通方便吗? 要去了,请问有人住过Le Suite del Dormiglione吗?附近的交通方便吗? 关注我来回答 全部回答(3) 必备旅行险 Hot Gabby90032510 Le Suite del Dormiglione旅馆位于加里波利(Gallipoli),距离Baia Verde海滩3.2公里,各处均覆盖免费WiFi。https://m.qyer.com/ask/question/2384793.html
21.在线式归档和离线式归档是什么意思?有大神知道么?问题描述:在线式归档和离线式归档是什么意思?邀请专家回答 我要回答全部回答 ul20190624091641198 2021-04-30 15:49:51 归档的两种方式 0 0 提交答案 收藏 邀请专家回答问题 发送邀请提醒TA回答,很快就能得到答案喔,每题最多可邀10人 xiabei 答题: 35765 被赞: 31514 邀请回答 yulele 答题: 20051 被http://m.zhuyew.cn/ask_info_67544.html
22.GitHubjosonle/Coding学习记录的一些笔记,以及所看得一些电子书eBooks、视频资源和平常收纳的一些自己认为比较好的博客、网站、工具。涉及大数据几大组件、Python机器学习和数据分析、Linux、操作系统、算法、网络等 - josonle/Coding-Nowhttps://github.com/josonle/Coding-Now/
23.Le+免费版下载Le+最新版手机版下载v4.1.2Le+是为乐尚科技集团智能家居系统设备提供的移动配套设施软件。您可以使用该软件自动连接家中的LeStyle智能产品,包括Lestyle灯泡和随机电源。交换机、视频语音音乐、智能遥控器、无线网关等设备。让生活更加便捷、智能,用户可以通过软件连接家里所有的智能家居,非常方便。 软件功能 1、如果APP上显示灯具离线,并且点击图标https://www.dianlut.com/soft/702467.html
24.MDAP:可观测性数据分析平台设计与实践OSCHINA4)Boussole 作为实时分析引擎,从数据源拉取数据并经过前置清洗,通过用户在平台中定义的指标和维度以及汇聚方式实时聚合后,将产生的结果数据落入持久化存储,用户通过平台前端配置的相关视图及 Dashboard 实时观测这些最新汇聚出的数据结果,这些结果做为告警的数据源,降低反复查询 ClickHouse 等数据库的频度,减少对页面访问https://my.oschina.net/techatshopee/blog/5552216
25.请问下更新完了之后用LE离线个人生涯进场闪退问题更新之后我用LE进游戏,个人生涯模式,开始比赛强化完目标,进场一发球就闪退这是什么情况,求大佬解惑 https://bbs.3dmgame.com/thread-6465782-1-1.html