人工智能(AI)机器学习(ML)深度学习(DL),到底他们哥仨是什么关系?

人工智能AI:模拟人脑,辨认哪个是苹果,哪个是橙子。

机器学习ML:根据特征在水果摊买橙子,随着见过的橙子和其他水果越来越多,辨别橙子的能力越来越强,不会再把香蕉当橙子。

机器学习强调“学习”而不是程序本身,通过复杂的算法来分析大量的数据,识别数据中的模式,并做出一个预测--不需要特定的代码。在样本的数量不断增加的同时,自我纠正完善“学习目的”,可以从自身的错误中学习,提高识别能力。

1、机器学习简史哲学上的三大终极问题:是谁?从哪来?到哪去?用在任何地方都是有意义的。——尼古拉斯·沃布吉·道格拉斯·硕德

1.1诞生并奠定基础时期

1949,Hebb,HebbianLearningtheory

赫布于1949年基于神经心理的提出了一种学习方式,该方法被称之为赫布学习理论。大致描述为:

假设反射活动的持续性或反复性会导致细胞的持续性变化并增加其稳定性,当一个神经元A能持续或反复激发神经元B时,其中一个或两个神经元的生长或代谢过程都会变化。Letusassumethatthepersistenceorrepetitionofareverberatoryactivity(or“trace”)tendstoinducelastingcellularchangesthataddtoitsstability.…WhenanaxonofcellAisnearenoughtoexciteacellBandrepeatedlyorpersistentlytakespartinfiringit,somegrowthprocessormetabolicchangetakesplaceinoneorbothcellssuchthatA’sefficiency,asoneofthecellsfiringB,isincreased

1950,AlanTuring,TheTuringtest

1950年,阿兰·图灵创造了图灵测试来判定计算机是否智能。图灵测试认为,如果一台机器能够与人类展开对话(通过电传设备)而不能被辨别出其机器身份,那么称这台机器具有智能。这一简化使得图灵能够令人信服地说明“思考的机器”是可能的。

2014年6月8日,一个叫做尤金·古斯特曼的聊天机器人成功让人类相信它是一个13岁的男孩,成为有史以来首台通过图灵测试的计算机。这被认为是人工智能发展的一个里程碑事件。

1952,ArthurSamuel,“MachineLearning”

可以提供计算机能力而无需显式编程的研究领域afieldofstudythatgivescomputertheabilitywithoutbeingexplicitlyprogrammed.

1957,Rosenblatt,Perceptron

1957年,罗森·布拉特基于神经感知科学背景提出了第二模型,非常的类似于今天的机器学习模型。这在当时是一个非常令人兴奋的发现,它比赫布的想法更适用。基于这个模型罗森·布拉特设计出了第一个计算机神经网络——感知机(theperceptron),它模拟了人脑的运作方式。罗森·布拉特对感知机的定义如下:

感知机旨在说明一般智能系统的一些基本属性,它不会因为个别特例或通常不知道的东西所束缚住,也不会因为那些个别生物有机体的情况而陷入混乱。Theperceptronisdesignedtoillustratesomeofthefundamentalpropertiesofintelligentsystemsingeneral,withoutbecomingtoodeeplyenmeshedinthespecial,andfrequentlyunknown,conditionswhichholdforparticularbiologicalorganisms.

3年后,维德罗首次使用Delta学习规则(即最小二乘法)用于感知器的训练步骤,创造了一个良好的线性分类器。

1967年,Thenearestneighboralgorithm

1967年,最近邻算法(Thenearestneighboralgorithm)出现,使计算机可以进行简单的模式识别。kNN算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。这就是所谓的“少数听从多数”原则。

1969,Minsky,XORproblem

图六XOR问题,数据线性不可分

1969年马文·明斯基提出了著名的XOR问题,指出感知机在线性不可分的数据分布上是失效的。此后神经网络的研究者进入了寒冬,直到1980年才再一次复苏。

1.2停滞不前的瓶颈时期

从60年代中到70年代末,机器学习的发展步伐几乎处于停滞状态。无论是理论研究还是计算机硬件限制,使得整个人工智能领域的发展都遇到了很大的瓶颈。虽然这个时期温斯顿(Winston)的结构学习系统和海斯·罗思(HayesRoth)等的基于逻辑的归纳学习系统取得较大的进展,但只能学习单一概念,而且未能投入实际应用。而神经网络学习机因理论缺陷也未能达到预期效果而转入低潮。

1.3希望之光重新点亮

1981,Werbos,Multi-LayerPerceptron(MLP)

图七多层感知机(或者人工神经网络)

伟博斯在1981年的神经网络反向传播(BP)算法中具体提出多层感知机模型。虽然BP算法早在1970年就已经以“自动微分的反向模型(reversemodeofautomaticdifferentiation)”为名提出来了,但直到此时才真正发挥效用,并且直到今天BP算法仍然是神经网络架构的关键因素。有了这些新思想,神经网络的研究又加快了。

在1985-1986年,神经网络研究人员(鲁梅尔哈特,辛顿,威廉姆斯-赫,尼尔森)相继提出了使用BP算法训练的多参数线性规划(MLP)的理念,成为后来深度学习的基石。

1986,Quinlan,DecisionTrees

在另一个谱系中,昆兰于1986年提出了一种非常出名的机器学习算法,我们称之为“决策树”,更具体的说是ID3算法。这是另一个主流机器学习算法的突破点。此外ID3算法也被发布成为了一款软件,它能以简单的规划和明确的推论找到更多的现实案例,而这一点正好和神经网络黑箱模型相反。

决策树是一个预测模型,他代表的是对象属性与对象值之间的一种映射关系。树中每个节点表示某个对象,而每个分叉路径则代表的某个可能的属性值,而每个叶结点则对应从根节点到该叶节点所经历的路径所表示的对象的值。决策树仅有单一输出,若欲有复数输出,可以建立独立的决策树以处理不同输出。数据挖掘中决策树是一种经常要用到的技术,可以用于分析数据,同样也可以用来作预测。

在ID3算法提出来以后,研究社区已经探索了许多不同的选择或改进(如ID4、回归树、CART算法等),这些算法仍然活跃在机器学习领域中。

1.4现代机器学习的成型时期

1990,Schapire,Boosting

1990年,Schapire最先构造出一种多项式级的算法,这就是最初的Boosting算法。一年后,Freund提出了一种效率更高的Boosting算法。但是,这两种算法存在共同的实践上的缺陷,那就是都要求事先知道弱学习算法学习正确的下限。

1995年,Freund和schapire改进了Boosting算法,提出了AdaBoost(AdaptiveBoosting)算法,该算法效率和Freund于1991年提出的Boosting算法几乎相同,但不需要任何关于弱学习器的先验知识,因而更容易应用到实际问题当中。

Boosting方法是一种用来提高弱分类算法准确度的方法,这种方法通过构造一个预测函数系列,然后以一定的方式将他们组合成一个预测函数。他是一种框架算法,主要是通过对样本集的操作获得样本子集,然后用弱分类算法在样本子集上训练生成一系列的基分类器。

1995,VapnikandCortes,SupportVectorMachines(SVM)

而神经网络遭受到又一个质疑,通过Hochreiter等人1991年和Hochreiter等人在2001年的研究表明在应用BP算法学习时,NN神经元饱和后会出现梯度损失(gradientloss)的情况。简单地说,在一定数量的epochs训练后,NN会产生过拟合现象,因此这一时期NN与SVM相比处于劣势。

2001,Breiman,RandomForests(RF)

决策树模型由布雷曼博士在2001年提出,它是通过集成学习的思想将多棵树集成的一种算法,它的基本单元是决策树,而它的本质属于机器学习的一大分支——集成学习(EnsembleLearning)方法。随机森林的名称中有两个关键词,一个是“随机”,一个就是“森林”。“森林”我们很好理解,一棵叫做树,那么成百上千棵就可以叫做森林了,这样的比喻还是很贴切的,其实这也是随机森林的主要思想—集成思想的体现。

其实从直观角度来解释,每棵决策树都是一个分类器(假设现在针对的是分类问题),那么对于一个输入样本,N棵树会有N个分类结果。而随机森林集成了所有的分类投票结果,将投票次数最多的类别指定为最终的输出,这就是一种最简单的Bagging思想。

1.5爆发时期

2006,Hinton,DeepLearning

在机器学习发展分为两个部分,浅层学习(ShallowLearning)和深度学习(DeepLearning)。浅层学习起源上世纪20年代人工神经网络的反向传播算法的发明,使得基于统计的机器学习算法大行其道,虽然这时候的人工神经网络算法也被称为多层感知机,但由于多层网络训练困难,通常都是只有一层隐含层的浅层模型。

2015年,为纪念人工智能概念提出60周年,LeCun、Bengio和Hinton推出了深度学习的联合综述。

深度学习可以让那些拥有多个处理层的计算模型来学习具有多层次抽象的数据的表示。这些方法在许多方面都带来了显著的改善,包括最先进的语音识别、视觉对象识别、对象检测和许多其它领域,例如药物发现和基因组学等。深度学习能够发现大数据中的复杂结构。它是利用BP算法来完成这个发现过程的。BP算法能够指导机器如何从前一层获取误差而改变本层的内部参数,这些内部参数可以用于计算表示。深度卷积网络在处理图像、视频、语音和音频方面带来了突破,而递归网络在处理序列数据,比如文本和语音方面表现出了闪亮的一面。

神经网络与支持向量机一直处于“竞争”关系。SVM应用核函数的展开定理,无需知道非线性映射的显式表达式;由于是在高维特征空间中建立线性学习机,所以与线性模型相比,不但几乎不增加计算的复杂性,而且在某种程度上避免了“维数灾难”。而早先的神经网络算法比较容易过训练,大量的经验参数需要设置;训练速度比较慢,在层次比较少(小于等于3)的情况下效果并不比其它方法更优。

神经网络模型貌似能够实现更加艰难的任务,如目标识别、语音识别、自然语言处理等。但是,应该注意的是,这绝对不意味着其他机器学习方法的终结。尽管深度学习的成功案例迅速增长,但是对这些模型的训练成本是相当高的,调整外部参数也是很麻烦。同时,SVM的简单性促使其仍然最为广泛使用的机器学习方式。

1.6启示与未来的发展

人工智能机器学习是诞生于20世纪中叶的一门年轻的学科,它对人类的生产、生活方式产生了重大的影响,也引发了激烈的哲学争论。但总的来说,机器学习的发展与其他一般事物的发展并无太大区别,同样可以用哲学的发展的眼光来看待。

机器学习的发展并不是一帆风顺的,也经历了螺旋式上升的过程,成就与坎坷并存。其中大量的研究学者的成果才有了今天人工智能的空前繁荣,是量变到质变的过程,也是内因和外因的共同结果。

机器学习的发展诠释了多学科交叉的重要性和必要性。然而这种交叉不是简单地彼此知道几个名词或概念就可以的,是需要真正的融会贯通:

深度学习的成功不是源自脑科学或认知科学的进展,而是因为大数据的驱动和计算能力的极大提升。可以说机器学习是由学术界、工业界、创业界(或竞赛界)等合力造就的。学术界是引擎,工业界是驱动,创业界是活力和未来。学术界和工业界应该有各自的职责和分工。学术界的职责在于建立和发展机器学习学科,培养机器学习领域的专门人才;而大项目、大工程更应该由市场来驱动,由工业界来实施和完成。

对于机器学习的发展前途,中科院数学与系统科学研究院陆汝铃老师在为南京大学周志华老师的《机器学习》一书作序时提出了六大问题,我觉得这些问题也许正是影响机器学习未来发展方向的基本问题,因此我摘录其中五个在此(有两个问题属于同一个主题,合并之):

第一种观点:退出历史舞台——没有人抱有这种想法。第二种观点:统计学习和符号学习结合起来——王珏教授认为,现在机器学习已经到了一个转折点,统计学习要想进入一个更高级的形式,就应该和知识相结合,否则就会停留于现状而止步不前。第三种观点:符号学习还有翻身之日——Chandrasekaran教授认为机器学习并不会回到“河西”,而是随着技术的进步逐渐转向基本的认知科学。迁移学习也许会给问题的解决带来一丝曙光?包括周志华老师在内的一些学者认为深度学习掀起的热潮大过它本身的贡献,在理论和技术上并没有太多的创新,只不过硬件技术的革命使得人们能采用原来复杂度很高的算法,从而得到更精细的结果。目前流行学习已经“有点意思了”,但数学理论的介入程度远远不够,有待更多数学家参与,开辟新的模式、理论和方法。大数据时代给机器学习带来了前所未有的机遇,但是同样的统计、采样方法相较以前有什么本质不同吗?又从量变过渡到质变吗?数理统计方法有没有发生质的变化?大数据时代正在呼吁什么样的机器学习方法?哪些方法又是大数据研究的驱动而产生的呢?2、机器学习基本概念

权威定义:

Arthursamuel:在不直接针对问题进行编程的情况下,赋予计算机学习能力的一个研究领域。

TomMitchell:对于某类任务T和性能度量P,如果计算机程序在T上以P衡量的性能随着经验E而自我完善,那么就称这个计算机程序从经验E学习。

当我们判断是否要使机器学习时,可以看看是不是以下的场景

3、机器学习分类

3.1、监督式学习SupervisedLearning

在监督式学习下,每组训练数据都有一个标识值或结果值,如客户流失对应1,不流失对应0。在建立预测模型的时候,监督式学习建立一个学习过程,将预测的结果与训练数据的实际结果进行比较,不断的调整预测模型,直到模型的预测结果达到一个预期的准确率。

分类Classification

回归Regression

排序Rank

匹配学习

3.2半监督学习

在半监督学习方式下,训练数据有部分被标识,部分没有被标识,这种模型首先需要学习数据的内在结构,以便合理的组织数据来进行预测。算法上,包括一些对常用监督式学习算法的延伸,这些算法首先试图对未标识数据进行建模,在此基础上再对标识的数据进行预测。如深度学习:

深度学习DeepLearning

深度学习是监督学习的匹配学习中人工神经网络延伸出来发展出来的。

3.3无监督学习UnsupervisedLearning

在非监督式学习中,数据并不被特别标识,学习模型是为了推断出数据的一些内在结构。

聚类Cluster

关联规则AssociationRule

3.4增强学习ReinforcementLearning

在之前的讨论中,我们总是给定一个样本x,然后给或者不给标识值或结果值(给了就是监督式学习,不给就是无监督式学习)。之后对样本进行拟合、分类、聚类或者降维等操作。然而对于很多序列决策或者控制问题,很难有这么规则的样本。比如,四足机器人的控制问题,刚开始都不知道应该让其动那条腿,在移动过程中,也不知道怎么让机器人自动找到合适的前进方向。

增强学习要解决的是这样的问题:一个能感知环境的自治agent,怎样通过学习选择能达到其目标的最优动作。这个很具有普遍性的问题应用于学习控制移动机器人,在工厂中学习最优操作工序以及学习棋类对弈等。当agent在其环境中做出每个动作时,施教者会提供奖励或惩罚信息,以表示结果状态的正确与否。例如,在训练agent进行棋类对弈时,施教者可在游戏胜利时给出正回报,而在游戏失败时给出负回报,其他时候为零回报。agent的任务就是从这个非直接的,有延迟的回报中学习,以便后续的动作产生最大的累积效应。

3.5其他

集成算法

集成算法用一些相对较弱的学习模型独立地就同样的样本进行训练,然后把结果整合起来进行整体预测。

THE END
1.解析人工智能三大算法机器学习深度学习与强化学习的核心之旅解析人工智能三大算法:机器学习、深度学习与强化学习的核心之旅 人工智能三大算法是现代计算机科学领域中的重要组成部分,它们分别是机器学习、深度学习和强化学习。每种算法都有其独特的特点和应用场景,共同推动了人工智能技术的发展。 机器学习:数据驱动的革命 机器学https://www.fmovhaqkz.com/shou-ji/530948.html
2.人工智能三大算法机器学习深度学习与强化学习的融合与应用前景在当今信息技术高速发展的时代,人工智能(AI)已经成为全球科技界关注的焦点。其中,机器学习、深度学习和强化学习被认为是人工智能领域中最重要的三大算法,它们分别代表了不同的研究方向和解决问题的手段。本文旨在探讨这三个关键算法,以及它们如何相互融合,并对未来的人工智能发展产生何种影响。 https://www.2gadecbu9.cn/xing-ye-dong-tai/433419.html
3.机器学习算法的数据增强:提高学习效率的关键方法数据增强(Data Augmentation)是一种在训练机器学习模型时,通过对现有数据进行改变而产生新数据的方法。数据增强的目的是提高模型的泛化能力,提高学习效率,减少需要的标注数据量,从而降低成本。数据增强在图像识别、自然语言处理、语音识别等领域都有广泛的应用。 https://blog.csdn.net/universsky2015/article/details/135801267
4.增强学习与深度学习的比较:同点与不同尽管增强学习和深度学习在理论和方法上有很大差异,但它们在实际应用中存在一定的联系。例如,深度学习可以用于模拟环境模型,增强学习可以利用深度神经网络作为价值函数或策略评估器。 3.核心算法原理和具体操作步骤以及数学模型公式详细讲解 3.1增强学习算法 3.1.1Q-Learning https://blog.51cto.com/universsky/9048294
5.7个流行的强化学习算法及代码实现本文介绍了流行的强化学习算法的发展和改进。 强化学习在近些年得到了越来越多的关注。虽然现在关于强化学习的资料有很多,但是许多读者仍然觉得强化学习入门比较困难,许多时候有一种似懂非懂或者 “知其然而不知其所以然”的感觉。甚至一些读者认为强化学习是一个黑盒子,很多东西数学上是解释不清的,这其实是一种误解https://zhuanlan.zhihu.com/p/690515680
6.最值得关注的10大深度学习算法腾讯云开发者社区今天给大家分享一下10大经典的深度学习算法。 首先,对比一下传统机器学习和深度学习的训练过程差异: 下图展示了传统机器学习算法与深度学习技术在数据量方面的性能比较。从图表中可以明显看出,随着数据量的增加,深度学习算法的性能也随之提升。 相比之下,传统机器学习算法的性能虽然会在一定程度上提升,但之后会趋于稳定(https://cloud.tencent.com/developer/article/2437425
7.深度增强学习PPO(ProximalPolicyOptimization)算法OpenAI出品的baselines项目提供了一系列deep reinforcement learning(DRL,深度强化学习或深度增强学习)算法的实现。现在已经有包括DQN,DDPG,TRPO,A2C,ACER,PPO在内的近十种经典算法实现,同时它也在不断扩充中。它为对DRL算法的复现验证和修改实验提供了很大的便利。本文主要走读其中的PPO(Proximal Policy Optimization)算法http://www.fpga7.com/ziyuan.asp?id=41
8.AlphaZero加强版AlphaTensor问世,发现史上最快矩阵乘法算法例如研究人员提出了一种序列增强学习技术,用于在乳房X光片中使用SVM检测微钙化(MC)簇时提高性能等。ML和模式识别算法对大脑成像有重大影响,从长远来看,ML领域的技术发展和放射学可以互惠互利。深度学习(DL)是ML的一个分支,它处理的是受大脑的生物和功能启发的算法(即ANN)。DL已经迅速成为医学影像领域评估医学图像的https://www.medsci.cn/article/show_article.do?id=97c6e419443f
9.BAT机器学习面试1000题系列(二)面试笔试整理3:深度学习机器学习面试问题准备(必会) 105.当机器学习性能遭遇瓶颈时,你会如何优化的? 可以从这4个方面进行尝试:基于数据、借助算法、用算法调参、借助模型融合。当然能谈多细多深入就看你的经验心得了。 这里有一份参考清单:机器学习系列(20)_机器学习性能改善备忘单 https://www.jianshu.com/p/4a7f7127eef1
10.2020年媒体技术趋势报告:13大领域89项变革全输出机器学习指的是一种应用算法来分析数据,从而可以更好地完成各种任务的系统,并且随着时间推移,它会越来越擅长这些任务。但这种系统也面临着效率问题:系统需要停下来解析数据。而最新研究表明,实时机器学习可以随数据获取而实时调整模型。这标志着数据移动方式以及我们检索信息方式的巨大变化。 https://36kr.com/p/5267903
11.博弈环境下的深度强化学习和传统的深度强化学习不同博弈环境下的深度学习通常使用增强学习算法来训练智能体。增强学习是一种通过与环境交互学习最优策略的方法。传统的深度学习通常使用监督学习算法。 3、求解目标 博弈环境下的深度学习的目标是通过与其他智能体竞争或合作来学习最佳行动策略。传统的深度学习通常是为了解决特定的任务或问题。 https://wap.sciencenet.cn/home.php?mod=space&uid=40841&do=blog&id=1418525
12.成为算法工程师需要学习哪些课程?算法工程师要求很高的数学水平和逻辑思维。需要学习高数,线性代数,离散数学,数据结构和计算机等课程。专业要求:计算机、电子、通信、数学等相关专业;学历要求:本科及其以上的学历,大多数是硕士学历及其以上;语言要求:英语要求是熟练,基本上能阅读国外专业书刊;必须掌握计算机相关知识,熟练使用仿真工具https://zhidao.baidu.com/question/1994330805504728707.html
13.2021届计算机科学方向毕业设计(论文)阶段性汇报基于多智能体增强学习的交互式图像分割算法研究 本课题旨在利用强化学习算法,将与人类的不断交互的信息引入到图像分割的过程中,从而实现交互式的图像分割,增加分割的准确率和收敛速度,最终降低分割所需要的标注成本。 目前现已基于开源的ppo强化学习算法进行修改,完成了算法主体部分的代码框架搭建,并且完善了数据处理、https://zhiyuan.sjtu.edu.cn/html/zhiyuan/announcement_view.php?id=3943
14.主动学习入门篇:什么是主动学习?有哪些具体应用1、随机采样策略(Random Sampling,RS):RS 不需要跟模型的预测结果做任何交互,直接通过随机数从未标注样本池筛选出一批样本给专家标注,常作为主动学习算法中最基础的对比实验。 2、不确定性策略(Uncertainty Strategy,US):US 假设最靠近分类超平面的样本相对分类器具有较丰富的信息量,根据当前模型对样本的预测值筛选出最https://www.scholat.com/teamwork/showPostMessage.html?id=9011
15.多模态学习情感计算:动因框架与建议前沿领域进入2010年后,情感计算被广泛应用于教育领域[1],期间各类学习系统利用情感计算技术发展起来,代表性的有情感导学系统(ATS)。该类系统通过采集学习者面部、语音等数据,利用机器学习算法分析与处理情感信息,以识别与反馈情感状态,进而为学习者提供个性化导学策略。此外,学习情感计算也从单模态走向多模态数据融合,其中,深度学https://www.eduwest.com/html/2022/qianyanlingyu_0301/678.html
16.YSGStudyHards/DotNetGuide:C#/.NET/.NETCore学习逻辑算法通常使用形式化的逻辑语言和符号进行描述和表达,以便于机器或计算机程序的理解和执行。 逻辑算法提升 小浩算法 Hello算法 AcWing在线题库 牛客网基础算法 CodeTop企业题库 在线算法刷题平台-力扣 labuladong的算法小抄 VisuAlgo可视化学习算法 程序员必须掌握的算法有哪些? C#常见逻辑算法 C#经典十大排序算法 https://github.com/YSGStudyHards/DotNetGuide