人工智能:让机器拥有学习能力

最近,国内外掀起了一阵讨论人工智能的热潮,其背后主因是以谷歌和脸书为代表的高新技术企业广泛应用机器学习以及深度学习技术开始显现出了良好的效果。特别是在语音识别和图像识别两个领域,这几年的提升非常快。谷歌在2014年将语音识别的精准度从2012年的84%提升到98%,而脸书的人脸识别精度在短短几年里甚至超过人类肉眼的水平。

与此同时,各大企业开始了一场抢夺人工智能人才的大战,比如谷歌设立了“谷歌大脑计划”,并在2014初斥资5亿美元收购了人工智能创业公司DeepMind。国内的搜索巨头百度也不甘示弱,高薪从谷歌挖来了斯坦福大学人工智能专家吴恩达负责“百度大脑计划”。那么,人工智能到底是什么?其经过了什么样的发展历程?未来的人工智能到底会是什么样子?就此,科技日报记者采访了日本KDDI研究所研究员、通讯与网络专家吴剑明博士。

人工智能是如何出现的?

那么到底什么是人工智能呢?为什么人工智能之路会如此的沧桑坎坷呢?吴剑明说,顾名思义,人工智能就是让机器拥有学习能力,甚至能够像人类一样去思考工作。在人工智能的早期,有些科学家非常乐观地认为,随着计算机的普及和CPU计算能力的提高,人工智能的实现指日可待。不少早年的科幻电影描述,到了2000年,机器人几乎无所不能。但事实证明,人工智能的发展没有预期的那么美好和顺利,因为人类对人脑机制的理解还是有道迈不过去的坎儿。

一般人看来,人工智能属于计算机科学的范畴,但实际上人工智能覆盖了计算机科学、数学、心理学、哲学和语言学等几乎所有自然科学和社会科学学科,要想有所突破,仅仅靠精通计算机的专家学者和技术人员是远远不够的。幸运的是,强攻不果,迂回之战却有了突破,近年来随着机器学习以及深度学习技术的成熟,人类离人工智能的梦想实现还是实实在在地迈出了一大步。

发展历程:从经典数理逻辑到专家系统

人工智能从出现发展到现在,经历了一个比较曲折的过程。

吴剑明指出,人工智能从1956年概念建立至今,最初的30年是逻辑学派占主导地位,主要是因为逻辑推理和启发式搜索在智能模拟中避开了当时知之甚少的大脑思维规律中深层次的复杂问题,利用了比较成熟有效的逻辑学方法。这在当时计算机性能不高、普及率也很低的条件下显得简单灵活、见效快,是一个捷径。通过计算机实现的人工智能很快在定理证明、问题求解、模式识别等关键领域取得了重大突破,崭露头角。于是早年的科学家们乐观地认为,人工智能与传统计算机程序的本质差别在于它能够进行逻辑推理,依靠逻辑推理定理的完善和计算机的高性能CPU以及大容量存储设备的普及,可以在不久的将来完全解决智能模拟问题。

吴剑明称,事实证明,通过经典数理逻辑的方法是实现不了真正的人工智能的,科学家需要找到其他办法来解决所遇到的难题。

他说,在此之后的10多年,也就是80年代开始,人工智能进入了专家系统发展的黄金时代。科学家们发现,人类之所以能快速高效地解决各种复杂问题,不仅是由于人有逻辑推理能力,更由于人具有知识,特别是有关领域的专门知识。这时期尽管也属于前面提到的弱人工智能时代,但确定了基于知识的逻辑推理在智能模拟中的重要地位,人工智能开始从实验室走向实际应用。

但在这个时期,专家系统的瓶颈问题也显现了,那就是知识获取的途径一直没有得到良好的解决,主要原因在于不像现在有互联网,有云计算,有无处不在的智能手机,那个时代专家知识库的构建常常是没有完备性和可靠性保证的经验知识,专家学者和技术人员不得不依靠各种经验性的非精确推理模型。而且,人类思维面临的实际问题中,只有很少一部分是可以确切定义的确定性问题,大部分是带有不确定性的问题。所以当知识工程深入到这些问题时,经典数理逻辑的局限性不可避免地暴露出来了。尽管弱人工智能时代使人工智能理论有了长足的发展和进步,但离实用还有比较大的距离,一直到2000年后机器学习和深度学习的出现,科学家们才发现终于找对了方向。

机器学习:其实是“旧瓶装新酒”

吴剑明指出,如果2000年前是弱人工智能时代,那么2000年之后就可以称为强人工智能时代。

吴剑明说,与弱人工智能相比,强人工智能在最近的十多年里慢慢成为主流。强人工智能又称仿生方法,这个方法认为,人工智能应该专注于模拟人脑的结构机制,也就是说通过计算机模拟人的思维过程,应该通过研究神经元的互相合作机制,而不是逻辑学运算过程。这一学派重视对人脑模型的研究,谷歌就是强人工智能技术的推土机之一。

吴剑明说,在传统上,如果我们想让计算机工作或是按照弱人工智能的方式运作,我们会给它编好一段段的指令,然后计算机就会遵照这个指令忠实地一步步执行下去,或是按照事先制定好的知识逻辑公式推导下去。有前因才会有后果。但这样的方式仍然只属于机器的范畴而不是人工智能。强人工智能和弱人工智能的区别就在于,它们不是接受事先安排好的指令或是逻辑推论,而是从输入的数据里自己发现事物的规律。

吴剑明所说的推动强人工智能迅速发展的机器学习技术。

他认为,近年来大放异彩的机器学习其实是“旧瓶装新酒”。早在1956年人工智能概念出现后不久,就有了对机器学习的研究,但之后迟迟没有进展。和前面提到的专家系统类似,原因在于那个时代知识或是数据获得的途径非常少,难度以及成本又非常大。

机器学习的思想并不复杂,它模拟人类在生活中学习成长的过程,从数据中自动分析获得规律,并利用规律对未知数据进行预测。因为机器学习算法中涉及了大量的统计学理论,所以也被称为统计学习理论。

换句话说,机器学习的本质就是将人的操作/思维过程的输入与输出记录下来,然后统计(又叫做训练)出一个模型用来对新的数据进行预测,使得这个模型对输入输出达到和同人类相似的表现,这种方式也慢慢成了现代强人工智能最基本的核心理念。

大家直观地想象一下人和机器的区别在哪里?其实不在于弱人工智能强调的计算能力、存储能力,或是推理能力,任何人和机器最大的区别在于,人类在成长、生活过程中积累了很多的历史与经验,人类会定期对这些经验进行“归纳”,获得生活的“规律”。当遇到未知问题时,人类会使用这些“规律”对未来进行“推测”,从而指导自己的生活和工作,甚至于去创造新的东西出来。我们老祖宗说得好,“以史为鉴,可以知兴替;以人为鉴,可以明得失”,这与机器学习的思想是极为接近的。机器学习中的“训练”与“预测”过程,也可以分别精确地一一对应到人类的“归纳”和“推测”过程。

吴剑明说,随着现代互联网和个人计算机的普及,以及智能手机的崛起,海量数据和知识的获得变得非常容易和低成本了,这也直接促进了机器学习的飞速发展和实用性的迅速提高。当训练数据的样本足够大,学习算法方向对头的话,就有望接近极限,达到甚至超过人类的能力。比如前几年“谷歌大脑”通过从网络上的上千万张图片学习建立各种各样的猫的品种、颜色、姿势和拍摄角度等特征量,然后对于任意一张图片,它就可以从中把“猫”准确地识别出来。

深度学习:技术进步使之终有用武之地

吴剑明指出,现在除了机器学习,人工智能还出现了一个叫“深度学习”的概念。深度学习是机器学习研究中的一个新的领域,和机器学习相比,它让人工智能又前进了一步。深度学习在机器学习的基础上进一步深入模拟人脑进行分析学习的神经网络,它模仿人脑的机制来训练和预测数据,例如图像、声音和文本。

吴剑明介绍,和大多数机器学习技术需要事先给训练数据提取特征做标注不同,深度学习直接把海量数据投放到算法中,系统会自动从数据中学习。比如“谷歌大脑”识别猫的算法,在训练数据的时候不用告诉机器“这是一只猫”,深度学习系统自己找到了什么是“猫”这个分类。

既然手工选取特征不太好,人类也不可避免的有主观偏差,那么能不能自动地学习一些特征呢?吴剑明指出,深度学习就是用来干这个事情的,它的一个别名UnsupervisedFeatureLearning,顾名思义,Unsupervised的意思就是不要人参与特征的选取过程。

吴剑明介绍说,这类研究最早起步的契机是,研究瞳孔与大脑皮层神经元的对应关系的科学家们发现了一些有趣的现象,人眼和大脑合作识别看到物体时,通过神经元互相合作很可能有一个分层次识别过程。具体的讲,从原始信号摄入开始(瞳孔摄入像素Pixels),接着做初步处理(大脑皮层某些细胞发现像素色块间边缘的局部变化特征),然后下一步抽象(大脑皮层判定眼前的物体的形状、颜色、质地等),最后再进一步抽象(从周围的场景、物体和物体间的空间位置关系等等)确定识别的物体。

深度学习正是运用了类似的分层次抽象思想,更高层次的概念从低层次的概念学习得到,而每一层都自底向上,对没有人工标注的数据进行学习,最后再用人工监督自顶向下反向进行调优。这一点也为深度学习赢得了重要的优势。

吴剑明指出,深度学习的实质,是通过构建具有很多隐层的机器学习模型和海量的训练数据,来学习更有用的特征,从而最终提升分类或预测的准确性。区别于传统的机器学习,深度学习的不同在于:首先,强调了模型结构的深度,通常有5层、6层甚至10多层的隐层节点;其次,明确突出了无监督特征学习的重要性,也就是说,通过逐层特征变换,将样本在原空间的特征表示变换到一个新特征空间,从而使分类或预测更加容易。与机器学习所需要的依靠人工建立特征的方法相比,利用大数据来自动提取学习特征,是我们朝着真正的人工智能迈进的又一步。

在另一方面,和传统人工神经网络的迭代训练需要过于复杂的计算量不同,深度学习并不同时训练所有层,辛顿教授提出了更为有效的降低训练上的计算量和减少训练偏差的方法。简单的说,就是自底向上每次只训练一层网络,通过非监督学习“逐层初始化”(layer-wisepre-training)网络,当所有层训练完之后,再自顶向下反向调教(backpropagation)优化。打个比方,人类的大脑发育初期,大脑每一部分的职责分工并不是明确的,我们对外界事物的理解由浅到深也是出自于本能或是实践,而去了学校学习后则可以通过后期教育来纠正自己错误的认识,进而对事物有更为体系和深入的理解。

即使这样,深度学习也是需要很大的计算量的,好在近年来,得益于计算机速度的提升、大规模集群技术的兴起、GPU的应用以及众多优化算法的出现,耗时数月的训练过程可缩短为数天甚至数小时,深度学习终于在实践中有了用武之地。

未来发展:通过仿生学思路实现突破

吴剑明指出,目前世界各科技发达国家人工智能的发展路线不尽相同。和其他科技领域有些相像,在人工智能行业,一直是欧美在带头创造新理论,而日本则是在改良和应用上下工夫。相对来说,日本在硬件方面,比如机器人的精密机器制造、机器人仿人运动方面有优势,但在关键的人工智能理论方面,新创或是原创的理论很少,所以不管在学术界还是在产业界,目前看来还不如欧美,特别是美国那么活跃。此外,可能和日本经济的长期不景气有关,近年来一些日本大公司对研发投入的决心和长期眼光还不够。比如在语音识别领域,由于谷歌走在了前面,一些日本大公司干脆就放弃了自家的语音识别技术转而使用谷歌的技术。但这样一来,人工智能的关键入口和背后的大数据就被谷歌给夺走了,这也导致在人工智能领域很难再翻身超越。

至于哪个路线的未来性更大,吴剑明表示,尽管机器学习和深度学习在语音、图像、文本识别上有了长足的进步,也让计算机变得聪明智能了很多,但和人类所具有的智能相比,仍然有本质区别。比如计算机能精确识别人脸、物体,但是却无法识别如张三闯红灯、李四喝醉了这样更为抽象的场景。

人类具有丰富的联想能力、理解能力、创造能力,要实现这些能力而又不通过建立人脑类似的机制,就会绕很大的弯路,几乎是不可能的。要真正实现强人工智能,必须借鉴人脑先进结构和学习思维的机制,再通过深度学习这样的方法进行规模、结构和机理上的模拟,通过仿生学思路实现人工智能的突破。

当然,人类是从低等生物经历几十亿年、在地球生态圈这么庞大的空间中进化而来,要获得人类这样充足的进化时空环境几乎是不可能的。在没有完全弄清大脑原理之前,通过模仿部分人脑原理来逐步渐进,可能是比较现实的办法。比如谷歌在收购DeepMind之后明确表示,不会首先将其应用在机器人部门,而是先从基础的语义识别开始。而百度也是将深度学习技术应用在具体的用户服务方面,比如说提高中文语音识别率、完善图像识别能力。所谓循序渐进,按部就班,就像人类一样有五感才会有思考,把人工神经网络低层的学习水平给完善了,才会有更抽象的高层的学习水平的突破。从这点来看,应该对深度学习未来进一步的理论发展充满希望。

吴剑明表示,深度学习运用在各个单独领域比如声音识别、图像识别时已经得到了很好的效果,当计算机不需要被事先告知明确数据含义,下一步能够融合吸收和理解各个部分的数据,起到1+1>2的作用时,人工智能也许将会被真正兑现。

THE END
1.西瓜书机器学习极简史机器学习的发展还不到100年,在这几十年的时间里,不同的时间阶段产生了不同的流派,抢占一时风头。但随着基础物理技术的进步,部分流派也慢慢归于历史。但它们的思想,当时面临的问题,却给后续的机器学习人们,留下了宝贵的财富。 在20世纪50年代到70年代初,人工智能处于“推理期“,那时人们以为只要赋予机器逻辑推理能https://www.jianshu.com/p/86ccc8703a04
2.机器学习的发展历程10.迁移学习(2017年):迁移学习旨在通过将从一个任务中学到的知识应用到另一个任务中,以加速学习过程或提高性能。迁移学习在数据稀缺或标注困难的情况下表现出色。 以上是机器学习发展历程中的一些重要里程碑事件,随着技术和应用的不断推进,相信机器学习将在未来继续发展壮大。?https://wenku.baidu.com/view/43bf5fb3f211f18583d049649b6648d7c1c708db.html
3.机器学习发展历史回顾腾讯云开发者社区机器学习发展历史回顾 机器学习是现阶段解决很多人工智能问题的主流方法,作为一个独立的方向,正处于高速发展之中。最早的机器学习算法可以追溯到20世纪初,到今天为止,已经过去了100多年。从1980年机器学习称为一个独立的方向开始算起,到现在也已经过去了近40年。在这100多年中,经过一代又一代人的努力,诞生出了https://cloud.tencent.com/developer/article/1329605
4.机器学习发展历程.ppt机器学习发展历程.ppt 44页内容提供方:123***6651 大小:3.73 MB 字数:约4.62千字 发布时间:2019-10-14发布于湖北 浏览人气:126 下载次数:仅上传者可见 收藏次数:0 需要金币:*** 金币 (10金币=人民币1元)机器学习发展历程.ppt 关闭预览 想预览更多内容,点击免费在线预览全文 免费在线预览全文 *https://max.book118.com/html/2019/1014/6103031102002113.shtm
5.机器学习发展历程与机器学习应用之道从机器学习发展的过程上来说,其发展的时间轴如下所示: 机器学习发展历程 从上世纪50年代的图灵测试提出、塞缪尔开发的西洋跳棋程序,标志着机器学习正式进入发展期。 60年代中到70年代末的发展几乎停滞。 80年代使用神经网络反向传播(BP)算法训练的多参数线性规划(MLP)理念的提出将机器学习带入复兴时期。 https://m.elecfans.com/article/1859558.html
6.机器学习简史及发展趋势预测机器学习的发展史机器学习的发展和人工智能发展是离不开的,机器学习是人工智能研究发展到一定阶段的必然产物。人工智能的研究历史有着一条从以“推理”为重点,到以“知识”为重点,再到以“学习”为重点的自然、清晰的脉络。下面是人工智能发展的三个时期: 推理期: 时间为1950s~1970s,人们认为只要给机器赋予逻辑推理能力,机器就能具https://blog.csdn.net/scott198510/article/details/125053996
7.人工智能行业发展分析报告2、机器学习发展历程 3、机器学习市场规模 4、机器学习竞争格局 5、机器学习研究趋势 5.3.5 中国语音识别市场分析 1、语音识别基本概念 2、语音识别发展历程 3、语音识别市场现状 4、语音识别竞争格局 5.3.6 中国人机交互市场分析 1、人机交互基本概念 2、人机交互发展历程 3、人机交互竞争格局 5.3.7 中国人工智能https://bg.qianzhan.com/report/detail/f048b03a50c54565.html
8.人工智能的发展历程是怎样的?人工智能的发展历程可以总结为三个阶段:第一阶段:理论探索期(1956-1980年)。这一阶段奠定了人工智能的https://www.zhihu.com/question/515493539/answer/3038738759
9.了解人工智能生成内容(AIGC)的基本原理和应用AIGC的发展可以追溯到机器学习和自然语言处理等领域的进展,以及深度学习模型的快速发展。 ? AIGC的发展历程 AIGC的发展历程可以追溯到上世纪50年代的机器翻译研究,早期的机器翻译系统主要基于规则和统计方法。随着深度学习的兴起,特别是神经网络模型的发展,AIGC取得了显著的进展。深度学习模型通过大规模的数据训练,https://www.skycaiji.com/aigc/ai11801.html
10.发展历程SRIBD官网发展历程 研究院概述 发展历程 组织架构 人才队伍 深圳市大数据研究院 深圳市大数据研究院是在深圳市委、市政府的支持下于2016年3月组建,依托罗智泉教授领衔的大数据信息处理及应用创新团队,致力于建立国际一流、具有自主知识产权、核心技术优势突出的“大数据研究机构和协同研发平台”。 更多 2024 通过深圳市基础https://www.sribd.cn/node/140
11.Android技术架构演进与未来·Android系统开发·看云2013年到2018年,这个阶段Android 进入飞速发展期,被升级的有摄像头、内存、机身、芯片等,原来的3.5寸小屏已退出历史舞台,全面屏、刘海屏、水滴屏已成为当下主流屏幕方案。 2. 系统演进 系统演进趋势:每个Android大版本的更新迭代前行,历经10余年,在用户体验、流畅性、续航、安全、隐私、机器学习等方面都取得较大的http://static.kancloud.cn/alex_wsc/android_rom/1861204
12.知识图谱(knowledgegraph)——1.概念篇——张杰整理回顾知识工程四十年多来发展历程,总结知识工程的演进过程和技术进展,可以将知识 工程分成五个标志性的阶段,前知识工程时期、专家系统时期、万维网 1.0 时期,群体智能 时期以及知识图谱时期,如图 1 所示。 1950-1970 时期:图灵测试—知识工程诞生前期 人工智能旨在让机器能够像人一样解决复杂问题,图灵测试是评测智能的https://maimai.cn/article/detail?fid=1369045550&efid=KSrM2U2Y8RkYulBlHgXhbA
13.智慧民航的构想和探索行业研究(一)智慧化技术发展历程 随着技术的不断发展,人类社会已经步入了人工智能时代。目前的智能化,本质上是让机器学习模拟人,充分发挥数据的作用,更自动、更智能地帮助人类处理重复而又复杂的工作,是人类能力的延伸。而智慧化却代表着更高的层次,在智能的基础上,能进一步的归纳分析、理解联想,进而演化出审美、情感、思想等http://news.21csp.com.cn/c16/202202/11412645.html
14.广东财经大学2023年硕士研究生招生简章发展历程 学校始建于1983年,原名广东财经学院,起始办学层次为本科教育;1985年更名为广东商学院,2003年获得硕士学位授予权,2007年以“优秀”等级通过本科教学工作水平评估;2013年更名为广东财经大学,2021年获批为博士学位授予单位。 学校现有广州和佛山两个校区,占地面积2275亩,有全日制本科生、研究生31000多人,其中研究https://yzb.gdufe.edu.cn/2022/0914/c4690a165972/page.htm