AI3.0,走向“大数据”与“大知识”融合的全新时代

4月17日下午,湛庐特别邀请圣塔菲研究所客座教授、《AI3.0》一书作者梅拉妮·米歇尔,中国科学院自动化研究所复杂系统管理与控制国家重点实验室主任王飞跃,驭势科技联合创始人、董事长兼CEO吴甘沙,清华大学计算机系副教授、智源青年科学家刘知远等国内外知名科学家和创业者,以及特别嘉宾达闼云端机器人小姜,一起探讨AI3.0时代的新商机和新生态。

这次全智能场景发布会第一次采用了演播室和户外智能场景双现场形式,在无人驾驶汽车和云端智能机器人的烘托下,全面展示了中国人工智能领域的创新实力和前沿进展。几位科学家、企业家跨界深度交流,共同探讨了人工智能发展现状,以及透视当下AI发展的关键问题,并对产业布局和政策提出了可供参考的建议,助力未来的想象与开创。

以下为清华大学计算机系副教授、智源青年科学家刘知远的演讲精华内容

清华大学计算机系副教授智源青年科学家刘知远

《AI3.0》的作者米歇尔教授通过深入浅出的方式,把人工智能的发展历程,特别是其内在的技术路线的逻辑呈现给了大家,并提出了人工智能未来发展将会面临的一些非常重要的命题,以及无人驾驶、自然语言处理等人工智能非常重要的应用场景。我相信从技术路线的发展上来讲,未来会有更多探索的可能性。我相信这是所有学者都在追寻的问题。

AI3.0,一个“大数据”和“大知识”融合的时代

说到“AI3.0”,那么必然存在“AI1.0”和“AI2.0”。人工智能学者有一个重要共识,那就是人工智能的发展已经历了两个非常重要的阶段:从“小数据”(smalldata)到“大数据”(bigdata),再到“智慧数据”(smartdata)的过程。从语言理解这个层面,我认为人工智能的发展基本上也可以划分成三个阶段。

第一个阶段,自然语言处理最初是从机器翻译开始的。最开始,我们通过人为地编写一些翻译的规则,再配一个词典,以实现机器翻译。这个阶段对应“AI1.0”。

后来,人们发现这个做法不可行,因为人类的语言千变万化,我们很难通过一套人工编写的规则来覆盖所有情形。到了20世纪90年代,有人提出用机器学习方法,通过大规模的数据,让人工智能自动学习翻译的规则。随后,人们进一步使用神经网络来挖掘每个词背后的深层语义信息,以实现对整句话的理解。这是第二个阶段,它对应的是“AI2.0”。

从自然语言处理这个角度来讲,人工智能在这一阶段已经达到一个新的高峰。我们在智源研究院的支持下做的“悟道”模型——超大规模的预训练模型,就是想要用互联网级别的大规模的文本数据来学习各种语言的语言模型。

多模态,人工智能认知世界的全新形式

人类的认知其实是多模态的,有视觉的、听觉的、语言的等,因此我们希望计算机在认识世界时也是多模态的。

米歇尔教授在《AI3.0》中也提到了,在自动驾驶方面,人工智能领域正越来越多地讨论关于赋予机器常识的重要性,人工智能对于语言、图像的理解需要各种各样的包括抽象能力、类比能力、常识在内的复杂知识的支持。未来的人工智能需要像人一样,构建出关于这个世界的全面的认知体系,这是非常重要的。

同时,我们希望利用数据驱动的方法从数据中获取更多的关于语言理解的知识,其实这就是fromdatatoknowledge(从数据到知识)。不过,我认为现在的这种“data追问”的方法实际上无法比较好地还原我们人类对这个世界的认知模型,包括抽象层次的结构、复杂的关系,不同类型的知识等。然而,现在的训练模型的确可以通过大规模的数据习得生成流畅语言的能力,这说明它其实已经学到了很多关于语言的知识,比如语法的规则等,互联网上的语言文本的数据,可以看成是我们大脑中语言能力的外在体现。所以,在我看来“data追问”的方法一定是未来的一个非常重要的需要继续坚持的路径。

“悟道1.0”是智源发布的一个最初版本,我们希望其能够不断演化,在各大高校和研究机构的支持下,利用大数据、大算力以及学生们的聪明才智,一起推动这个领域的发展。

重构人类的知识平台,人工智能的未来使命

在我看来,未来的计算机一定能够更好地服务于我们和我们社会,比如在人的生老病死、衣食住行等各个方面肯定都能发挥很重要的作用。

我主要是从事自然语言处理,具体来说是知识图谱方面的研究,我认为整个人类社会的发展其实是不断积累我们认识世界、改造世界的知识的过程,但其实就我们现在的社会来说,每个人的分工、知识体系其实都是高度专业化的,而且会越来越专业化。

每个人其实都只是整个人类知识的拼图里很小的一块,而且这一块可能会越来越小,因为整个拼图其实变得越来越大了,这时,对于人类社会来说,认识世界、改造世界会变得越来越难。那么,随着拼图越来越大,我们到底该如何学才能更高效地把通识教育学习得更好,这是我们应该思考的问题。比如,对于生物学家或者医生而言,他会面临一些挑战,从去年新冠疫情出现至今,关于新冠病毒的论文已经有几万篇了,那么对于从事这个领域研究的学者来说,他应该如何读这么多论文,其实本身我觉得对于学者来讲,或者说对于人类社会的每个人来讲,他想要再去创造新的知识就会变得越来越难,因为他所需的积累会变得越来越多。

所以,我认为人工智能未来的一个非常大的使命,就是帮助人类把这个平台构建起来,使其成为我们的一个外部知识库,这样一来,我们只需掌握如何去利用这个知识库,就可以更好地认识世界、改造世界。

每个人都能够借助人工智能,走向一个更高的地方

米歇尔教授在书中最后提到了6个问题,其中计算机能够具有创造性吗?我们距离创建通用的人类水平人工智能还有多远?都是非常关键的问题,需要我们不断地去探索并找到答案。

20世纪五六十年代的学者在面向未来时,他们也不知道该如何走,他们各自提出了一些技术路线,然后不断得以演化,这也是一个跌宕起伏的展过程。虽然人工智能至今只有近70年的历史,但其发展历程可谓波澜壮阔,经历过高峰,也经历过低谷。这一发展历程正体现了一代又一代的人工智能学者的不懈探索。

说到人工智能的发展,它源于很多领域专家的共同努力,比如数学家、控制论的专家、计算机专家以及脑科学家和神经科学家等。所以,人工智能其实是一个交叉学科,其中甚至包含一些哲学、伦理学方面的研究。

因此,未来人工智能的发展需要摒弃“人工智能就是一门独立的学科”这种观念,我们需要综合多学科的努力才能推动这个领域的发展。那么,在人才培养上,我们应该重视培养交叉学科的能力和专业素养,这是人工智能跟其他的学科发展的不同之处。

每个人都在不断地探索这个世界、获取新的知识,但是这些知识可能都是散落在各处的,我希望未来的人工智能像粘合剂一样,把这些知识拼出一个人类认识这个世界的途径,使得每个人都能借助人工智能,走向一个更高的地方。

THE END
1.在线教育如何推动跨学科知识的融合,科学实践智慧落地1、提高解决问题的能力:跨学科知识融合有助于培养学习者综合运用多学科知识解决问题的能力。 2、适应社会发展需求:当今社会,许多问题的解决需要跨学科的合作,跨学科知识融合有助于学习者适应社会发展需求。 3、促进创新:跨学科知识融合有助于激发学习者的创新思维,推动科技进步和社会发展。 https://shoufuyun.com/post/5847.html
2.知识图谱入门(六)知识融合本节主要介绍知识融合相关技术,首先介绍了什么是知识融合,其次对知识融合技术的流程做一个介绍并对知识融合常用工具做一个简单介绍。知识融合简介知识融合,即合并两个知识图谱(本体),基本的问题都是研究怎样将来自多个来源的关于同一个实体或概念的描述信息融合起来。需要确认的是: https://blog.csdn.net/pelhans/article/details/80066810
3.37.0知识图谱之知识表示知识抽取知识融合上图描述了知识图谱的技术体系。最底层我们有大量的文本数据、结构化数据、多媒体文件等数据来源,通过知识抽取、知识融合、知识众包等技术获取我们需要的知识,而后通过知识表示、知识推理、知识链接等技术将知识规范有序的组织在一起并存储起来(知识存储),最终用于知识问答、语义搜索、可视化等方面。下面我们将依次进行讲解https://qianshuang.github.io/2018/10/04/KB_01/
4.知识融合什么是知识融合 知识融合的基本技术流程 典型知识融合工具简介 典型案例简介 zhishi.me openkg.link LIMES实战演练 什么是知识融合 目标:融合个层面的知识 合并两个知识图谱(本体),需要确认: 等价实例; 等价类/子类; 等价属性/子属性 来源于不同知识库的同一实体 https://www.jianshu.com/p/82b2d9c6add6
5.知识图谱融合知识融合是重要的预处理步骤之一 数据集成 不同知识图谱可能存在重叠的知识 融合多个不同来源的知识图谱 异构问题 本体匹配(Ontology Matching) 发现(模式层)等价或相似的类、属性或关系 本体对齐、本体映射 本体匹配发现一个三元组M=<O,O' ,M>,包括一个源本体О,一个目标本体O',以及一个映射单元集合M ={m1,http://www.notedeep.com/page/20183
6.知识图谱——知识融合知识图谱——知识融合 一、简介 为了解决存在逻辑联系的知识要素之间的冲突消解问题 , 定义了知识元的统一语义表达方式 , 将知识元之间的冲突按照粒度分为术语冲突、谓词冲突和语义冲突 ; 提出了逻辑树融合法、频率融合法、句法融合法。逻辑树融合、频率融合和句法融合 . 逻辑树融合仅限于消解术语冲突 ; 频率融合https://www.pianshen.com/article/5807335215/
7.知识图谱6知识融合.pdf知识图谱6-知识融合.pdf 89页VIP内容提供方:t_github 大小:7.19 MB 字数:约2.22万字 发布时间:2023-11-25发布于江苏 浏览人气:35 下载次数:仅上传者可见 收藏次数:0 需要金币:*** 金币 (10金币=人民币1元)知识图谱6-知识融合.pdf关闭预览 https://max.book118.com/html/2023/1121/5211003302011012.shtm
8.王京知识图谱技术与人文社科领域的融合路径探析【摘要】知识图谱作为新知识工程的核心内容,对于推动人工智能概念在各领域的迁移应用具有重要意义,成为跨学科发展的关键理论和重要手段。本文对领域知识图谱视域下的人文社会科学及其相关数据概念进行了辨析,通过对知识融合通用型关键技术的分析,提出了面向人文社会科学研究的知识图谱构建方法,随后以影视文化领域知识图谱的构建http://philosophy.cssn.cn/kygz/xszm/whzx/202407/t20240712_5764277.html
9.大模型时代知识图谱如何搞?澳联大等最新《知识图谱:机遇与挑战为了加深对知识图谱的理解,对该领域进行了系统综述。具体来说,关注知识图谱的机遇和挑战。首先从两个方面回顾了知识图谱的发展机遇: (1)基于知识图谱构建的人工智能系统; (2)知识图谱的潜在应用领域。然后,深入讨论了该领域面临的知识图谱表示、知识获取、知识补全、知识融合和知识推理等技术挑战;本综述将为知识图谱https://aidc.shisu.edu.cn/8c/04/c13626a166916/page.htm
10.数智时代的信息分析方法:数据驱动知识驱动及融合驱动—卢小宾等摘要 数智时代面对大数据、大知识所带来的挑战,如何创新发展信息分析方法,关乎新时代信息分析工作的开展,关乎数据资源的开发利用。本文在梳理现有信息分析方法的基础上,提出基于数据驱动、知识驱动,以及数据与知识融合驱动的三种数智型方法思路。首先,刻画了基于文本、网络、音频、图像等数据驱动以及与之相应的文本挖掘、图https://www.las.ac.cn/front/product/detail?id=ced100f4e20b91dec8decf4e0932af68
11.语义理解知识挖掘知识融合知识补全……知识图谱成银行反近几年,知识图谱成为银行应用反欺诈“利器”。原因在于,知识图谱从本质上来说是一种大规模的语义网络,以海量的业务数据为基础,综合运用语义理解、知识挖掘、知识融合、知识补全等技术,提炼出高精度知识,将真实业务中的实体及其之间的关系通过图结构来表示,构建大规模的高精度、高质量的知识图谱。 https://bank.hexun.com/2021-02-01/202945600.html
12.融合课程的方法与策略(精选十篇)我认为,这是融合课程给孩子们带来的享受,他们的知识融合了,学习兴趣提高了,表达、创作能力也提升了。但我一直在思考:他们的基础夯实了吗?知识能够转换为能力外显出来吗?这种学习过程和方法能迁移吗?这种情感体验是孩子喜欢的,那如何把他们对知识的热爱转换为内在的学习力呢?我逐渐认识到,真正的融合应该是通过“一https://www.360wenmi.com/f/cnkey93ya76y.html
13.英语演讲稿:知识的融合和人才的全面发展知识的融合和人才的全面发展 我们理工科的学生都知道科技在以一种难以置信的速度变化发展着。我们都在紧张和严肃地思考着是否我们的大学能够为我们提供一个适应当前工业需要的知识基础。以我的专业通信工程为例,科学家们说21世纪是生物医学的世纪,而不是电气电子的世纪。但是如果没有电子化的数据处理和转换,生物医学时https://www.ruiwen.com/zuowen/yingyuyanjianggao/862579.html
14.双曲知识嵌入:如何将知识“融合”带入新空间?知识图谱作为人类知识的结构化数据,是构建人工智能的基石。然而目前的知识图谱都是不完备的,所以需要将多个知识图谱融合以获得更完备的知识库。基于表示学习的知识关联作为知识图谱融合的新方法受到了许多关注。但知识关联模型面临着参数多、复杂性高、知识图谱维数不一致等问题。如何解决这些问题呢? https://blog.51cto.com/u_15047485/2618044
15.知识图谱赋能智慧教育,科教融合助推教学改革——中国青年网知识图谱赋能智慧教育,科教融合助推教学改革 为了充分发挥信息技术在高等教育人才培养过程中的重要作用,更好地促进人工智能、大数据、云计算、物联网等新一代信息技术与教育教学深度融合与创新发展,推动新时代本科高校教育教学改革,河南省教育厅于2021 年 9 月启动了本科高校智慧教学专项研究项目立项工作。郑州轻工业大学https://t.m.youth.cn/transfer/index/url/edu.youth.cn/wzlb/202309/t20230912_14784201.htm