AIforScience融合计算正在为科学带来新的增长点张平文院士谈《机理与数据的融合计算》

本场讲座中,张院士从应用数学的发展历程说起,阐述应用数学发展经历了以机理为中心的计算,以数据为中心的计算,并最终进入机理与数据融合计算的历程。接下来以近年来融合计算最有影响力的3个成功案例,和融合计算在天气预报中的应用为例,向大家介绍了融合计算的模式和广阔前景。在此基础上张院士围绕AIforSocialScience的概念,从人文社科的科研范式,算法的伦理和科技智库的建立三个角度,介绍融合计算将对人文社科产生极其深远的影响。最后,张院士探讨了融合计算将给应用数学领域带来哪些全新的增长点以及应用数学在国内落地的机制体制问题。

主讲嘉宾介绍

张平文,中国科学院数理学部院士,发展中国家科学院院士,北京大学数学科学学院教授。现任北京大学党委常委、副校长,大数据分析与应用技术国家工程实验室主任。张平文院士主要从事复杂流体的数学理论和计算方法,大数据分析与应用等方面的研究,他与合作者为液晶领域的Doi-Onsager模型奠定了数学基础并建立了Doi-Onsager模型与宏观的Ericksen-Leslie模型之间的联系;研究了一系列不同层次、不同尺度的模型之间的关系并发展了能够描述复杂相和动力学行为的统一模型;针对嵌段聚合物自洽场理论模型,发展了挖掘复杂结构的高效数值方法,设计了有序相变成核算法,这些方法和算法已经成为该领域模拟研究常用的工具。另外,他还在基于调和映射的移动网格方法、多尺度算法与分析等方面做出了创新性贡献。张平文现担任国家自然科学基金委“复杂流体和复杂流动的计算方法与数学理论”创新研究群体学术带头人,学术期刊《CSIAMTransactionsonAppliedMathematics》主编,AMM等十余种国内外杂志的编委,累计在JAMS,SINUM,PRL等杂志发表论文100余篇,并在2018年应邀在国际数学家大会作45分钟邀请报告。

讲座视频回放

讲座精彩回顾

应用数学的演进

张院士首先回顾了应用数学演进历程。应用数学的研究具有两大特点:方向碎片化,发展并行化。在所有的方向中,研究主要聚焦于计算和统计。当代应用数学发展的第一个阶段是以机理为中心,重点在于建立有效的模型和高效的算法,而不需要大量的数据。当代应用数学发展的第二个阶段是以数据为中心,强调从数据中提取特征,其重点在于足够多的数据和有效特征,避免传统模型中的计算问题。

当代应用数学发展的第三个阶段是机理与数据的融合计算。以机理为中心的优势在于时效性长,劣势是部分问题过于复杂,难以处理;以数据为中心的优势在于其适用范围广,劣势在于可解释性差,时效性短。因此机理与数据的融合就可以做到优势互补,为大量工程问题的最后一公里提供了实现途径。

融合计算的模式

融合计算的3个成功案例关于融合计算到底有哪些模式,张院士举了近年来最有影响力的3个案例。第一个是人工智能领域的AlphaGo和AlphaZero,它们分别使用记录数据和模拟数据来进行计算取得了良好的效果。其带来两个重要的问题:一个是临界点问题,即算法达到什么样的状态,模拟数据才真正有用;另一个是极限问题,即算法通过不断迭代,最终的极限在哪里。

第二个是解决蛋白质折叠问题的AlphaFold2,也是采用基于实验数据的计算方式,解决了蛋白质结构预测的问题。

前两个例子是纯粹基于数据的计算模型,而第三个例子是典型的融合计算:深度势能分子动力学。它利用第一性原理得到模拟数据、利用机器学习来学习分子的相互作用力,使其模型精度和效率得到极大的提升。

融合计算在天气预报中的使用

如果想对观测数据与模式数据做更深一步的融合,就需要了解两种数据各自的特点。观测数据是真实的数据,同时包含高频和低频信息;但是观测数据很难包含全部信息,仅利用观测数据预测的时效性较短。模式数据则恰恰相反,它更多是大尺度数据,能够有效进行长期预测,但是在对一些极端天气预测、高精度预测上难以满足要求。

张院士团队开发的天气预报机器学习MOML算法,就通过将大尺度、低频、可预测的模式数据和小尺度、高/低频,不可预测的观测数据融合进一套算法,成功做到了对于气温、湿度、风速等的精细预报。算法本身应用在北京气象台的天气预测,并发展成为冬奥会的一个天气预测产品,取得了比较好的效果。

融合计算的广阔前景

融合计算未来的发展前景是广阔的,以国家基金委发布的重大研究计划为例,其重要目标就是发展数据驱动和知识驱动融合的人工智能。机理与数据的深度融合无疑是下一代人工智能的重点,存在巨大的挑战与机遇。

AIforSocialScience

张院士接下来围绕AIforSocialScience的概念,强调融合计算的不断发展势必会对人文社科(SocialScience),尤其是社会科学产生深远的影响。这种影响主要集中在三个方面,即人文社科的科研范式,新的算法伦理和文理科结合的科技智库。

人文社科的科研范式

人文社科的科研范式分成4个方面。首先是统计软件的使用,并作为工具解决社会科学中的问题。第二就是结构模型的建立,比如经济学中尺度介于微观经济学和宏观经济学之间的结构经济学就非常具有研究价值。第三是基于数据的计算方法,比如颠覆图书情报学的搜索算法和颠覆新闻传播学的推荐算法,都是基于数据的经典算法。最后,也是未来可能影响最大的是机理与数据的融合计算。比如在人类语言的进化研究中,既要考虑一些机理方面的内容,如口腔的构造、发声的原理等,也要使用大量的数据,如语音的数据、考古的数据等。这类问题只有基于机理与数据的融合计算,才能彻底把问题研究清楚。

算法(人工智能)的伦理

算法的伦理问题既要求算法做到“以人为本”,又在“以人为本”的同时要兼顾算法的能力。这是近年来科学家遇到的一个新问题,也是不得不考虑和解决的问题。

科技智库

数字化具有极强的穿透性,随着数字化的不断发展,数据在各行各业发挥越来越强大的作用。在这个背景下,由理工科和人文社科相结合的科技智库将能够更好的激发数据要素的活力,对政策建议发挥更大作用。以国际数字生态研究为例,由于研究的复杂性和重要性,张院士的团队会在研究过程中使用大量的数据,并借助一些融合计算的手段,才能切实提出正确且有意义的政策建议。

应用数学新的增长点

融合计算为应用数学带来了哪些全新的增长点呢?张老师从理论、学科交叉和落地三个方面进行了分析。

首先在理论方面,想要去理解机器学习,一个实际的数学挑战就是高维空间中的数值分析。同时融合计算存在多个不同的模式,这也将从理论层面给应用数学带来一些新的领域。

其次融合计算将极大扩充应用数学的应用场景。例如人文社科领域将出现大量由理工科与人文社科共同建设的实验室,一些过去无法解决的复杂系统,如地球系统很可能将由融合计算提供解决方案等。

最后也是最大的增长点是在落地方面,融合计算将极大扩充应用数学的落地方式。将由原先单一的基础软件,变成包括基础软件、工业软件、数据产品在内的多种形式,并将真正推动产业的发展。

应用数学落地的体制机制

最后张院士从体制机制的角度讨论了应用数学在我国的落地问题。

应用数学本质上是由国家需求驱动的,其驱动力主要来自于国防建设和企业创新两方面。成果想要落地就需要提供好的产品,但是企业和高校由于驱动方式、工作模式等存在较大差异,两者之间的连接就是一个巨大的挑战。要解决这个问题,就需要建立完善的体制机制。

基于这个问题张院士在北大做了“学术创新链”的探索,提出从基础研究到“四个面向”的高效连接和有机闭环。由院系、平台、新型研发机构和企业发挥各自特点和优势承担不同阶段的任务,既能保证科学研究能最终转换成有价值应用,又能让企业遇到的实际问题及时有效反馈给科研机构进行解决。

THE END
1.15个应用嘲的算法实现(可套用)算法应用时常,在项目中会遇到算法问题,多数人也就在面试时背背算法题,工作中也用的比较少,常见的算法也有封装好的实现,比如JDK封装的Arrays工具类中的二分查找。 那我们还需要去研究算法吗,答案是需要,在很多业务场景中,成熟的算法可以提高效率,减少不必要的问题出现,规避风险。 https://blog.csdn.net/qq_38566465/article/details/138206290
2.这就是算法:日常生活中的算法应用当我们一听到“算法”这个词,脑海里可能立刻浮现出数学公式和复杂计算的画面。但事实上,算法并不总是那么高深莫测,很多算法其实是基于我们日常生活中随处可见的基本逻辑。在深入讨论算法之前,我想先分享一个让人好奇的事实:你可能已经无意识地掌握了一些算法,并且在日常生活中自然而然地使用它们。接下来,我会通过https://baijiahao.baidu.com/s?id=1802799591805078324&wfr=spider&for=pc
3.无处不在的算法,让算法充分发挥作用,提升社会效率在上面的例子中,订单分配的结果实际上就是算法应用的结果。后台根据骑手当前位置、手头已有订单数量等数据,计算当前送餐距离和送餐路线,预估新的送餐距离和送餐路线,最终把订单分配给时间充裕且最为顺路的骑手,实际上就是通过一系列明确的计算步骤来进行判别和预测,这也是算法的本质。 http://www.idataway.com/cmscontent/5354.html
4.算法应用(精选十篇)大素数生成速度问题是影响RSA运算速率的主要因素。仿真实验发现, PSO及其改进算法可以大大提高RSA加密算法的大素数生成速度, 从而达到提高RSA算法的加解密速度, 使RSA加密算法的应用范围更加广泛。 参考文献 [1]Niel Ferguson, Bruce Schneier, 著.张振峰, 徐静, 李红达, 译.密码学实践[M].北京:电子工业出版社, https://www.360wenmi.com/f/cnkey2w51lax.html
5.哈希算法的七种应用哈希算法的应用非常多,本文介绍最常见的七个,分别是安全加密、唯一标识、数据校验、散列函数、负载均衡、数据分片、分布式存储。 安全加密 最常用于加密的哈希算法是 MD5(MD5 Message-Digest Algorithm,MD5 消息摘要算法)和 SHA(Secure Hash Algorithm,安全散列算法)。除了这两个之外,当然还有很多其他加密算法,比如 DEShttps://www.jianshu.com/p/3227b2568b63
6.用图形解释10种图形算法快速介绍10种基本图形算法以及示例和可视化 在现实世界中,例如社交媒体网络,网页和链接以及GPS中的位置和路线,图形已经成为一种强大的建模和捕获数据的手段。 如果您有一组相互关联的对象,则可以使用图形来表示它们。 > Image by Author 在本文中,我将简要说明10种基本图形算法,这些算法对于分析及其应用非常有用。 https://www.51cto.com/article/628420.html
7.遗传算法算法软件开发一、遗传算法的应用 函数优化(遗传算法的经典应用领域); 组合优化(实践证明,遗传算法对于组合优化中的NP完全问题,如0-1背包问题,TSP等,非常有效); 自动控制; 机器人智能控制; 组合图像处理和模式识别; 人工生命; 遗传程序设计; 二、遗传学基本概念与术语 https://www.open-open.com/lib/view/open1389594522398.html
8.算法工程师的分类关键技术要求及应用领域(6) 熟悉基于GPU的算法设计与优化和并行优化经验者优先;(7) 【音/视频领域】熟悉H.264等视频编解码标准和FFMPEG,熟悉rtmp等流媒体传输协议,熟悉视频和音频解码算法,研究各种多媒体文件格式,GPU加速; 应用领域:(1) 互联网:如美颜app (2) 医学领域:如临床医学图像(3) 汽车领域(4) 人工智能 相关术语:(1) https://maimai.cn/article/detail?fid=1193393813&efid=2X-wHOW7uO7hYGeB9S_g5w
9.人工智能之GBM算法GBM算法应用: GBM 算法可以用于回归模型,同样它也可以用于分类和排名模型。GBM 算法现已被广泛应用于众多领域。 GBM 算法近年来被提及比较多的一个算法,这主要得益于其算法性能,及该算法在各类数据挖掘以及机器学习比赛中的卓越表现。 结语: GBM梯度提升机(或梯度推进机)是一种集成学习法(Ensemble),就是使用一系列https://mp.ofweek.com/ai/a645673021216
10.版权前沿大规模微侵权算法侵权的司法应对版权资讯由此所导致的法律规制的难点在于,自动驾驶产品缺陷的技术及法律责任认定的困难、自动驾驶对于现行保险制度的冲击(自动驾驶对于传统保险机制下投保主体、保险对象、保险内容以及责任分担等形成系统性的挑战)、被动接管规则的应用困境等。 基于自动驾驶算法的场景化特征,在自动驾驶汽车设计缺陷的认定上,应通过“理性算法”标准http://www.ccct.net.cn/html/bqzx/2024/0110/4878.html
11.共达地李苏南:0代码自动化,让AI算法赋能千行百业商业模式鲸解通过算法商城,即把市场上常见的、可复用的算法生产出来,让客户可以即买即用,就像在商城里买现成商品一样,是一个扩大算法的应用广度的好方法。但与其他算法商城相比,共达地基于自动化机器学习的算法商城,里面的算法是“活的”,并不会像一个实体的超市,好像商品摆在那里可能一年到头就不会动了。 https://www.cls.cn/detail/1154839
12.详解C++实现匈牙利算法C语言对于每个左部节点,寻找增广路最多遍历整张二分图一次,因此,该算法时间复杂度为O(MN) 四、匈牙利算法的应用 一些题目,乍一看与上面这个男女配对的问题没有任何相似点,其实都可以用匈牙利算法。例如: 4.1、(洛谷P1129) [ZJOI2007]矩阵游戏 题目描述 小Q是一个非常聪明的孩子,除了国际象棋,他还很喜欢玩一个电脑益https://www.jb51.net/article/215059.htm
13.徐伟琨自动化行政中相对人算法决策拒绝权的实现路径随着图像识别等人工智能技术的发展,算法决策应用场景得到了极大的提升和拓展。2022年1月,国务院办公厅印发了《“十四五”数字经济发展规划》,明确要求“加快构建算力、算法、数据、应用资源协同的全国一体化大数据中心体系”。这为算法决策嵌入政府公共行政提供了有力支持和方向指引。 https://www.jfdaily.com/sgh/detail?id=1118205
14.国产密码算法为地理信息应用保驾护航以国产密码算法应用为核心,充分利用国产的密码技术和产品,创新国产密码在自然资源关键基础设施保护中的应用。(1)数据保护处理在涉密内网对原始涉密数据进行脱敏处理,然后调用测绘数据密码机对矢量数据进行透明加密处理。对切片数据采用国产密码对切片的栅格位置信息进行文件保护。(2)数据集中存储对数据进行统一、集中管理,https://www.hnup.com/sys-nd/394.html
15.基于加权动态网络的频繁模式挖掘研究AET挖掘加权动态网络的频繁子图困难在于产生的候选子图数量过多,而且子图同构检测问题也会影响算法的效率。对此,本文算法利用支持度的反单调性对搜索空间进行裁剪,并采用参考文献[7]的策略将挖掘图划分成挖掘路径、树和循环图的三个子问题,减少了候选子图数量和子图同构检测次数,提高了算法效率。而且将算法应用于实际的股http://www.chinaaet.com/article/167593
16.深度学习在NLP中的应用——TextCNN腾讯云开发者社区卷积神经网络(Convolutional Neural Networks,CNN)的提出使得深度学习在计算机视觉领域得到了飞速的发展,大量基于CNN的算法模型被提出,同时深度学习算法在多个视觉领域实现了突破。最初在文本领域,主要使用的深度学习模型是RNN,LSTM等,既然CNN在图像领域得到广泛的应用,能否将CNN算法应用于文本分类中呢?Kim在2014的文章《Conhttps://cloud.tencent.com/developer/article/1951509
17.“九章”刷屏的背后:万字长文解析,量子计算机和电子计算机各有何算法研究是一个非常非常复杂艰深的领域,特别是我需要横跨量子和经典两大部分,而且涉及到的应用涵盖了组合优化,密码学,生物学,科学计算,理论计算机等各个领域,以个人水平很难涵盖完整。而且考虑到受众,我有必要模糊化和简化一些概念,而只保证核心思想是正确的。因此如果过程中有差错,请多多包涵。 https://www.thepaper.cn/newsDetail_forward_10381047
18.算法的乐趣数组、链表、栈和队列是四种最常见的线性表,其外部行为和接口都各有特色,本节就简单介绍一下这四种基本数据结构的特点及其在算法设计中的应用。 1. 数组 数组(array)是一种相对比较简单的数据组织关系,所有数据元素存储在一片连续的区域内。对数组的访问方式一般是通过下标直接访问数组元素,除此之外,对数组的基本https://www.ituring.com.cn/book/tupubarticle/5656
19.BoostKit大数据业界趋势鲲鹏大数据组件增强特性和典型配置聚焦大数据查询效率低、性能优化难等挑战,提供大数据组件的开源使能和调优、IO智能预取等基础加速软件包、Spark算法加速库等应用加速软件包,开源openLooKeng查询引擎,提升大数据分析效率。 了解详细:https://www.hikunpeng.com/developer/boostkit/big-data 2、BoostKit分布式存储 https://developer.huawei.com/consumer/cn/blog/topic/03898238728230088