重磅发布开源框架2.0RC版生物计算平台「螺旋桨」,百度飞桨交了份年终成绩单百度人工智能开源框架新浪科技

在12月20日举行的「WAVESUMMIT+2020深度学习开发者峰会」上,飞桨平台交出了一份非常亮眼的年终成绩单。

2020年,是不平凡的一年:这一年,人工智能全面进入落地期,与各行业深度融合,也更加深刻地改变了人类社会。

数以千万计的开发者,正扮演着越来越重要的角色。像百度飞桨这样的产业级深度学习平台,也为产业智能化贡献着更多的力量。

本届峰会,百度飞桨带来八大全新发布与升级,有支持前沿技术探索和应用的生物计算平台PaddleHelix螺旋桨,开发更加便捷的飞桨开源框架2.0RC版,端云协同的AI集成开发环境BMLCodeLab,支持更强大分布式训练的业界首个通用异构参数服务器架构,开源算法库增至200+,飞桨企业版EasyDL智能数据服务升级,飞桨硬件生态路线图以及携手全球开发者开启「大航海」计划。可见飞桨技术与生态发展的步调越来越快。

飞桨是一个开源的平台,既受益于开源,也反过来促进了开源社区的发展。在谈到开源开放的重要性时,百度CTO王海峰表示,「开源开放对人类社会过去几百年科学和技术的发展起到非常重要的作用,让我们可以更快追踪到最新的技术进展,并将改进意见以及创新思想迅速进行反馈,形成一个正循环,进一步推动科技的创新迭代。当下,中国开源力量正在影响全球的科技创新。同时,在以深度学习为代表的人工智能发展浪潮中,产业界已经成为驱动开源开放的重要力量。而成熟的开源开放技术生态与开放平台,也正在推动社会各界加快融合发展。」

这是在飞桨平台与开发者的共同努力下,短短半年内取得的卓越成绩,且它的未来更加可期。

接下来,让我们打开百度飞桨这份2020年度成绩单。

飞桨的跨界:生物计算平台「螺旋桨」发布

人工智能是新一轮科技革命和产业变革的重要驱动力量,飞桨在这场时代变革中成为了承载体。作为AI开发的基础设施,飞桨和人工智能一起在向更多的行业、地域和领域发挥着价值。在人工智能技术和生物计算领域的结合上,百度已经做出了一系列尝试和探索。

在本次的WaveSummit+峰会上,百度正式发布了生物计算平台「PaddleHelix螺旋桨」。这个人工智能和生物计算领域结合的平台,是飞桨的一次「跨界」。

该平台先期将开源螺旋桨生物计算开源工具集,提供包括RNA二级结构预测、大规模的分子预训练、DTI药物靶点亲和力预测以及ADMET成药性预测等在内的新药研发和疫苗设计环节的核心能力,帮助生物信息学、计算机交叉学科背景的学习者、研究者和合作伙伴,更便利地构建AI算法模型。

编程一致、动静统一:飞桨开源框架迎来2.0RC版本

作为国内开源最早、技术领先、功能完备的产业级深度学习平台,飞桨一直在进行迅速地迭代。在本次的WaveSummit+峰会上,百度深度学习技术平台部高级总监马艳军宣布:飞桨开源框架2.0RC版本正式发布。

经过两年的研发,新版本能够给开发者带来「编程一致、动静统一」的全新开发体验。这一体验的实现,离不开飞桨在以下几个方向的重要创新和升级。

动态功能走向成熟,默认开发模式升级为动态图模式

为了兼顾两种编程范式的优势,飞桨2.0RC将默认的开发模式正式升级为动态图模式。开发者可以随时查看变量的输入、输出,方便快捷地调试程序,还可以使用Python原生的控制流(如:if,for等)灵活组网。

然而,动态图的模型在使用C++部署时会面临巨大的挑战。对此,新版飞桨提供了完备的动转静支持,在Python语法支持覆盖度上达到领先水平。在动态图编程调试的过程中,开发者仅需添加一个小小的装饰器,就可以无缝平滑地自动转静态图训练部署。同时,2.0RC版本的飞桨还做到了模型存储和加载的接口统一,保证动转静之后保存的模型文件能够被纯动态图加载和使用。

全新升级的API体系

如果说深度学习框架是开发者们在AI海洋中乘风破浪的动力引擎,那么API就是这个引擎的控制面板上的按钮,是深度学习框架威力发挥的直接入口。飞桨开源框架2.0RC版本升级了整个API体系,使其更加简洁、系统,还能向前兼容。

在开发过程中,开发者往往需要以一种更加简单、快捷的方式应用API,完成数据增强、建立数据流水线等可以标准化的工作流程。针对这个需求,新版飞桨提供了更适合低代码编程的高层API,允许开发者用10行代码编写完成训练部分的程序。而且,这些高层API和基础API可以灵活地交叉使用,让开发者在简捷开发与精细化调优之间自由定制,改变了很多开源框架高层API和基础API割裂的局面。

说到这里,很多开发者可能会问,这个新的API体系迁移成本高不高?马艳军在会场强调,「我们是完全向前兼容的」。此外,飞桨还提供了专门的迁移工具和新旧版本的API对照表,以降低开发者的迁移成本。

更好地支持深度概率编程等前沿学术研究

飞桨2.0RC「编程一致,动静统一」的编程体验对深度概率编程、量子机器学习开发等前沿技术研究也有巨大的支撑作用。

此次大会上,清华大学计算机系教授、深度学习技术及应用国家工程实验室副主任朱军介绍了珠算深度概率编程与百度飞桨的合作,依托飞桨框架成熟的底层功能和动静统一的开发体验,更好地支持深度概率编程工具开发和前沿技术探索。

在设计上,珠算底层复用了飞桨框架的核心能力,实现了动态图编程。它还基于飞桨的全新API体系实现了进一步的丰富和扩展,增加了BayesianNet、StochasticTensor等特色组件,丰富了底层概率库,让开发者能够轻松地完成深度生成模型建模、变分推断、蒙特卡洛采样等应用,有力支持了深度概率编程领域的研究与探索。

在量子机器学习开发方面,飞桨框架新增了对复数计算方面的支持,成倍地提升了复数运算的效率,基础复数运算速度最高可提升22.3倍。此外,飞桨还优化了复数Tensor运算的写法,简化了使用量桨开发模型的代码实现规模,助力量桨进一步提升了性能和易用性。

业内首个通用异构参数服务器架构

伴随着2.0RC版本的发布,飞桨还宣布了大规模分布式训练的升级,正式推出业内首个通用异构参数服务器架构。

在搜索推荐领域,模型通常具有大规模稀疏特征,训练时是一个IO密集型任务。这种任务适合用CPU搭建的参数服务器架构来完成。但为了追求更好的效果,开发者通常需要在推荐模型中增加越来越多的复杂网络结构,使得训练算力成为瓶颈。

算力不够,加GPU行不行?首先,传统服务器架构往往要求硬件类型一致,无法加入算力较强的GPU等硬件。其次,GPU等硬件不擅长IO密集型任务,因此我们也不能用GPU完全取代原来的硬件。

在这种背景下,飞桨推出了首个异构服务器训练架构,实现了异构硬件的自由混布,能够实现数据的独立存取传输,大幅提高了数据吞吐量。此外,它还通过流水线机制提高了训练速度,通过多种通信策略提高了带宽的利用率。

测试结果表明,在相同的硬件条件下,飞桨的异构参数服务器架构比单纯的非异构参数服务器架构性能提升了65%以上。

开源算法库全面升级

开源算法库的升级也是新版飞桨的一个重大更新。新版飞桨官方支持的算法从140+个扩充到200+个,涉及各个领域,而且都升级到了动态图实现。

飞桨企业版两大新特性发布

除了以上发布的全新内容外,飞桨企业版还迎来了两大新特性的发布。

全新AI集成开发环境BMLCodeLab

很多AI开发者都遇到过「想做模型训练,本地机器资源不够用」、「租云服务器好贵,机型少不稳定」等问题。基于开发者的痛点,百度飞桨企业版推出了全新的端云协同AI集成开发环境——BMLCodeLab。

BMLCodeLab在基于JupyterLab优秀功能的基础上,引入了微软MonacoEditor-VSCode的编码体验,支持任何编程语言的代码补全、用法提示、多光标等IDE功能,实现了50多个体验优化项。

为了达到开箱即用的效果,BMLCodeLab集成了许多高性能的AI工具组件,比如高性能单机引擎,相比开源Pandas/Sklearn加速性能平均高6倍以上;还有飞桨文心(ERINE)NLP开发套件,将数据标注、算力投入、开发时长等成本大幅降低。

另一个非常有特色的功能是端云协同。BMLCodeLab可通过云端仓库把本地的代码、数据、模型上传到云端,在大数据量和大计算量的情况下,将本地任务无缝扩展到云端。

智能数据服务平台EasyData

随后,百度AI平台研发部总监忻舟介绍了智能数据服务EasyData的升级。

在智能数据标注方面,EasyData通过核心算法、算法流程、硬件的升级,将智能标注的时长平均减少了74%,在物体检测和图像分割上的准确率分别提升了6.4和3.2个点。

EasyData的多人标注功能能够解决数据分发、标注结构审核等问题,将数据集和标签管理进行了拆分,让开发者更加灵活地使用数据。

第三个新特性是高级智能清洗,可自动过滤无人脸、无人体的数据,广泛应用于安全生产、视频监控等场景。

此外,飞桨的生态建设离不开广大的生态伙伴。为了加快生态建设,飞桨在5月份发布了硬件生态圈共建计划。在半年之后的今天,马艳军宣布:飞桨硬件生态路线图正式发布。

从图中可以看出,整个飞桨已经与20家硬件企业达成合作,目前正在适配和已经完成适配的芯片和IP的型号已经有29种,并且在国产硬件的支持方面遥遥领先,加速了国产AI产业链适配升级。

产业共进、人才共育、开源共建:AI大咖共话未来发展

开源以来,飞桨一直秉持开源开放、技术创新,产学研用通力融合,从产业应用、人才培养、开源社区三个维度全面推进生态繁荣,助力产业智能化升级。在本次的WaveSummit+大会中,多位大咖围绕「产业共进」、「人才共育」、「开源共建」探讨了深度学习的未来发展问题。

在「开源共建」环节的圆桌论坛上,百度飞桨总架构师于佃海邀请了复旦大学计算机科学技术学院教授邱锡鹏、北京大学信息科学与技术学院前沿计算研究中心助理教授董豪、PreAngel合伙人李卓桓、Zilliz创始人兼首席执行官星爵等人共同探讨了AI开源项目的创建与维护经验。

从左到右:于佃海、董豪、邱锡鹏、星爵、李卓桓

如何打造一个成功的AI开源项目?嘉宾们认为,首先要保证实现「生态」和「技术」两个闭环,做开源项目和创业十分相似,找到一个好的「选题」是重中之重,而项目成员的多样性,能够促使项目后期去探索无限的可能性,此外还需要一群优质的、多元化的开发贡献者。

开源开放的飞桨促进了AI产学研社区的发展壮大。其实,这不仅是我们的主观感受,还体现在飞桨平台的一些数据中。在大会上,百度集团副总裁吴甜为我们解读了其中的一些数据。

当然,AI社区的持续壮大离不开人才培养。而在这方面,基于在产品、技术、生态各个方面的积累,飞桨已经准备就续,准备全面开启大航海计划。

大航海计划包括领航、启航和护航三个部分,领航计划面向核心开发者群体,践行开源布局理念,永当AI时代的先行者,领航前行。护航计划面向产业界,通过企业培训、技术咨询、技术服务等方式护航企业智能化转型,启航计划面向人才培养,通过校企合作、产教融合开启AI人才培养的新篇章。在本次峰会上,飞桨正式发布了启航计划,预计在未来三年投入总价值5亿元的资金与资源,支持全国500所高校,联合培养50万关键AI人才。

在峰会上,百度、LFAI&DATA基金会、深度学习技术及应用国家工程实验室也联合为97位飞桨社区核心开发者颁发了「PPDE飞桨开发者技术专家」证书,作为对开源开放工作的鼓励与支持。

百度副总裁徐菁现场为AI濒危物种保护项目、AI文物保护项目、AI沙漠栽树机器人项目三支团队颁发了2020年度AI公益合作项目证书并授予星辰计划基金。

左上:王爱华、吴甜为产业应用奖获奖项目颁奖、右上:徐菁颁发星辰计划基金;左下&右下:张伟民、朱军为飞桨技术开发者技术专家颁发证书

时隔半年,人们再次见证了百度飞桨在开源开放之路上的巨大进步。驱动这种核心力量的正是每一位飞桨平台的开发者,265万飞桨开发者的每一步,都将推动中国人工智能领域走向全新的方向。

THE END
1.飞桨alstudio使用tensorFlowmob64ca140a59b0的技术博客1、飞桨Paddle Serving企业级部署 Paddle Serving 依托深度学习框架 PaddlePaddle 旨在帮助深度学习开发者和企业提供高性能、灵活易用的工业级在线推理服务。Paddle Serving 支持 RESTful、gRPC、bRPC 等多种协议,提供多种异构硬件和多种操作系统环境下推理解决方案,和多种经典预训练模型示例。 https://blog.51cto.com/u_16213658/12779477
2.如何快速使用百度飞桨(PaddlePaddle)在AIStudio上创建一个新的项目来进行机器学习或深度学习实验。 点击页面上方的“项目”按钮,并选择“创建项目”。 根据提示填写项目信息并创建项目。 6. 使用Notebook Notebook是百度飞桨AIStudio的一个重要功能,用于编写和运行代码。 在页面中选择“笔记本”选项卡,可以看到预配置的编程环境。 https://blog.csdn.net/wsl3465205046/article/details/140775701
3.百度飞桨平台官网,paddlepaddle,开源深度学习平台别摸鱼导航快速安装,本地快速安装,开发灵活,推荐有深度学习开发经验、有源代码和安全性需求的开发者使用! 百度飞桨平台官网:https://www.paddlepaddle.org.cn/ 数据评估 百度飞桨浏览人数已经达到723,如你需要查询该站的相关权重信息,可以点击"5118数据""爱站数据""Chinaz数据"进入;以目前的网站数据参考,建议大家请以爱站数据https://biemoyu.com/sites/paddlepaddle.html
4.百度飞桨平台官网,paddlepaddle,开源深度学习平台快速安装,本地快速安装,开发灵活,推荐有深度学习开发经验、有源代码和安全性需求的开发者使用! 百度飞桨平台官网:https://www.paddlepaddle.org.cn/ 数据评估 百度飞桨浏览人数已经达到870,如你需要查询该站的相关权重信息,可以点击"5118数据""爱站数据""Chinaz数据"进入;以目前的网站数据参考,建议大家请以爱站数据https://feizhuke.com/sites/paddlepaddle.html
5.飞桨(PaddlePaddle)是一款由百度公司开发的开源深度学习平台飞桨(PaddlePaddle)是一款由百度公司开发的开源深度学习平台,旨在为开发者提供简单易用、高性能的深度学习框架。飞桨集成了深度学习的核心训练和推理框架、基础模型库、端到端开发套件和丰富的工具组件,适用于各种深度学习应用场景。 飞桨平台提供了多种功能,包括: https://www.openmao.cn/sites/4667.html?menu-id=196&mininav-id=1079
6.AI大国博弈深度学习平台好在,中国企业还是能有办法避免“地震”,这就不得不说到百度的深度学习平台飞桨(PaddlePaddle)。 我们可以看一看飞桨的全景图。 飞桨集核心框架、工具组件和服务平台为一体的端到端开源深度学习平台,囊括支持面向真实场景应用、达到工业级应用效果的模型,针对大规模数据场景的分布式训练能力、支持多种异构硬件的高速推理引https://news.pedaily.cn/201907/444847.shtml
7.百度飞桨AIStudio官网,基于百度深度学习平台飞桨的一站式AI开发百度AI Studio是基于百度深度学习平台飞桨的一站式AI开发平台,提供在线编程环境、免费GPU算力、海量开源算法和开放数据,帮助开发者快速创建和部署模型。它是一个面向开发者的平台,提供了一整套的开发环境和工具,可以帮助开发者更快速地进行AI模型的开发和部署。 https://www.8kmm.com/sites/9861.html
8.国内最大开源深度学习框架百度飞桨发布21项新内容提供1亿元GPU【Tec hWeb】11月5日,在WAVE SUMMIT+”2019深度神经网络开发人员秋天高峰会上,中国较大的开源系统深度神经网络架构百度搜索飞桨(PaddlePaddle)全新升级公布和关键更新21个商品方位,包含朝向产业链应用领域的四大端到端开发设计模块、结合数据信息和专业知识的预训炼融合迁移学习的飞桨Master方式、端侧逻辑推理模块Paddle https://www.cockor.com/a/11268.html
9.量桨出世!飞桨成为国内首个支持量子机器学习的深度学习平台在谷歌开源 TensorFlow 一年以后,百度宣布开源其深度学习平台飞桨(英文名 PaddlePaddle)。飞桨发展到现在,已经具备了开发便捷的核心框架、支持超大规模深度学习模型训练、多端多平台部署的高性能推理引擎和产业级开源模型库等技术。飞桨是中国首个也是目前国内唯一开源开放、功能完备的产业级深度学习平台,正是因为它的出现,https://www.infoq.cn/article/U8rfp0BVLK24Urgg8sgg
10.百度飞桨与第三代英特尔?至强?可扩展处理器为深度学习针对这两点需求,百度开源深度学习平台百度飞桨结合第三代英特尔? 至强? 可扩展处理器给出了令产业开发者满意的解决方案,为深度学习技术在实际场景用落地提供了有力支撑。 关于百度飞桨 百度飞桨以百度多年的深度学习技术研究和业务应用为基础,是中国首个开源开放、技术先进、功能完备的产业级深度学习平台,集深度https://www.intel.cn/content/www/cn/zh/now/data-centric/creating-speed-security-leverage-points-baidu.html
11.百度飞桨与华为麒麟深度合作,加速智能时代嘲应用风险库百度“飞桨”是目前国内唯一开源开放的深度学习平台,华为“麒麟”是全球领先的端侧AI芯片平台,双方深度合作,为端侧AI提供最强劲的算力,加速中国产业智能化进程。 在2019百度AI开发者大会上,百度CTO王海峰与华为消费者BG软件总裁王成录联合宣布,百度飞桨与华为麒麟芯片达成深度合作,这个重磅消息让人们对智能时代有了更多的http://www.riskbbs.com/paddlekirin.html
12.百度大脑5.0技术干货:详解飞桨五大优势,鸿鹄芯片架构细节据介绍,百度飞桨(PaddlePaddle)是国内唯一功能完备的开源深度学习平台,自Paddle Fluid v1.0发布以来,飞桨陆续在开发、训练和部署全流程上进行全方面的升级。 而在刚刚过去的百度AI开发者大会上,百度CTO王海峰介绍了飞桨的五大优势。 在此,我们根据百度大脑分论坛的介绍,对这五大优势进行更详细的解读。 https://zhidx.com/p/152013.html
13.fromIndustrialPractice(『飞桨』核心框架,深度学习&机器PArallel Distributed Deep LEarning: Machine Learning Framework from Industrial Practice (『飞桨』核心框架,深度学习&机器学习高性能单机、分布式训练和跨平台部署) - PaddlePaddle/Paddlehttps://github.com/PaddlePaddle/Paddle
14.2022服贸会进行时百度吴甜:深度学习平台+大模型加速AI产业落地极客当前,人工智能已经广泛渗透到人们经济生产活动的主要环节,用户对「智能」的需求越来越旺盛。吴甜表示,AI 技术越来越复杂的同时,深度学习平台的标准化、自动化和模块化特征也越来越显著,并正在通过开源开放助力 AI 开发和应用越来越容易。 国内首个产业级深度学习开源开放平台飞桨,为各个产业铺起低门槛、创新升级之路。https://www.geekpark.net/news/307692
15.百度深度学习平台——飞桨全景介绍神秘嘉宾 2116 EasyEdge-百度端计算模型生成平台简介 神秘嘉宾 1950 基于Paddle Lite的移动端目标检测部署实践 神秘嘉宾 1809 基于Paddle Lite的EdgeBoard边缘AI部署实践 神秘嘉宾 2272 视频介绍 课程资料 评价 嘉宾介绍 主题介绍 百度深度学习平台——飞桨全景介绍https://itdks.com/Home/Course/detail?id=117513
16.深度学习与飞桨PaddlePaddleFluid实战飞桨PaddlePaddle Fluid是百度推出的深度学习框架,不仅支撑了百度公司的很多业务和应用,而且随着其开源过程的推进,在很多行业得到普及、应用和关注。 本书基于最新的飞桨PaddlePaddle Fluid版本,以真实的应用案例介绍如何用飞桨PaddlePaddle解决主流的深度学习问题。全书共14章。本书首先介绍了什么是飞桨PaddlePaddle,然后介绍了https://www.epubit.com/bookDetails?id=UB6c964719f6a5a