简单易用高性能!一文了解开源迁移学习框架EasyTransfer

丰富的线上&线下活动,深入探索云世界

做任务,得社区积分和周边

最真实的开发者用云体验

让每位学生受益于普惠算力

让创作激发创新

资深技术专家手把手带教

遇见技术追梦人

技术交流,直击现场

海量开发者使用工具、手册,免费下载

极速、全面、稳定、安全的开源镜像

开发手册、白皮书、案例集等实战精华

为开发者定制的Chrome浏览器插件

尽管面向自然语言场景的深度迁移学习有很多的需求,目前开源社区还没有一个完善的框架,而且构建一个简单易用且高性能的框架有巨大挑战。

面对这三大挑战,PAI团队推出了EasyTransfer,一个简单易用且高性能的迁移学习框架。框架支持主流的迁移学习算法,支持自动混合精度、编译优化和高效的分布式数据/模型并行策略,适用于工业级的分布式应用场景。

值得一提的是,配合混合精度、编译优化和分布式策略,EasyTransfer支持的ALBERT模型比社区版的ALBERT在分布式训练的运算速度上快4倍多。

同时,经过了阿里内部10多个BU,20多个业务场景打磨,给NLP和迁移学习用户提供了多种便利,包括业界领先的高性能预训练工具链和预训练ModelZoo,丰富易用的AppZoo,高效的迁移学习算法,以及全面兼容阿里巴巴PAI生态产品,给用户提供一个从模型训练到部署的一站式服务。

阿里云机器学习PAI团队负责人林伟表示:本次开源EasyTransfer代码,希望把阿里能力赋能给更多的用户,降低NLP的预训练和知识迁移的门槛,同时也和更多伙伴一起深入合作打造一个简单,易用,高性能的NLP和迁移学习工具。

简单高性能的框架

语言模型预训练工具链

支持完整的预训练工具链,方便用户预训练语言模型如T5和BERT,基于该工具链产出的预训练模型在中文CLUE榜单和英文SuperGLUE榜单取得很好的成绩。

丰富且高质量的预训练模型ModelZoo

支持PAI-ModelZoo,支持Bert,Albert,Roberta,XLNet,T5等主流模型的ContinuePretrain和Finetune。同时支持自研的多模态模型服装行业的Fashionbert等。

丰富且易用的应用AppZoo支持主流的NLP应用和自研的模型应用,比方说文本匹配下支持DAM++、HCNN等单塔模型,以及BERT双塔+向量召回模型;阅读理解下支持BERT-HAE等模型。

自动知识蒸馏工具

兼容PAI生态产品

框架基于PAI-TF开发,用户通过简单的代码或配置文件修改,就可以使用PAI自研高效的分布式训练,编译优化等特性;同时框架完美兼容PAI生态的产品,包括PAIWeb组件(PAIStudio),开发平台(PAIDSW),和PAIServing平台(PAIEAS)。

EasyTransfer的整体框架如下图所示,在设计上尽可能的简化了深度迁移学习的算法开发难度。框架抽象了常用的IO,layers,losses,optimizers,models,用户可以基于这些接口开发模型,也可以直接接入预训练模型库ModelZoo快速建模。框架支持五种迁移学习(TL)范式,modelfinetuning,feature-basedTL,instance-basedTL,model-basedTL和metalearning。同时,框架集成了AppZoo,支持主流的NLP应用,方便用户搭建常用的NLP算法应用。最后,框架无缝兼容PAI生态的产品,给用户从训练到部署带来一站式的体验。

下面详细介绍下EasyTransfer框架的核心功能。

高性能分布式框架

EasyTransfer框架支持工业级的分布式应用场景,改善了分布式优化器,配合自动混合精度,编译优化,和高效的分布式数据/模型并行策略,PAI-ALBERT做到比社区版的ALBERT在多机多卡分布式训练的运算速度上快4倍多。

丰富的ModelZoo

框架提供了一套预训练语言模型的工具供用户自定义自己的预训练模型,同时提供了预训练语言模型库ModelZoo供用户直接调用。目前支持了20+预训练模型,其中在PAI平台上预训练的PAI-ALBERT-zh取得中文CLUE榜单第一名,PAI-ALBERT-en-large取得英文SuperGLUE第二名的好成绩。下面是详细的预训练模型列表:

预训练模型在CLUE榜单的效果:

SuperGLUE的效果:

丰富的AppZoo

EasyTransfer封装了高度易用、灵活且学习成本低的AppZoo,支持用户在仅用几行命令的条件下“大规模”运行“前沿”的开源与自研算法,即可迅速接入不同场景和业务数据下的NLP应用,包括文本向量化、匹配、分类、阅读理解和序列标注等。

高效的迁移学习算法

EasyTransfer框架支持所有主流的迁移学习范式,包括ModelFine-tuning,Feature-basedTL,Instance-basedTL,Model-basedTL和MetaLearning。基于这些迁移学习范式开发了10多种算法,在阿里的业务实践中取得了良好效果的效果。后续所有的算法都会开源到EasyTransfer代码库里。在具体应用的时候,用户可以根据下图来选择一种迁移学习范式来测试效果。

预训练语言模型

自然语言处理的一大热点工作就是预训练语言模型比方说BERT,ALBERT等,这类模型在各大自然语言处理场景都取得了非常不错的效果。为了更好的支持用户使用预训练语言模型,我们在新版的迁移学习框架EasyTransfer里植入了一套预训练语言模型的标准范式和预训练语言模型库ModelZoo。传统Albert为了减少参数总量,取消了bert的encoder堆叠的方式,转而采用encoder循环的方式,如下图所示。全循环方式在下游任务上表现并不十分理想,于是我们将全循环改为了在2层堆叠的encoder上全循环。然后我们基于英文C4数据,重新对Albertxxlarge进行预训练。在预训练的过程中,我们仅仅使用MLMloss,配合WholeWordMasking,基于EasyTransfer的Trainonthefly功能,我们实现了dynamiconlinemasking,即可以在每次读入原始句子的同时动态生成需要masking的tokens。我们最终的预训练模型PAI-ALBERT-en-large在SuperGLUE榜单上取得国际第二,国内第一的成绩,模型参数仅仅为第一名GoogleT5的1/10,效果差距在3.5%以内。后续我们会继续优化模型框架,争取以1/5的模型参数达到比T5更好的效果。

多模态模型FashionBERT

随着Web技术发展,互联网上包含大量的多模态信息,包括文本,图像,语音,视频等。从海量多模态信息搜索出重要信息一直是学术界研究重点。多模态匹配核心就是图文匹配技术(TextandImageMatching),这也是一项基础研究,在非常多的领域有很多应用,例如图文检索(Cross-modalityIR),图像标题生成(ImageCaption),图像问答系统(VisionQuestionAnswering),图像知识推理(VisualCommonsenseReasoning)。但是目前学术界研究重点放在通用领域的多模态研究,针对电商领域的多模态研究相对较少。基于此,我们和阿里ICBU团队合作提出了FashionBERT多模态预训练模型,针对电商领域的图文信息进行预训练的研究,在多个跨模态检索和图文匹配等业务场景都有成功的应用。模型架构图如下所示。该工作提出了AdaptiveLoss,用于平衡图文匹配,纯图片,和纯文本三部分loss。

任务自适应的知识蒸馏

预训练模型从海量无监督数据中提取通用知识,并通过知识迁移的方法提升下游任务的效果,在场景里取得了优异的效果。通常预训练模型尺寸越大,学习到的知识表征对下游任务越有效,带来的指标提升也越明显。然而大模型显然无法满足工业界应用的时效性需求,因此需要考虑模型压缩。我们和阿里智能计算团队合作提出了一种全新的压缩方法AdaBERT,利用可微神经架构搜索(DifferentiableNeuralArchitectureSearch)自动地将BERT压缩成任务自适应的小型模型。

在这个过程中,我们将BERT作为老师模型,提炼它在目标任务上有用的知识;在这些知识的指导下,我们自适应地搜索一个适合目标任务的网络结构,压缩得到小规模的学生模型。我们在多个NLP公开任务上进行了实验评估,结果显示经由AdaBERT压缩后的小模型在保证精读相当的同时,推理速度比原始BERT快12.7到29.3倍,参数规模比原始BERT小11.5到17.0倍。

QA场景领域关系学习

早在2017年,我们就在阿里小蜜问答场景里面尝试了迁移学习,我们主要侧重于DNNbasedSupervisedTL。这类算法主要有两种框架,一个是Fully-shared(FS),另外一个是Specific-shared(SS)。两者最大的差别是前者只考虑了sharedrepresentation,而后者考虑了specificrepresentation。通常来说SS的模型效果比FS效果好,因为FS可以看作是SS的一个特例。对于SS来说,最理想的情况下是shared的部分表示的是两个领域的共性,specific的部分表示的是特性。然而往往我们发现要达到这样的效果很难,于是我们考虑用一个adversarialloss和domaincorrelation来协助模型学好这两部分特征。基于此,我们提出了一个新的算法,hCNN-DRSS,架构如下所示:

我们将这个算法应用在了小蜜的实际业务场景中,在多个业务场景里(AliExpress,万象,Lazada)取得了不错的效果。

强化迁移学习ReinforcedTransferLearning

迁移学习的有效性,很大程度上取决于sourcedomain和targetdomain之间的gap,如果gap比较大,那么迁移很可能是无效的。在小蜜QA场景,如果直接把Quora的textmatching数据迁移过来,有很多是不太合适的。我们在小蜜的QA场景,基于Actor-Critic算法,搭建了一个通用的强化迁移学习框架,用RL来做样本选择,帮助TL模型取得更好的效果。整个模型分三部分,基础QA模型,迁移学习模型(TL)和强化学习模型(RL)。其中RL的policyfunction负责选出高质量的样本(actions),TL模型在选出来的样本上训练QA模型并提供反馈给RL,RL根据反馈(reward)来更新actions。该框架训练的模型在双11AliExpress的俄语和西语匹配模型,在西语和俄语的匹配准确率都取得了非常不错的提升。

元调优MetaFine-tuning

预训练语言模型的广泛应用,使得Pre-training+Fine-tuning的两阶段训练模型成为主流。我们注意到,在fine-tuning阶段,模型参数仅在特定领域、特定数据集上fine-tune,没有考虑到跨领域数据的迁移调优效果。元调优(MetaFine-tuning)算法借鉴Meta-learning的思想,旨在学习预训练语言模型跨领域的meta-learner,从而使得学习的meta-learner可以快速迁移到特定领域的任务上。这一算法学习训练数据样本的跨领域typicality(即可迁移性),同时在预训练语言模型中增加domaincorruptionclassifier,使得模型更多地学习到领域无关的特征(domain-invariantrepresentations)。

我们将该fine-tuning算法应用于BERT,在自然语言推理和情感分析等多个任务上进行了实验。实验结果表明,元调优算法在这些任务上都优于BERT的原始fine-tuning算法和基于transferlearning的fine-tuning算法。

元知识蒸馏Meta-KnowledgeDistillation

最后,EasyTransfer工具是中文CLUE社区官方推荐的toolkit。同时,阿里云天池平台将携手CLUE社区打造一个多任务语义理解的大赛,EasyTransfer为默认的开发工具,用户可以基于EasyTransfer轻松搭建多任务的baseline和进行建模和优化,敬请大家期待。

THE END
1.速算app哪个更好?速算软件官方版数学速算app下载速算软件专题为大家整理了多款速算app,其中包括速算盒子、斑马速算、霍影速算、速算总动员等,速算软件是专为小学生提供一种数学学习软件,使用速算app可以快速的帮助学生提高算数能力,从加减乘除到小学毕业系统全面,通过闯关pk、课堂练习、时代升级等方式不断锻炼小朋友的数学思维,每日不断在线练习养成良好的学习习惯,欢迎http://www.downcc.com/k/susuanapp/
2.学算法必备的一个网站与app公众号关注 “五分钟学算法” 设为“星标”,带你挖掘更多开发神器! 大家好,我是小 G。 众所周知,程序员都需要翻越数据结构与算法这座大山,有的大神可以到达山顶领略更美好的风景,有的则在半山腰停下了绝不,而有的则在山底徘徊找不到上山的路径。 https://blog.csdn.net/kexuanxiu1163/article/details/110729709
3.学习编程的APP推荐学习编程的下载学习编程的app 在当今数字化时代,学习编程已经成为一项必备的技能。而随着智能手机的普及,学习编程的APP成为了学习者的首选。通过学习编程的APP,你可以随时随地掌握编程的技巧和知识。这些APP提供了丰富的教程和实践项目,帮助你从零基础逐步掌握编程语言和算法。通过这些APP,你可以学习到Python、Java、C++等流行的编程https://www.wandoujia.com/bangdan/876164/
4.数学算法启蒙app下载数学算法启蒙app官方版v1.1数学算法启蒙app,一款很好的数学启蒙的软件,平台上的资源和学习内容都是可以在这里分享的,有什么需要的可以在这里完成,推荐的内容是超级周到的,孩子们能够完成轻松的学习。 软件特色: 能够为你带来最全面的数学知识学习,让你能在暑假的时候尽情的完成各类家庭作业; 拥有众多的数学工具,如计算器以及各类公式辅助服务https://www.i5xt.com/down/164209.html
5.算法学习app免费下载算法详解app是一款手机学习算法的app,为用户详解各种算法原理,图文并茂,让你可以更好的理解和学习算法模型,对于对编程感兴趣的朋友来说非常不错。需要的用户赶快来下载吧。 功能介绍 算法详解app这款应用解释了一些算法的细节并且还有更加详细的演示功能,帮助使用者更好的理解特定的算法。 https://www.fxxz.com/azsoft/288531.html
6.监督学习的典型算法包括()【单选题】角膜的组织学特点是( ) 查看完整题目与答案 【单选题】职业道德是人们在特定的( )中所应遵循的行为规范的总和。 查看完整题目与答案 【单选题】角膜位于人眼球的( )部位。 查看完整题目与答案 【单选题】职业道德在社会主义时期,是社会主义道德原则在( )和职业关系中的具体体现。 查看完整题目与https://www.shuashuati.com/ti/e576372be1e247c1b0fd88772e7f2253.html
7.iAlgoApp下载iAlgo算法可视化学习v1.0.2最新版iAlgo App,是一款算法可视化掌上学习工具。这里提供了排序算法、图算法、安全算法、动态规则算法等,让学习者从可视化的角度来学习算法,从而提高学习的效率,让理解变得更容易,加强学习更快的学会各类算法知识。 iAlgo软件功能 1.自定义数据运行算法代码或者查看数据结构动画,演绎你想要的数据; 2.一步一动的查看动画的播https://m.qqtn.com/q/542241
8.启动优化APP瘦身网络算法架构组件化iOS签名密码iOS原理、启动优化、APP瘦身、网络、算法、架构、组件化、iOS签名、密码学、iOS安全、设计模式https://juejin.cn/post/7406347285900574760
9.移动互联网已经成为这个产业新的爆发点。口语学习app为学习者提供口语评分——英语学习中的机器学习算法 (原文:网页链接) 中国有数以亿计的英语学习者,移动互联网已经成为这个产业新的爆发点。口语学习app为学习者提供了一个更加轻松环境和低成本的投入。一方面鼓励用户“大声说出来",一方面为他们提供有效的评分反馈,指出发音中的具体错误,帮助他们进行有针对性的训练。https://xueqiu.com/8707480199/33295831
10.拍照识花手机APP—深度学习算法用于植物识别和分类只需要拍摄植物的花、果、叶等特征部位,即可快速识别植物,也可以从相册分享植物照片到APP进行识别。同时软件还会按照植物分类学方法进行系统分类,此外还可以链接到植物百科,了解所识别的植物的重要生理特征,生存环境等。这些软件以海量植物分类图片为基础,基于深度学习算法开发而成,几乎涵盖身边所有常见植物,尤其适合园艺http://www.360doc.com/content/23/0811/12/83135760_1092113091.shtml
11.LeetCode算法学习app下载LeetCode算法学习(技术学习平台)v2.10.2LeetCode算法学习app是上海优浅花信息科技有限公司提出的一款自主学习和技能提升平台。拥有丰富有用的干货,多种学习方法为大家分享。帮助大家轻松搞定名企面试。 软件介绍 LeetCode算法学习简介极客挚爱的高质量技术平台,想要学习和提升专业能力从这里开始,充足技术干货等你来啃,轻松拿下 Dream Offer! https://www.jb51.net/softs/898877.html
12.开发机器学习APP,太简单了51CTO博客开发机器学习APP,太简单了 学习的根本目的只有一个,学以致用! 机器学习,大家都学了很多算法,搞了很多模型,但是极少拿来解决实际问题。 毕竟开发一个机器学习应用所需的技术栈不是每个人都能掌握,今天就向同学们介绍一个绝佳解决方案———streamlit 它https://blog.51cto.com/u_15465080/4861147
13.在AI算法跌下神坛的当下,YouTube的这款儿童APP值得学习吗?此前我们曾注意到,人工智能推荐算法都是两家引以为傲的王牌,如快手曾喊出其背后核心是人工智能,火山更是继承了今日头条擅长AI算法的基因。 图注:整改后的火山和快手首屏 但是由上面俩家的整改建议,我们似乎也看到了一种信号:人工智能推荐算法被拉下神坛并一定程度上被雪藏,人工审核逐步上位。这样的影响也显而易见https://www.tmtpost.com/3176653.html
14.animeface张永停 (zyt),PB17111585,主要负责深度学习算法的调研、解释、使用等。 任务说明 written by tky 来源 一开始定题的时候大家都很纠结,想了几天都没有很好稍微学到了一点 tensorflow,以及发现 tensorflow 的 tutorial 真详细。学到了一个图像库的用法 imgaug。 体会就是,读代码写代码调参数=很痛苦,跑代码=充满https://github.com/taoky/anime-face-recognition/blob/master/README.md
15.算法动画图解app苹果版下载Algorithms算法动画图解i算法动画图解app是一款由大神开发的算法学习软件,适合算法初学者、程序员、经验丰富的工程师等人群使用,可以将枯燥无味、难以理解的算法,以动画图形和文字描述的方式让用户更加容易理解和学习。并且小伙伴们可以点击前进和后退按键,以此控制动画图解的走向,让你不在为学习算法而烦躁,轻松掌握它们。该软件涵盖分类、聚类、https://www.ddooo.com/softdown/159873.htm
16.和学在线App排行榜VIVO手机和学在线app推荐ViVO手机和学在线App排行榜由点点数据提供。本次排行榜包含了:和学在线、综评学生版、智慧中小学、中国象棋对弈打谱、迷你星工场-迷你世界创作平台、智学网、完美校园-科技让校园更美好、幂学在线、作业帮家长版-邀好友口算PK更有趣、小熊美术-在线美术学画画等十大和学在线App排行榜 http://vip.diandian.com/phb/1392/4-1.html
17.做了一个算法动画的App,算法动画图解,代码执行可视做了一个算法动画的App,算法动画图解,代码执行可视 个人在学习算法时经常反复学反复忘。通过文章学习没有视频生动,通过视频学习不敢拖进度。学习过程中体感是枯燥的,急躁的,受挫的。 这里本质上是学习方式和效率的问题,如何能有一种更好的方式学习和复习呢?https://leetcode.cn/circle/discuss/a6CFRE/