文心大模型:知识增强的NLP模型详解

预训练大模型能够充分地挖掘大规模无标注数据的潜力,从海量数据中学习知识与规律,就像我们人类的通识教育。从出生开始,我们接受的都是通识教育,到上大学以后,才接受专业教育。在应用大模型以后,通过大模型加任务数据微调的方式,能获得非常好的效果,这已经成为了新的研发范式。

拥有了预训练大模型后,我们可以从之前的手工调参依赖AI专家的阶段进入大规模可复制的大工业落地阶段。

这是我们文心大模型的全景图,包括NLP大模型、CV大模型和跨模态大模型,在此基础上,我们开发了大模型的开发工具、轻量化工具和大规模部署工具,而且我们支持零门槛的AI开发平台以及全功能AI开发平台。

知识增强大模型

文心ERNIE

接下来,首先让我们解读知识增强大模型文心ERNIE。

文心ERNIE:持续学习框架

首先,我们来看第一个特色,从大规模知识图谱和海量无结构数据中学习。从这个例子可以看出,我们同时输入大规模图谱和相应无标注、无结构化的文本,通过文本的Mask,能够推理这个知识图谱里的关系,从而使这个模型具有知识推理能力。在右图的知识问答过程图可以看到,ERNIE具有增强的知识推理能力。

在Fine-tuning任务上,文心ERNIE可以用在不同任务中,用任务数据做微调。文心ERNIE在21类54个Fine-tuning任务中取得领先。这些任务分布很广泛,有语言理解、语言生成、知识推理等。同时,文心ERNIE在零样本和小样本学习的能力也非常好,尤其是在文本分类、阅读理解、知识推理、指代消解等任务中取得全面领先。

众所周知,大模型的训练成本及使用成本非常高,在实际业务落地应用中面临着相当大的挑战。首先,对千亿模型进行知识蒸馏需要耗费非常高的计算资源,而且,如果从千亿的规模蒸馏到几亿或几千万的数据量,差距过大,影响蒸馏的效果。针对这个问题,我们提出了在线蒸馏的框架,能够降低计算资源的消耗。同时,我们采取辅助蒸馏的方式,首先从千亿规模蒸馏到几十亿,然后到几亿。通过这个过程,我们能使模型蒸馏的效率和效果都得到很好的提升。

从这个实际应用案例中能看到,我们实现了搜索15亿的大模型无损蒸馏,并把这个模型应用在搜索排序的场景中。实际上,在这个过程中,我们将多个教师模型进行蒸馏,使效果得到了非常大的提升。

刚才介绍了文心ERNIE的学习框架以及学习效果。接下来,我将针对知识增强大模型里其他的跨语言大模型、跨模态大模型以及图模型进行解读。

跨语言大模型文心ERNIE-M

在跨语言的学习过程中,中文和英文这类语种的语料资源较为丰富,然而对于很多小语种来说,比如泰语,我们的资源是不够丰富的。那么,如何利用资源丰富的语种来帮助资源缺乏的语种实现性能提升呢?我们采用了用少量平行语料和大量非平行语料通过回译的机制进行学习的方式来实现。

在这个过程中,我们使用统一模型建模了96种语言,并在5类语言任务上刷新世界最好结果。例如在自然语言推断、语义相似度、阅读理解、命名实体识别、跨语言检索等任务中,我们都获得了极大提升,同时在权威跨语言理解榜单XTREME上获得了第一。

看一个例子,我们通过用非平行语料来学习各个语种中语义的关联,同时将标注丰富语种中的知识(比如中文中一些命名实体的标注)通过跨语言模型迁移到其他语种中,从而实现语言知识的迁移,并提高其他语种下游任务的效果。

跨模态大模型文心ERNIE-ViL

在文心ERNIE-ViL中,我们在跨模态模型中首次引入了场景知识。引入场景知识的目的是为了理解图像中细粒度的语义,比如说房子、车子和人之间的关系,以及车的颜色等。通过构建场景图的方式,模型能够对图像进行细粒度的语义理解,从而在跨模态任务上取得最好的效果,比如视觉问答、视觉常识推理、图像检索等。我们在权威视觉常识推理任务VCR榜单上也排名第一。

来看一个例子,左边图中一共有几位运动员?我们看到的一共有六个人,到底有几个运动员呢?我们选择了C,这是正确答案。在这个过程中模型要给出解释,为什么在6个人之中只有5个是运动员?模型要判断其中一个是裁判。这个其实就是通过视觉推理来获得的。这就是在场景图里加入知识,通过它的文字信息去构建场景图,使得模型能够理解图中细粒度的语义。

跨模态大模型文心ERNIE-ViLG

图模型文心ERNIE-Sage

对话生成模型

文心PLATO

基于这样的框架,去年我们发布了全球首个百亿参数的预训练对话生成模型文心PLATO-XL,它的特点是规模大、效果好、能耗低。从下图左侧可以看出,在参数规模还不是很大的情况下,跟参数规模非常大的效果相比,文心PLATO-XL也能取得相对好的结果,而在能耗方面成本更低。

知识外用指的是我们把知识作为一个库,外挂在生成模型之外,通过检索的方法,检索知识加入生成模型中,能够很好地增强回复生成的信息量。知识内化是指我们把各种异构的数据、知识加入到这个聊天语料中一起训练,然后把知识信息学到模型参数中。通过这样的方法,我们能够把知识的准确率提升到90%以上。

举个例子,在医疗领域的对话中,我们用医疗图谱来指导生成。我们采用了两步生成方式,第一步通过上下文的方式生成一个流畅的句子,但是里面的知识可能是不准确的,这个时候利用知识图谱,也就是利用医疗知识图谱修正里面的知识错误,使生成回复中知识的准确率相对提高60%,达到80%以上。这样一个知识增强模型生成的回复,能够保持知识的准确率处于一个相对比较高的水平。

刚才提到,我们在有些任务中需要有对话推荐,如推荐一首音乐、推荐一本书,推荐一个地方去旅游等,这些都需要在对话中满足,也采用了两种方法:一种是层次化的内容规划,另外一种是通过数据增强的方式实现。我们也建立了多种跨类型的对话数据集,并且这些数据集已经发布。通过这样的方法,使多轮对话的合适度和推荐的成功率在90%以上。

百度语言与知识技术开放平台

在这个能力引擎平台和知识中台上,我们能够支持各种场景定制,比如,智能文档分析、对话理解、定制与服务平台、智能创作、机器翻译开放平台、内容审核平台等,所有这些平台都可以支持各种互联网应用和工业应用。

THE END
1.图像识别精准识别超过十万种物体和场景,包含10余项高精度的识图能力并提供相应的API服务,充分满足各类开发者和企业用户的应用需求首购 热销图像识别产品限时 7折! >立即选购 立即使用 技术文档 产品价格 商务咨询 功能体验 HOT Demo快速体验图像识别能力 优惠活动 HOT 限时秒杀,新人1元首购专享福利! 私有化部署 https://ai.baidu.com/tech/imagerecognition?ref=gjk.17628128.com
2.百度识图在线入口百度识图可以识别商品、素材、植物、人物、风景等图片,用户只需上传图片可搜到类似内容,具体的入口地址可能很多小伙伴还不清楚,下面小编将为大家详细介绍一下,感兴趣的一起来看看吧。 百度识图在线入口 入口地址:点击前往 详细介绍 1、用户只需点击上述链接就能直接跳转至百度识图界面。 https://app.ali213.net/gl/1572613.html
3.百度识图网页版入口在线使用百度识图网页版登录官网《百度识图》作为百度公司倾力打造的在线图像识别工具,以强大的AI技术为支撑,为用户打开了一扇通往视觉智能新世界的大门。无需下载任何软件,无需复杂设置,只需上传或粘贴图片链接,即可享受即时、准确的图像识别服务。下面为大家带来《百度识图》网页版入口。 https://app.3dmgame.com/gl/523054.html
4.百度申请三维人体重建方法和装置专利,适用于各种人体测量和建模应用场金融界2024年12月9日消息,国家知识产权局信息显示,北京百度网讯科技有限公司申请一项名为“三维人体重建方法和装置”的专利,公开号CN 119091053 A,申请日期为2024年9月。 专利摘要显示,本公开提供了三维人体重建方法和装置,涉及人工智能领域,尤其涉及计算机视觉领域,适用于各种人体测量和建模应用场景。具体实现方案为:根https://www.163.com/dy/article/JJ0DG0ML0519QIKK.html
5.百度智能识图在线使用理想股票技术论坛想要在线使用百度智能识图,可按照以下方法操作:首先前往百度官网,然后点击进入智能识图功能页面。接着上传待识别的图片,系统将自动进行图像识别,并提供相关搜索结果和信息。了解百度智能识图的详细使用教程及步骤,让您更好地应用这一功能。 ,理想股票技术论坛https://www.55188.com/tag-03997885.html
6.百度识图领先的图像识别技术连接人与信息百度识图通过图像识别和检索技术,为你提供全网海量、实时的图片信息;你可以通过上传,粘贴图片网址等方式寻找目标图片的高清大图,相似美图;通过猜词了解和认知图片内容(如花卉、宠物、名人等);百度识图还拥有全网检索的人脸技术,帮你找到最相似的人脸。https://pidoutv.com/sites/10209.html
7.百度识图在线识图,以图搜图在线识图,以图搜图 标签:搜索工具以图识图百度识图识图工具识图网站 链接直达手机查看 百度识图是百度提供的一项图像识别技术,它通过先进的图像搜索技术连接人与信息,帮助用户搜寻和识别所见的图像。这项技术能够让用户通过上传图片或输入相关关键词,快速找到所需的图片内容,包括但不限于相似图片、原始出处、高清大图https://www.bgrdh.com/sites/27069.html
8.图片识别,图片识别在线百度识图,Python在IT领域,图片识别是一项关键的技术,特别是在人工智能和机器学习的应用中。本项目涉及的核心是利用在线百度识图服务和Python编程语言实现图片识别。主要技术包括迁移学习和inception v3模型,这些都是图像识别领域的先进工具和技术。 迁移学习是一种机器学习方法,它允许我们利用在大规模数据集上预训练的模型,如ImageNet,https://download.csdn.net/download/weixin_42696333/22356988
9.百度识图无线技术分享导航百度图像搜索-领先的图像识别技术连接人与信息-为你搜寻所见 摄影图库 以图搜图 图像搜索 图像检索 图像识别 图片搜索 图片识别 找图 拍图 拍照 搜图 识图 链接直达 手机查看 百度图像搜索-领先的图像识别技术连接人与信息-为你搜寻所见 相关导航 SauceNAO 图像搜索 https://www.iwuxian.vip/sites/2295.html
10.广州建网站站公司/百度识图在线入口广州建网站站公司,百度识图在线入口,网站备案期间做什么,儿童网站开发方面外文文献分析架构 我们开发系统,常规有两个架构,一个BS架构(浏览器/服务器模式),一个CS(客户端/服务器端模式);我们微信小程序项目属于CS架构,C客户端是我们要开发的小程序&… http://www.mhkc.cn/news/609139.html
11.搜狗图片搜索/搜索识图图说新闻 组图:刘雯胶片质感大片曝光 微醺灯光下展现女性优雅自如的力量 6张 图说新闻 组图:章子怡刘嘉玲女神气场足 王俊凯宋亚轩等同场 12张 图说新闻 宋佳梳马尾穿个性花衬衫 单手托腮眼神霸气 13张 图说新闻 组图:师兄弟同框!王俊凯宋亚轩一前一后下飞机梦幻养眼 6张 图说新闻 组图:李现最新时尚大片释出 穿灰蓝色https://pic.sogou.com/
12.百度识图系统百度在线网络技术(北京)有限公司软件名称百度识图系统 软件简称百度识图版本号V1.9 登记号2012SR104494分类号- 著作权人百度在线网络技术(北京)有限公司首次发表日期2010-12-13 登记日期2012-11-05 该公司其他软件著作权 序号登记日期软件全称软件简称登记号版本号 12024-08-12百度数字证书系统数字证书系统2024SR1164006V2.0 https://banquan.tianyancha.com/rj/z97mz9fe93ce438b985dfa1a9l4dm4d6
13.百度和谷歌识图他们所使用的方法的核心,是一项由新罕布什尔州的达特茅斯学院和英国剑桥微软研究所开发的新技术,这项技术能够根据画作包含的视觉概念对其进行分类。这些概念被称之为“classemes”,它包含了几乎所有的东西,从小的物质描述如鸭子、飞盘、人、独轮手推车到颜色变化再到高层面描述如死尸、水体、路面等等。https://m.zol.com.cn/article/4806857.html
14.20个全球图片搜索引擎识图网站,以图搜图很多时候,我们手上会有一些不错的图片,但质量不怎样,要么分辨率太低,要么是有水印的,很多人都想要在网上找到原图、大图或者是无水印的图片。当我们需要搜索一些图片的时候使用图片搜索引擎网站可以帮我们更快地找到自己需要的图片,而且现在的搜图工https://www.extrabux.cn/chs/guide/7914279
15.《百度识图》在线入口手机软件php小编苹果为您介绍《百度识图》在线入口,这是一款功能强大的图片识别工具,用户可以通过上传图片或输入图片链接,在线快速识别图片内容。无论是想了解图片中的物体名称、获取相关信息,还是寻找相似图片,都能轻松实现。《百度识图》在线入口的便捷操作和准确识别,让用户在日常生活中更加便利快捷。 百度识图在线入口 https://m.php.cn/faq/690536.html
16.百度识图,"鉴"你所见以图搜图优秀新媒体导航百度识图-鉴你所见。百度图片使用世界前沿的人工智能技术,为用户甄选海量的高清美图,用更流畅、更快捷、更精准的搜索体验,带你去发现多彩的世界。https://123.meibp.com/6358.html
17.以图搜图百度识图如何操作?页面为百度识图的技术,里面的按钮点击一下,然后上传你的图片,即可进行识图工作。多搜搜怎么以图搜图,需要利用在线识图搜索引擎。以图找图,是一种查找图片出处、图片来源的好办法。 如何以图搜图?点击“识图一下”按钮,然后点击“本地上传”按钮,即可进行以图搜图。欢迎大家访问反向搜图神器duososohttps://www.duososo.com/index_shitu.php
18.百度识图搜索结果梦想导航百度识图搜索结果 百度图像搜索-领先的图像识别技术连接人与信息-为你搜寻所见多搜搜 - 图片搜索 & 人工智能AI图片 多搜搜为您提供版权图片搜索、无版权图片搜索、AI图片搜索、人工智能图片搜索,各类图片搜索索以及图片搜索引擎,推荐版权图片,AI图片,人工智能图片,无版权可商用图片网站,并提供搜索聚合服务。https://nav.dreamthere.cn/site/index/86
19.图像识别百度AI支持超过10万类常见物体和场景识别,接口返回图片内1个或多个物体的名称,并可获取百科信息。适用于图像或视频内容分析、拍照识图等业务场景。 技术文档:https://ai.baidu.com/ai-doc/IMAGERECOGNITION/Xk3bcxe21 图像主体检测 检测图片中的主体,支持单主体检测、多主体检测。可识别出图片中主体的位置和标签,方便裁剪http://openaistore.com/h-pd-40.html
20.百度api图像识别接口一览表简述:图像识别技术精准识别超过十万种物体和场景,包含10余项高精度的识图能力并提供相应的API服务,充分满足各类开发者和企业用户的应用需求。 百度AI人工智能技术在人脸识别、语音识别、文字识别、图像识别等方面有几百种产品,很多用户都在咨询腾佑科技百度云服务中心的图像识别技术,那么今天小编就为大家做一个百度apihttps://ai.tuidc.com/zixun/4756.html
21.抖音图文文字怎么提取抖音图文怎么提取文字跟图片百度识图:这是一款由百度开发的能够识别图像内容的工具。您可以使用它来截取抖音视频中的文字图像,然后通过识图功能获得文字。 谷歌识图:谷歌提供了一款强大的图像识别工具,能够识别图像中的文字。您可以将抖音视频的截图上传至谷歌识图,即可获得对应的文字内容。 https://tool.a5.cn/article/show/39676.html
22.百度识图黑科技Lens技术打造视觉能力增强利器2. 从技术层面,它首次实现了类人眼的对实时视频流数据的感知和认知能力。百度识图具备了目前全球最快最稳定的跨平台实时视觉 AI 能力,可以嵌入到 Android/iOS 系统部署,依靠百度移动端深度学习预测框架 paddle-mobile,在移动端和智能硬件中运行,并保持业内遥遥领先的性能和效果指标。 https://www.infoq.cn/talk/190Vwctyk5XhhRvGHVhB?utm_source=hot_talk
23.揭秘10大顶级反向图片搜索引擎:重新定义图片搜索TinEye是一款由Neven Vision公司开发的图像搜索引擎,以其先进的图片识别技术闻名。与谷歌识图、百度识图、搜狗识图和Yandex.Images类似,TinEye也提供了简洁直观的用户界面,并且分类详细,能够根据不同需求快速识别和搜索图片。 TinEye的一个显著特点是它能够追踪图片的使用情况和修改历史。当用户上传一张图片时,TinEyehttps://tech.wmzhe.com/article/108224.html
24.这10个免费新媒体工具,超级实用!拿走吧识图技术哪家强,打开电脑找百度。 百度识图真的很强大,小公举就曾经用它识别过各种植物盆栽,一识一个准,百度的图像识别和检索技术还真不是盖的。 1、百度识图(http://image.baidu.com/?fr=shitu) 使用方法: 用电脑打开百度识图,将想要识别的图片上传上去,或者输入图片网址,就可以坐等结果啦。 https://maimai.cn/article/detail?fid=1590082491&efid=R2JMa8ILuc1jk9tkW0g7RA