预训练技术在美团到店搜索广告中的应用

而针对预训练在语义匹配任务中的应用,业界也提出不少的解决方案。中科院计算所郭嘉丰等人提出PROP[6]和B-PROP[7]等针对搜索任务的预训练方法,主要思想是引入文档中代表词预测ROP(RepresentativewOrdsPrediction)任务。纽约大学石溪分校曹庆庆等人提出DeFormer[8]分解预训练语言模型来做问答等语义匹配任务,在BERT的低层分别对问题和文档各自编码,再在高层部分拼接问题和文档的表征进行交互编码,让文档和问题在编码阶段尽可能地独立,从而提升模型的整体效率。百度刘璟等人提出RocketQA[9]和RocketQAv2[10]等面向端到端问答的检索模型训练方法,通过跨批次负采样、去噪的强负例采样以及数据增强技术大幅提升了双塔模型的效果。陈丹琦等人提出SimCSE[11],采用自监督来提升模型的句子表示能力,从而提升语义匹配的效果。

深度语义匹配通常分为表示型和交互型两类:表示型模型一般基于双塔结构分别得到两段输入文本的向量表示,最后计算两段文本表示的相似度;该方法的优点是Doc向量可提前离线计算缓存,且匹配阶段计算速度很快,适合线上应用;缺点是只在模型最后阶段进行交互,对文本之间匹配关系学习不足。而交互型模型在初期即对两段输入文本进行交互,匹配阶段可以采用更复杂的网络结构,以学习文本间细粒度匹配关系;这种方法往往可以达到更高的精度,主要挑战在于线上应用的性能瓶颈。

为了解决这些问题,我们基于BERT在训练数据、特征构造和模型方面进行若干探索和实践。下文将逐一展开介绍。

我们按照模型学习的困难程度,从低到高设计了三种负样本采样方式:

最终,我们的微调样本包括约50万条数据,涵盖餐饮、休娱、亲子和丽人等20个主要类目,其中正负样本比例为1:5,三种负样本比例为2:2:1。

为了更合理的引入品类信息,我们对BERT模型的输入编码部分进行改造,除了与原始BERT一致的Query、Doc两个片段外,还引入了品类文本作为第三个片段,将品类文本作为额外片段的作用是防止品类信息对Query、Doc产生交叉干扰,使模型对于POI文本和品类文本区别学习。

我们首先利用上文介绍的数据增强后的训练样本训练了MT-BERT-Base模型(12层768维),与ESIM模型相比,各项指标均显著提升,其中AUC提升6.6PP。在BERT模型优化方面,多任务学习和引入品类信息这两种方式均能进一步提升模型效果,其中引入品类信息的MT-BERT-Base模型效果更佳,相比标准的MT-BERT-Base模型AUC提升1.2PP。

在BERT模型规模方面,实验发现随着其规模增长,模型效果持续提升,但是预训练和部署成本也相应增长,最终我们选取了大约3亿参数量的MT-BERT-Large模型(24层1024维),在同样引入品类信息的条件下,相比MT-BERT-Base模型AUC增长1.21PP,相比ESIM模型AUC增长8.12PP。

在模型的实践落地过程中,我们也遇到若干挑战,并且针对性的设计了优化方案。第一个挑战是BERT模型的前向耗时无法满足线上性能要求,我们通过知识蒸馏和低精度量化方法对模型进行压缩,并且采用离线缓存与实时预测结合的方式进一步提升了服务性能。

由于BERT模型的庞大参数量和前向预测耗时,直接部署上线会面临很大的性能挑战,通常需要将训练好的模型压缩为符合一定要求的小模型,业内常用模型压缩方案包括模型裁剪、低精度量化和知识蒸馏等。知识蒸馏[12]旨在有效地从大模型(教师模型)中迁移知识到小模型(学生模型)中,在业内得到了广泛的研究和应用,如HuggingFace提出的DistillBERT[13]和华为提出的TinyBERT[14]等蒸馏方法,均在保证效果的前提下大幅提升了模型性能。

经过在搜索等业务上的探索和迭代,美团NLP团队沉淀了一套基于两阶段知识蒸馏的模型压缩方案,包括通用型知识蒸馏和任务型知识蒸馏,具体过程如下图3所示。在通用型知识蒸馏阶段,使用规模更大的预训练BERT模型作为教师模型,对学生模型在无监督预训练语料上进行通用知识蒸馏,得到通用轻量模型,该模型可用于初始化任务型知识蒸馏里的学生模型或直接对下游任务进行微调。在任务型知识蒸馏阶段,使用在有监督业务语料上微调的BERT模型作为教师模型,对学生模型在业务语料上进行领域知识蒸馏,得到最终的任务轻量模型,用于下游任务。实验证明,这两个阶段对于模型最终效果的提升都至关重要。

为了充分结合交互结构效果好和双塔结构效率高的优势,FacebookPoly-encoder[15]、斯坦福大学ColBERT[16]等工作在双塔结构的基础上引入不同复杂程度的后交互层(LateInteractionLayer)以提升模型效果,如图4?所示。后交互网络能提升双塔模型效果,但也引入了更多的计算量,在高QPS场景仍然很难满足上线要求。针对上述问题,在第二阶段任务型知识蒸馏过程中,我们提出了虚拟交互机制(VirtualInteRacTionmechanism,VIRT),如图4(d)所示,通过在双塔结构中引入虚拟交互信息,将交互模型中的知识迁移到双塔模型中,从而在保持双塔模型性能的同时提升模型效果。

任务型知识蒸馏及虚拟交互的具体过程如上图5所示。在任务型知识蒸馏阶段,我们首先基于MT-BERT-Large交互模型在业务语料上进行微调得到教师模型。由于学生模型Siamese-MT-BERT-Medium缺乏上下文交互,如图5(b)所示,注意力矩阵中的灰色部分代表了2块缺失的交互信息,我们通过虚拟交互机制对缺失部分进行模拟,计算公式如下为:

我们对蒸馏阶段各个模型进行了Benchmark上的效果评估以及线上QPS=50时的性能测试,结果如表2所示。通过虚拟交互进行任务型知识蒸馏得到的任务轻量模型Siamese-MT-BERT-Medium相较于直接对通用轻量模型进行微调得到的同结构的Siamese-MT-BERT-Medium(W/O任务型知识蒸馏)模型,各项效果指标明显提升,其中Accuracy提升1.18PP,AUC提升1.66PP,F1-Score提升1.54PP。最终我们对任务轻量模型Siamese-MT-BERT-Medium进行上线,相较于最初的MT-BERT-Large模型,线上推理速度提升56倍,完全满足线上服务的性能要求。

表2模型效果对比

线上实时计算的任务轻量模型使用TF-Serving进行部署,TF-Serving预测引擎支持使用美团机器学习平台的模型优化工具—ART框架(基于Faster-Transformer改进)进行加速,在将模型转为FP16精度后,最终加速比可达到5.5,数值平均误差仅为5e-4,在保证精度的同时极大地提高了模型预测的效率。

THE END
1.#1.9元买网课第一天看了半小时广告#转!#来自搜狐科技#1.9元买网课第一天看了半小时广告#【转!#卖课直播用1.9元勾引人花8800元#】总台记者调查发现,不少直播间在推销低价网课,有的仅需1.9元。记者发现,1小时的课程实际教学内容不足半小时。其它时间老师主要是在展示自己的声音,介绍自己通过声音致富的经历,并声称“可以轻松变现赚钱。”直到直播课程第5天,主播老师就https://weibo.com/6982382342/P58p01rgM
2.这才是最好的招生广告吧!董明珠问雷军:你给股民分了多少钱 正部级吴存荣任上被查 7岁异瞳女孩在学校受欢迎 学习贯彻中央经济工作会议精神 实习生一句小姨让同事汗流浃背 《我是刑警》杨小洁原型有多牛 被抱养37年拒绝认亲当事人发声 中国公开6.56马赫高超音速飞行器 日本女学生在麦当劳被捅致死 江苏8死爆炸事故7人被采取强制措施 乒超联赛https://m.163.com/v/video/VAIK6NF6F.html
3.线上广告营销干货学习资料库广告行业数字招聘平台最新电视剧、最新电影、动漫番剧、学习课程,蓝光视频免费在线观看服务,无广告不卡,每天第一时间更新! 收藏 LIBVIO影视 聚合海外超清在线视频站 收藏 FreeOK - 追剧也很卷 追剧FreeOK为您提供2023最新电视剧、最新电影、动漫番剧、学习课程,蓝光视频免费在线观看服务,无广告不卡,每天第一时间更新! https://www.bidianer.com/site/245518
4.线上广告营销干货学习资料库广告行业数字招聘平台HAOAD | 广告情报局官网-线上广告营销干货学习资料库-全球广告营销创意平台https://www.haoad123.com/
5.汇量科技利用AWS打造一站式大数据机器学习平台,日均高效处理1000汇量科技利用Amazon Web Services(AWS)云服务打造的一站式大数据机器学习平台,日均高效处理1000亿次线上预测,数倍提升线上变现价值。汇量科技是全球卓越的技术平台服务商,凭借全球化网络和本地化服务的能力,为60多个国家的2000多个活跃应用开发者提供从获客到变现的全栈http://aws.amazon.com/cn/solutions/case-studies/mobvista-machine-learning/
6.4500+资源免费对接:乘风破浪的姐姐直播招商滴滴寻品牌实物2:靠谱的有实力的医疗网站线上线下平台推广 3:微信公众号、网站也可付费购买广告位 我提供:海量优质医生继续教育课程,提供脊柱、关节、创伤、运动,保膝等五个方面手术视频,优质课程,为医生的继续学习和发展提供全方位服务与帮助! 10、【丽格荟】求万代,乐高的供货资源: https://www.niaogebiji.com/article-27383-1.html
7.广告人求职攻略(文案篇):30+广告公司总监HR的选人标准整体影响不大,按计划进行,部门面试改为线上 目前招聘流程是初步确定合适的候选人后,按照职级划分,会进一步安排 1-2 轮面试。 筛选简历时,看重的内容 工作经历、学习能力、对广告的想法与见解 比较看重的是工作经历部分,当然这只是对于候选人的个人能力起到一个参考作用,重要的是他本身是否有足够的学习能力,对广告https://www.digitaling.com/articles/282218.html
8.干货!这些线上微课,教你宅家也能搞学术!澎湃号·政务这篇文章是本学期给金融学院硕博连读生上《学术论文写作》的部分内容,关于论文如何写作(有更多干货)可以去超星平台学习。 关于论文写作前的准备。这里主要从选题、查找文献、阅读文献、数据收集、数据处理五个部分给大家介绍。 01选题 选题可咨询导师。在导师的指导下,结合自己的研究兴趣选择一个既有意义也具有可操作性https://www.thepaper.cn/newsDetail_forward_6317775
9.Contents/premium.mdatmaster·Newslab2020/Contents·GitHub社交媒体上发言的为什么更多是极端者? 我们能做些什么来改变现状? 608 问答专辑 2022/8/16 如何看待国内社交平台公开IP属地? 如何理解并说服长辈避免通过营销号获取信息? 如何看待《财新》所处的环境? 回复会员通讯604期《互联网必然抖音化?》 607 加拿大网络新闻法:平台向媒体付钱? https://github.com/Newslab2020/Contents/blob/master/premium.md
10.腾讯自研机器学习平台“太极”八年进化之路● AI pipeline 各阶段可观测性,平台对特征入库、模型训练、线上推理提供性能、效果监控报告,确保信息数据透明。 ● 资源管理与模型治理,系统化管理训练、存储资源,对模型的上下线等请求提供完整监控记录和回溯能力,保障模型质量。 平台初期的挑战 广告大模型迭代链路是个在线学习闭环流程,有着特征数据量级大实时性高https://cloud.tencent.com/developer/article/2255686
11.2020年度大事记大事记7月17日第六届中国国际“互联网+”大学生创新创业大赛校园选拔赛暨安徽新闻出版职业技术学院“互联网+”大学生创新创业大赛在学院图书科技楼会议室和“腾讯会议”平台线上线下同步举办。 7月17日学院召开2020年度第十八次党委会,研究了“640万欧元贷款购置设备的处理事宜”等主要内容。 https://www.ahcbxy.edu.cn/zjxy/dsj/202203/t20220304_5848831.html
12.懒人周报拼多多市值超百度;ZAO换脸视频走红;Costco大陆首店开业腾讯发布全栈机器学习平台Angel 3.08月22日,腾讯首个AI开源项目Angel正式发布一个里程碑式的版本:Angel 3.0。这是一个全栈的机器学习平台,功能特性涵盖了机器学习的各个阶段,超过50万行代码,在GitHub上Star数已超过4200,Fork数超过1000。QQ发布新版本8.1.3,上线“一起听歌”、“16人视频通话”等功能腾讯QQ发布安卓https://www.360doc.cn/article/66143359_922066683.html
13.广告:回应5G安全质疑;央视点名虎牙等直播平台:网课给网游带流量钉钉推出新职业在线学习平台,计划培育 100 万从业者 6月 8 日消息,中国就业培训技术指导中心联合阿里巴巴钉钉推出的新职业在线学习平台 2.0 版正式上线。据悉,该平台是全国首家专注于新职业数字资源培训的线上服务平台,立足培育新型技能人才,服务促就业稳就业,今年计划培训 100 万新职业从业者。 https://www.geekpark.net/news/261128
14.常州幼儿师范学校2020年春季学期开学教学工作预案下发各专业本学期课务安排情况表,由课程负责人或备课组长牵头,组织制定课程授课计划、泛雅平台课程教学空间建设计划,利用微信群、QQ群、平台交互等开展假期集体备课工作,开发网络学习课程,建设泛雅平台课程学习空间,以做好线上授课准备。2月15日,以教研室为单位申报线上授课课程,于中下旬启动部分公共基础课和部分专业https://www.wjtts.net/info/1093/5470.htm
15.互联网行业术语未来电子商务平台即将消失, 线上线下和物流结合在-起,才会产生新零售。线上是指云平台,线下是指销售门店或生产商,新物流消灭库存, 减少囤货量。( 电子商务平台消失是指,现有的电商平台分散,每个人都有自己的电商平台) 粉丝经济 互联网时代,通过内容营销 , 聚集起志同道合的粉丝。这些粉丝聚集后, 获得参与感、归https://blog.csdn.net/echizao1839/article/details/106859234
16.线上宣传推广方案(精选12篇)4、配合企业年度战略方向,选取有影响力的'品牌新闻网络宣传平台,并制定品牌软文内容年度性方案。 5、筛选出较有影响力的20个论坛社区平台,并对论坛贴子炒作制定年度性方案。 6、每周跟进付费广告、品牌新闻发布、攒写贴子并发布论坛社区等方式进行推广宣传。 https://www.ruiwen.com/fangan/6675325.html
17.跨境电商培训卖家开店教程官方运营培训了解Listing及其重要性、学习准备工作以及上传与质量自查操作。 官方直播 免费直播 初阶 新手Listing全攻略 从上传到优化,全面提升您的Listing质量。 官方讲堂 付费 初阶 线下 三步提升转化迈向爆单 优化商品详情页迈向爆单 官方讲堂 付费 进阶 线上 Level 2: 高阶广告诊断与详情页升级 https://gs.amazon.cn/learn
18.4万字回顾2023电商复盘2024经营风向,藏在这50条洞察里所以对于商家来讲,获取流量的手段有了两种,要不然是降低自己的利润,要不然是在平台中购买流量。本质上都是以什么样的方式去求平台的生存机会。 平台呢?平台是不是愿意将原有可以进行商业化变现的流量和坑位,免费给到低价商品?这笔账也好算。过往平台收了那么多广告费,把这些费用归拢到一起变成市场投放,再向全域去https://36kr.com/p/2540161078304901
19.2019机器之心人工智能年度奖项正式公布:关注创业先锋,聚焦产品2019 年,寒武纪继续在「智能终端处理器 IP」和「智能云服务器芯片」两大产品线上深耕,并于 6 月,推出了云端 AI 芯片中文品牌「思元」、第二代云端 AI 芯片思元 270(MLU270)及板卡产品,为客户在智能视频分析、语音合成、推荐引擎、AI 云等多个领域提供了高能效比的解决方案,同时处理非稀疏深度学习模型的理论峰https://www.zhuanzhi.ai/document/2abfb47db9cd9ab70b4144f329e147b8
20.从设计工具到SaaS,酷家乐如何赋能家居家装企业爱分析调研创新能力方面,基于平台积累的海量室内设计相关数据,酷家乐在积极探索大数据和机器学习的应用,提升产品的智能化体验。此外,酷家乐还有专门负责VR的技术团队,在VR硬件投资上也有所布局。虽然目前VR还不成熟,但未来有望在家居家装行业较好的应用前景。 平台广告业务将成为新的营收增长点 http://kujiale.com/ask/3FO4K7RYD0HS/
21.客服部明年工作计划(精选16篇)3、线上线下一体化销售服务支撑平台。实现OTO线上线下一体化支撑。支撑总部功能落地开发。支撑集团客户WO店。 4、在线客服及导购平台升级扩容 。 5、全流程管控生产运营支撑系统 。实施四厅运营状态监控和两终端电子化管理,实现全流程生产运营指令跟踪与分析。 https://www.yjbys.com/gongzuojihua/2014/3127367.html
22.七彩课堂app官方版下载七彩课堂2024年最新版本v2.2.1学生可以直接在软件内查找对应教材内容,无论是预习还是复习,都能找到所需资料,居家学习也能高效进行。软件会持续更新最新教育资源,确保用户能够获取到最新的学习信息和教材内容。 介绍说明 1、为线上教育量身打造了多方面、即时互动的云教育内容 2、提供高效率的教学网上学习服务,激发学生的学习乐趣 3、涵盖了语数外https://www.qimu86.com/soft/27778.html
23.线上学习工具下载海信智课软件v3.1.2官方版下载线上学习工具下载 投诉报错 软件大小:186MB 软件语言:简体中文 软件类型:国产软件 软件授权:免费软件 软件类别:教育管理 应用平台:Windows平台 软件官网:官方网址 更新时间:2021-05-27 网友评分: 360通过腾讯通过金山通过 186MB 详情介绍 海信智课软件是一款功能强大,专业实用的优秀学习软件,集教材资源、课前导学、同https://www.jb51.net/softs/776913.html