深度学习在计算广告中的应用随着机器学习特别是深度学习的不断发展,其广泛应用于计算广告投放流程的各个阶段。笔者最近对深度

2019年阿里巴巴推荐团队发表的论文《SDM:SequentialDeepMatchingModelforOnlineLarge-scaleRecommenderSystem》提出了SDM(SequentialDeepMatchingModel)算法,其在双塔模型的基础上,引入用户行为序列,挖掘其中长、短期兴趣信息,并融合得到用户兴趣表征,从而能够通过用户历史行为进行更加个性化的推荐。

损失函数使用交叉熵损失函数:

2019年阿里巴巴天猫团队发表的论文《Multi-InterestNetworkwithDynamicRoutingforRecommendationatTmall》提出了MIND(Multi-InterestNetworkwithDynamicrouting)算法,设计了多兴趣抽取层(Multi-InterestExtractorLayer),通过动态路由(DynamicRouting),自适应地聚合用户历史行为生成用户兴趣表征,将用户历史行为划分为多个聚类,每类的用户历史行为被转化为表征用于表示用户的某一类兴趣,因此,对于一个用户,MIND会输出多个用户表征,用于表达用户多样化的兴趣。

MIND的任务之二是将召回的目标商品的特征通过商品塔转化为商品表征:

《LearningTree-basedDeepModelforRecommenderSystems》是阿里妈妈算法团队于2018年发表的一篇论文,其中提出了TDM,创新性地将树结构索引和深度神经网络结合,在推荐系统召回阶段,通过树结构索引实现海量商品的快速检索和高效剪枝。

论文中还提到,召回过程中实际并不需要计算出概率真实值,只需要计算出各节点概率的相对大小即可,因此论文使用用户和商品交互这类隐式反馈作为样本,使用一个深度神经网络进行训练,用作各节点的分类器,即全局所有分类器共用一个深度神经网络。

对于树的构建和模型训练,论文的整体方案是,先采用一定的方法初始化树,再按以下的步骤循环多次:

最终得到线上服务使用的深度神经网络和树结构。

TDM方案存在以下不足:一是索引和模型的联合训练比较耗计算资源,二是树结构索引中的每个非叶子节点并不表示具体的某个商品(仅每个叶子节点表示具体的某个商品),因此在模型中,节点特征无法使用商品信息。而NANN解决了上述的两个不足:一是在模型训练和图搜索上进行优化减少计算量,二是图中的节点均表示具体商品,可以充分使用商品信息。

NANN的模型结构如下图所示:

对于图的构建,论文直接使用了HNSW算法,并使用商品向量的L2距离作为距离度量。基于HNSW算法进行分层遍历,如下所示:

多任务学习、多场景学习的主要区别如图25所示,多任务学习是对同一样本数据集的多个不同类型的任务进行联合学习,而多场景学习是对多个不同场景样本数据集的同一类任务进行联合学习。

在DeepGSP机制下,强化学习涉及的状态、动作和奖励定义如下:

2018年发表的论文《BudgetConstrainedBiddingbyModel-freeReinforcementLearninginDisplayAdvertising》提出了基于无模型强化学习的自动出价。

这里的无模型是指不对环境进行建模、不直接计算状态转移概率,智能体只能和环境进行交互,通过采样得到的数据进行学习,这类学习方法统称为无模型的强化学习(Model-freeReinforcementLearning)。无模型的强化学习又可以分为基于价值和基于策略的算法,基于价值的算法主要是学习价值函数,然后根据价值函数导出一个策略,学习过程中并不存在一个显式的策略,而基于策略的算法则是直接显式地学习一个策略函数,另外,基于策略的算法中还有一类Actor-Critic算法,其会同时学习价值函数和策略函数。

论文具体使用DQN算法,该算法将强化学习中基于价值的算法和深度学习相结合。另外,论文在该算法的基础上,针对自动出价场景的特点进行优化。

论文使用带约束的马尔科夫决策过程(ConstrainedMarkovDecisionProcess,CMDP)对自动出价问题进行建模,如图31所示,其分为离线训练环境和在线预测环境。

自动出价目标可由下式表示:

基于上述约束条件的统一表示,论文给出带约束自动出价问题的统一表示:

论文进一步推导出上述线性规划问题取得最优解时,每次展现的出价可由下式表示:

上一节已提到无模型的强化学习分为基于价值和基于策略的算法,基于价值的算法主要是学习价值函数,然后根据价值函数导出一个策略,学习过程中并不存在一个显式的策略,而基于策略的算法则是直接显式地学习一个策略函数,另外,基于策略的算法中还有一类Actor-Critic算法,其会同时学习价值函数和策略函数。USCB具体使用了Actor-Critic算法中的DDPG算法。DDPG算法使用Actor网络和Critic网络分别拟合策略函数和价值函数。DDPG算法在和环境的交互中,先使用Actor网络根据状态得到动作,再使用Critic网络根据状态和动作得到动作价值。USCB中DDPG算法的实现与原始DDPG算法基本一致,其中几处细节是:

和USCB类似,PerBid首先对带约束自动出价问题进行建模:

和USCB类似,PerBid也推导出最优出价公式:

之前所介绍的各自动出价方案,均先离线与仿真竞价系统交互进行训练、再在线与真实竞价系统交互进行预测,因此存在一个共性问题是如何保持仿真竞价系统和真实竞价系统的一致性,而真实竞价系统存在复杂的拍卖机制、激励的出价竞争,仿真竞价系统难以精确模拟真实竞价系统,而如果不能保持两个系统的一致性,则可能导致仿真竞价系统下所训练的自动出价方案在真实竞价系统中非最优。

阿里妈妈在2023年发表的论文《SustainableOnlineReinforcementLearningforAuto-bidding》,其提出的SOLA框架,将离线强化学习和在线安全探索相结合,同时解决了训练依赖仿真竞价系统和在线探索出价安全性的问题。

粗排和精排均可以认为是排序(LearningtoRank,LTR)问题,而排序问题的求解一般有3种方式:

这三种方法从上到下,从只考虑序列中元素自身、到考虑序列中两两元素相互关系再到考虑序列中所有元素相互关系,考虑的信息更加全面,但问题求解的样本空间也逐渐增大,从所有元素构成的样本空间、到所有元素两两配对构成的样本空间、再到所有元素组合序列构成的样本空间。

《COLD:TowardstheNextGenerationofPre-RankingSystem》由阿里妈妈于2020年发表,介绍了其粗排模型基于Pointwise类型的排序方法,从简单的后验统计、到浅层模型、再到深层模型的演进历程,并主要介绍了其深层模型COLD在模型结构和工程实现上的优化思路,从而在保证在线系统性能要求的前提下,在模型准确度上取得较好的提升。

降低精度。网络前向传播中的运算主要是矩阵相乘,而Float16相对Float32在矩阵相乘上有更高的性能,因此,可以使用Float16替代Float32。

令真实的训练样本集,IP(ImmediatePositive)表示立即发生转化的正样本,DP(DelayPositive)表示延迟发生转化的正样本,其等价于FN(FakeNegative),即假负样本,RN(RealNegative)表示未发生转化的真负样本。

对于上述反馈延迟问题,业界已经有比较多的理论研究和业务实践,其中一个思路是保持模型不变,但针对反馈延迟导致的样本标记分布偏差,通过在损失函数中进行正负样本的加权来纠偏。

对于点击延迟,论文在处理样本时并不会等待其相应的点击发生,而是直接将样本标记为负样本,待点击发生后,再将原样本复制成一条新样本,并将新样本标记为正样本。

论文通过推导,损失函数最终可写成:

通过复制,训练样本集除包含真实样本集中的Positive、FakeNegative和RealNegative外,还包含复制样本集中的真正样本和真负样本,真实样本集和复制样本集除部分样本的标记不同外,其余均一致。

前述论文均是基于重要性采样,并不断优化权重计算方式,但均存在一个问题,即FakeNegative样本在训练时被错误地标记。阿里妈妈于2022年发表了论文《AsymptoticallyUnbiasedEstimationforDelayedFeedbackModelingviaLabelCorrection》,提出了DEFUSE(DElayedFeedbackmodelingwithUnbiaSedEstimation)算法,采用两阶段优化来解决上述问题,首先预测FakeNegative样本的概率,然后再进行重要性采样。

基于规则的归因算法包括但不限于:

基于数据的算法最早于2011年在论文《Data-drivenMulti-touchAttributionModels》中被提出,其中使用Logistic回归模型进行各触点归因权重分析,而随着深度学习的发展,近几年来不少论文探索基于深度学习的多触点归因算法。

2018年发表的论文《DeepNeuralNetwithAttentionforMulti-channelMulti-touchAttribution》提出了DNAMTA算法。论文指出其首次在业界将深度学习应用于多触点归因中。

即将转化路径中属于该渠道的触点的归因权重求和。

将各个渠道的ROI作为其权重,从总预算中分配该渠道的预算:

CAMTA的整体网络结构如图48所示,其包含三部分。

2021年的论文《CausalMTA:EliminatingtheUserConfoundingBiasforCausalMulti-touchAttribution》提出了CausalMTA,其和CAMTA相比,将用户偏好这一混杂因子,进一步区分为不变的静态属性和变化的动态特征,对于静态属性,其使用变分循环自编码器作为渠道序列生成模型获取其无偏分布,然后基于无偏分布和逆概率加权方法对每个转化路径重加权,从而消除静态属性引起的选择偏差,而对于动态特征,其和CAMTA类似,也是借鉴CRN,通过循环神经网络和域对抗训练,生成用户历史的无偏表征,从而消除动态特征引起的选择偏差,得到无偏的转化率预估模型。最后,基于转化率预估模型,采用反事实分析计算各渠道的夏普利值作为归因权重,即对各渠道,使用转化率预估模型分别预估有无该渠道时的转化率,因引入该渠道带来的转化率提升即该渠道对转化的边际期望增益,也就是该渠道的夏普利值,被作为该渠道的归因权重。

CausalMTA整体解决方案模型如图50所,其包含三部分。第一部为转化路径重加权(JourneyReweighting),其对于静态属性,使用变分循环自编码器作为渠道序列生成模型获取其无偏分布,然后基于无偏分布和逆概率加权方法对每个转化路径重加权,从而消除静态属性引起的选择偏差。第二部分为因果转化率预估(CausalConversionPrediction),其对于动态特征,借鉴CRN,通过循环神经网络和域对抗训练,生成用户历史的无偏表征,从而消除动态特征引起的选择偏差,得到无偏的转化率预估模型。第三部分为归因权重计算(Attribution),其基于转化率预估模型,采用反事实分析计算各渠道的夏普利值作为归因权重,即对各渠道,使用转化率预估模型分别预估有无该渠道时的转化率,因引入该渠道带来的转化率提升即该渠道对转化的边际期望增益,也就是该渠道的夏普利值,被作为该渠道的归因权重。

上一节介绍的MMoE采用多个专家网络对各任务的知识进行挖掘和共享,并对每个任务设计其专有的门控网络,每个任务的门控网络对各专家网络的输出进行加权求和作为该任务专有网络塔的输入。

综上,PLE构建多层抽取网络,在CGC网络区分任务专有专家网络和共享专家网络、分别挖掘专有和共享知识的基础上,进一步通过共享门控网络逐层从所有专家网络中抽取共享知识,从而实现各任务专有信息和所有任务共享信息的逐层抽取和深层挖掘。

THE END
1.实时数据流传输架构mob64ca12f37e8a的技术博客在大数据时代,实时数据流传输架构变得愈加重要。这种架构让我们能够以低延迟、高吞吐量的方式传输、处理和分析数据,使得企业可以迅速获取关键业务洞察力。本文将探讨实时数据流传输架构的基本概念,以及相关实现的代码示例。 实时数据流的概念 实时数据流是指连续生成的数据流,这些数据通常来自于传感器、服务器日志、社交媒体https://blog.51cto.com/u_16213444/12854373
2.QQ中的4G在线标志,技术原理与含义解析五金交电摘要:,,本文探讨了QQ上4G在线的含义及其技术原理。4G在线是QQ状态的一种显示,表示用户当前使用的设备正在通过4G网络连接到QQ。背后的技术原理涉及到移动网络的演进和QQ软件的功能设计。通过了解4G网络的高速数据http://xjxygt.cn/post/15467.html
3.在线表达式的革命,重塑计算边界与理解之力传输在线表达式作为一种新兴的云计算方式,正在改变我们的计算方式和生活方式,它具有实时性、交互性、便捷性和灵活性等特点,广泛应用于教育、科研、工程和金融等领域,随着技术的不断发展,我们有理由相信,在线表达式的应用场景将更加广泛,为我们的生活和工作带来更多便利。 http://m.zj-xy.net/post/22512.html
4.掌握未来技术,解析强实时性及如何应用于实际任务中的初学者与进阶强实时性系统是指系统对时间要求极为严格,能够在极短的时间内完成数据处理并作出精确响应,在强实时系统中,时间因素直接影响系统的性能与结果,自动驾驶汽车就需要强大的实时计算能力,以确保安全行驶。 认识强实时性的应用领域 强实时性技术在许多领域都有广泛应用,包括但不限于以下几个方面: https://www.shuguo168.com/post/11415.html
5.计算机考研:计算机网络五大考点解析腾讯云开发者社区计算机知识点多且难,一直是学生们头痛的科目之一,我们化繁为简,按照考研计算机专业大纲解析,特归纳出计算机网络五大核心考点以供同学们复习参考。 OSI参考模型的分层结构? OSI七层参考模型图如下: 最底层:物理层(PhysicalLayer)功能:数据物理传输 https://cloud.tencent.com/developer/article/2478828
6.实时,在线方式和离线方式的含义是什么?20岁,女性,人院前2周间歇性发热并有寒战,夜间体温39℃。发热期间左腹股沟有疼痛、肿胀。伴食欲缺乏,恶心、呕吐,时有咳嗽。体检左腹股沟有3cm×5cm肿块,肝、脾略肿大,腹部见玫瑰疹。血白细胞1.5×109 /L,中性粒细胞0.70×109/L,淋巴细胞0.36×109 /L,单核细胞0.04×109 /L。肝功正常,腹股沟https://www.shuashuati.com/ti/1d46a43729e74fce9d6abaf97383d863.html
7.实时在线方式和离线方式的含义是什么?实时、在线方式和离线方式的含义是什么? 参考答案:实时:所谓“实时”,是指信号的输入、计算和输出都是在一定时间范围内完成的,即计算机对输入信息以足 点击查看完整答案 您可能感兴趣的试卷 你可能感兴趣的试题 1.问答题什么是计算机监控系统的操作员工作站、通信工作站和培训工作站?http://www.ppkao.com/tiku/shiti/1963998.html
8.实时在线方式和离线方式的含义是什么?【题目】 实时、 在线方式和离线方式的含义是什么? 搜题找答案>08241计算机控制系统试题答案>试题详情 【题目】实时、 在线方式和离线方式的含义是什么? 纠错 查看答案 查找其他问题的答案?https://www.zikaosw.cn/daan/18588476.html
9.计算机网络第六话·数据的传输方式(上)知识点6:数据的传输方式 PS:本期内容包含了数据传输方式的基础内容与对应的一些概念和特点类习题,更多关于大题的计算与深度理解,请敬请期待下期哦~ 6.1 电路交换(Circuit Exchanging) 1.什么是电路交换? 在进行数据传输前,两个结点之间必须先建立一条专用的、双方独占的物理通信路径(由通信双方之间的交换设备和链路https://zhuanlan.zhihu.com/p/506165800
10.计算机控制技术复试面试(一)计算机控制面试问题总结(1)实时数据采集:对被控量的瞬时值进行检测,并输入给计算机。 (2)实时决策:对采集到的表征被控参数的状态量进行分析,并按已定的控制规律,决定下一步的控制过程。 (3)实时控制:根据决策,适时地对执行机构发出控制信号,完成控制任务。 5.实时、在线方式和离线方式的含义是什么? https://blog.csdn.net/weixin_44141520/article/details/115273613
11.海康威视IVMS4200设备添加和预览怎么配置?监控安装网在线,就代表添加成功,可以直接进入主预览界面查看监控画面 离线,那就注意一下电脑左下角的报错提示是什么,我们可以根据具体报错来找添加失败的原因。 02、实时预览 设备添加成功后,点击左上角图标,然后点击主预览进入软件预览界面 进入主预览界面后,点击监控点下方的分组,可以通过三种方式预览监控点画面 http://www.zdxt.net/show-65-3215.html
12.武平县公安局第九期公共安全视频监控建设项目货物类采购项目附件系统能支持多种方式的数据传输:可通过FTP或TCP/IP方式将车辆图片、违法图片、车辆通过信息(时间、地点、车牌号码、车身颜色等)、设备监测数据等上传到中心管理系统;也可在中心通过网络调用或下载操控前端设备存储的数据。 系统应能支持数据的断点续传:如因网络中断或其它故障,数据无法上传至管理中心时,可暂时将数据存储http://zfcg.longyan.gov.cn/upload/document/20211027/8f239fdf66564012af5845ec4fa0aa9b.html
13.奥鹏作业答案优学网可做奥鹏全部院校作业、国开形考作业答案、在线作业、离线作业、毕业论文,答案联系 微信:wxxygzs 22春北京中医药大学《计算机基础》平时作业4(在线答案) 试卷总分:100 得分:100 一、单选题 (优学网(www.youxue100f.com)共 100 道试题,共 100 分) 1.下面说法正确的是( ) http://www.youxue100f.com/a/zgyk/2022-04-20-8204.html
14.电脑翻译语音软件手机字幕翻译语音(34篇)可以预见,随着实时翻译语音字幕技术的不断发展和普及,它将在更多领域展现出巨大的应用潜力,为人类社会的交流方式带来革命性的变革。 未来交流的新方向 实时翻译语音字幕技术的出现,标志着人类社会交流方式的一次革命。在未来,随着科技的进一步发展和普及,实时翻译语音字幕技术将迎来更加广阔的发展空间,成为推动全球交流的https://shishifanyi.com/tag/?url=1227
15.法学:电子商务法律法规考试题库(考试必看)考试题库A.只是交易方式的电子化 B.其交易过程一般是在线订货、支付 C.其交易过程一般是离线送货 D.其交易过程一般是在线订货、支付和送货 点击查看答案 39、填空题 广义的电子商务是指所有利用()和()进行的商业贸易活动。 点击查看答案 40、名词解释 完全独立的服务器 点击查看答案 41、多项选择题 数据库特殊权利,http://www.91exam.org/exam/87-1478/1478378.html
16.ApacheDoris实时数据仓库的构建与技术选型方案数据仓库想必每个行业从业者都在以各式各样的方式进行实践和应用,在久远一点叫做离线数仓,后来由被称为数据中台等演化名称,再往后,又衍生到现代化实时数据栈这样的概念中,但说到底,终究还是为了解决数据的接、存、管、算、查这五个要义的,无论是多么具有附加价值的其他能力,也都是围绕这五个基本核心功能延展的。 https://developer.aliyun.com/article/1424133
17.房产市场信息系统技术规范相对于在线方式,另一种申请方式为离线方式,即房地产开发企业在本地计算机填写好预售申请,保存为文件,再上传到本子系统中。 5.2 功能要求 5.2.1 说明预售许可管理功能包含的内容。 商品房预售许可证的申请、审批、发放是新建商品房网上备案子系统的重要过程。 https://www.jianshu.com/p/28dfd9d99d50
18.Odoo14版本发行说明,全面了解新特性和变化Odoo中文应用商店财务报告的新设计,显示了每个部分的含义。 审计 跟踪对以下科目过帐条目的修改:帐户,标签,参考,标签(税格),到期日。 自动输入 将自动转帐应用于特定合作伙伴;使公司间交易更容易;一个向导,用于在向导中生成和传输预览条目。 现金 为现金舍入定义两个不同的帐户-一个用于损益,一个用于损益。 https://www.sunpop.cn/odoo14_features_new/
19.使用DataSync迁移数据到GaussdbTDataSync支持GaussDB 100(GaussDB T)在线迁移和Sybase、Oracle、MySQL、 GaussDB 100 V100R003C10、SQL Server离线迁移两种数据迁移方式。配置好源库以及目标库相关配置信息后,启动迁移工具即可,运行过程中会生成相关的日志文件和报告,便于用户进行日常的管理及维护。 https://blog.itpub.net/29715045/viewspace-2681966/
20.北部湾旅:首次公开发行股票招股意向书股票频道Online To Offline(在线离线/线上到线下),是指将线下的商 O2O 模式 指 务机会与互联网结合,让互联网成为线下交易的前台 是健康(Health)、安全(Safety)和环境(Environment)三 HSE 管理 指 位一体的管理体系 LPG 指 液化石油气(Liquefied petroleum gas) LNG 指 液化天然气(Liquefied natural gas) CNG 指 压缩https://stock.stockstar.com/notice/JC2015030300000062_127.shtml
21.上海联净上海联净有序发展事业合伙人,形成共享愿景、共谋发展、共创价值的“合伙人机制”。机制旨在通过制度性安排,以长期激励为导向,从根本上激发合伙人的能动性,实现聚合效应。 “共创共赢”的基调下,合伙人在所在的领域内大力推行上海联净的优质产品及系统服务。依靠上海联净质量、品牌、培训等诸多优势,通过平台助力和自身https://www.legion.com.cn/feed1.html
22.状态监测与故障诊断技术在电厂设备管理中的应用2.1 状态监测与故障诊断技术的含义 设备的状态监测通常是指通过测定设备的某一特征参数(如振动、温度),来检查其状态是否正常。当特征参数小于允许值时认为正常,否则认为异常。而设备故障诊断技术是通过了解和掌握设备在线使用的状态,结合设备的运行历史,对设备可能要发生的或已经发生的故障进行预报、分析、判断,确定故障https://www.iianews.com/ca/_01-ABC00000000000111129.shtml
23.不良事件报告范文12篇(全文)MAUDE数据库完全对公众开放, 提供在线检索和离线下载两种方式。使用在线检索功能时, 可以一个词、词组或年份作为检索关键词, 也可以进一步使用高级检索功能, 选择其他的检索标准。网上检索易于操作, 适合一般公众使用;可下载文件则包含了网站搜索可以获得的所有报告的信息, 这些文件采用管道线 (“|”) 分隔格式, 所有https://www.99xueshu.com/w/ikey9wajeuvc.html