KDD2021|美团联名信用卡技术实践:自适应信息迁移多任务(AITM)框架top

·用户多步转化过程中的路径序列依赖更长。

·在多步转化的长序列依赖中,正反馈(正样本)是逐步稀疏的,类别不平衡越来越严重。

在我们的信用卡业务中,我们通常希望用户能完成最后两个转化阶段(即曝光->核卡、曝光->激活),这才被认为是有效转化。因此,用前边任务的丰富的正样本信息来缓解后续任务的类别不平衡问题是很有必要的。在这个方向上,多任务学习是一个提高端到端获客转化率的典型解决方案。

二、背景介绍

在我们的信用卡业务中,

·申请(application):进入申请表格页后用户可以填写申请表格,并且点击申请按钮来申请一张信用卡。

·核卡(approval):也称授信,意味着用户信用良好,通过申请并被授予了一定的信用卡额度。在我们的系统中,这在多数情况下也是一个系统实时判断的过程。

以上的转化步骤有序列依赖,这意味着只有前一个步骤发生了,后一个步骤才可能发生。基于这个约束,用户只可能有5个不同的转化阶段如下图所示。

图15个不同的转化阶段

在工业界和学术界,多任务学习是一个提高端到端获客转化率的典型解决方案。近年来,在多任务学习中建模任务间关系的研究取得了很大的进展。我们将这些主要研究分为两大类:

1.控制多任务模型底部的专家模块如何在任务间参数共享[1,2,3],顶部的多塔模块分别处理每个任务,正如图3(a)所示,我们称这一类为专家底(Expert-Bottom)模式。然而,专家底模式只能在任务间传递浅层表示,但在靠近输出层的网络中往往包含更丰富、更有用的表示[4,5],这已被证明能带来更多的增益[6]。另外,由于专家底模式不是专门为具有序列依赖的任务设计的,因此这些具有专家底模式的模型不能显式地对序列依赖进行建模。

2.在不同任务的输出层中迁移概率[7,8,9,10],如图3(b)所示,我们称之为概率迁移(Probability-Transfer)模式。概率迁移模式只能通过标量乘积传递简单的概率信息,而忽略了向量空间中更丰富、更有用的表示,导致了信息的损失。如果其中任何一个概率没有被准确预测,多个任务将会受到影响。

三、系统概览

另外,美团联名信用卡是与不同的银行合作发行的,不同的银行处于不同的业务发展阶段,因此对核卡和激活有不同的要求。信用卡业务刚刚起步的银行往往希望发行更多的信用卡以迅速占领市场,而发展成熟的银行则希望提高激活率以实现快速盈利。因此,我们的系统中有一个选择器,可以为不同的银行输出不同的转化目标,多任务框架可以很好地处理不同的业务需求。

此外,由于美团不同的业务都需要流量来为各自业务获客,而且不同用户对不同业务的兴趣也不同,所以不能简单地将流量划分给不同的业务。我们需要一个多业务排序机制来分配流量从而最大化整体的利益。

四、模型介绍

图3:(a)专家底模式(b)概率迁移模式(c)AITM框架。

上图(c)中展示了我们提出的AITM框架。该框架利用AIT模块来建模用户多步转化过程中的序列依赖。这个模型图显示了两个相邻的任务:t-1和t。

首先,输入特征经过任务共享的Embedding分别输出到多个Tower网络中。通过共享Embedding模块,一方面可以用前边任务的丰富的正样本信息来学习Embedding表示,从而缓解后续任务的类别不平衡问题,另一方面可以减少模型参数。Tower网络可以根据自己需要定制,这里我们只使用了简单的MLP。然后,AIT模块利用当前任务Tower输出的向量以及前一个任务传来的信息来学习任务间如何融合信息。AIT模块如下定义:

这里其实利用了特殊设计的注意力机制来自动为迁移信息和原始信息来分配权重。而迁移的信息是通过函数来学习的,这里可以是一个简单的全连接层,用来学习两个相邻的任务间应该迁移什么信息。而该函数的输入是前一个任务的AIT模块的输出。

具体地,AIT模块中的注意力机制如下设计:

其中,是自动学习的迁移信息的权重。,,利用前馈神经网络将输入投影到新的向量空间。

最后,我们通过在损失函数中施加校准器来约束概率的输出尽量满足序列依赖。损失函数是交叉熵+校准器约束,其中定义了校准器约束强度:

具体地,交叉熵定义如下:

校准器约束定义如下:

如果大于,校准器将输出一个正的惩罚项,否则输出0。

五、实验分析

在本节中,我们将在工业和公开现实数据集上进行实验,对比各种基线模型来评估我们提出的AITM框架。接下来,首先会介绍使用的数据集,然后是离线和在线实验结果,最后是进一步的实验分析(包括消融实验、超参数实验和CaseStudy)。

5.1数据集

表1:数据集统计信息。其中,“%Positive”代表采样后训练集中每个任务的正样本占比

5.2离线、在线实验

表2:工业和公开数据集上的AUC均值标准差表现。

Gain表示与LightGBM模型相比的AUC提升,下划线代表最好的基线模型。“*”表示与最好的基线模型相比,AITM在配对样本t检验上p-value<0.05。“**”表示与最好的基线模型相比,AITM在配对样本t检验上p-value<0.01

表3:在线A/B实验

我们进行了离线和在线实验。随着业务发展,我们先后部署了LightGBM、MLP和AITM3个模型到线上。离线和在线实验都证明了AITM的显著表现。

5.3消融实验

我们设计了AIT模块来建模用户多步转化过程中的序列依赖,为了证明AIT模块的有效性,我们对AIT模块进行了消融研究。我们先分别随机取了500个激活正、负样本,然后对它们的激活任务预测分进行排序。越TOP的预测分,表明模型预测这些用户越容易激活联名卡。然后我们利用t-SNE在激活任务上画出了原始信息,迁移+原始信息,以及AIT模块学习到的信息的二维图。

从下图中,我们可以看到当用户激活比较容易预测时(即激活分TOP0%-TOP50%),三个模块都能够较好地区分正负样本。但是,当用户激活比较难预测时(即激活分TOP50%-TOP100%),原始信息、迁移+原始信息+都不能很好地区分正负样本,而AIT模块在TOP50%-TOP100%预测分上显著优于其他两个部分,说明了AIT模块的有效性。

图4:AIT中不同模块的t-SNE可视化

5.4超参数实验

另外,为了研究AITM框架的稳定性以及对超参数的依赖,我们进行了超参数研究。我们通过对Embedding向量维度、校准器强度、正样本比例、任务数量取不同的值进行多次实验,有以下发现:

·前两个超参数实验表明,AITM模块在Embedding向量维度、校准器强度这些超参数下都表现比较稳定。

·第三个超参数实验表明合适的下采样比例是缓解类别不平衡的一个重要举措。

·最后一个图显示了更多的任务可以带来更多有用的信息,从而进一步提升端到端转化率。

图5:不同超参数设置下的平均AUC表现,阴影代表多次实验的标准差5.5CaseStudy

最后,为了理解AIT模块在不同的阶段迁移了什么信息以及多少信息,我们进行了casestudy。下图中Wu是迁移信息的权重。我们先随机采样4万个测试样本,然后将它们按照相邻两个任务的label分成3组:00/10/11(分别对应图中红色、蓝色、绿色的线),并且在每个组中根据logloss对TOP500个样本进行排序,越TOP的样本表示预测越准。

·首先,看红色的线,由于存在序列依赖,当前一个任务label是0时,后一个任务label也只能是0。所以我们看到前一个任务迁移了很强的信息给后一个任务(权重几乎为1)。

·然后,看蓝色和绿色的线,当前一个任务label是1时,后一个任务label是不确定的。随着logloss的增加,迁移信息的权重会逐渐增大,这表明后一个任务的预测结果可能会被前一个任务所误导。

·另外,看绿色的线,当后一个任务label是1时,前一个任务迁移了很少的信息(权重很小),这表明后一个任务主要根据自己任务本身来识别正样本。

·从以上的结果中,我们可以看到AIT模块能学习到两个相邻的任务间应该迁移多少信息。

图6:不同转化阶段的迁移信息平均权重,阴影代表标准差

六、总结

作者简介

奚冬博、陈振、燕鹏、陈彧:

美团金融智能应用团队

张颖而:

美团实习生、浙江大学本科生

朱勇椿:

中科院计算所直博生

庄福振:

北京航空航天大学人工智能研究院研究员

参考文献

[1]JiaqiMa,ZheZhao,XinyangYi,JilinChen,LichanHong,andEdHChi.2018.Modelingtaskrelationshipsinmulti-tasklearningwithmulti-gatemixture-of-experts.InKDD.1930–1939.

[2]ZhenQin,YichengCheng,ZheZhao,ZheChen,DonaldMetzler,andJingzhengQin.2020.MultitaskMixtureofSequentialExpertsforUserActivityStreams.InKDD.3083–3091.

[3]HongyanTang,JunningLiu,MingZhao,andXudongGong.2020.ProgressiveLayeredExtraction(PLE):ANovelMulti-TaskLearning(MTL)ModelforPersonalizedRecommendations.InRecSys.269–278.

[4]YixuanLi,JasonYosinski,JeffClune,HodLipson,andJohnEHopcroft.2016.ConvergentLearning:DodifferentneuralnetworkslearnthesamerepresentationsInICLR.

[5]MatthewDZeilerandRobFergus.2014.Visualizingandunderstandingconvolutionalnetworks.InECCV.818–833.

[6]EricTzeng,JudyHoffman,NingZhang,KateSaenko,andTrevorDarrell.2014.Deepdomainconfusion:Maximizingfordomaininvariance.arXivpreprintarXiv:1412.3474(2014).

[7]ChenGao,XiangnanHe,DahuaGan,XiangningChen,FuliFeng,YongLi,Tat-SengChua,andDepengJin.2019.Neuralmulti-taskrecommendationfrommulti-behaviordata.InICDE.1554–1557.

[8]ChenGao,XiangnanHe,DanhuaGan,XiangningChen,FuliFeng,YongLi,Tat-SengChua,LinaYao,YangSong,andDepengJin.2019.LearningtoRecommendwithMultipleCascadingBehaviors.TKDE(2019).

[9]XiaoMa,LiqinZhao,GuanHuang,ZhiWang,ZelinHu,XiaoqiangZhu,andKunGai.2018.Entirespacemulti-taskmodel:Aneffectiveapproachforestimatingpost-clickconversionrate.InSIGIR.1137–1140.

[10]HongWen,JingZhang,YuanWang,FuyuLv,WentianBao,QuanLin,andKepingYang.2020.EntireSpaceMulti-TaskModelingviaPost-ClickBehaviorDecompositionforConversionRatePrediction.InSIGIR.2377–2386.

IllustrationbyDmitryNikulnikovfromOuch!

-TheEnd-

“AI技术流”原创投稿计划

投稿内容

//前沿资讯解说/心得经历讲述//

投稿须知

我们会选择部分在深度技术解析及科研心得方向,

投稿方式

发送邮件到

chenhongyuan@thejiangmen.com

扫码观看!

本周上新!

关于我“门”

将门是一家以专注于发掘、加速及投资技术驱动型创业公司的新型创投机构,旗下涵盖将门创新服务、将门技术社群以及将门创投基金。

将门成立于2015年底,创始团队由微软创投在中国的创始团队原班人马构建而成,曾为微软优选和深度孵化了126家创新的技术型创业公司。

如果您是技术领域的初创企业,不仅想获得投资,还希望获得一系列持续性、有价值的投后服务,欢迎发送或者推荐项目给我“门”:

THE END
1.在线实验系统一、什么是在线实验? 在线实验系统,成为互联网企业策略验证、产品迭代、算法优化等有效的实验工具。AB实验是指生物学上的随机对照实验,互联网在线实验与传统AB实验不同之处在于: (1)样本数量:互联网流量有着充足的实验样本; (2)实验成本:获取实验样本的成本可以忽略; https://zhuanlan.zhihu.com/p/443696048
2.在线水分仪和离线(实验室)水分仪的区别但是为了得到更好的一致性,必须在仪器调试阶段尽使用尽可能多的样品点数据来发现实验室和在线仪器所得到数据的相关性,通过各种技术手段 来是二者的趋势比较吻合,比较接近客户的使用惯性和判断惯性。而多点取样可以弥补 实验室和在线仪器之间的差距。http://www.gaoz17.com/pddetailthree/news/detail-1557917.html
3.ALICE实验在线和离线数据系统的软件质量和安全的研究ALICE实验中产生的大量的数据不仅来之于被各类探测器在粒子碰撞过程中捕获的原始数据,也包含分析原始数据和蒙特卡洛数据产生的分析结果。本文围绕ALICE实验处理大量数据的在线和离线数据系统中存在的问题和挑战展开研究。ALICE实验中,在线数据系统叫DAQ,用于处理从各类探测器到永久存储设备的数据流的归档:离线数据系统叫AliEnhttps://cdmd.cnki.com.cn/Article/CDMD-10511-1013278207.htm
4.智能实验室可以实现实验室操作流程的自动化智能实验室的原理基于以上关键技术的融合和应用,通过将人工智能、物联网、大数据和云计算等先进技术与实验室设备和仪器结合,实现实验室的自动化、智能化和数据驱动。通过提高实验效率和准确性,优化实验过程和结果,并实现实验数据的存储、管理和分析,能够为科学研究和工程实践提供更加便捷、精确的支持。 https://www.chem17.com/tech_news/detail/3571523.html
5.推荐算法简介推荐系统中,主要有3种评测推荐效果的实验方法,即离线实验(offline experiment)、用户调查(user study)和在线实验(online experiment)。 2.1 离线实验 离线实验的方法一般由如下几个步骤构成: (1) 通过日志系统获得用户行为数据,并按照一定格式生成一个标准的数据集; (2) 将数据集按照一定的规则分成训练集和测试集;https://www.jianshu.com/p/dcbb1095d376
6.大工23春《电力系统继电保护实验》实验报告及要求[答案][答案本课程的考核形式为离线作业(实验报告),无在线作业和考试。“离线作业及要求”在该课程的“离线作业”模块中下载。 二、离线作业要求 学生需要在平台离线作业中下载“大工23春《电力系统继电保护实验》实验报告”,观看实验课件,根据课件中的操作及实验结果来读取实验数据、认真填写“大工23春《电力系统继电保护实验》https://www.zy158.cn/m/view-51471.html
7.国内研究团队提出基于120个刺激编码视觉诱发电位的脑机接口实验过程中,利用滤波器组对脑电信号进行预处理,采用TRCA算法对刺激目标进行检测。此外,还考虑了渐进式扫描的影响,以提高脑电模板的时间精度。根据离线实验结果选择最佳的金氏码组合,通过在线实验对BCI系统性能进行评估。验证了该系统同时具有指令集大(120个刺激目标)、效率高(平均ITR为265.74 bits/min)和训练时间短(https://blog.csdn.net/zyb228107/article/details/124811837
8.首次用于大规模在线系统AI&大模型ChanghuaPei5.5 离线实验 在本节中,我们首先对 Yahoo Letor 数据集和电子商务重新排名数据集进行离线评估。然后给出了在线 A/B 测试的结果。我们还进行了消融研究,以帮助发现 PRM 模型的哪一部分对性能贡献最大。 5.5.1 雅虎 Letor 数据集离线评估 在本节中,我们将对 Yahoo Letor 数据集进行评估,以讨论以下问题: https://www.infoq.cn/article/a1tj74y7V2EKFikKYcwv/
9.这种新技术,在临床检验中有哪些应用?文章刊载于《临床实验室》杂志2024年第4期“临床实验室智能化与数字化构建”专题-「新技术与新方法」版块 页码p47-p53https://mp.weixin.qq.com/s?__biz=MzA5MDE4NzAxNw==&mid=2653139514&idx=2&sn=d498a99cf0aa369a0d49c685ba2c6399&chksm=8a2ba909e3569a9f4556db82df09bb4debb1cdbab117e0778b2e93ebd88d0197ceebf9494d2f&scene=27
10.在线气相色谱仪软件中的在线和脱机模式的功能比较在线模式和脱机模式是在线气相色谱仪软件中常见的工作模式。在线模式适用于实时监测、反应优化和参数调整等场景,具有实时性和自动化控制的优势;脱机模式适用于大规模数据采集和后续分析,具有数据保护和离线处理的优势。用户可以根据实验需求和数据处理要求选择合适的模式,以充分发挥色谱仪的功能和优势。http://m.jinghe17.com/huaijun-News-1510187/
11.首次用于大规模在线系统mb5fdb0a1b25659的技术博客5.5 离线实验 在本节中,我们首先对 Yahoo Letor 数据集和电子商务重新排名数据集进行离线评估。然后给出了在线 A/B 测试的结果。我们还进行了消融研究,以帮助发现 PRM 模型的哪一部分对性能贡献最大。 5.5.1 雅虎 Letor 数据集离线评估 在本节中,我们将对 Yahoo Letor 数据集进行评估,以讨论以下问题: https://blog.51cto.com/u_15060462/2677083
12.图解机器学习模型评估方法与准则腾讯云开发者社区进行评估的实验方法可以分为「离线」和「在线」两种。 1)离线实验方法 模型评估通常指离线试验。原型设计(Prototyping)阶段及离线试验方法,包含以下几个过程: 使用历史数据训练一个适合解决目标任务的一个或多个机器学习模型。 对模型进行验证(Validation)与离线评估(Offline Evaluation)。 https://cloud.tencent.com/developer/article/1953727
13.学习报告:基于脸颊范式的新型触觉P300脑机接口同时脸颊刺激范式在离线测试中也获得了更高的平均分类准确率以及单次实验准确率。通过对时间窗贡献的分析可以看出,两种范式的延迟并没有显著差异。两种范式的单目标准确率也显示出刺激的左右位置并不会对准确率有显著性影响。 通过对比在线实验数据可以看出,脸颊刺激范式在分类准确率和信息传输率方面都显著高于传统的https://www.scholat.com/teamwork/teamwork/showPostMessage.html?id=12632
14.浙大专硕考研337Arduino仿真模拟器如果你不想购入Arduino硬件,但又想在入门学习时查看代码运行后实验原型的效果;亦或是你已经购入了一套Arduino硬件套件但因为缺少部分元器件而不能完成更多的原型实验。别担心,琢木设计技术团队为大家找到了性价比极高的解决方案:选择Arduino仿真模拟器来进行在线or离线的模拟仿真实验。 https://www.douban.com/note/774336049/
15.在线气相色谱仪软件中的在线和脱机模式的功能比较在线模式和脱机模式是在线气相色谱仪软件中常见的工作模式。在线模式适用于实时监测、反应优化和参数调整等场景,具有实时性和自动化控制的优势;脱机模式适用于大规模数据采集和后续分析,具有数据保护和离线处理的优势。用户可以根据实验需求和数据处理要求选择合适的模式,以充分发挥色谱仪的功能和优势。https://china.guidechem.com/jhVIP/shownews559304.html
16.C#GMap.net百度地图的在线地图和离线地图的的用法C# GMap.net百度地图的在线地图和离线地图的的用法。 经严格反复的实验,可行可用。 GMap 百度地图 BaiduMapProv2018-06-02 上传大小:2.00MB 所需:49积分/C币 C# GMap.net高德地图的用法 C# GMap.net高德地图的用法,经实验可行。 同时包含在线地图和离线地图的用法。 https://www.iteye.com/resource/qreqwrerwerew-10455118
17.2020届计算机科学方向毕业设计(论文)阶段性汇报加速器的最终硬件架构、重要细节及实验结果。 蒋泽天 多图的离线协同式匹配和在线增量式匹配 介绍多图的离线协同式匹配和在线增量式匹配,MGM-FLoyd,MGM-SPFA和FastSPFA。 叶昊然 带有预算限制的拍卖机制 本次汇报介绍了单人拍卖中有条件的和无条件的预算限制,证明了无条件的预算限制下最优拍卖机制的形式,给出了无条https://zhiyuan.sjtu.edu.cn/html/zhiyuan/announcement_view.php?id=3709
18.14度小满风控实验平台的架构与实践.pdf风控实验平台架构设计实践 风控实验过程贯穿风控完整决策过程 业务单元 告 贷前系统 贷中系统 贷后系统 风控系统整体架构 报 究 风控系统分为三层结构 研 ? 业务层 变量中心 选 决策中台 精 ? 平台层 / 案 ? 数据层 服务能力 实验平台 在线实验 离线实验 方 践 业务层 实 ? 业务整体流程的执行https://max.book118.com/html/2022/0417/7065120001004113.shtm
19.高压考试2试验A 非破坏性实验 B 破坏性试验 C 在线 D 离线 *2.关于检查性试验和耐压试验,以下说法不正确的是() A检查性试验在较低电压下或用其它不会损伤绝缘的方法测量绝缘的各种情况,判断绝缘内部的缺陷。 B 耐压试验以等价或高于设备的正常运行电压来考核设备的电压耐受能力和绝缘水平。 https://www.wjx.cn/vj/esPwE21.aspx
20.SIGIR2022流行度偏差如何利用?探索解耦域适应无偏召回模型离线实验 指标说明:我们定义了一个模型召回结果的集中度衡量指标 来衡量召回结果中热门商品的占比: 其中, 表示召回的商品集合, 表示热门商品集合。下表是离线指标对比,可以看出在长尾商品的指标和集中度都有所改善。 线上实验 将原有的Base双塔替换为 https://tech.taobao.org/news/kn24sk
21.实验空间—国家虚拟仿真实验教学项目共享服务平台专业在线实验室土木类在线实验室分子计算在线实验室 2500万+人次 应用评价 人气指数共享指数互动指数吸引指数 热门实验 推荐课程电力系统自动化、电力系统分析、电力系统继电保护物理虚拟仿真实验大学物理实验近代物理实验普通物理实验中国近现代史纲要毛泽东思想和中国特色社会主义理论体系概论思想道德修养与法律基础 国一流 电https://www.ilab-x.com/
22.SwanLab:yourMLexperimentnotebook.你的AI实验 支持在线使用: 通过 SwanLab 可以方便地将训练实验在云端在线同步与保存,便于远程查看训练进展、管理历史项目、分享实验链接、发送实时消息通知、多端看实验等。而 Tensorboard 是一个离线的实验跟踪工具。 多人协作: 在进行多人、跨团队的机器学习协作时,通过 SwanLab 可以轻松管理多人的训练项目、分享https://github.com/SwanHubX/SwanLab