省时查报告-专业、及时、全面的行研报告库
省时查方案-专业、及时、全面的营销策划方案库
美团外卖推荐团队在推荐算法的长期落地实践中,针对外卖业务情境化特点对排序模型进行深入探索与优化。本文介绍了面向情境化建模的“情境细分+统一模型”建模思路,通过用户行为序列建模以及专家网络两个模块的优化,实现不同场景间对信息独有性的刻画和信息共性的相互传递,进而提升全部流量效率。
4.总结和展望
1.引言
针对无限细分的用户情境以及情境的不断拓展和演化,为解决以上挑战,我们提出“情境细分+统一模型”(andModel)的建模思路。情境细分针对用户特定情境进行针对性建模提升推荐精准度,统一模型将多个相近用户情境进行知识共享和迁移解决情境拓展和演化的问题。
图3情境化智能流量分发模型
基于该方案,对于CTR、CXR(CTCVR)任务,模型在离线指标AUC、GAUC()上均取得了显著提升,并在线上也取得了、、、曝光新颖性、首购订单占比等指标收益。线上指标计算口径如下:3.1情境化长序列检索
工业实践中,用户行为序列特征往往包含商家/商品ID、品类、价格等商家/商品表示特征,而在行为表示上除了用户到商家的点击之外,用户通过什么页面进入到商家点菜页、用户在商家点菜页中的细粒度行为,同样可以反映用户的偏好。因此,可以对用户从浏览商家到最终下单整个流程进行归纳分析,捕捉用户最细腻的行为并纳入模型,充分学习用户在外卖场景中重要的、最细粒度的行为及其所代表的意图偏好。
图4用户点外卖过程接下来,我们详细介绍下图4中用户点外卖过程的4类12种Micro-。如下图5左所示,9种不同意图的Micro-的当日转化率存在着明显差异(当日转化定义:用户在商家发生某一Micro-后的自然日内有成单;结算提单意图下3种行为由于转化率很高,因此不做展示)。
图5Micro-和转化率关系
分别在用户实时(短周期行为)、历史(长周期行为)商家序列中引入Micro-信息。如下表所示,离线实验数据表明,引入的Micro-信息取得了比较明显的提升。最终,细粒度行为特征在线取得了+1.77%,+1.05%的收益。
离在线实验效果表明引入Micro-信息增加了模型的精准推荐能力。此外,我们进一步对模型是否正确的学习了细粒度行为进行验证。随机选取一个用户的成单商家及其商家序列引入Micro-后权重变化,如下图6所示,图左上部分表示用户行为序列中的商家以及相应Micro-信息,图右上部分是序列中商家引入Micro-信息后所对应的权重可视化,方块颜色越深则表示权重越大,图下部分是用户的最终成单商家“鸿鹄一品跷脚牛肉”在引入不同Micro-信息后的商家排名。通过对比序列中商家引入Micro-观察权重的变化:
图6引入Micro-和权重关系的Case从以上过程中可以看到,引入Micro-的信息越完善,模型对于用户兴趣的理解越是充分,用户最终成单的商家也是能够得以排名靠前。3.1.2长序列多路情境检索
最初,我们直接将近三年的点击行为直接引入到模型中来,发现离线效果提升显著,但是带来的训练和推理的压力不可承受。在此基础上,借鉴了SIM4,将候选商家的品类ID当作Query,先从用户的行为序列中检索出相同品类的商家,再进行兴趣建模,离线取得了不错的收益。
具体的,尝试过使用二级品类和叶子品类来分别做检索,在检索后根据分位点进行最大长度截断的情况下,二级品类检索出来的序列平均长度大约为X,而叶子品类因为品类划分过细,检索出来的序列平均长度大幅减少。根据离线实验评估,最终选择了使用二级品类进行检索,在离线取得了CXRGAUC+0.30pp的效果。对于检索条件中,像二级品类和叶子品类这种泛化性与精确性之间的tradeoff,我们目前正在进行更进一步的探索。
为了进一步提升模型的效果,考虑到用户兴趣建模从DIN发展到SIM,都是根据候选商家、商品的属性,从用户的行为历史中提取对该候选商家、商品的兴趣,这在传统电商场景下是行的通的,因为用户对某一商家、商品的兴趣基本不会随着他所处位置、所处时段改变(用户要买手机壳,不会因为他在家还是在公司有改变,也不会因为他的购物时段是在早上还是晚上而改变)。但是餐饮外卖相较于传统电商,正如前面的问题与挑战中提到的,其鲜明的LBS和餐饮文化特色构成多种多样的情境,用户在不同的情境下对于不同的商家、商品的偏好是不一样的,是会变化的。因此,除了建模品类偏好外,还要进一步建模用户的地理位置偏好和时段偏好。
最后,我们将二级品类ID检索序列(品类偏好)、地理位置偏好)以及检索序列(时段偏好)全部加入到模型中,并根据各自的平均长度等信息对不同子序列分别进行了不同的最大长度调整,模型结构如下图7所示:
图7长序列多路情境检索
最终,在离线取得了CTRGAUC+0.30pp,CXRGAUC+0.52pp的收益,在线上取得了+0.87%,+0.70%,+0.70%,首购订单占比+1.29%的收益。可以注意到上述长序列的引入,不仅带来了效率的提升,还带来了新颖性的提升,分析发现通过建模用户更长期的兴趣,扩展了模型的视野,不再集中于用户的短期兴趣,能更好地满足用户口味“短聚集,长多样”的特性。
在后续的数据探查中,基于样本维度统计了二级品类ID检索序列、检索序列和
然而,当前三路检索合并的版本,虽然可以对用户的品类偏好、地理位置偏好和时段偏好进行有效的建模,但还是存在两个比较明显的缺陷。首先,各路检索序列中还是存在冗余信息,并且需要分别建模三个序列,带来的性能压力较大。其次,将情境割裂成一个个单独的维度进行建模,无法建模他们之间的联系,更真实准确的情况应该是对用户所处情境的不同维度进行统一建模。针对这两个问题,我们正在情境Cube的概念下,开展通过一个序列统一建模用户所处情境偏好的探索工作。
下文继续介绍长序列工程优化实践。长序列模型会为线上服务带来一系列工程挑战,序列长度变长极大增加了服务时数据传输成本与模型推理成本,需要针对这两个方面做专门优化。
图8用户序列计算图折叠3.2情境化多专家网络
大部分工业界的CTR预估模型遵循传统&MLP范式,将用户兴趣向量、商家/商品表征和其他特征作为输入,通过朴素的多层神经网络学习特征、样本、标签之间的关系。另有学术界一些熟知的工作如PNN5、、、DCN8等方法,都在努力建模特征间共现关系、特征的特异性、特征的层次结构关系、样本之间的关系等信息,并且在公开数据集和部分特定工业场景下取得显著效果。而在NLP领域,2018年10月,发布BERT9模型,刷新了11个NLP任务的最好水平,由此开启了NLP“大炼模型”时代,引爆了业界的研究热潮。
专家混合(of,MOE)模型被证明是通往容量更大、性能更强大的机器学习模型的有效途径。MOE是基于分而治之的原则建立的,其中问题空间在几个神经网络专家之间划分,由门控网络进行监督。在MOE基础上,提出一种新颖的多任务学习方法,在所有任务中共享专家子模型本地外卖系统,使MOE结构适应多任务学习,在的大规模内容推荐系统取得显著收益。
美团外卖涵盖多个推荐入口,包括首页Feed(主要流量入口),以及美食“金刚”、甜点“金刚”、夜宵“金刚”、下午茶等子频道。对于不同入口情境建模存在以下挑战:
图9外卖推荐基于多入口多任务学习网络结构示意图我们通过实现多入口统一建模()解决以上挑战。具体的,设计了如图9所示的多入口情境专家模型,在模型结构的特征和多任务Tower之间构建了Share学习全部入口的信息,该将始终处于激活状态;为了捕捉多入口之间的区别与联系,构建了模块,为每个入口设置一个由MLP组成的专家网络()。
离线实验上,我们采用全入口数据混合训练+入口ID特征的模型作为基线,尝试了Multi-Task(为各个入口分别设置一个预估任务)、MMOE、等方法。由于用户在外卖各入口的消费行为存在互斥关系,且小入口的行为样本较为稀疏,因此直接采用多任务的方式效果较差,而引入MMOE会有一定的提升。与此同时,对比阿里的STAR,该方法中各个入口拥有自己的独立网络参数,但未能捕获各个入口间的关系,在外卖推荐场景中提升有限。相比之下,在主入口和小的入口上都实现了较大的提升。
图10不同入口权重热力图该解决方案不仅实现了首页Feed、美食“金刚”、甜点饮品等流量入口间模型的统一,同时也为各个入口带来了显著的离线指标收益和线上指标的增长。经过联合建模,小入口可以有效利用到首页Feed的丰富信息,使得线上和离线效果提升显著,此外,对于首页Feed,该方案同样有显著的效果提升,不同场景线上收益如下表所示:
3.2.2情境化稠密MMOE
专家网络是情境化建模的主要手段之一,模型可以根据不同情境自动选择需要激活的参数参与推理达到整体更高的精度水平。我们发现在Share-CTR/CXR多目标结构基础上,引入MMOE结构可以带来显著的离线CTR/CXRAUC收益(如下表所示),可以发现当数量达到64时,CTRGAUC和CXRGAUC分别有0.3pp与0.4pp左右的提升。
引入大数量级的MMOE结构可带来较显著的离线收益,但同时也会相应带来离线训练以及线上服务成本的增加,需要做效果与效率之间的权衡。我们在保持一定离线训练时长与在线约束下,选择了MMOE版本作为新的基线模型,并做详细的探索,进行较为细致的优化,包括:
最终,情境化稠密MMOE在线取得了+0.75%,+0.89%,曝光新颖性+1.51%的收益。
3.2.3情境化稀疏MMOE
在探索得到稠密MMOE最优版本之后,我们开始对稀疏MMOE模型进行探索。借鉴提出的Model,如等,我们采用TopKMMOE方法进行尝试。其核心思想在于,每条样本根据Gate的计算结果,从所有N个的输出中只选取K个(K
外卖CPS小程序部署指南:个人如何获取美团外卖小程序跳转链接
管理员后台管理与外卖系统开发指南:设计数据库与接口,实现前后端交互
堂食点餐韧性小生意:广东经营主体总量突破1800万户,小而美彰显广东力量