随着机器学习的快速发展,经典的机器学习算法被广泛地应用到推荐领域中,如逻辑回归(LogisticRegression,LR)、梯度提升决策树(GradientBoostingDecisionTree,GBDT)和因子分解机(FactorizationMachines,FM)等[8G10].基于机器学习的推荐模型可以处理运算复杂的推荐,但基于机器学习的推荐算法往往只能建模用户的历史交互数据中的低阶特征表示,缺乏对高阶特征表示的建模能力.随着深度学习的兴起,深度神经网络被广泛地应用到推荐领域中,如深度神经网络(DeepNeuralNetworks,DNN)[11G12]、卷积神经网络(ConvolutionalNeuralNetworks,CNN)[13G15]、循环神经网络(RecurrentNeuralNetwork,RNN)[16]、注意力模型(AttentionModel)[17]以及变分自编码器(VariationalAutoencoder,VAE)[18G19]等,并且都取得了不错的推荐效果.
2推荐任务定义、评估指标和数据集
3基于交互信息的推荐系统
(1)交互图的采样:交互二部图是根据用户和物品的交互数据构建而成.但由于推荐任务中的物品数量巨大,考虑推荐模型的训练和计算效率,如何设计数据采样方式才能有效地捕捉用户与物品之间的消息传播,更好地提升推荐性能
(2)信息聚合:用户与物品之间存在复杂、丰富和潜在的交互关系,如何设计信息聚合方式才能有效地将复杂的、间接和高阶的信息聚合到目标节点,丰富用户和物品的特征表示,实现用户与物品之间的消息传播
(3)节点输出:如何构建适用于下游推荐任务的节点表示
4融入社交信息的推荐系统
(1)朋友的影响:如何构建朋友的影响并将其融入推荐过程中不同的朋友对目标用户产生的影响程度不同,如何区分朋友之间的影响力如何利用社交网络中存在的隐式社交关系
(2)用户偏好分析:如何从社交信息扩散角度和物品的交互行为角度来分析用户喜好如何将社交网络中和物品交互网络中的兴趣偏好特征融合,更加全面构建出用户的喜好
5融入知识图谱的推荐系统
由于知识图谱包含了物品之间丰富的语义信息和用户与物品、物品与物品之间的多重关系,若能够充分捕捉物品之间潜在的连接关系,对分析用户真实的兴趣偏好和物品的属性特征十分有益.因此,将知识图谱融入推荐系统中,可以进一步提升模型的推荐性能[22,64G68],还可以增加推荐物品的多样性和有效性.知识图谱虽然包含了丰富的物品信息和用户与物品之间的多重复杂关系,但具有复杂的图结构,其中包含了多种类型的实体和关系,使充分挖掘知识图谱的语义信息成为一个挑战[28].为充分利用知识图谱中丰富的语义关系来提升推荐性能,本文将知识图谱应用在推荐任务上所面临的问题主要概括如下:
(1)结构复杂性:鉴于知识图谱具有复杂的图结构,如何简化知识图谱结构来实现消息的高效传播和对知识图谱信息的充分挖掘
(2)多关系传播:如何捕获实体与实体之间复杂、高阶的多重关系,并将其有效地融入推荐任务中
(3)特征整合:如何从知识图谱中复杂的实体和多种关系中学习到用户和物品的特征表示并进行有效地融合,从而更加全面挖掘出用户的喜好和物品的属性
6基于图学习推荐的未来研究方向
图学习方法不仅在图分类、链路预测等图结构任务上取得了巨大成功[21G27,80G86],而且在推荐领域也具有出色的推荐表现,但它仍然有许多问题和挑战亟待解决.本节将对图学习方法在推荐领域中的未来研究方向进行分析与总结.
6.1基于图学习的大规模图推荐
6.2多源多模态信息整合
辅助信息已被证明在改善数据稀疏性和冷启动等推荐问题上非常有效[29,71,87G90].在线上购物系统中,多源多模态的信息包括商家对商品的描述、分类等信息,用户对物品的点击、浏览、加入购物车、评分等信息以及商品的文本、图像等信息.现有的图学习方法难以将多源多模态数据进行有效的融入,导致对数据中丰富的信息利用不充分或数据对象之间的关系表示不明显,不能有效地捕捉到用户更加真实的兴趣偏好和物品真实的属性,使模型的推荐性能无法发挥到极致.而现有图学习推荐方法对节点的特征向量表示的方式比较单一,通常只能对用户历史交互记录进行有效的处理,难以将多源多模态信息有效地融入用户与物品的特征表示中,使模型达到最佳的推荐效果.因此,如何有效地整合多源多模态数据信息是图学习推荐方法需要解决的一个重要问题.