2024年推荐系统技术全面综述:历史现状分类应用展望

开通VIP,畅享免费电子书等14项超值服

首页

好书

留言交流

下载APP

联系客服

2024.07.23

关键词:推荐系统·基于图的推荐系统·基于知识的系统·多模态推荐系统·大型语言模型·个性化·行业应用·可解释的AI·透明度·公平性·深度学习·综述

我们翻译解读最新论文:从理论到实践全面综述推荐系统,文末有论文链接。作者:张长旺,图源:旺知识

目录

1引言

2背景

2.1历史背景

2.2推荐系统实践和理论的现状

3文献综述方法论

4推荐系统的挑战

5基础推荐系统

5.1基础推荐系统

5.2基础推荐系统能否解决实际挑战?

6推荐系统中的深度学习时代

6.1基于深度学习的推荐系统

6.2基于深度学习的推荐系统能否解决实际挑战?

7推荐系统中的高级建模技术

7.1基于图的推荐系统

7.2顺序和基于会话的推荐系统

7.3基于知识的推荐系统

7.4基于强化学习的推荐系统

7.5基于大型语言模型的推荐系统

7.6多模态推荐系统

8专业推荐系统

8.1基于上下文的推荐系统

8.3基于方面的推荐系统

8.4可解释和值得信赖的推荐系统

8.5推荐系统中的公平性、可问责性、透明度和伦理性(FATE)

8.6杂项

9推荐系统在不同领域的应用

10讨论

10.1这项研究的影响

10.2局限性

10.3未来展望

本综述着重于RS的理论及其向实际应用的转变,旨在弥合学术研究和行业实践之间的差距。它强调了如何将理论进步有效地实施在现实世界的场景中。

本综述的必要性

与现有综述的不同之处

主要贡献

推荐系统(RS)是一种旨在根据用户的偏好向用户推荐项目(如书籍、电影、产品或内容)的算法。RS的主要目标是通过个性化内容来增强用户体验[3]。在核心上,RS结合了用户和项目档案以及过滤机制,以使用户的偏好与合适的项目对齐[13]。用户档案收集了如人口统计和浏览历史等数据,而项目档案则详细列出了如类型等功能。显式反馈(例如评分)和隐式反馈(例如浏览行为)可以细化这些推荐。

RS的先驱工作之一是ElenRich在1979年[67]根据用户偏好分类为“刻板印象”来推荐书籍。随后,JussiKarlgren在1990年[68]提出了“数字书架”的概念,后来SICS、MIT和Bellcore的研究人员对其进行了扩展,PattieMaes、WillHill和PaulResnick等人的GroupLens项目[69]因其贡献获得了2010年ACM软件系统奖。后来,Adomavicius[3]、Herlocker[70]和Beel[71]为RS提供了基础理论。

传统的RS方法可以归类为协同过滤、基于内容的过滤和混合方法,旨在提高用户体验[13]。协同过滤(CF)[70]基于这样一个观点:具有相似偏好的用户将来可能具有相似的口味。CF通过查找相似用户或项目的邻域来推荐项目。CF可以在不需要大量内容分析的情况下推荐项目,但它通常面临冷启动、可扩展性和稀疏性等挑战[34]。基于内容的过滤(CBF)[72]根据用户过去的偏好和项目特征推荐项目,使用诸如词频-逆文档频率(TF-IDF)、余弦相似度和神经网络等技术进行项目表示。然而,它可能在推荐新的或未见过的项目方面存在困难。混合RS[36]结合了两种方法的优势,通过整合多样化的方法,提供更准确和个性化的推荐。

NetflixPrize[73],一个旨在提高RS算法的比赛,显著地推广了这些算法。虽然比赛专注于提高准确性,这是算法有效性的一个重要方面,但它也强调了多样性、隐私和意外性在提高用户满意度方面的重要性[63]。

机器学习方法,如k-最近邻算法(k-NN)、深度神经网络和自然语言处理(NLP),多年来通过提供更精确的推荐来增强RS。然而,关键的挑战和伦理问题,如保护用户和数据隐私、减少偏见以实现公平推荐、透明度以赢得用户信任以及跟上技术进步的步伐,仍然是挑战。

学术界专注于RS的理论、方法和算法,而行业强调实际应用、可扩展性和直接的业务影响。本节探讨了这两个领域所面临的不同挑战。

推荐系统的理论研究

通常由学者通过开发新的算法、模型和评估指标来启动对RS的理论研究。然而,学术研究人员在获取多样化和全面的数据集方面面临挑战,这是由于隐私问题、专有限制和财务障碍。此外,数据质量问题,如偏见、不准确和过时的信息,限制了在不同背景下开发和测试RS。

推荐系统的实践

行业在部署RS时面临几个挑战,特别是随着用户基础和目录规模的扩大,可扩展性成为一个问题。适应不断演变的用户偏好和内容可用性带来了持续的困难。确保推荐的多样性和公平性至关重要,以避免偏见。此外,整合实时数据并在重负载下保持高性能是重大挑战。在平衡个性化与隐私问题的同时,需要谨慎处理用户数据,以建立信任并遵守法规。

共同挑战

从理论上讲,RS算法现在已经相当先进,具有深层神经网络和最新的语言模型复杂性。然而,在实践中,这些模型并不立即适用于现实世界的用例。行业部门通常运行一组标准模型,需要进行重大调整才能有效实施这些高级算法。

在本次综述中,我们检查了RS的理论和实践方面,目标是促进从研究到实际应用的顺利过渡。

研究问题

数据库搜索

搜索查询

质量评估

文献搜索的结果已经最终确定,并按数据库分类,如图3所示。

文献计量分析

RS在个性化用户体验和推动各个领域的商业价值方面发挥着至关重要的作用。尽管它们被广泛采用,但在部署和维护方面仍然存在几个挑战。

娱乐:在娱乐行业,挑战在于在跨类型跟踪用户偏好的同时,向他们介绍新内容以保持参与度。平衡个性化和新颖性至关重要。音乐推荐需要频繁更新,因为歌曲的保质期比电影短[77]。相反,电影推荐不太依赖于频繁更新,因为电影通常有更长的保质期。然而,有效的电影RS仍然需要在推广新发布和维护一系列持久的最爱之间取得平衡,以满足广泛的用户偏好[78]。

新闻:新闻行业必须及时提供个性化内容,以免压倒用户。新闻偏好高度动态,需要能够适应兴趣和当前事件的快速变化的推荐[59]。提供多样化的观点以防止回音室、对抗错误信息[79]并维护用户信任至关重要。

旅游:旅游中的个性化预订推荐必须考虑到用户对目的地、旅行日期、预算和住宿的偏好[80]。整合过去旅行历史、季节性趋势和实时可用性等因素至关重要。平衡即时需求,如旅行期间的餐饮推荐,与住宿和主要景点的提前预订,增强了整体用户体验。

讨论:尽管RS具有行业特定的特性,但它们在各个领域都面临着一系列共同的挑战。通常,这些系统在平衡个性化和用户隐私、管理数据可扩展性以及确保推荐的多样性和新颖性以保持用户参与度方面存在困难。它们还必须解决冷启动问题,即用户数据不足可能阻碍系统进行准确推荐的能力。此外,动态用户偏好要求系统不断适应并从新数据中学习,这在实时处理和算法效率方面提出了挑战。最后,确保公平并避免偏见至关重要,因为这些系统通常影响用户决策,如果管理不当,可能会延续现有的差异。

在接下来的部分中,我们将探讨RS的演变以及它们如何应对这些挑战。

RS可以数学上表示为一个函数f,它预测用户u对项目i的效用,表示为估计用户u对项目i的偏好程度。[3]。这个函数通常是从历史数据中学习得到的:

其中Θ表示模型参数,从数据中学习得到。在RS的背景下,表示用户可能对项目分配的评分或效用的预测。这个预测用于推荐用户可能感兴趣的项目。RS的一般框架如图2所示。一个数据驱动模型在RS中的生命周期从数据获取开始,接着是存储和准备。这导致特征工程,形成了数据管道的基础。数据管道进入训练管道,包括模型训练和验证。训练后,过程包括候选生成和排名。这个过程通过A/B测试、离线和/或在线评估得到补充。最后阶段包括部署和监控。

下面,我们提供了基础RS的概述。

基础RS指的是在推荐引擎领域建立核心原则和方法论的早期模型和技术。这些系统主要包括协同过滤、基于内容的过滤和混合方法。

基于内容的过滤

基于内容的过滤(CBF)是一种推荐策略,根据用户的偏好和项目的属性向用户推荐项目,通常使用相似性度量来匹配用户偏好和项目属性[83]。在CBF中,推荐基于项目的属性向量()和用户偏好的配置文件():

CBF推荐模型的演变始于传统方法[83],如向量空间模型、概率模型和决策树,依赖于手动特征工程和相似性计算。向量空间模型通过余弦相似度[84]计算项目相似度,概率模型通过统计分析[85]估计用户偏好的可能性,决策树根据属性对项目进行分类并推荐项目。这些模型通过利用显式的项目特征和用户偏好奠定了个性化推荐的基础。

CBF面临的挑战:总的来说,CBF面临诸如冷启动问题、过度专业化(只推荐用户已经看过或喜欢过的项目)、计算成本(可能随着用户和项目数量的增加而呈二次方或三次方增加)以及用户和项目配置文件更新不足等挑战。

协同过滤

协同过滤(CF)是RS用来预测用户偏好的技术,基于其他类似用户的偏好[34]。CF技术主要分为两类:基于内存的方法和基于模型的方法。基于内存的CF使用用户评分中的相似性直接进行推荐。它有两种类型:基于用户的CF根据类似用户的历史评分预测用户评分[70],而基于项目的CF根据类似项目预测评分[91]。这两种方法都面临着可扩展性和稀疏性的挑战。基于模型的CF,如矩阵分解[92]和因子机[93],揭示了代表用户偏好和项目特征的潜在因素。这些方法将用户-项目交互矩阵分解为用户和项目的潜在特征向量。

CF通常从构建用户-项目交互矩阵R开始,其中用户、项目和代表用户和项目之间的已知交互。CF中的一种流行方法是矩阵分解[92],其中R由两个低维矩阵U(用户特征)和I(项目特征)的乘积近似:

CF的神经扩展通过使用深度学习来捕捉复杂的用户-项目关系,并显著提高推荐准确性。技术如神经协同过滤(NCF)[94]、序列感知RS[95]和图神经网络(GNNs)[48]已成为CF中的最先进方法。

CF面临的挑战:像CBF一样,这些方法更准确、更强大,但它们也带来了挑战,如计算复杂性和有限的可解释性,这可能阻碍了它们在现实世界场景中的可扩展性和实际适用性。

混合方法

如Wide&DeepLearning框架[97]、神经因子机(NFM)[98]、DeepFM[99]和Deep&Cross网络[100]等技术结合了显式特征交互和隐式特征层次结构,利用浅层和深度学习模型增强推荐。

包括CF、CBF和混合方法在内的基础RS构成了许多个性化推荐解决方案的核心。虽然这些系统在各个行业中都证明是有效的,但它们在解决实际挑战方面的能力通常是有限的,尤其是在电子商务、娱乐、新闻、旅游、金融、医疗保健和电子学习等行业。例如,CF可以通过利用新闻RS[59]或音乐RS[42]中的行为数据来个性化用户体验,但在动态用户偏好和实时推荐的需求方面存在困难。在旅游、金融、医疗保健和电子学习中,基础RS可以理解用户偏好和行为模式,但冷启动问题、数据多样性、隐私问题以及对高度个性化服务的需求需要更复杂的解决方案。这些解决方案通常将基础技术与现代进步(如下文讨论的深度学习和专业RS)相结合。

多层感知器:传统的RS主要使用线性方法,如矩阵分解[92],这些方法在捕捉复杂的用户-项目交互方面存在困难。相比之下,多层感知器(MLPs)是一种前馈神经网络,使用深层来更准确地模拟这些非线性交互,从而提高预测准确性和推荐质量。MLPs在RS中的演变见于如神经协同过滤(NCF)[94]、深度因子机(DFM)[99]、Wide&Deep[97]、xDeepFM[141]、Deep&CrossNetwork(DCN)[100]、FMLP-Rec[142],这是一个具有可学习过滤器的模型,用于改进序列推荐——以及FinalMLP[143],它结合了双MLP架构和特征选择,以有效预测点击率(CTR)。

MLP的挑战:尽管取得了成功,RS中的MLP模型面临着复杂性、过拟合风险、缺乏空间不变性、消失或爆炸梯度问题以及可解释性问题等挑战。

自编码器是专门为无监督学习设计的神经网络架构,是一种有效的降维方法。自编码器由两个组成部分组成:编码器用于将输入数据压缩成低维表示,解码器则重构原始数据。与传统的MLP模型不同,自编码器明确捕捉编码-解码结构。

值得注意的RS包括AutoRec[144]、协同过滤自编码器、多变量自编码器(MultiVAE)[145]、深度推荐器(DeepRec)[146]、推荐器变分自编码器(RecVAE)[147]、基于项目的变分自编码器用于公平推荐[148],以及变分带宽自编码器(VBAE)混合RS[149]。这些方法解决了稀疏性和噪声挑战,使它们在个性化推荐中非常有效。

自编码器的挑战:自编码器在降维和捕捉复杂数据结构方面非常强大,但一个关键问题是它们对噪声敏感,如果输入数据嘈杂,可能导致重构效果差。此外,重构过程可能无法始终保留对推荐至关重要的有意义的模式。

卷积神经网络(CNNs)可以从视觉、序列和多模态数据中学习,并已增强了推荐的准确性和个性化。CNNs在RS中的各种设置中得到应用。DeepCoNN分析文本和视觉线索以了解用户偏好[87,151]。CNNs与图结构集成,用于可扩展的推荐系统[120],在DKN中用于新闻推荐[152],并在MusicCNN中利用音频信号进行音乐推荐[153]。基于CNN的RS模型预测下一个项目推荐[130],通过CoCNN识别用户偏好模式[154],并利用CAGCN进行协同过滤[155]

CNNs在RS中的挑战:CNNs在RS中面临的挑战包括数据稀疏性、可扩展性、隐私和特定领域问题[156]。研究人员继续探索解决方案以提高基于CNN的RS的性能和可用性。

RNN的挑战:RNN的一个常见挑战是梯度爆炸和消失[49]。解决这些问题通常需要仔细的初始化、梯度裁剪或使用LSTM网络等替代架构,这些可以减轻梯度问题。此外,训练是顺序的,因为RNN按顺序接收数据,与CNN不同。

表5显示了基于深度学习的RS的主要出版物。

深度学习的进步为RS的理论和实践带来了进一步的变化,导致了先进建模方法的发展,这将在接下来讨论。

在这里,()表示节点v在第l层的特征向量,N(v)表示v的邻居,UPDATE(l)和AGGREGATE(l)分别是各自的更新和聚合函数。基于GNN的RS的目标是学习一个预测函数f,用于估计用户u和项目i之间的交互可能性,利用它们的特征向量和:

在这里,^是交互预测分数,Θ表示模型参数。训练涉及最小化损失函数L,该函数比较预测分数^与实际交互yui:

此方程反映了在集合D中观察到的所有用户-项目交互的损失总和。

GNN在RS中的最新模型

GNN已逐步改变了RS,从基础模型开始,即图卷积矩阵补全(GCMC)[189],它将深度学习应用于用户-项目交互图以进行有效的链接预测。在此基础之上,GraphSAGE[194]是一个利用节点特征的归纳框架,用于动态环境,尽管它无法解决现实世界交互数据的复杂性。Pinterest的PinSage[120]是一个适用于网络规模图的可扩展模型,改进了其前身模型以处理数十亿个节点。

神经图协同过滤(NGCF)模型[208]将协同信号整合到用户和项目嵌入中,以提高推荐质量为代价增加了复杂性。知识图谱注意力网络(KGAT)[197]整合了知识图谱,提高了推荐多样性和可解释性。异构图注意力网络(HGAT)[122]将分层注意力纳入RS,解决了关系和节点类型的异质性问题。

特征交互图神经网络(Fi-GNN)[184]代表了向捕获多字段特征交互的转变,特别是在CTR预测中。同时,基于会话的推荐图神经网络(SR-GNN)[216]解决了基于会话的推荐问题,通过捕获项目转换来提高准确性。多模态图卷积网络(MMGCN)[204]将多模态数据整合到基于图的学习中,尽管面临可扩展性挑战。

LightGCN[202]的引入,专注于邻域聚合和简化架构,代表了GNN领域的简化,提高了效率而不影响性能。MixGCF[203]提出了一种新颖的负采样方法,优化了训练过程。随后的发展如GNNRec[187]和XSimGCL[222]分别推进了基于会话的和基于图对比学习的推荐,分别解决了特定挑战,如社交影响整合和偏见缓解。确保基于GNN的RS的可信度需要在鲁棒性、可解释性和公平性方面的增强,以确保可靠的推荐[224]。

GNN解决的实际挑战

表6提供了GNN的使用、它们的变体、所使用的数据、评估指标以及应用的全面概述。有关可扩展性、可解释性、计算效率和可复制性的详细评估标准,请参考附录。

一个顺序RS模型可以定义为:inext=(history()),其中inext是下一个推荐项目,history()是用户u的互动序列,f模拟序列行为以预测未来的互动。

一个基于会话的RS模型可以定义为:isession-next=(scurrent),其中isession-next是即将到来的会话推荐,scurrent代表正在进行的会话互动,g预测下一个项目,考虑到会话的上下文。

顺序和基于会话的RS的演变见证了各种模型的显著进步。例如,基于转换的RS(TransRec)[308],整合了第三阶交互以增强序列预测。研究进展到使用GRU4Rec[158]及其增强版GRU4Rec+[159],通过改进的损失函数和采样策略提高基于会话的推荐。

随后,CNNs被应用于像卷积序列嵌入推荐模型(Caser)[245]和NextItNet[130]这样的模型,目标是有效的基于会话的推荐。在基于会话的推荐中引入自注意力机制的自注意力基于RS(SASRec)[161],以及探索项目转换的基于会话的推荐图神经网络(SR-GNN)[216],显示了进一步的进展。

最近的发展见证了变换器架构的应用,模型如BERTforRS(BERT4Rec)[228]使用双向自注意力进行深度序列分析,以及Transformers4Rec[247]将NLP变换器适应于推荐上下文。

GNNs已被用于GRASER[219]中的基于会话的交互建模,LightSANs[139]通过降低复杂性和改进序列建模的低秩分解自注意力,改进了传统的自注意力网络(SANs)。

频率增强的混合注意力网络(FEARec)[240]和知识提示调整用于顺序推荐(KP4SR)[241]通过利用混合注意力机制和集成外部知识库,分别推进了顺序推荐,以提高模型性能。

实际挑战的解决

知识库(KB),特别是知识图谱(KG),在文献中被广泛使用,通过利用用户/项目信息来增强个性化推荐[173]。KG是一个有向图G=(V,E),其中V和E分别代表实体和它们之间的关系,EV×V。它包括实体类型函数Φ:V→A和关系类型函数Ψ:E→R,将实体映射到类型A,关系映射到类型R。KG被描述为三元组的集合eh,r,et,表示从eh到et的关系r。这种关系信息帮助RS理解用户偏好和项目关系,采用各种方法将KG整合到RS中以改进推荐。KG-basedRS可以通过三种主要方法观察到:基于嵌入的方法、基于路径的方法和基于传播的方法,每种方法都推进了RS利用KG中丰富的关系数据的方式,如[173]所分类。

基于嵌入的方法侧重于学习和应用嵌入来表示KG实体(节点)和关系(边),增强用户和项目表示。它们通常从使用模型如TransE[309]、TransD[198]和node2vec[310]生成初始嵌入开始,然后通过注意力机制如KSR[229]或生成模型如BEM[176]和KTGAN[311]将它们应用于RS。

联合学习方法使用统一的损失函数同时优化KG嵌入和推荐组件。例子包括CKE[112],它集成了自动编码器用于项目表示,以及SHINE[312],它从异构图中获取用户嵌入。多任务方法如KTUP[221]和MKR[206]同时解决KG增强推荐和KG补全,改进了实体/关系表示和推荐。

基于路径的方法利用KG的连接模式。基于元结构的方法如KGCN[111]使用图卷积在潜在空间中保持实体接近性。基于路径嵌入的方法,如MCRec[313]和RKGE[157],从路径嵌入中派生偏好分数,整合元路径信息和基于RNN的路径语义。

KG在各个行业中变得越来越重要,利用复杂和丰富的数据集构建RS。例如,在电子商务中,像TransE[309]和Node2Vec[310]这样的方法被用来通过理解项目和用户偏好之间的潜在联系来准确推荐产品。同样,在电影推荐领域,像KSR[229]和KTUP[221]这样的模型利用用户-项目互动和实体图来提供个性化的电影建议。社交网络平台也受益,像SHINE[312]这样的系统分析情感和社会网络以增强用户参与度。总的来说,这些系统实现了更具上下文意识、个性化和高效的推荐系统,显著提高了这些行业的用户体验。更多细节见表8。

RL在RS中的方法已经发展为两个主要框架:传统的基于RL的RS和深度学习增强的基于RL的RS。传统方法,如Q-learning[255]和SARSA[324],使用无模型方法在马尔可夫决策过程中优化策略,其应用在各种情境中都有详细记录[325,269,271,267,257]。这些方法经常利用蒙特卡洛树搜索(MCTS)[326]进行有效的模拟和策略改进。

RL被用于RS中以改进个性化问题。例如,在电子商务中,RL通过不断从用户互动中学习来增强个性化并提高客户满意度,如亚马逊和淘宝[212,262]中使用的系统所示。在媒体领域,RL帮助策划更具吸引力的内容推荐,如音乐和新闻,通过分析顺序交互数据来预测未来的偏好[267,259]。此外,在职位推荐系统中,RL算法通过建议与用户不断发展的职业兴趣和技能紧密对齐的角色来优化结果[257]。通过使用深度Q网络和技术梯度方法等技术,基于RL的推荐系统不断完善其决策过程,从而提高长期用户参与度和满意度。更多细节见表9。

语言是人类交流的基本工具,对于表达思想、情感和意图至关重要。理解和利用人类语言的挑战一直是NLP研究的核心追求,导致了语言建模的显著发展[282]。早期的统计模型依赖于马尔可夫假设来预测词序列[330,331],而随后的神经语言模型则利用神经网络来估计词序列的概率[332,333,334]。像BERT这样的预训练语言模型的出现[233,335,336]标志着一个重要的进步,提供了深入的上下文洞察,极大地增强了NLP任务。Transformer架构及其注意力机制允许有效处理长距离依赖和上下文[337]。规模定律表明,更大的模型和数据集通常会产生更好的性能[336],这导致了大型语言模型(LLMs)的发展[294],它们在像上下文学习(in-contextlearning)和常识推理(commonsensereasoning)这样的AI任务中展示了复杂的能力[338]。将LLMs整合到RS[287,289]中,促进了广泛的研究和持续的创新,最近的综述和分析提供了全面的回顾和分析[51,50,284,290],概述了基于LLM的RS技术的不断发展的格局。

将BERT类模型整合到RS中的初始应用,如BERT4REC[228],利用深度双向自注意力来模拟用户行为序列,而进一步的发展则将BERT应用于从对话RS[78]到CTR预测[339]等任务。BERT基础模型的增强解决了特定的RS挑战,例如对话中的物品对齐[340]和通过模型如U-BERT[341]和UserBERT[342]进行用户表示。进一步的创新包括基于BERT的重新排序[343]和解决群体推荐中的数据稀疏性问题[344]。

此外,提示调整和个性化推荐策略的进步展示了LLM在RS中应用的不断发展,显著提高了系统性能,同时也突出了像伦理考虑和人气偏见管理这样的挑战[286,283]。这些发展表明,正在向更复杂、上下文意识更强的系统转变,这些系统可以动态适应用户的偏好和行为。

多模态涉及使用和分析各种数据类型——文本、图像、音频、视频,以增强处理和理解。多模态RS利用这些多样化的输入来改善推荐质量和用户体验,通过更好地理解用户偏好和项目特征[296]。这些系统通过有效整合异构数据来克服单一模态系统的局限性。

多模态RS的演变始于引入视觉贝叶斯个性化排名(VBPR)[349],它通过整合产品图像中的视觉特征来增强个性化排名。结果显示了提高的准确性和解决冷启动问题。注意力协同过滤(ACF)[350]引入了一种新的注意力机制,以更好地处理多媒体推荐中的项目级和组件级反馈。

进一步的进步是通过开发多模态知识图谱(MKGs)[194],这是一个具有多级融合的混合变换器,用于链接预测和实体关系提取等任务。在线蒸馏增强的多模态变换器(ODMT)[244]使用不同类型的数据(ID、文本、图像)和具有在线蒸馏的ID感知多模态变换器来增强特征交互。这些模型在推荐准确性方面显示出显著的性能提升。

协作交叉网络(CoNet)[351]利用深度迁移学习。多模态丰富顺序推荐(MMSR)[249],一个基于图的模型,自适应地融合多模态信息,根据它们的顺序关系动态优先考虑模态。贝叶斯多模态推荐模型(BM3)[301]通过避免使用辅助图和多模态数据的负样本来简化训练。多模态兴趣感知序列表示推荐(MISSRec)[243]克服了基于ID的模型的限制,利用多模态信息进行稳健、通用的序列表示。多模态推荐(MMRec)[297]是另一个RS,它提供了一个可配置的平台,用于测试多模态推荐模型。

多模态推荐中的多级自监督学习(MENTOR)[298]采用多级自监督任务来提高模型性能,尽管它需要大量的计算资源。最近,多模态知识蒸馏(PromptMM)[300]通过多模态知识蒸馏和提示调整简化了推荐过程。

专业RS可以定义为那些为满足各种领域中特定需求而量身定制的RS,它们使用先进技术来解决独特的用户偏好或情况。与通用RS不同,这些专注于专业技术、功能和有针对性的推荐。在以下子部分中,我们将详细探讨这些专业系统。

CARS中使用的核心模型涵盖了一系列复杂的算法,旨在有效地将上下文信息整合到推荐过程中。其中,因子分解机(FM)[353]因其能够在大型数据集中捕获变量之间的交互而脱颖而出。领域感知因子分解机(FFMs)[354]特别优化了CTR预测,展示了为提高CARS性能而开发的模型的多样性和深度。神经因子分解机(NFM)[98]通过神经网络的非线性来模拟二阶特征交互,扩展了FM的功能,以实现更高阶交互。

像注意力机制这样的技术使推荐更加适应性和上下文敏感。注意力因子分解机(AFM)[356]引入了神经注意力网络来显示每个特征交互的重要性,增强了模型的可解释性和效率。图卷积机(GCM)[188]和基于门控循环单元的注意力上下文感知序列推荐模型(ACA-GRU)[226]都通过有效地综合用户、项目和上下文信息来增强RS。

已经为不同的用例开发了各种CARS。这些包括为个性化建议而设计的旅游RS[225],以及使用图CNN与BERT结合进行有效文档和上下文编码的基于上下文的论文引用RS[134]。还有为智能产品-服务系统[357]和文化遗产[66]设计的CARS。此外,上下文感知兴趣点(POI)推荐序列模型(SCR)[237]通过整合短期偏好与多头注意力聚合和长期偏好通过上下文感知层,增强了下一个POI预测。

基于方面的RS主要应用于旅游[386]和用户生成内容,如餐馆[387]。

为了获得用户参与和满意度,最新的RS研究开始优先考虑透明度和可信度。可解释的RS通过提供清晰、易懂的推荐背后的原因,增强用户信任和系统可用性[31]。同时,值得信赖的RS可靠地产生准确和公平的推荐,以确保像隐私保护和偏见最小化这样的道德实践,维护用户信心[388]。

进一步的发展包括Multi-ModalAspect-awareTopicModel(MATM),它利用多模态数据进行详细解释,反映不同的用户偏好[393]。各种方法,包括自然语言模型、反事实推理和视觉解释,已经被用来增强RS中的交互性、公平性和个性化[394,299,183,395,396]。

最近的努力,如CounterfactualExplainableFairness(CEF)框架,专注于识别和减轻RS中的公平性问题[397]。关于值得信赖的RS的讨论进一步强调了安全和稳健性、公平性、可解释性、隐私和问责性等关键维度,这些对于维护RS的完整性和可靠性至关重要[388]。这些发展表明,创建不仅有效而且公平和值得信赖的RS的重要性越来越大。

8.5推荐系统中的公平性、问责性、透明度和伦理性(FATE)

在推荐系统中,越来越注重公平性、问责性、透明度和伦理性(FATE),这确保了RS对所有用户公平,对它们的推荐负责,决策过程透明,并与机构或社会价值观的伦理对齐[400]。

正如[401]中概述的,RS中的公平性指的是一个伦理原则和要求,即推荐算法以公平和公正的方式在不同用户和项目之间分配资源(信息、机会或曝光)。RS中公平方法的演变显示了从简单的预处理策略到处理中(模型调整)和后处理技术的转变。

预处理公平方法:RS中预处理公平性的努力涉及调整训练数据,通过重采样[174]或添加合成数据[402]来改变受保护群体(如性别、种族、年龄)的比例。这些方法旨在在模型训练之前减少输入数据中的偏见,它们难以完全消除在训练或推理期间出现的偏见。

对抗性学习通过学习与敏感属性独立的表示或确保跨群体的公平分布,进一步增强了公平性,具有图嵌入[178]、分数分布相似性增强[410]、基于图的推荐[200]和个性化反事实公平[411]的显著应用。强化学习方法[412]通过奖励和约束引入公平性,旨在实现可持续的公平性。其他处理中方法包括向变分自编码器(VAEs)[413]添加噪声,使用偏差校正技术进行预训练和微调,以及调整梯度以实现公平分布[415]。处理中方法直接增强了公平性,但可能会面临由于额外约束导致的性能下降,并可能受到后续重新排序阶段的影响,改变预期结果。

在电子商务行业中,基于FATE的RS有助于建立客户信任并增强购物体验。这些系统旨在减少偏见,并确保产品推荐的公平性,这有助于保持多样化的客户群,并符合日益增长的道德AI实践的监管要求。通过整合FATE原则,这些RS不仅提高了客户满意度,而且还培养了负责任的品牌形象,这对于长期业务成功至关重要。基于FATE的RS可以与常规RS流程无缝使用,以增强透明度和问责性,从而提高整体客户参与度和忠诚度。更多细节见表16。

还有其他RS可以服务于特殊目的,如下所述。

基于群体的RS旨在通过考虑用户的共享偏好、社交动态和行为方面提供集体推荐[424]。最初的研究通过群体特定的方法和深度学习应用解决冷启动问题[425]。随后的研究强调了多样性的重要性,引入了优化群体效用和多样性的算法[426]。群体推荐的进展探索了信任和社交动态,使用基于社交影响和偏好关系框架[427,428,429]。一些工作将用户偏好聚合成统一的群体偏好,使用显式和隐式的反馈机制[424]。此外,强调了考虑群体场景中重要因素的上下文感知能力[133]。解决个体偏好聚合的策略,如聚合投票和确保所有成员满意,也被讨论[430,431]。最近的研究提出了通过最少痛苦方法最大化群体满意度的新方法,反映了为更好地满足群体需求而进行的持续改进[104]。

总的来说,这些基于群体和社会的RS方法反映了在日益复杂的情况下提高群体推荐的精确度和满意度的承诺。

电子健康:健康RS分析健康数据、生活方式和遗传学,以改善结果[443]。它们解决隐私和信任方面的挑战,并是医疗保健4.0的重要组成部分,专注于个性化干预[24,81,22,444]。

系统评审评估了健康RS的进展,并强调了风险管理和隐私[7,445,446,447,26]。机器学习和深度学习的进步已经改进了RS,在糖尿病、心脏病护理等领域的应用[448,449,450,110]。

算法的进步包括通过信任关系和高级机器学习技术(如混合深度学习模型)提高预测准确性[451,452,453,454,455,456,457,458]。正在进行的研究探索了持续学习和基于聚类的技术,以改进临床RS应用[459,460,461]。

电子政府RS的初步开发使用了CF和CBF,结合混合模型以获得更准确的预测[463,464,465,466]。NLP和预测分析的使用增强了公共服务推荐[467,107]。信息过载等挑战通过改进CF与负面项目技术来解决,而CNNs和GNNs等新方法在工业应用中推进了特征提取和推荐准确性[465,468,185]。

电子图书馆和电子学习:电子学习是电子图书馆的一个子集,利用电子资源(电子书、学术论文、期刊和其他数字内容)进行学习和包括更广泛的数字服务,用于信息检索和研究[116]。电子图书馆RS的早期发展集中在结合CBF和CF技术的混合系统上,通常具有书架功能以个性化交互[469,470]。这些系统还使用书目网络表示模型进行引用推荐[177,471,64,472]。深度学习和上下文感知推荐的进展显著提高了电子学习系统的效率,超越了传统方法[473,82]。

电子旅游/旅行:RS已经通过使用大量数据提供个性化的旅行建议,从而彻底改变了旅行和旅游业,增强了用户满意度[80,21,474]。主要平台如TripAdvisor和Booking.com使用CF、CBF和混合方法提供量身定制的旅行选择[475,476]。需要持续的进步来管理动态数据,并保持最新、透明的推荐,以建立用户信任[62,477]。未来的创新可能会结合沉浸式目的地预览,进一步个性化旅行体验[210,478]。

电子金融:金融RS通过将投资选择与个人目标和风险承受能力对齐,显著增强了投资者的参与度和知情决策,通过分析金融历史、风险概况、市场趋势和经济指标[19,479]。像FinPathlight[480]这样的框架通过提高金融素养和能力,整合了行为金融[481],根据心理偏见量身定制财务建议。此外,像StockTwits这样的平台使用情感分析提供更准确的投资建议[479],而KiRTi利用区块链和深度学习自动化和保护贷款流程[482]。这些技术共同提高了金融服务、建议和策略优化的个性化[123]。

尽管取得了进展,但在处理市场波动性和确保RS透明度和信任方面仍存在挑战[19]。未来的开发可能会专注于提高可解释性,并使用预测分析更好地预测市场趋势和用户偏好,进一步个性化财务建议[483]。

电子新闻:新闻RS根据CF、CBF和混合方法等方法,区分个性化和非个性化系统,策划和推荐内容[59,60]。新闻RS的显著进步已经整合了深度学习和机器学习,以改善新闻内容和用户数据的建模。这包括使用神经网络架构和预训练语言模型来提高内容推荐的准确性[152,484,485]。新技术还探索了使用GNNs来理解复杂的用户-新闻交互[220,192],以及像Prompt4NR这样的创新模型用于高级点击预测任务[346]。新闻RS的发展还面临道德挑战,如解决过滤泡沫、确保多样性和促进公平,这对于维护用户信任和系统完整性至关重要[486,408,487]。

ByteDance为TikTok引入了创新模型,以快速适应用户互动,采用独特的检索模型和可扩展系统,如Monolith,该系统使用无冲突嵌入表进行高效的内存使用[491,492]。苹果开发了SlicedAnti-symmetricDecomposition(SAD)模型,以增强协同过滤,允许更微妙的用户-项目交互,并探索使用扩散模型控制音乐制作[493,494]。DeepMind的生成模型通过从用户互动中解码语义ID来改进RS,增强项目检索和系统性能[495]。

我们涵盖了RS的许多领域的全面指南,尽管如此,一些领域和领域需要更多的报道,这些将在下面简要讨论:

尽管RS在理论方面的迅速发展和跨领域的实施,当前方法显示出几个关键局限性。每个应用领域,从电子商务到电子学习,都面临着独特的挑战,这些挑战加剧了局限性。例如,电子商务RS必须适应快速变化的库存和消费者趋势,而电子学习系统需要考虑多样化的学习风格和教育目标[105,236,437,28,496,473,497]。这些领域特定的挑战强调了需要RS不仅在技术上稳健、道德上可靠,而且还要灵活、可扩展,以便能够被各种规模的组织有效部署,包括那些资源有限的组织。这些局限性涵盖了RS的各个方面,包括技术限制、适应性问题和道德问题[7,61,55]。

基于矩阵分解的模型被认为是RS理论中的标准,但由于潜在特征表示不足和它们交互模型的固有线性,它们在捕获复杂的用户-项目交互方面存在困难[4]。这些方法的神经扩展通过纳入非线性关系和捕获高维潜在特征带来了改进[86,24]。然而,随着数据量的增长,这些基于深度学习的RS遇到了它们自己的挑战集,特别是在保持计算效率和可扩展性方面[498,499,500]。训练和推理这些模型所需的大量计算资源,特别是在需要实时推荐的情况下,构成了障碍。此外,许多系统严重依赖于显式用户反馈(例如,评分、点赞),这些反馈通常是稀疏的,并不总是可用的,忽略了可以提高推荐准确性的隐式反馈信号[141]。此外,数据稀缺严重影响了推荐系统的质量[501]。从外部数据丰富的领域转移知识可以是增强RS建模能力和性能的解决方案[501]。此外,数据增强、自监督学习和知识图谱等方法可以丰富数据环境,并可持续地解决RS开发中的数据短缺问题[501]。

负责任的AI:实践RS塑造用户决策、观点和行为,强调其设计需要优先考虑责任。最近的研究[504,505]对RS可能的负面影响表示担忧,例如,为了增加利润而偏向产品推广或促进错误信息的传播。尽管在RS社区内对采用负责任的AI实践越来越感兴趣,但仍然存在一些挑战。大多数现有的数据集缺乏有关敏感用户属性的全面数据,这使得产生公平推荐的努力变得复杂[506]。此外,特定模型架构对推荐公平性的影响仍然没有得到很好的理解,研究也很少,这表明需要进一步调查的关键领域。

评估推荐系统超越准确性:RS传统上使用单一指标,如准确性进行评估。然而,这种方法并没有完全包含现实世界用户交互的复杂性。用户不仅需要推荐中的精确度或召回率,还需要推荐中的多样性和偶然性,以获得更好的用户体验[408]。未来的研究应该考虑扩大RS的评估框架,包括能够捕捉这种多样性和偶然性的指标。

对透明度和可解释性[397]的日益增长的需求表明,需要转向更易解释的模型[403]。整合多模态数据和应用先进的学习技术提供了丰富的方向,以丰富用户体验,使RS不仅更有效,而且更公平、更吸引人。这种全面的方法将确保RS满足用户在实际场景中不断演变的期望。

计算和存储资源:尽管将来自不同用户的用户-项目交互数据聚合到中央数据库中,以利用协作信息进行推荐的方法有其好处,但这种方法也有一些缺点。它是耗时的,需要大量的通信和存储资源,并且引发了严重的隐私和安全问题。一种新的研究方向是在设备上进行推荐(DeviceRS),这是一个小型的最小模型,可以用较低的计算和存储资源进行训练[508,509]。这条研究线仍处于早期发展阶段,并处理着几个开放的问题和挑战。找到一种有效使用来自其他用户的协作信息的方法,同时保持计算、存储和数据暴露低,并考虑到每个用户设备上的数据差异,仍然是一个开放的挑战。

11结论

在这篇综述中,我们回顾了RS在学术和工业背景下的显著方法论、应用和挑战。我们提出了一个框架,根据建模技术和应用对RS出版物进行分类。将RS与最先进的方法,如深度学习、图神经网络和LLMs整合,展示了该领域的演变,并强调了其在改善电子商务、金融、媒体流和个性化教育等不同领域用户体验方面的影响。尽管取得了显著进步,我们仍然面临着数据稀疏性、隐私问题以及对系统既要适应性强又要可解释性的需求等挑战。这篇综述旨在将理论进步和算法发展与实际应用联系起来,帮助行业实现可扩展性和即时的商业影响。我们的目标是加强学术界和工业界的合作,这对于将理论进步转化为实际应用至关重要。

THE END
1.书籍数据分析和可视化系统毕设源码在此基础上,他们为读者提供了丰富的书籍推荐功能,以帮助其更有效地获取和利用书籍资源。例如,美国学者通过对图书销售数据进行数据挖掘和分析,发现了一些与读者购买行为相关的潜在趋势,如读者在书籍购买中的地域偏好、购买时段和书籍类型偏好等。这些发现为读者提供了更准确、更个性化的书籍推荐,有助于提高读者对书籍的https://blog.csdn.net/fufulove/article/details/144366037
2.图书管理系统数据模型ER图经管文库(原现金交易图书管理系统数据模型ER图 https://bbs.pinggu.org/forum.php?mod=viewthread&tid=13095880&ordertype=2
3.科学网—[转载]榜单发布丨21世纪图情领域高影响力图书TOP10010月24日,清华大学图书馆、浙江大学图书馆与中国知网联合主办的“第二届高校图书馆评价服务高质量发展研讨会”在杭州顺利召开,来自全国80余所高校的 ,科学网https://blog.sciencenet.cn/blog-554179-1463892.html
4.资源动态丨中国知网数据库资源推介广州新华学院它通过文献或知识的聚类功能,将不同文献或知识之间的内在关系进行有机整合,将CNKI数据库中期刊、学位论文、报纸、会议论文、图书等不同类型的文献进行关联,在此基础上,进一步形成了文献知网节、作者知网节、基金知网节、机构知网节等,从而构建系统的知识网络和内容解释体系。https://library.xhsysu.edu.cn/info/1531/4157.htm
5.ER图关系模式的转换数据库系统原理---ER图转化成关系模式 E-R图转换 ? E-R图是由实体、实体的属性和实体之间的联系三个要素组成的。将E-R图转换为关系模型实际上就是要将实体、实体的属性和实体之间的联系转化为关系模式 。 实体集向关系模式的转换 一般转换遵循的原则 实体集的转换规则:一个实体型转换为一个关系模式。实体https://www.pianshen.com/article/7895168137/
6.TKDE2023为推荐系统注入先验知识:基于近邻增强的对比学习推荐嘿,记得给“机器学习与推荐算法”添加星标 TLDR: 本文针对协同过滤技术固有的数据稀疏问题,提出了两种监督对比损失函数,将锚定节点的近邻信息视为最终目标损失函数内的正样本。通过对所提出的损失函数进行梯度分析,可以发现锚点节点表征的更新将同时受到多个正样本和增强负样本的共同影响。最后通过大量的实验验证了所提出https://cloud.tencent.com/developer/article/2408024
7.ER图中通常用()来表示实体。D. 一个包含用户个人信息的数据库 查看完整题目与答案 海外社交媒体的客户体验历程指什么?() A. 消费者购买历程 B. 消费者调研历程 C. 消费者E. 极轻度 查看完整题目与答案 根据资本资产定价模型的建议,一个资产分散状况良好的投资组合,最容易受()因素的影响。 A. 系统性风险 B. 投资分配比https://www.shuashuati.com/ti/8a36878f3a114bbfb927fcd7c5097012.html?fm=bd48484da6b7cb8798fd0b0e1931dec828
8.awesomegoNoSQL数据库驱动程序 检索及分析资料库 日期和时间 分布式系统 动态域名 电子邮件 可嵌入的脚本语言 错误asciigraph star:2132 在命令行中构建轻量级ASCII线图╭┈╯,应用程序中没有其他依赖项。 uiprogresscmdr star:118 一个POSIX/GNU风格的、类似getopt的命令行UI Go库。 env star:102 基https://gitea.mrx.ltd/Go-pkg/awesome-go-cn/src/commit/c5a36a9329cd55bce92df7888f09e744ebea35b5/README.md
9.图数据库发展综述图数据库管理系统(以下简称图数据库)是一种经过优化的用于存储、查询和更新图结构数据的数据库管理系统[5], 它支持对图数据模型的增、删、查、改(CRUD)方法. 图数据库以数学中的图论作为理论基础, 以图模型为特点进行数据存储, 主流的图模型有3种, 分别是属性图、RDF和超图. 相对于RDF和超图属性图模型目前https://c-s-a.org.cn/html/2022/8/8713.html
10.库+网络库+视频库+微服务框架+视频教程+音频音乐库+图形图片库优秀的第三方库 音频和音乐 数据结构:Go中的通用数据结构和算法 分布式系统:Go中的通用数据结构和算法基于ringbuffer实现的队列 https://github.com/eapache/queue 拼音 https://github.com/go-ego/gpygo-rquad 具有有效点定位和邻居发现功能的区域四叉树。 gocache 具有多个存储(内存,memcache,redis等https://github.com/r14152/golangFamily
11.精选了千余项目,包括机器学习深度学习NLPGNN推荐系统推荐系统 机器视觉 因果推断 金融股票与时间序列 强化学习 语音识别与合成 生物医药 图数据库 图算法 图神经网络GNN 大数据 虚拟化 安全与渗透 硬件 网络与前后端开发 其他项目 机器学习与深度学习 Coursera-ML-AndrewNg-Notes [教程/笔记]吴恩达老师的机器学习课程个人笔记 d2l-ai/d2l-zh [教程/笔记]《动手学深https://openi.pcl.ac.cn/gzoftju/gzoft202308011423431
12.机器学习与数据科学(基于R的统计学习方法)第2章:连接数据。机器学习的第一步是连接到一个合适的数据集,在R环境下得到数据内容,然后开始对其进行分析。在这一章中,我们使用R来连接数据,使用不同数据源(逗号分割文件格式CSV、Excel、JSON、Twitter和谷歌分析)用多种方式连接。我们也会铺设一条在SQL数据库中连接数据的通路。一旦数据连接到R环境中,我们就能开https://www.epubit.com/bookDetails?id=N17365
13.MKR模型在电影推荐系统中的应用研究摘要: 针对电影推荐系统中推荐结果的准确性和可解释性不高的问题,研究了基于多任务特征学习的知识图谱增强推荐(multi-task learning for knowledge graph enhanced recommendation, MKR)。通过构建知识图谱,将其作为辅助信息构建了MKR模型,并将其应用到电影推荐系统中。采用预测用户满意度评分的方法根据评分结果来判定用户http://hanspub.org/journal/PaperInformation?paperID=41485
14.新闻推荐系统python新闻推荐系统ER图柳随风的技术博客新闻推荐系统 python 新闻推荐系统ER图 E-R图也称实体-联系图(Entity Relationship Diagram),提供了表示实体类型、属性和联系的方法,用来描述现实世界的概念模型。 用矩形表示实体型,矩形框内写明实体名;用椭圆表示实体的属性,并用无向边将其与相应的实体型连接起来;用菱形表示实体型之间的联系,在菱形框内写明联系https://blog.51cto.com/u_14276/7307966
15.计算机支持的协同学习7篇(全文)UACFRAC流程图如图1所示。 该模型,首先通过数据集得出用户i的相似度集合和用户u对项目v评分r的共同属于聚类k的概率; 再通过条件选择以及相应计算得到用户i对于项目v的最近邻用户集合; 最后预测评分,并由预测评分排序,评分高的项目推荐给用户。本文的增量更新机制采用文献[11]中改进的增量更新机制,其基本原理是: 当https://www.99xueshu.com/w/ikeyrku0so8e.html
16.河南财大成教《大数据基础》高起专原题及答案1、关于推荐系统的说法错误的是() A.推荐系统的架构为离线计算-在线计算-推荐引擎APP B.推荐系统的相关技术包括机器学习及数据挖掘算法等 C.推荐系统的常见9、在数据库设计中,将E-R图转换成关系数据模型的过程属于() A.需求分析阶段 B.物理设计阶段 C.逻辑设计阶段 D.概念设计阶段 答案:C 10、在合并分Ehttp://www.ehnzk.com/forum.php?mod=viewthread&tid=1820&page=1
17.跨媒体科技大数据的知识图谱构建与动态精准画像图神经网络模型的特征交互建模 文/张晓宇,李泽坤,吴书 36 面向开放协同的科技大数据汇聚融合与演化分析平台研究 文/陈浩,陈建国 42 慧科研:基于科技大数据计算的智能知识服务平台 文/钱力,谢靖,胡吉颖 48 FedCube: 面向隐私数据的数据联邦计算平台 文/刘吉,熊昊一,季石磊,李徐泓,边江,窦德景 54 科技情报分析系统https://new.caai.cn/index.php?s=/home/file/download/id/456.html
18.图计算人工智能之图计算图(Graph)是一种重要的数据结构,它由节点V(或称为顶点,即个体),与边E(即个体之间的联系)构成,我们一般将图表示为G(V,E)。图数据的典型例子有网页链接关系、社交网络、商品推荐等。对应互联网来说,可以把web网页看作顶点,页面之间的超链接关系作为边;对应社交网络来说,可以把用户看作顶点,用户之间建立的关系https://www.zhuanzhi.ai/document/5d59a34bbf23eccbe8589070a95fc534