CCF YOCSEF青岛首次在YEF上举办博学堂论坛——“薛定谔的RS”:你被推荐系统猜中了吗?新闻动态

辛鑫教授以“基于离线强化学习的推荐系统”为题,介绍了如何使用离线训练数据来构建基于强化学习的推荐系统方法。该方法主要包括结合监督学习与对比学习的训练方法,以及基于奖励引导的训练方法。推荐系统旨在改善用户体验,由于强化学习非常贴合这一目标——最大化用户在每个会话的累积奖励,因此使用强化学习去构建推荐系统是一个很具有前景的研究方向。然而,在离线训练的场景下,设计基于强化学习的推荐算法并不容易。具体而言,传统强化学习的关键在于使用大量的在线试错训练智能体,因此在训练过程中会产生许多试错经验。然而,在推荐场景下,在线试错代价高昂。因此,在推荐场景下,智能体需要通过以前推荐策略产生的离线数据进行训练,而传统的强化学习算法在这些离线训练设置下可能导致次优的策略。

黄超教授以“鲁棒推荐系统的研究”为题,介绍了如何设计更为鲁棒的推荐系统从而解决实际场景中的两个关键问题:1)现有推荐算法的效果极大程度上依赖充足、准确的用户交互记录作为监督信号,在监督信号稀缺的情况下,很难学得准确、高质量的用户、商品表征。2)数据噪声和倾斜分布问题阻碍模型进行有效的用户、商品交互建模,导致现有基于图的协同过滤模型偏向于预测流行商品,并在面对交互数据稀缺的用户时会出现严重的效果退化。推荐系统能够帮助用户缓解信息过载问题,近年来在线上购物、流视频网站、地点推荐等各类网络应用中发挥了越来越重要的作用。为了更准确地对用户偏好进行建模,协同过滤方法将用户、商品嵌入语义空间,可使用表征向量压缩观测到的用户、商品交互数据。

李晨亮教授以“多场景融合的搜推系统前沿进展”为题,从特征重构、知识共享、模型结构优化、预训练模型等多个角度介绍了当前多场景融合的搜推系统进展。指出搜推系统已渗透进生活与工作的各个角落,现阶段不同场景往往相对独立,各类场景定制的搜推模型不断更新。如何打破不同场景之间的数据壁垒,推进全方面的用户需求理解,改善低资源场景的性能、降低智能化服务的成本是目前业界较为关心的问题。

引导发言阶段结束后,论坛进入Panel环节。会场的6位嘉宾围绕5个议题展开了思辨研讨。

黄栋:推荐系统也好和数据安全,涉及到多个层面的力量博弈,包含政府、用户以及企业,所以它并不平衡。另外,用户的视角具有一定的盲目性,把选择权和知情权直接完全交给用户,可能也并不适合。

华伟:可信的这件事是一个主观的事,把技术和技术在社会中的运用,以及个人对技术理解的结合程度,创造一个综合的客观评价。

辛鑫:非常赞同沈老师的观点,可信的需求是非常客观的,可以引入多视角去了解平台、用户和政府要优化的分别是什么。每一个人对可信推荐系统的理解都是不一样的,需要加强个性化的推荐系统。

张琨:可信的标准目前其实是不确定的。对于不同的角色而言,每个人对可信的理解是不一样的。目前来讲的话,还是需要有这种更明确的一些定义或方向,才能去讨论怎么去实现。

郭磊:用户觉得不可信是因为没有参与到推荐过程中去,大多数情况下推荐算法像一个黑盒子,因此可加强其可解释性。

郭磊:有时希望随机的推荐,按照偏好推荐确实存在漏网之鱼或过度推荐。

张琨:认为现在的推荐是过度推荐。企业希望不漏掉任何可能的用户。可参考大模型,采用随机策略保证推荐更多样。

辛鑫:每个人都有自己的体验。可能目前没有很好的算法推荐这样的场景,比如医院分诊台,对推荐系统有更高的要求,在很多民生领域存在很多漏网之鱼。

沈华伟:度很难讲,从同质化和多样化角度来讲。从需要、特殊群体来看,很多普及技术对特殊群体来说并不了解。要把推荐看成一种服务,而不仅仅是技术。

黄栋:准确性不是很好的度量。用户隐私保护要适度,用户视角更local,期望更全局的视角。

黄超:很多APP没有用户隐私,有时APP可以用,但不要给其他人应用。从公平角度,应该用完消除数据和影响,需要更灵活的编辑。

沈华伟:企业认为技术上很难做到消除数据和影响。没有安全只有平凡,因为平凡所以安全。隐私和精确性是从两个角度来说的。

辛鑫:需要定义什么是隐私。对推荐算法提隐私难以实现和管理。是否有责任向用户批露用了哪些数据。

张琨:目前无法做到删除数据和学到的知识,但可以做到达到准确率标准的情况下用哪些数据就足够了。

郭磊:隐私是分层级的,对于隐私的保护从立法角度执行和监管需要更大的努力。违反协议跨平台使用数据的情况需要避免。

沈华伟:隐私界定并不严格。国家保护了知情权和选择权。认为从扩大了使用和知悉范围来界定更好。

沈华伟:每个人都生活在自己的茧房,推荐系统会带来更紧的气泡。未来更多的考虑认知安全。很多是社会问题,不仅仅是技术问题。

黄栋:从过去主动查找到现在的被动接受,行为模式的改变有利有弊。获取知识能力发生了改变。

郭磊:对青少年来说,推荐系统会加速禁锢的行为,系统层面应承担更多的责任。

张琨:每个人都非常喜欢看到自己喜欢的东西,推荐系统加速了这种情况,应避免“夹带私货”。

黄超:要打破信息茧房还是很困难的。算法可在重排环节增加推荐内容的多样化,要牺牲掉短期的精确性。鼓励生成多样化。

黄超:当前太过度追求精确度,更多鼓励大家追求公平性、可信赖、隐私保护。

黄栋:企业看到的更多是业务量的成长,生态应该更体现社会责任感,对社会贡献的增长。目标导向怎么定义,需要思考短期刺激和长期收益。

沈华伟:推荐系统有自己的生命。优化的目标是能活多久,如何一直被大家用。

辛鑫:学术界定义的推荐系统与工业界的定义有很大差距。企业需要有社会责任感。在学术界需要论文的insight,而不是与baseline的比较。

张琨:生态改善需要先活下来,是否可以改善评价推荐系统的标准,有了多维度指标才能有动力去做,不仅仅是收益,还要有社会责任感等。

THE END
1.推荐系统架构设计与实现:从算法选择到工程化部署的解决方案推荐系统架构设计与实现:从算法选择到工程化部署的解决方案 一、概述 推荐系统的重要性 推荐系统是一种能够根据用户的历史行为和偏好,为其推荐可能感兴趣的物品或服务的系统。在当今https://www.jianshu.com/p/5fb6a37a0153
2.五大推荐系统算法java推荐系统算法有哪些五大推荐系统算法java 推荐系统算法有哪些 受到大家公认的推荐算法基本包括以下几种:基于内容的推荐、协同过滤推荐、基于关联规则的推荐、基于知识的推荐、组合(混合)推荐及其他推荐 1 基于内容的推荐 基于内容的推荐是根据用户已经选择的对象,从推荐对象中选择其他特征相似的对象作为推荐结果。https://blog.51cto.com/u_16099166/9068610
3.五类推荐系统算法,非常好使,非常全面五大推荐系统算法这种方法很简单,如果在为一名热爱观看英超联赛的足球迷推荐新闻时,新闻里同时存在关键字体育、足球、英超,显然匹配前两个词都不如直接匹配英超来得准确,系统该如何体现出关键词的这种“重要性”呢?这时我们便可以引入词权的概念。在大量的语料库中通过计算(比如典型的TF-IDF算法),我们可以算出新闻中每一个关键词的https://blog.csdn.net/qq_32649581/article/details/83058048
4.大佬总结:广告算法和推荐算法的五大差异导读:广告和推荐算法的技术框架比较相似,但是在优化目标等具体细节上又有很多不同。本文摘选自知乎问答板块“广告算法(系统)和推荐算法(系统)有什么异同?”下王喆老师的分享,有需要的小伙伴可以学习参考。 以下为王喆@知乎的回答: 要理解好广告算法和推荐算法的的异同,一定要首先抓住解决广告和推荐这两类问题的根本目https://k.sina.cn/article_2674405451_9f68304b019013b89.html
5.深度PedroDomingos解析机器学习五大流派中的算法精髓推荐系统 在深度学习盛行之前,支持向量机可能是应用最强健地学习算法。人们从20世纪50年代便开始运用这种基于类比的学习算法,因此这种学习算法基本上适用于地球上的一切事物。我们都体验过这种学习算法的应用实例,尽管可能没有意识到应用到了基于类比的学习算法。这便是推荐系统。例如,我想弄清楚推荐给你什么类型的电影比https://www.cloud.tencent.com/developer/article/1053989
6.学术社交网络(精选八篇)推荐系统算法,即通过分析已有对象的行为或者属性,利用一些数学上的算法来得出更可能满足该对象需求或者与该对象更加相似的对象。此类算法很多,不同的算法分析多种多样,得到的结果也不尽相同,以下简单介绍一些相关的算法。 3.1 协同过滤算法 协同过滤算法被人们研究的比较深入,此算法也经常被应用到推荐系统中,协同过滤算法https://www.360wenmi.com/f/cnkey1i6c6ou.html
7.Contents/premium.mdatmaster·Newslab2020/Contents·GitHub答:需根据相应的时间长度购买。例如,从第001期到108期是一年的内容,需支付300元购买。 试读文章 通讯358:我们需要怎样的“辟谣”? 通讯253:《黑镜》新片:交互是电影业的未来吗? 通讯165:Facebook“数据门”究竟是怎么回事? 通讯53:一门叫做“抵制狗屁”的大学课程 https://github.com/Newslab2020/Contents/blob/master/premium.md
8.TikTok:独具一格,顺势而为流媒体网TikTok兴起基于底层逻辑是重构信息分发方式,传统的互联网时代信息分发方式——人工筛选、搜索引擎、订阅、社交网络都存在一定局限性和门槛,而信息推荐将带来移动互联网时代从“人找信息”到“信息找人”的信息分发方式变革,让信息和人实现更广泛和更高效率的匹配。基于此认知,TikTok母公司逐步将算法推荐系统打造成为核心https://lmtw.com/mzw/content/detail/id/210534/keyword_id/-1
9.数字经济核心要素:数据算法和算力信息技术图神经网络、强化学习、对比学习、因果推断等前沿方法,进一步拓展了组合推荐的新边界。 在推荐系统发展的同时,用户画像作为个性化推荐的基石,其理论和方法也不断演进。从静态画像到动态画像,从粗粒度画像到细粒度画像,从单域画像到跨域画像,用户画像变得越来越立体、越来越精准。用户画像通过机器学习算法,整合用户在不同https://www.zgcsswdx.cn/info/10274.html
10.中国自媒体五大平台是什么(抖音快手视频号小红书B站通常所说的自媒体“五大平台”一般指的是:抖音、快手、视频号、小红书、B站。以下是它们各自的特点、选择依据以及面向的用户群体特点: 一、抖音: 庞大的用户基数和流量: 日活跃用户数量巨大,是目前最具影响力的短视频平台之一,拥有极高的曝光机会,只要内容优质且符合平台算法推荐逻辑,就有可能迅速获得大量关注和传播https://www.xdjk.cn/traffic/12164
11.2023抖音最全大纲(新手看这篇就够了)TaoKeShow五、抖音的推荐机制 抖音的推荐算法(了解一下推荐系统背后的算法) 一.我们为什么需要推荐算法呢? 因为抖音是一个拥有大量用户和创作者的平台,每分钟有成千上万的视频被上传到抖音上。我们的用户不可能全部看完,每一个抖音视频之所以需要一个复杂的推荐算法,让用户在海量的内容中挑选到他最喜欢的。简单一点来说https://www.taokeshow.com/44413.html
12.详解个性化推荐五大最常用算法现在,许多公司都在用大数据来向用户进行相关推荐,驱动收入增长。推荐算法有很多种,数据科学家需要根据业务的限制和要求选择最好的算法。 为了简化这个任务,Statsbot团队写了一份现有的主要推荐系统算法的概述。 协同过滤 协同过滤(Collaborative filtering, CF)及其变体是最常用的推荐算法之一。即使数据科学的新手也可以用https://zhuanlan.zhihu.com/p/27768663
13.36氪研究院2024年中国AI+制造产业研究报告同时,基于大数据分析和机器学习算法的个性化推荐系统,企业能够深入挖掘客户的需求和偏好,为客户提供量身定制的产品推荐和个性化服务,加深与客户的互动和连接。此外,AI还可以通过分析客户信用和支付历史,评估其信用风险,帮助企业制定风险控制策略,并将其集成到CRM系统中,自动更新客户信息,跟踪客户互动,优化客户关系管理。以https://36kr.com/p/2853458940627588
14.个性化推荐系统实践应用机器之心本文五大内容: 一、推荐系统概述 二、搭建推荐系统的关键算法 三、推荐系统难点分析和解决方法 四、深度学习在推荐系统中的应用 五、进阶资源推荐 一、推荐系统概述 常见的推荐系统主要有以下三种场景: 1.个性化推荐例如打开今日头条时最先看到一个推荐页面,这是一个FEED流,还有像电商网站有猜你喜欢的推荐位置。 https://www.jiqizhixin.com/articles/2019-02-11-6