“推荐算法”究竟是什么?这篇科普报告帮你快速了解

算法究竟是什么?我们为什么需要算法?

算法是否能服务人在获取信息时对效率提升、公平发展的诉求?

今年,在中国人民大学高瓴人工智能学院举办的“推荐算法社会价值与可持续发展”研讨会上,我们发布了《算法向善与个性化推荐发展研究报告》(下称《报告》)。

在这份算法科普性报告中,课题组围绕这些热点问题进行了探讨。

1、算法是什么?我们为何需要算法?

互联网数据中心发布的《数据时代2025》报告显示,全球每年产生的数据将从2018年的33ZB(十万亿亿字节)增长到175ZB,相当于每天产生491EB(百亿亿字节)的数据。

图1:用数学公式解决“鸡兔同笼”问题体现了算法思维

2、推荐技术发展历史上的关键事件有哪些?

“信息过载(InformationOverload)”是在上个世纪80、90年代就已经存在的概念。随着信息技术和互联网的快速发展,人类从信息匮乏时代走向了信息过载时代。

《报告》研究指出,早期的研究提出了通过信息检索和过滤的方式来解决这个问题。

到了上世纪90年代中期,研究者开始通过预测用户对推荐的物品、内容或服务的评分,试图解决信息过载问题。推荐系统由此也作为独立研究领域出现了。

图3:推荐系统发展历史

3、推荐系统有哪几个类型?

在《报告》看来,推荐系统发展至今,其核心技术可大致分为“基于协同过滤的推荐方法”、“基于内容的推荐方法”,以及“混合推荐方法”。

基于协同过滤的推荐方法,本质是根据相似的用户具有相似的喜好,推荐给他们喜欢的物品、内容或者服务。

图4:基于协同过滤的推荐方法

图5:基于内容的推荐方法

混合推荐方法:衡量各推荐方法的利弊,扬长避短,通过加权、切换、混杂、特征组合等方式避免或弥补各推荐技术弱点,进一步提升推荐方法性能。

图6:融合知识图谱的混合推荐方法

4、什么是个性化推荐算法?

纵观推荐系统的发展历史,可将其大致分为非个性化推荐系统和个性化推荐系统。

其中,个性化推荐系统,就是为每一个特定用户提供特定的服务,实现“千人千面”,服务个性化诉求。

图7:在个性化推荐算法下,不同人搜索“京剧”一词结果不同

5、推荐算法,会导致信息窄化吗?

在外界的印象里,个性化推荐就像漏斗一样,会将推荐内容与用户相匹配,倾向于向用户推荐高度符合其偏好的内容,致使推荐的内容越来越窄化。

但与外界的固有认知相反,《报告》认为在行业实践中,互联网应用(特别是位于头部的大型平台)有追求算法多样性的内在动力。

推荐技术并不是单纯地“投其所好”。在一些专家看来,在推荐已知的用户感兴趣内容基础上,如果能深入激发、满足用户的潜在需求,那么算法就能更好地满足人对信息的多维度诉求。

6、算法如何服务人对安全的诉求?

《报告》观察发现,当前很多内容创作与分发平台,从创立之初就将用户和内容安全视为最高优先级问题。

以今日头条为例,在内容安全技术方面采用了鉴黄模型、谩骂模型以及低俗模型等内容识别技术。抖音安全中心则自主研发反欺诈模型、风控策略,结合抖音产品功能、内容属性、用户行为特征,对欺诈行为进行主动拦截。

图9:抖音安全中心通过算法技术主动拦截欺诈行为

7、推荐技术如何服务人对公平的诉求?

《报告》认为,推荐系统中的“公平”是站在不同角度定义问题。

比如在招聘网站上,求职者方可能将公平定义为“相同的学历和能力可以被推荐类似的工作,而不受国籍、种族和性别等偏见”;对于招聘方,“公平”可能为“系统可以将他们的招聘信息推给优质的求职者,而不会因为公司的背景等因素,只将招聘信息推给不太合适的求职者”。

当前,学界对算法公平性的研究与探讨正不断深入。

图10:在抖音等国内短视频直播平台上,也能看到更多推荐系统服务“用户”、“物品”公平的案例

THE END
1.什么是算法?算法的概念什么是算法? 算法(Algorithm)是指解决特定问题的一系列明确、有限且可执行的步骤或规则。算法是计算机科学的核心概念之一,用于指导计算机完成各种任务,从简单的数学运算到复杂的数据处理和决策。 一、算法的基本定义 从广义上讲,算法可以定义为: 有穷性:一个算法必须在有限的步骤内完成。也就是说,算法不能无限循环,https://blog.csdn.net/weixin_48579910/article/details/141722210
2.什么是算法?怎样可以学好算法?什么是算法?怎样可以学好算法?众所周知,算法是计算机科学中的重要概念。但是,很多人对算法这个词可能并不陌生,但是对于它的具体含义却懵懵懂懂。那么,什么是算法呢?简单来说,算法就是一系列解决问题的步骤或规则。首先,我们来看看算法的定义。算法是指一组明确的、可操作的指令,用于解决特定问题或完成特定https://baijiahao.baidu.com/s?id=1772131975016089080&wfr=spider&for=pc
3.什么是计算机算法?1算法((Algorithm)是指解题方什么是计算机算法?1、算法((Algorithm)是指解题方案的准确而完整的描述,是一系列解决问题的清晰指令,算法代表着用系统的方法描述解决问题的策略机制。也就是说,能够对一定规范的输入,在有限时间内获得所要求的输出。如果一个算法有缺陷,或不适合于某个问题,执行这个算法将不会解决这个问题。不同的算法可能用不同的https://www.douyin.com/note/7209845985432833313
4.networkx:kclique渗透算法 k-clique对象:k个节点两两存在边关系,这就是一个k-clique对象。 如果存在多个k-clique对象之间存在k-1个共同节点,则说明这2个k-clique对象是相邻的。 完全子图 k-clique-communities算法发现的社区是可以重叠的,及一个节点既可以存在于a社区,也可以存在于b社区。 https://juejin.cn/post/7049647517142614053
5.日柱是什么意思日柱的算法是什么日柱是什么意思 日柱的算法是什么 每个人都有日柱,那么日柱具体指什么呢?在不同时间出生的人对应的是不一样的,我们可以看下自己日柱中命带什么神煞,对命理有什么影响。来华易网八字日柱专题分析更多内容吧。 日柱是什么意思? 日柱为命理学之术语,即用农历的干支代表人出生的那一天。https://www.k366.com/bazi/171899.htm
6.快照为什么比实际存储数据大了1倍多?这是腾讯云的什么高级算法?--- 导致快照的大小大于文件系统的大小会有以下几个原因:1. 如果云盘的某个block曾经写过数据,那么https://cloud.tencent.com/developer/ask/209257
7.浅入浅出数据结构(1)——什么是数据结构及算法那么,为什么数据结构与算法往往是一起讲解的呢?这个问题想要通俗地解释有点困难,但是我们可以将原因归纳为两点: 1.特殊的数据结构需要特殊的算法进行处理。 有时候我们的程序会使用到特殊的数据结构来存储数据,比如上面提到的情形,我们就需要一个能动态变化大小的线性表——链表——来替代普通的数组去存储数据。而数据https://www.jianshu.com/p/9b0ec69c347f
8.练习——简答题51CTO博客1.什么是算法?算法有哪些特征? 答:算法是求解问题的一系列计算步骤。算法具有有限性、确定性、可行性、输入性和输出性5个重要特征。 2.算法设计应满足的几个目标 答:算法设计应满足正确性、可使用性、可读性、健壮性和高效率与低存储量需求。 3.算法设计的基本步骤 https://blog.51cto.com/u_15127603/3567921
9.我的第一本算法书(豆瓣)曲奇是块洋点心1赞2022-07-23 11:08:01 —— 引自章节:0-1 什么是算法 002 丛书信息· ··· 图灵程序设计丛书(共107册), 这套丛书还有 《机器学习基础》《我的第一本编程书》《利用机器学习开发算法交易系统》《机器学习》《Python深度学习》 等。 喜欢读https://book.douban.com/subject/30357170/
10.课程1、 什么是算法2、 算法的特征 ●2.2算法的表示方法 1、 自然语言表示的算法2、 传统流程图表示的算法3、 NS结构图表示的算法 第三章基本数据类型 (一)内容提要本章讨论了C语言程序中的各种基础数据类型及其使用方法,如常量与变量、整型、实型、字符型的定义、表示和使用方法,C语言程序中运算符和表达式的使用https://higher.smartedu.cn/course/62354ca59906eace048cfb15
11.高中数学教研组《数学与生活》校本研修活动(一)今天是2022年2月28日,因为今年是平年,所以明天是3月1日。哪年是闰年呢?这里的闰年和闰月又有什么区别呢? 二、厘清概念: 1.什么是闰年 公历的算法是根据地球围绕太阳运转所得出,每次运转一周就是公历的一年,时间加起来是365天5小时48分46秒,然一年之日数,必须是整数,故一年为365日,当地球绕太阳转了四圈,http://www.wngxzx.com/h-nd-335.html
12.中华人民共和国密码法–云南城市建设职业学院SM2算法为椭圆曲线公钥算法,比RSA算法加密强度更高、运算速度更快。SM9算法为公钥算法,用于身份认证等,加密强度高于RSA算法。SM3算法为杂凑算法,用于数字签名和完整性校验,安全性高于MD5和SHA-1算法。 商用密码应用案例 一、网络安全案例 (一)敏感数据缺乏密码保护https://www.yncjxy.com/baoweichu/falufagui/20964/
13.单双月生男生女准确度一、年龄单双月生男生女准确度: 1、古传半月秘法 这是最近在论坛传播很广的算法,得到众多妈妈的证实,准确率非常高。 计算方法: (1)单岁单月,双岁双月:女孩。 (2)单岁双月,双岁单月,上半个月:男孩。 (3)单岁 单双月生男生女准确度 https://www.snsnb.com/post-53368-1.html
14.年休假天数计算方法是怎样的?2、打折算法 (1)对于刚跳槽到新单位的劳动者第一年的年休假天数,《企业职工带薪年休假实施办法》(以下简称《办法》)规定,劳动者新进用人单位,且连续工作满12个月以上的,当年的年休假的天数,按在本单位剩余“日历天数”折算后确定,折算后不足1整天的部分不享受年休假。 https://www.64365.com/zs/744231.aspx