我们需要什么样的“算法”?

因为算法推荐,互联网平台越来越能抓住用户的心,帮助人们更加方便、精准地获取信息,也牢牢吸引了用户的注意力。据不完全统计,当前基于算法的个性化内容推送已占整个互联网信息内容分发的70%左右。算法推荐逐渐成为各平台“基本操作”的同时,诸如低俗劣质信息精准推送、“大数据杀熟”等乱象也凸显出来。

作为数字经济的重要推动力,算法如何实现更高质量发展?移动互联时代,我们究竟需要怎样的“算法”?

互联网平台越来越“懂”用户了吗?

这些平台的自动推荐功能,运用了一种叫算法推荐的技术。这是一种通过人工智能分析和过滤机制对海量数据进行深度分析、完成信息内容与用户精准匹配的技术。

自从1994年美国明尼苏达大学研究组推出第一个自动化推荐系统,算法推荐技术如今已深入到资讯、社交、电商、短视频、搜索引擎等平台和互联网应用中。

互联网平台变得越来越“懂”用户,在极大方便用户获取信息的同时,也容易引发一些用户尤其是青少年不同程度的沉迷问题。

从去年5月底开始,全国主要网络短视频平台中推广青少年防沉迷系统。在“青少年模式”下,大多数平台主要推送教育类、知识类等有益内容。但是,在缺乏监护人照管监督的情况下,防沉迷系统效果容易打折扣。

有受访者反映,一些新闻资讯、网络社交等平台的个性化推送存在“泛娱乐化信息多、低俗内容多、未经核实内容多”的“三多”现象;一些网络社交等平台防沉迷手段较少,容易导致青少年沉迷和盲目模仿。

北京大学中国社会与发展研究中心主任邱泽奇对记者表示,对自我的偏好是人类认知偏好的一部分,“偏好”阅读可能加速形成“信息茧房”效应和“情绪传染”效应,前者易导致视野局限,后者易使个人情绪受他人感染。

一些喜欢网购的人还可能因遭遇“大数据杀熟”而蒙受损失。一些平台利用算法技术给不同类型消费者数据“画像”,判断其偏好、用户黏合度、价格敏感度等,使不同用户看到的价格或搜索的结果不同。通常是老用户看到的价格比新用户贵,或搜索到的结果比新用户少。

9月中旬,微博上发起的一个投票显示,有1.5万人认为自己遇到价格明显差异的情况,占所有投票人员的近八成。

“算法”是中性的,问题出在人身上

算法技术的重要意义在于,将此前基于人力的“人找信息”转变成基于电脑自动化运算的“信息找人”,既极大解放了人力,又更高效地完成了人和信息的匹配。

从2012年起,互联网平台今日头条在业内较早将算法推荐系统应用到资讯领域的产品中,实现了系统的自动学习推荐。据今日头条算法架构师曹欢欢介绍,推荐系统综合考量内容特征、用户特征、环境特征等因素进行决策。例如,环境特征包括上班期间、上班路上、下班休息等不同场景下用户的兴趣偏好信息。

不过,在头部互联网平台切实严格自律的同时,仍有一些采编流程不规范、管理不严的网络社交媒体、新闻客户端在业务导向上走偏了。主要表现在:

——增加用户权益保护难度。一些算法推荐的内容过度强化用户偏好,影响了用户对于信息内容的自主选择权,加剧“信息茧房”效应,极易造成个体与社会的隔离,缺乏对当下国情世情的深刻认识和判断。由于依托于用户浏览记录等数据,算法推荐若设计不当,还可能侵犯用户个人隐私。

——进行“大数据杀熟”。中国传媒大学大数据研究中心教授沈浩介绍,对于算法而言,通过用户数据量以及数据更新频次,可轻易判断出是“生客”还是“熟客”。结果是平台大赚,商家、消费者利益受损,还容易导致垄断。

作为一项技术应用,算法推荐是中性的,问题出在设计者、操作者身上。

另一方面,过度追求“利益至上”,利用其信息不对称优势侵犯消费者合法权益。这是一个需要引起足够重视的法律问题。

大数据、算法推荐应更有“温度”

从另一角度看,社会舆论的疑问其实指向了大数据、算法等技术应用的价值导向问题。如何规范使用大数据、算法技术,让其变得更有“温度”、更让人放心?需要建立起一套行之有效的监管体系、评价系统,确保算法设计者、操作者以健康、正确、积极的价值观,指引算法推荐的设计和应用。

例如,正在公开征求意见的《个人信息保护法(草案)》规定,个人认为自动化决策对其权益造成重大影响的,有权拒绝个人信息处理者仅通过自动化决策的方式作出决定。

11月10日,国家市场监管总局发布的《关于平台经济领域的反垄断指南(征求意见稿)》规定,基于大数据和算法,根据交易相对人的支付能力、消费偏好、使用习惯等,实行差异性交易价格或者其他交易条件;对新老交易相对人实行差异性交易价格或者其他交易条件;实行差异性标准、规则、算法;实行差异性付款条件和交易方式等,都可能被认定为“大数据杀熟”等不正当竞争行为而面临更严格监管。

北京大学电子商务法研究中心主任薛军对记者表示,应针对算法运用的场景、对公民基本权益的影响,对算法进行不同强度的监管。除了法律规定需更加明确外,可以建立某种社会化的评议机制,对平台运用算法产生的后果进行评价,要求平台基于公共价值予以优化。

“应该在算法技术内讲价值伦理,把人之为人的一面当作技术本身来考虑,倡导企业在商业行为中履行社会责任。”姜奇平认为,对算法推荐技术和平台的监管应确保公平和效率、个人信息开发与保护、个人信息与平台信息等方面的平衡,在促进数字经济服务业态健康发展层面考虑,可按照个性化信息服务所得和付出的均衡原则进行政策调整。他建议,确保消费者对信息采集者的服务好坏有评判权,使消费者始终处于主动地位。

有专家认为,监管部门应督促企业调整业务逻辑,将正面价值取向、用户高品质追求作为关键标签纳入算法顶层设计之中;政府、学校、家长、平台各方应责任共担,不断提升青少年网络素养。记者彭训文

THE END
1.大数据机器学习算法概论腾讯云开发者社区大数据 机器学习 算法概论 ?算法概述? 算法是计算机科学领域最重要的基石之一,计算机语言和开发平台日新月异,但万变不离其宗的是那些算法和理论,数据结构和算法是软件开发必备的核心基础,是内功心法。下面举例拿推荐算法和分类算法的实际场景做下举例:https://cloud.tencent.com/developer/article/2479107
2.人工智能与大数据的深度融合带来的创新应用3. 大数据与人工智能紧密结合——新兴科技革命 3.1 数据驱动的人类活动模式转变 随着大规模集成式采集工具和云计算服务变得普遍可用,大量关于用户行为、环境监测以及经济活动等方面的大型数据源开始出现。大部分组织现在都意识到了这份宝贵资源,并努力将其转换为有用的知识,这正是利用大规模计算平台加上先进算法实现的人https://www.ykngnhhi.cn/shou-ji/544151.html
3.当今的大模型,普遍患有“数据饥渴症”澎湃号·湃客澎湃新闻澳鹏数据专注于AI数据服务,提供高精度数据标注平台和大模型智能开发平台,其自主研发的预标注通用模型和交互式算法在数据标注任务中能产生显著效率提升; 星尘数据提供AI数据标注和数据管理服务,平台可以处理100多种主流采集和标注场景。 数据挖掘的新方向:多模态与非传统数据源 https://www.thepaper.cn/newsDetail_forward_29673947
4.有人反复评论机票太贵让价格骤减3000元,年轻人开始算法驯化大数据大数据杀熟是平台无良,但卸载APP治标不治本。得让监管出手,把算法透明化、公平化,让老客户也享受到实惠才行啊! 12-14 13:47 山西 回复 64 心瀚小1C 抱歉打扰了我是个老兵,娃娃现正在被病痛缠身实在是没有任何办法了,现在我和孩子母亲每天在走廊盖着一个破毯子,一切只为了娃,可是现在真的无能为力了,恳求https://quanmin.baidu.com/sv?source=share-h5&pd=qm_share_search&vid=6285840807725490875
5.大数据:分类算法深度解析大数据分类算法深度解析 在大数据时代,处理海量数据并从中提取有用信息变得至关重要。分类算法是机器学习领域的核心,它们在大数据分析、模式识别和决策支持等方面发挥着关键作用。本文将深度解析大数据分类算法,包括其基本原理、常见算法、应用场景以及未来发展方向。 http://www.360doc.com/content/24/0112/20/78411425_1110858832.shtml
6.专业定制师or大数据推荐,你愿意把你的黄金假期交给谁?这家总员工数将近150人却有110多位技术人员的公司将重心放在了通过算法排列组合出最佳行程这件事上。 比如你想去欧洲玩10天,先输入你要去的城市、时间、人数、预定房间数、出发和返回城市;然后设置旅行偏好,比如飞机还是火车、是否接受廉价航空;大致行程出炉后,再做城市内规划,选择想去的景点、喜欢的酒店或餐厅风格https://www.tmtpost.com/1706368.html
7.美柚:最懂女性App背后的混合云架构与大数据服务这张图展示了美柚利用大数据进行反垃圾算法的整体框架,主要包含两部分。虚线上方是反垃圾算法的训练流程,最开始是基于NLP自然语言处理进行,首先对文本数据(垃圾贴和正常贴)进行分词,这些分词需要定期更新,然后再对帖子进行特征处理和选取,将提取之后的特征送入分类器模型训练,其中分类器包括贝叶斯分类、逻辑回归分类等,通https://developer.aliyun.com/article/11259
8.大数据“杀熟”套路太深!多位法学专家建言破解之道南方plus中国社科院大学副教授韩伟认为,消费者面临供应商通过算法实施的各类策略行为,可以考虑通过算法来武装自己。理论上来看,数字经济时代独立化的算法助理发展,一定程度上有助于对抗基于算法的大数据杀熟这类问题。 韩伟表示,算法助理大体有五大作用:提升买方力量、强化卖方约束、节约交易成本、抑制算法合谋、缓解算法歧视。比如,https://static.nfapp.southcn.com/content/202110/27/c5875937.html
9.大数据的诅咒:算法霸权与数学杀伤性武器看来,大数据有时候并不准。把大数据挂在嘴边的人,也通常不大靠谱。 之前写了一篇关于大数据的文章——《大数据推荐机制错在哪里?》,至今并没有看到这些使用大数据算法的互联网企业有什么进步,无非是多了一些数据,优化了推荐内容,更加相信大数据和算法的力量。 https://www.jianshu.com/p/b2840e78be21
10.java大数据算法java大数据是什么意思jacksky的技术博客java 大数据 算法 java大数据是什么意思 一、 大数据 背景:随着科技的发展,智能手机、智能穿戴设备越来越普及,数据量越来越庞大,大数据应运而生。 1M=1024KB 1G=1024M 1T=1024G 1P=1024TB… 大数据:大(海量)+数据(论文、视频、游戏战绩、购买记录等等)https://blog.51cto.com/u_14125/6788081
11.TCCT通讯Newsletter2016No.05资产组合优化的多分形模型及实证分析 系统科学与数学, 2016 Vol. 36 (2): 198- Abstract | PDF 刘爽,吕永波,张仲义 网络学术期刊核心竞争力评价研究 系统科学与数学, 2016 Vol. 36 (2): 210- Abstract | PDF 贾效伟,李梦,贾忠伟 从健康系统工程谈口腔影像学大数据研究伦理 系统科学与数学, 2016 Vol. https://tcct.amss.ac.cn/newsletter/2016/201605/journal.html
12.多拉快跑更安全?看G7智能挂的神级操作1、大数据算法,智能配货 拉货永远遵循一个原则,那就是多拉快跑,这句话用在快递快运领域尤其适合。 大家都知道,在快递快运领域多用的是厢式车。那么,如何在国家法律法规的允许下获得更大容积的厢式车,在同样容积的箱体里摆放更多的货物则成为现代运输人亟待解决的问题。 http://www.360che.com/news/190228/106757.html
13.滴滴出行定制公交上线济南基于数据算法选择线路利用滴滴出行以及合作公交公司大数据,滴滴公交可以串起城市中的居住区域与工作区域,选定最佳路线覆盖到最多人群。 这些公交线路基于城市现状公交站点及线网分布,根据滴滴平台大数据挖掘出的用户地理标签,先利用聚类算法找出城市中的热点通勤区域及通道,再利用路径规划算法在热点通勤通道中选出具体经行站点及路径,以最大化满http://3g.sdchina.com/show/4336361.html