远见个人信息保护法将出台揭开数据算法的神秘“面纱”

如今,大数据算法已深入每个人的生活:无论是电商平台,还是新闻客户端和短视频平台,大数据都能根据每个人的特点实现“千人千面”推送;在一些金融平台,科技金融公司也会用安全系统对用户进行“数字画像”,以此确定放款额度和利息。

但有时,大数据也让人有“被监视”的感觉,手机放在身边,刚和朋友说几句话,APP就会推送相应的内容,让人不寒而栗。此外,“大数据杀熟”也一直是备受争议和诟病的问题。

几年来,从网络安全法到时下备受瞩目的个人信息保护法草案、数据安全法草案,关于信息安全的立法进程不断完善和推进,数据算法的合理使用会服务人、更懂人,但是滥用则会侵犯人和控制人。算法到底是什么?怎样平衡安全和服务的边界?个人信息保护法又将怎样保护公民?

主持人:王思远总台央广经济之声【远见】栏目制作人

对话嘉宾:余弦资深安全技术专家、白帽黑客、漫雾科技创始人

数据安全法,明确“数字主权”,刹住数据越权乱象

思远:关于大数据的话题屡见不鲜,但很多时候是偏负面的,比如打车、住酒店时的“大数据杀熟”;外卖小哥被“困在系统里”。这些让算法变得很神秘和冰冷,作为从业者,你怎么用最通俗的理解去解释算法

余弦:简单说,“算法”就是用很多机器、服务器去尽可能模拟人类的思维、行为。大家会把算法简单理解为“人工智能”,但跟人类的思维和行为比,还有非常大差距。在长远的未来看,算法会让我们有更精准的感知和更好的应用场景;但当下还是早期,有时算法会比较“粗暴”。

思远:算法有时会给人两个极端的感觉。一面像是AlphaGo,特定的领域和规则下,表现远远优于人类;另一面,它又缺少人类的温度和感情。

余弦:技术的应用一定要看场景,比如AlphaGo下棋非常厉害,但只局限于此,下棋只是非常小的场景。单一场景内,模型的搭建是很简单的,在特定领域有小维度边界时,算法还能做到速度、储存量、运算能力上超过人类,但真的能够像人类似的万事俱通,在不同的领域都有自己的一套智慧和解决问题的方式,算法还差得非常远。

思远:2020年10月21日开始,个人信息保护法草案正式进入审议——千呼万唤始出来,无论是行业还是用户,都很需要。从业者需要知道数据使用和隐私保护的边界,用户希望技术服务人而不是侵犯人。个人信息保护法,整体从哪些方面保护人的权利?

现在的大数据乱象是伴随新事物而诞生,法律不能盲目制定,有一个过程。2017年6月1日起,网络安全法实施,其对网络个人数据已经有了一些定义;像民法总则、民法典等,也有关于个人信息、数据安全的规定。从国家层面,立法过程中也参考了海外,包括像欧盟通用的数据保护条例。无论是已经颁布的,还是探讨中的草案,我们都该重视它。

作为服务者,也要弄清自己的责任,比如数据储存在服务器里,但如果因为服务器漏洞被入侵的“黑客”偷走了,怎么界定责任?互联网厂商承不承担责任?法律上关于这种界定会越来越多,当下不能说法律很完善,但至少有了这几部法律的帮助,是很好的促进。

“爬虫学得好,牢饭吃到饱”?——论技术的价值观

思远:如果说算法是底层的逻辑和系统,那么大数据就是养料和细胞。从PC时代,到移动时代,再到物联网时代,算法都离不开“爬虫技术”,简单说就是通过网络勾连,实现数据的收集、分析和再组合,实现特定的目的。但“爬虫”经常会爬到隐私,听说圈里有一句话叫“爬虫学得好,牢饭吃到饱”?

余弦:在安全行业,尤其是前两年做“爬虫”生意的一些企业,都因此而触碰了法律被制裁。“爬虫”技术本身没有好与坏的说法,就像菜刀可以做菜,也可以犯罪。

思远:技术是中立的,但取决于人的价值观。

余弦:“爬虫”分为两种场景。第一种是专门做“爬虫”,故意去爬服务器的敏感数据,就是主观作恶。另一种是不小心把数据拿了回来。比如把个人的社保医疗隐私不小心爬回来了,但看到这个信息还挺有价值的,可能会二次利用。同时,这些社保医疗机构网站有漏洞,有没有责任呢?这就像是主动入室盗窃和主人没锁好门导致误闯民宅。不同情况,有不同的认定和处理,这是法律需要界定的。

场景1:金融风控,哪些“大数据画像”侵犯隐私?

思远:我们来聊聊算法的应用场景。生活中最常见的是金融风控——金融数据中的算法是怎样的逻辑?

余弦:核心是通过各类用户数据采集,进行用户画像。让业务决策者更好地理解目标群体,数据越准确、丰满,就越有利于特定的场景去做针对性的事情。

思远:比如给金融借贷,根据征信和消费行为等数据,判断优质客户,给出更好的还款周期和价格,用更低的价格、更高的额度做长线生意;对风险大的客户,拒绝放款。

余弦:这个现象确实非常普遍。很多时候,普通人高估了算法,在我们看来,很多技术真的非常粗暴,就如用户借贷的钱还不上,暴力催收公司通过非法采集用户数据,用灰色方式催债。

思远:很多信息的获取就是一瞬间,交易速度非常快,这对发现违法行为、固定证据会有很大麻烦。真正执法,要靠企业自律或相互监督、举报等,还是什么?

余弦:从操作角度来讲,这些法律是绝对可行的。这里面可能会涉及到具体敏感的话题,这里暂时不展开谈。但首先我们都得有法,才能去操作。未来的执法过程,一方面,数据的滥用,行业内确实有不少的外露特征,明面上能看到;执法肯定由公安进行——比如网安、网络警察。

场景2:大数据营销愈发精准,我们是否被“监视偷听”?

余弦:如果单方面来看,感觉会很惊悚,当然,实际上这是“幸存者偏差”,并不是非常普遍的事件,跟算法也没什么特别的关系——它可能是一种概率,碰巧遇到了,会放大这个事情。营销数据专门有做营销产业链的,通过各方面去采集数据,包括可能有非法的一些交易,能够尽量做到精准推广。

无论是个人信息保护法草案,还是数据安全法、网络安全法、民法典等,多少都有围绕隐私的关于数据的定义或说法。数据活动指的是,数据在收集、存储、加工、使用、提供、交易、公开等行为;数据安全是指通过采取必要的措施,保障数据得到有效保护和合法利用,并持续处于安全状态的能力。

思远:你说了两点。第一,有时大家过于敏感,陷入了“幸存者偏差”;第二,算法、大数据的合法性,包括大数据应该去脱敏的信息点,需要法律规范。回到算法本身,有句话说,“未来世界,只有两种人,一种是控制和决定算法的人,一种是被算法控制的人”。好像很有道理,以往人会自己去探索信息,有更多发展的可能性;现在算法会困住人,越来越懂你的同时,推荐的信息就越来越局限,会围绕着现有的水平、认知和圈层。你怎么看这个问题?

余弦:我赞同行业内这个说法。算法是机器输出来的,通过人类反应的信息,按照概率计算,反向给出推荐信息和服务,又让人形成新的依赖感,手机成了人的器官,人掉入了数据的舒适区,沉浸在这种数字体验中。我也会这样。

但另一方面,我懂技术,某些层面上我也控制算法,尽量让算法能为周边的人提供价值。所以我们才会讨论关于算法的法律红线,否则算法肯定会失控,要更规范,肯定要有法可依。某种程度上,算法和人是相互依存的关系,没有人的行为就没有数据,没有数据就没有了算法。

但同时我们也看到说,算法本身以技术的形式去存在,技术上,其实张一鸣曾在几年前抛出一个言论,大家也讨论得非常热烈,就是说,技术其实本来是工具,工具只分好用和不好用之分,技术高和技术低,我觉得这句话本身没有错。

因此,综合到算法上来说,无论是这个产业环境还是我们的生活,算法上有没有价值观,其实先放在一边,但是研究算法的人、使用算法的人必须有价值观,必须有法可依,算法才能更加值得人去信赖。

THE END
1.大数据算法一文掌握大数据算法之:概述特点类型及难点等,值得2.2 大数据算法特点 大数据算法是在处理和分析大量、多样性且高速数据时所应用的算法。 其特点既与大数据的特征密切相关,又对算法设计和优化提出了独特的要求。 以下是大数据算法的几个关键特点: 高效性 大数据算法必须能够在处理海量数据时保持高效性,这意味着要能迅速处理大量数据而不牺牲太多速度。分布式计算和并行处https://blog.csdn.net/wuyoudeyuer/article/details/141284911
2.大数据5大特点产品特点以下是关于大数据的5大特点以及产品特点的介绍: 这个介绍展示了大数据的5大特点以及对应的产品特点,有助于我们更好地理解大数据技术在实际应用中的关键要素。https://www.kdun.com/ask/715090.html
3.大数据主要特征有哪些大数据主要特征有哪些 东奥注册会计师 2024-09-12 03:52:09 大数据主要特征有大量性、多样性、高速性、价值性。 价值性是指海量数据中真正有价值的数据占比非常低,即价值密度低。 大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和https://www.dongao.com/zckjs/gsz/202107283501702.shtml
4.算法大数据平台有哪些特点帆软数字化转型知识库算法大数据平台是指集成了大规模数据存储、数据处理与分析工具,以及机器学习算法与模型管理系统的综合性平台。其主要功能是为企业和研究机构提供数据管理、处理与分析的能力,以及支持机器学习与数据挖掘应用的开发和部署。 算法大数据平台的特点有哪些? 弹性伸缩的数据处理能力:算法大数据平台具有强大的数据处理能力,能够支持https://www.fanruan.com/blog/article/4543/
5.Hadoop的特点有哪些大数据本篇内容介绍了“Hadoop的特点有哪些”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成! 1 Hadoop 简介 1.1 Hadoop 由来 数据容量 大数据时代数据量超级大,数据具有如下特性: https://m.yisu.com/zixun/489355.html
6.在线算法/数据流算法是面向大数据速度快的特点提出的。()在线算法/数据流算法是面向大数据速度快的特点提出的。()A.正确B.错误的答案是什么.用刷刷题APP,拍照搜索答疑.刷刷题(shuashuati.com)是专业的大学职业搜题找答案,刷题练习的工具.一键将文档转化为在线题库手机刷题,以提高学习效率,是学习的生产力工具https://www.shuashuati.com/ti/195ddf88b5cb4f11a28a7130fb63330e.html?fm=bdbdsd075b9c9bbaeeb8239adb7635af1fd3a
7.大数据有什么特点因此,如何从海量数据中提取出有价值的信息,是大数据处理和分析的关键问题。这也要求大数据处理技术具备更强的数据挖掘和分析能力,以发现隐藏在数据中的规律和知识。 综上所述,大数据具有数据体量巨大、数据类型繁多、处理速度快和价值密度低等特点。这些特点使得大数据成为当今信息化时代的重要资源,对于推动社会进步和经济https://localsite.baidu.com/article-detail.html?articleId=22506820&ucid=PHfzrjnLPWf&categoryLv1=%E6%95%99%E8%82%B2%E5%9F%B9%E8%AE%AD&ch=54&srcid=10005
8.云计算区块链大数据之间的关系与特点算法物联网区块链技术大数据主要涉及四个方面的特点,即数据量大、数据类型多样、数据生成速度快和数据价值高。大数据可以帮助企业和组织发现隐藏在数据中的模式和趋势,从而支持决策、优化业务流程、改善产品和服务,以及提高效率和竞争力,其中包括了大数据算法。 大数据算法是指在大规模数据集上运行的算法。由于大数据具有数据量大、复杂度高、https://www.163.com/dy/article/J8C6LTLB05524GM0.html
9.共达地李苏南:0代码自动化,让AI算法赋能千行百业商业模式鲸解请您和我们分享共达地的市场定位是怎样的,岗位分布有哪些特点? 李苏南:共达地专注在通过AutoML自动化机器学习实现AI的大规模商业化落地。如果说AI行业发展的上半场是只有少数公司、少数科学家和高阶工程师才能参与的“小众”领域,那么下半场,共达地希望把AI的开发和训练门槛降到最低,让各行业中了解业务场景、业务需求的https://www.cls.cn/detail/1154839
10.大数据:分类算法深度解析在实际应用中,理解数据的特点和选择适当的算法是取得良好性能的关键。 3.3 神经网络 神经网络是一种模拟人脑工作方式的分类算法,由多个神经元层组成。在深度学习中,神经网络在大数据分类任务中表现出色。 以下是一个基本的神经网络示例,使用Keras库构建和训练一个简单的神经网络模型。 http://www.360doc.com/content/24/0112/20/78411425_1110858832.shtml
11.Contents/premium.mdatmaster·Newslab2020/Contents·GitHub如果取消牌照费,有哪些替代方案? 与流媒体的竞争,以及 BBC的未来. 618 伊朗:女青年之死、抗议、断网 2022/9/25 “头巾法”与宗教警察; 第三次切断互联网; 女性革命的到来? 617 《柳叶刀》新冠报告 2022/9/20 委员会的构成与运行; 报告的主要观点; https://github.com/Newslab2020/Contents/blob/master/premium.md
12.个人信息安全知识(通用8篇)生活中你有没有接到过骚扰电话呢?可能有的是因为哪些人太无聊随手打的,但是有的是因为你的信息遭到了泄露,在大数据生活时代该如何保护好自己的个人信息呢?个人的信息要怎样保护它的安全呢?下面是小编为大家整理了有关个人信息安全知识的相关内容,希望大家喜欢。 个https://www.oh100.com/zhishi/641285.html?1500536401
13.大数据的详细定义当我们打开购物软件或社交软件,首页总会推送一些我们近期搜索过的物品、相关话题,这时候大家头脑里都会冒出一个词“大数据”,那究竟什么是大数据?对于大数据很多权威机构给出了自己的定义,比如Gartner对大数据的解释是:大数据是指高容量、高速度或高多样性的信息资产,它们需要借助成本效益高、创新的信息处理方式,以获取更https://blog.itpub.net/70041355/viewspace-3029299/
14.大数据金融第二章大数据相关技术第一节 大数据处理流程 首先是利用多种轻型数据库收集海量数据,对不同来源的数据进行预处理后,整合存储到大型数据库中,然后根据企业或个人目的和需求,运用合适的数据挖掘技术提取有益的知识,最后利用恰当的方式将结果展现给终端用户。 数据处理流程 一 数据采集 https://www.jianshu.com/p/d68251554c66
15.国家开放大学高起专真题《大数据技术概论》5、NoSQL数据库具有以下几个特点: A.与云计算紧密融合 B.灵活的可扩展性 C.灵活的数据模型 D.数据模型比较死板 正确答案:A、B、C 6、典型的机器学习和数据挖掘算法包括: A.聚类 B.分类 C.正交 D.回归分析 正确答案:A、B、D 7、大数据处理分析技术类型主要包括: http://m.sdlcjyjt.com/h-nd-6069.html
16.科学网—[转载]基于材料数值计算大数据的材料辐照机理发现然而,面向多尺度模拟软件的统一数据存储方案目前仍然是个空白。本文针对材料多尺度数值计算大数据的特点,设计了一种适用于材料多尺度数值计算大数据的存储与管理框架,并基于该数据库框架,结合机器学习等算法,实现了其在改进材料多尺度模拟中的应用。 3 材料数值计算大数据的特点https://wap.sciencenet.cn/home.php?mod=space&do=blog&id=1315554
17.大数据“杀熟”的法律规制问题研究但是由于算法技术的专业性和隐蔽性,极易导致网络平台利用其特点对用户进行价格歧视和精准“杀熟”。遏制大数据“杀熟”需要建立完善的监管措施,实现消费者与网络平台提供者之间的利益平衡;构建算法解释机制,以便于实现保护消费者知情权与平台创新动力的平衡;完善权利救济机制,确保消费者可以平等地与网络平台提供者进行交易https://www.acla.org.cn/article/page/detailById/35713
18.中量大?专业巡礼走进数据科学与大数据技术9、数据科学与大数据技术专业的毕业生,主要面向哪些行业就业? 本专业就业前景广阔,毕业生能够在计算机和互联网领域以及大数据相关产业从事数据科学研究、大数据相关工程应用开发、技术管理与咨询等工作。智能计算方向的毕业生可以从事算法工程师、机器学习与人工智能理论研究与应用开发;大数据技术方向的毕业生能够从事数字化标准https://zs.cjlu.edu.cn/info/1067/3006.htm
19.大数据算法:1.2大数据算法大数据算法的特点与难点硬声是电子发烧友旗下广受电子工程师喜爱的短视频平台,推荐 大数据算法:1.2大数据算法-大数据算法的特点与难点视频给您,在硬声你可以学习知识技能、随时展示自己的作品和产品、分享自己的经验或方案、与同行畅快交流,无论你是学生、工程师、原厂、方案商、代理商、终端https://www.elecfans.com/v/152621
20.大数据时代“算法风险”的思考德勤中国风险咨询随着算法的深度应用,依赖算法的潜在风险也逐渐引起公众和业内关注,如大数据“杀熟”现象、推荐算法易加强低俗内容的扩散,推送群体偏差造成的客户体验下降等。就目前而言,由人类创造的人工智能,还摆脱不了人为因素,虽然学习了知识,却无法摒弃认知偏见。https://www2.deloitte.com/cn/zh/pages/risk/articles/algorithmic-risk-in-big-data-era.html
21.大数据分析是什么大数据分析是指对规模巨大的数据进行分析,挖掘数据的有利信息并加以有效利用,将数据的深层价值体现出来。从大数据的特点可以看出,没有一套可靠的数据分析方法和数据分析工具是不可能完成大数据分析的。有了大数据分析才能让规模巨大的数据有条有理,正确分类,产生有价值的分析报告,从而应用到各领域中,促进其发展。 https://www.linkflowtech.com/news/2090