什么是算法歧视?种类特征介绍

歧视,从字面上看其意思是有区别的予以看待:歧视,在本质上与不平等、非正义对等。对于歧视的概念在法律上的界定,从对不同国际公约的表述中“可以将歧视概括为基于外在环境和自身情况的差异,使得人们对他人或者特定群体因种族、性别、民族、宗教信仰、社会出身等存在的不同而产生的损害其机会或者待遇平等的一种概括性固定看法”。

算法歧视的本质是由算法模型导致的对特定个人或群体的系统性的、重复性的不合理对待。因为算法歧视是计算机系统在收集和分析数据的过程中自动生成的,所以也有学者称之为“自动化歧视”。

2.算法歧视的种类

(1)数据带来的歧视

从数据的处理上看,大量的数据供给并不是都能直接拿来利用,这就需要将数据通过一定的方式变成能够被采纳的描述。如通过科学合理的模型建造和数据解读。若在模型建造上发生错误,或者数据解读训练不够,或者有意为之以达到自己想要的结果,这些到最后都会使结果偏离客观真相。

前述无论是数据的采集还是对数据的解读,一旦发生偏差和错误就可能会造成算法作出有失客观、公正的决策,并且算法决策是用旧有数据提取的信息对未知目标进行的预测,过去的数据造成的歧视在得到算法的确认后都将每一次的输入生成的偏差结果作为下一次输入的反馈。可想而知,每一次的结果偏差将比上一次的更大。整个算法运作系统变成了类似“声反馈自激振荡”的歧视性循环,尤其是在受众颇多的公众决策中会造成一部分人因此而受到歧视。

(2)算法引起的歧视

算法是开发者、设计者主观思维的代码化,它从开始的设计目的、成功与否的指标、筛选数据、反馈验证等一系列流程,都体现着开发者、设计者的主观意愿。如果他们的偏见意识被嵌入进算法系统,那么算法就先天性的具备了偏见“基因”。在包含有深度学习的算法运行过程中,可能会产生非事先设定的决策路径,而得出具有“黑箱”的决策。因此,这种机器自主学习的算法也同样会产生具有歧视的决策。

按照歧视被识别的难易程度可以将歧视划分为“直接歧视和间接歧视”。《宪法》中规定有对民族、种族、性别等禁止性歧视的平等性原则,若用算法直接表达出具有以上禁止性歧视特征的评价的话,尚可直接寻求通过司法途径予以约束。当算法应用中通过对数据的整合,从中归纳出一些共性特征后,以此特征为依据将会作出带有评价性的决策,这其中也会包含一些歧视性的评价。而这些隐藏性的歧视即——间接歧视却不易被发现。比如,某个算法对大量的数据分析后,发现某种工作岗位,大多数都是男性群体并且该岗位薪资普遍较高,那么该算法模型在投递招聘信息时就会有选择性的投递给男性群体,从而忽略了女性群体的平等机会。这就势必会对适合此岗位的女性群体造成歧视。此外,算法会从大量数据中分析出数据主体是否残疾、身体健康状况等隐私特征,并可能以此对数据主体作出不利的评价,该歧视就不易被人发现。可以看出算法歧视的一个主要原因是算法错误的判断了不同目标之间的逻辑关系,即错误的判断了该岗位匹配男性优先于匹配女性。跟海量数据的“扒”取相似,算法决策往往侧重于关联性的强弱。一旦被算法判定有足够强的关联性就会被当作对目标对象作决策的根据。

少数个体会被算法歧视,群体也未能幸免。“根据EdmundS.Phleps提出、DennisJ.Aigner等学者认为当劳动信息不完全的前提下,雇主依据统计的群体性特征作雇佣和工资决策时就会对处于不利的群体造成就业和工资的歧视”。假如,两位求职者,其工作经历、学历等方面不相上下,其中一人第一学历是名牌高校,另一人第一学历是普通高校,若雇佣者仅仅根据学校名气为依据便录取了第一学历是名牌大学的毕业生,而不去对工作能力方面做进一步的考查,对第一学历为普通高校的毕业生来说,构成实质上的歧视。若将该招聘模式做成算法,以此规律作统计依据,这种决策就会对该类群体产生算法歧视,并且这种歧视将会是大范围的。毕竟名牌大学生相对于普通大学生在数量上而言,差距明显。即使普通大学里的优秀生,也会被这种算法歧视损害权益。

3.算法歧视的特征

(1)机制化

虽然人脑的认知模式是科学界的终极奥秘,始终无法消除歧视和偏见,心理学研宄表明做出包含歧视性决定的人可能往往没有意识到其决策具有歧视,尤其是面对需要快速或自动回应的问题时,但是人类的决策机制通常是个别的和随机的,并且不具有连续性。与之相反,算法决策系统则是普遍的和持续的,往往具有很高的稳定性。当人类对算法决策的使用越来越频繁,有缺陷的算法可能为它的扩展性和重复性以更快的速度、更大的规模造成损害。人类在场景互动过程产生的主观感觉或价值判断总体上是一种可控的选择,而且人类的决策所产生的歧视往往是分散的,通常不会造成集成化的影响。因而,当算法决策取代人类决策时,它们往往会带来一种“不可避免的色彩”(PatinaofInevitability),这种假象使得算法决策的结果看似是公平的,实际上很可能是缺乏根据的。

就目前技术发展的现实图景而言,大数据与算法的结合还不足以构成一个感知系统,即便深度学习能够借助随机的、自主的试错来不断趋近程序设定的目标,但是它们仍然不能用于处理具有复杂性、情感性以及创造性的事务。在这种情况下,人工智能作为自动化的决策系统,若输入包含歧视性的数据,那么产生具有歧视性的结果就几乎无法避免,而且它还会通过机器学习实现自我迭代,从而系统性、重复性地造成社会不公平,可以说恰恰是人工智能中持续生产的偏见,使得人类充满歧视的历史迈向了一个全新的阶段。

由数据建模产生的算法歧视具有机制化的特征,使得它对平等权的侵蚀更加广泛和深入,这导致“当今世界大多数的不公平,并不是来自个人的偏见,而是来自大规模的结构性偏见”。而人类大脑的认知系统还没有进化出察觉结构性偏见的能力,在这个人工智能时代,算法充斥人类社会各个角落,这种状况对于保护平等权来说不啻一个真实的坏消息。

(2)隐蔽性

算法歧视的隐蔽性主要归咎于算法黑箱,即自动化决策算法通过对原始数据的自动化分析产生高级认知的过程是缺乏透明性的。简而言之,所谓“算法黑箱”就是指在人工智能数据输入和结果输出的过程中,存在着人类无法得知甚至超越人类认知维度的秘境。如学者季卫东所言,在数据驱动的人工智能时代,“透明社会”与“算法黑箱”是我们不得不面临的一对根本矛盾。

敬请阅读末页的重要说明证券证券研究报告研究报告|公司公司深度报告深度报告工业工业|军工军工强烈推荐强烈推荐-A(首次首次)铂力特铂力特688333.SH当前股价:68.3元2020年年07月月27日日航空航天航空航天3D打印打印领先者领先者,下游市场快速放量下游市场快速放量基础数

证券研究报告请务必阅读正文之后的免责条款DocuSign:全球电子签名:全球电子签名SaaS龙头,持续龙头,持续成长可期成长可期全球SaaS云计算系列报告232020.7.28中信证券研究部中信证券研究部核心观点核心观点许英博许英博科技产业首席分析师S101051012004

THE END
1.什么是算法?算法的概念什么是算法? 算法(Algorithm)是指解决特定问题的一系列明确、有限且可执行的步骤或规则。算法是计算机科学的核心概念之一,用于指导计算机完成各种任务,从简单的数学运算到复杂的数据处理和决策。 一、算法的基本定义 从广义上讲,算法可以定义为: 有穷性:一个算法必须在有限的步骤内完成。也就是说,算法不能无限循环,https://blog.csdn.net/weixin_48579910/article/details/141722210
2.计算算法计算算法是计算机解决某一特定类型问题的有限运算序列(指令的有限集合),对任何一类问题来说,算法就是解决该类问题的方法和步骤。定义 算法与数据结构是计算机程序的两大基础,数据结构是为了研究数据运算而存在的;算法是为了实现数据运算,即实现数据的逻辑关系变化或者是在这个结构上得到一个新的信息而存在的。数据https://baike.baidu.com/item/%E8%AE%A1%E7%AE%97%E7%AE%97%E6%B3%95/20837174
3.算法是指什么?算法概述算法是指什么?算法概述 描述 一、算法概述 算法是指解题方案的准确而完整的描述,是一系列解决问题、高度符合逻辑性、可执行性的指令集合,代表运用系统方法描述解决问题的策略机制。算法能够对一定规范的输入在有限时间内运行得到输出。 算法中的指令描述的是计算过程,当其运行时能从初始状态和初始输入(初始输入可能为https://m.elecfans.com/article/2008707.html
4.如何通俗易懂地解释什么是算法?“你觉得算法是什么?”有人说“就是计算什么的吧?精准的东西吧?”也有人说:“计算方法吧?”都https://www.zhihu.com/question/55136787/answer/298954174
5.什么是算法?什么是算法? 文章目录 前言 主要内容 总结 更多宝藏 前言 在数字化时代,计算机已经成为人类生活中不可或缺的一部分。计算机能够帮助我们处理海量的数据,实现各种复杂的功能和任务,其中最关键的就是算法。 算法是计算机科学中的基础学科,涉及众多的算法类型和应用场景,是实现程序功能的核心思想。无论是从事计算机编程、https://www.coonote.com/algorithm-note/what-is-an-algorithm.html
6.什么是密码算法?马在旅途:什么是密码算法? 回复:密码算法是实现密码对信息进行“明”“密”变换的一种特定的规则。不同的密码算法有不同的变换规则。因此,密码算法也是加密算法、解密算法、签名算法和认证算法等各类算法的统称。 密码算法对密码系统的安全性有着至关重要的意义。衡量密码算法的优劣采用的是密码强度的概念。密码强度https://www.oscca.gov.cn/sca/hdjl/2016-11/18/content_1002847.shtml
7.衡量算法好坏的五大标准是什么?Worktile社区衡量算法好坏的五大标准是什么 衡量算法好坏的五大标准: 1、时间复杂度; 2、空间复杂度; 3、正确性; 4、可读性; 5、健壮性。时间复杂度是指,执行算法所需要的计算工作量,这是一个代表算法输入值的字符串的长度的函数。 1、时间复杂度 在计算机科学中,时间复杂性,又称时间复杂度,算法的时间复杂度是一个函数https://worktile.com/kb/p/34908
8.系数是什么?算法及举例系数,是指代数式的单项式中的数字因数。单项式中所有字母的指数的和叫做它的次数。通常系数不为0,应为有理数。 1系数的含义 系数的字面意思:有关系的数字。比如说代数式"3x",它表示一个常数3与未知数x的乘积,即表示3×x,等于x+x+x。“3x”代表一个数值,这个数值只与x有关系,是什么关系呢?“3”便是说明http://www.gaokao.com/e/20211129/61a4e9033ad52.shtml
9.用实例解释什么是算法和流程图算法流程图的应用越来越广泛,它通过使用图形表示算法的思路,让算法更清晰的呈现,是一种极好的方法,因为千言万语不如一张图。算法是解决方法的问题和步骤,通常被编译成计算机程序,从而让计算机来解决并执行问题。而流程图是演算法的一种表达方式。本文将通过实例来解析什么是算法和流程图。 https://www.edrawsoft.cn/explain-algorithm-flowchart/
10.什么是加密算法?常见的区块链加密算法有哪些?什么是加密算法?常见的区块链加密算法有哪些? 币界网报道: 加密算法是一种数学工具,通过对数据进行处理,使得原始数据无法被未授权的个体读取或修改。在计算机科学领域,加密算法在保护数据安全和隐私方面起着重要的作用。通过使用适当的加密算法,可以使数据保持机密性,防止被恶意攻击者访问和窃取。https://www.528btc.com/college/1695496704132088.html
11.算法稳定币是什么意思?算法稳定币都有哪些?币种百科区块链稳定币,相信不少投资者都有所了解,稳定币就是和某个标的保持稳定兑换比例的加密货币,稳定是指这种货币在一段时间内的价格不会有大幅波动,价格相对较为稳定,但是要说算法稳定币,了解的投资者可以说是少之又少,甚至连算法稳定币是什么都不知道。 算法稳定币是什么意思? https://www.jb51.net/blockchain/871350.html
12.什么是算理和算法在计算教学中,算理与算法是两个不可或缺的关键。算理是对算法的解释,是理解算法的前提,算法是对算理的总结与提炼,它们是相互联系,有机统一的整体。透彻理解算理和熟练掌握算法是提高学生计算能力的重要保证。那么什么叫做算理和算法呢?算理:即计算的原理或者道理,它有两层含义:一是列式的依据,即某一问题为什么要用https://www.unjs.com/xuexi/jiaoyuwenzhai/20111016201853_703871.html
13.Vue中的diff算法是什么?什么是diff算法diff算法是指用于比较虚拟什么是diff算法 diff算法是指用于比较虚拟DOM新旧节点之间的变化,找出新旧节点之间的差异,以达到最小化更新视图,提高渲染性能的一种算法。 这个算法有两个基本特点: 比较只会在同层级进行,不会跨层比较。 在diff比较过程中,是从节点的两端向中间比较。 https://juejin.cn/post/7171076476933472293
14.什么是哈希算法?SHA1,SHA2哈希算法之间的差异今天要为大家介绍的是哈希算法,在介绍SHA之前,只有了解什么是SHA,我们才清楚SSL证书如何使用哈希来形成数字签名。那么什么是哈希呢? HASH算法将任意长度的二进制值映射为较短的固定长度的二进制值,这个小的二进制值称为哈希值。 什么是哈希值? 例如句子“那只敏捷的棕色狐狸跳过了懒惰的狗,”通过一种称为CRC32的特https://www.wosign.com/News/news_2018111301.htm
15.深入理解JVM垃圾回收算法腾讯云开发者社区这一期讲述垃圾回收的算法。我们根据分代的理念讲述一下JVM是使用什么算法对于不同分代的对象进行垃圾回收的的,同样内容十分基础,但是对于学习JVM后续的内容十分重要。 前文回顾 在上一节当中,我们看到了JVM当中堆将分为新生代和老年代,对象优先在新生代分配,以及新生代在长期存活并且满足条件之后进入老年代,介绍了新https://cloud.tencent.com/developer/article/1862200
16.病假期间工资的算法是什么病假工资的支付标准为:连续工龄不满10年的,按本人工资的70%发给;连续工龄满10年不满20年的,按本人工资的80%发给;连续工龄满20年不满30年的,按本人工资的90%发给;连续工龄满30年及其以上的,按本人工资的95%发给。关于病假期间工资的算法是什么的问题,下面华律网小编为您详细解答。 https://www.66law.cn/laws/1753412.aspx
17.什么是数字滤波,常用算法介绍首先我们来看一下什么是数字滤波,数字滤波就是用数字设备,然后通过一定的算法,对信号进行处理,滤除某个频段的信号,得到所需的新信号。 滤波又分为硬件滤波和软件滤波。 硬件滤波:一定规格的电阻、电容组成的RC滤波器或者采用电感、电容组成的LC滤波器等模拟滤波器进行滤波。 http://www.chinahall.net/goodsid/xinwenview/11450376.html
18.代通知金和经济补偿金算法是什么?代通知金和经济补偿金算法是什么? 代通知金是用人单位没有选择提前30天以书面形式通知劳动者,需要额外支付劳动者一个月工资后与劳动者解除劳动合同,这支付的一个月工资通常就被称为代通知金。经济补偿金是在劳动合同解除或终止后,用人单位依法根据劳动者在本单位的工作年限和其工资标准一次性支付给劳动者的经济上的https://www.64365.com/zs/1063225.aspx