什么是算法歧视?种类特征介绍

歧视,从字面上看其意思是有区别的予以看待:歧视,在本质上与不平等、非正义对等。对于歧视的概念在法律上的界定,从对不同国际公约的表述中“可以将歧视概括为基于外在环境和自身情况的差异,使得人们对他人或者特定群体因种族、性别、民族、宗教信仰、社会出身等存在的不同而产生的损害其机会或者待遇平等的一种概括性固定看法”。

算法歧视的本质是由算法模型导致的对特定个人或群体的系统性的、重复性的不合理对待。因为算法歧视是计算机系统在收集和分析数据的过程中自动生成的,所以也有学者称之为“自动化歧视”。

2.算法歧视的种类

(1)数据带来的歧视

从数据的处理上看,大量的数据供给并不是都能直接拿来利用,这就需要将数据通过一定的方式变成能够被采纳的描述。如通过科学合理的模型建造和数据解读。若在模型建造上发生错误,或者数据解读训练不够,或者有意为之以达到自己想要的结果,这些到最后都会使结果偏离客观真相。

前述无论是数据的采集还是对数据的解读,一旦发生偏差和错误就可能会造成算法作出有失客观、公正的决策,并且算法决策是用旧有数据提取的信息对未知目标进行的预测,过去的数据造成的歧视在得到算法的确认后都将每一次的输入生成的偏差结果作为下一次输入的反馈。可想而知,每一次的结果偏差将比上一次的更大。整个算法运作系统变成了类似“声反馈自激振荡”的歧视性循环,尤其是在受众颇多的公众决策中会造成一部分人因此而受到歧视。

(2)算法引起的歧视

算法是开发者、设计者主观思维的代码化,它从开始的设计目的、成功与否的指标、筛选数据、反馈验证等一系列流程,都体现着开发者、设计者的主观意愿。如果他们的偏见意识被嵌入进算法系统,那么算法就先天性的具备了偏见“基因”。在包含有深度学习的算法运行过程中,可能会产生非事先设定的决策路径,而得出具有“黑箱”的决策。因此,这种机器自主学习的算法也同样会产生具有歧视的决策。

按照歧视被识别的难易程度可以将歧视划分为“直接歧视和间接歧视”。《宪法》中规定有对民族、种族、性别等禁止性歧视的平等性原则,若用算法直接表达出具有以上禁止性歧视特征的评价的话,尚可直接寻求通过司法途径予以约束。当算法应用中通过对数据的整合,从中归纳出一些共性特征后,以此特征为依据将会作出带有评价性的决策,这其中也会包含一些歧视性的评价。而这些隐藏性的歧视即——间接歧视却不易被发现。比如,某个算法对大量的数据分析后,发现某种工作岗位,大多数都是男性群体并且该岗位薪资普遍较高,那么该算法模型在投递招聘信息时就会有选择性的投递给男性群体,从而忽略了女性群体的平等机会。这就势必会对适合此岗位的女性群体造成歧视。此外,算法会从大量数据中分析出数据主体是否残疾、身体健康状况等隐私特征,并可能以此对数据主体作出不利的评价,该歧视就不易被人发现。可以看出算法歧视的一个主要原因是算法错误的判断了不同目标之间的逻辑关系,即错误的判断了该岗位匹配男性优先于匹配女性。跟海量数据的“扒”取相似,算法决策往往侧重于关联性的强弱。一旦被算法判定有足够强的关联性就会被当作对目标对象作决策的根据。

少数个体会被算法歧视,群体也未能幸免。“根据EdmundS.Phleps提出、DennisJ.Aigner等学者认为当劳动信息不完全的前提下,雇主依据统计的群体性特征作雇佣和工资决策时就会对处于不利的群体造成就业和工资的歧视”。假如,两位求职者,其工作经历、学历等方面不相上下,其中一人第一学历是名牌高校,另一人第一学历是普通高校,若雇佣者仅仅根据学校名气为依据便录取了第一学历是名牌大学的毕业生,而不去对工作能力方面做进一步的考查,对第一学历为普通高校的毕业生来说,构成实质上的歧视。若将该招聘模式做成算法,以此规律作统计依据,这种决策就会对该类群体产生算法歧视,并且这种歧视将会是大范围的。毕竟名牌大学生相对于普通大学生在数量上而言,差距明显。即使普通大学里的优秀生,也会被这种算法歧视损害权益。

3.算法歧视的特征

(1)机制化

虽然人脑的认知模式是科学界的终极奥秘,始终无法消除歧视和偏见,心理学研宄表明做出包含歧视性决定的人可能往往没有意识到其决策具有歧视,尤其是面对需要快速或自动回应的问题时,但是人类的决策机制通常是个别的和随机的,并且不具有连续性。与之相反,算法决策系统则是普遍的和持续的,往往具有很高的稳定性。当人类对算法决策的使用越来越频繁,有缺陷的算法可能为它的扩展性和重复性以更快的速度、更大的规模造成损害。人类在场景互动过程产生的主观感觉或价值判断总体上是一种可控的选择,而且人类的决策所产生的歧视往往是分散的,通常不会造成集成化的影响。因而,当算法决策取代人类决策时,它们往往会带来一种“不可避免的色彩”(PatinaofInevitability),这种假象使得算法决策的结果看似是公平的,实际上很可能是缺乏根据的。

就目前技术发展的现实图景而言,大数据与算法的结合还不足以构成一个感知系统,即便深度学习能够借助随机的、自主的试错来不断趋近程序设定的目标,但是它们仍然不能用于处理具有复杂性、情感性以及创造性的事务。在这种情况下,人工智能作为自动化的决策系统,若输入包含歧视性的数据,那么产生具有歧视性的结果就几乎无法避免,而且它还会通过机器学习实现自我迭代,从而系统性、重复性地造成社会不公平,可以说恰恰是人工智能中持续生产的偏见,使得人类充满歧视的历史迈向了一个全新的阶段。

由数据建模产生的算法歧视具有机制化的特征,使得它对平等权的侵蚀更加广泛和深入,这导致“当今世界大多数的不公平,并不是来自个人的偏见,而是来自大规模的结构性偏见”。而人类大脑的认知系统还没有进化出察觉结构性偏见的能力,在这个人工智能时代,算法充斥人类社会各个角落,这种状况对于保护平等权来说不啻一个真实的坏消息。

(2)隐蔽性

算法歧视的隐蔽性主要归咎于算法黑箱,即自动化决策算法通过对原始数据的自动化分析产生高级认知的过程是缺乏透明性的。简而言之,所谓“算法黑箱”就是指在人工智能数据输入和结果输出的过程中,存在着人类无法得知甚至超越人类认知维度的秘境。如学者季卫东所言,在数据驱动的人工智能时代,“透明社会”与“算法黑箱”是我们不得不面临的一对根本矛盾。

敬请阅读末页的重要说明证券证券研究报告研究报告|公司公司深度报告深度报告工业工业|军工军工强烈推荐强烈推荐-A(首次首次)铂力特铂力特688333.SH当前股价:68.3元2020年年07月月27日日航空航天航空航天3D打印打印领先者领先者,下游市场快速放量下游市场快速放量基础数

证券研究报告请务必阅读正文之后的免责条款DocuSign:全球电子签名:全球电子签名SaaS龙头,持续龙头,持续成长可期成长可期全球SaaS云计算系列报告232020.7.28中信证券研究部中信证券研究部核心观点核心观点许英博许英博科技产业首席分析师S101051012004

THE END
1.强化学习算法详解:从理论到实践的完整指南强化学习算法详解:从理论到实践的完整指南 强化学习概述 强化学习是一种机器学习方法,旨在让智能体从与环境的交互中学习最佳行为策略,以最大化累积奖励。强化学习的核心思想是通过与环境的不断交互来学习最优的行为策略,从而实现自主学习和决策。与监督学习和无监督学习相比,强化学习具有更强的自主性和灵活性,适用于复https://www.jianshu.com/p/f1948a5d95cc
2.自主学习:未来技术的驱动力3.自然语言处理(natural language processing,NLP):NLP是一种自主学习方法,它通过分析文本数据来发现语言的结构和意义。 4.深度学习(deep learning):深度学习是一种自主学习方法,它通过多层神经网络来学习复杂的表示和模式。 在接下来的部分中,我们将详细介绍这些核心概念和算法的原理和具体操作步骤,以及如何使用代码实https://blog.csdn.net/universsky2015/article/details/135810419
3.AI是如何做到自主学习的?通过无监督学习和强化学习,机器学习算法可以自主学习,并在面对新的数据和任务时,自适应地调整自己的模型和行为,从而提高自己的能力和性能。这种自主学习的原理使得AI可以在许多领域具有广泛的应用前景。是如何做到的 AI自主学习的实现需要依赖于一系列技术和方法。以下是一些常见的实现方法:1、深度学习:深度学习是指https://baijiahao.baidu.com/s?id=1761745891894984650&wfr=spider&for=pc
4.自主学习神经网络算法研究针对算法自身的缺陷,根据BP算法的基本原理,结合自主学习的特点及自主学习研究的基本模型,本文构建了自主学习神经网络模型,提出了具有寻找全局最优值的自主学习神经网络ALBP算法,并且对算法中比较重要的激励函数进行改进,加入神经元学习误差函数,对权值的变化增加了松紧变量,让学习率动态变化等,从而利用改进BP算法的自主https://wap.cnki.net/touch/web/Dissertation/Article/1011138784.nh.html
5.推荐一些用于智能体自主学习的有效算法或框架在设计具有自主学习能力的智能体时,可以考虑使用一些有效的算法或框架,如AgentGym、AgentEvol、DQN(深度Q网络)等。这些算法和框架能够帮助智能体在多种环境和任务中进行自我进化,提高其泛化能力和适应性。例如,AgentGym提供了一个交互平台,支持大语言模型智能体轨迹采样、自我进化、能力评测的框架,特点是提供多样、实时https://www.ctyun.cn/developer/article/589070045204549
6.一年级减法教学设计8篇(全文)4.自主学习算法。 34-6,个位上4减6不够减怎么办? 摆小棒思考。 二、合作探究,释疑点拨 1.34-6的算理。 (1)小组内交流“34-6,个位不够减,怎么办?” (2)全班交流。 在黑板上演示小棒图: 3捆4根小棒表示34,要减掉6根小棒,遇到个位数4减6不够减时,要打开一捆小棒,由原来1个十变成现在10个一,这就https://www.99xueshu.com/w/filepaxem8cs.html
7.使用分层自主学习提高粒子群优化算法的收敛精度和收敛速度的详细针对粒子群优化(PSO)算法容易陷入局部最优、收敛精度不高、收敛速度较慢的问题,提出一种基于分层自主学习的改进粒子群优化(HCPSO)算法。首先,根据粒子适应度值和迭代次数将种群动态地划分为三个不同阶层;然后,根据不同阶层粒子特性,分别采用局部学习模型、标准学习模型以及全局学习模型,增加粒子多样性,反映出个体差异https://m.elecfans.com/article/1282810.html
8.生成式AI如何赋能城市治理?大模型可打破“算法孤岛”自主学习“同一个摄像头的数据中,违章停车是一个算法,老人或孩子走丢是一个算法,重点人群盯防是一个算法……同一批数据需要重复计算多次,但大模型来了之后,单个事件的算法就不存在了。”杨旭青解释道,“大模型不再是很多琐碎的算法,而是根据上亿级别的大量参数去自主学习,你只要把一段摄像头视频交给它,大模型就会自己去找https://m.thepaper.cn/kuaibao_detail.jsp?contid=23778412
9.北师大版四年级数学上册《买文具》教案设计(精选11篇)(一)上单元我们学习了神奇的计算工具和一些有趣的计算,其实在数学计算中,还有许多运算规律,你们想研究和学习吗?这节课开始,我就来探究和学习一些有关数学计算的规律。 (二)自主学习 出示课件,创设情境,交流算法。 (1)从图中你能知道哪些数学信息? https://mip.cnfla.com/jiaoan/1049568.html
10.两位数减两位数退位减法教案(精选11篇)1.知识目标:深化两位数减法的整理分类和归纳,熟练两位数减法的各种算法。 2.能力目标: 培养学生整理、分类的能力,培养学生的算法思维,提高自主学习的能力。 3.情感目标: 让学生在分类、整理的过程中,感受数学的逻辑性和严谨性。 教学重点: 熟练两位数减法的各种算法 https://www.ruiwen.com/jiaoan/4904552.html
11.数字经济专题大数据算法的价格合谋问题研究[4]OECD(2017)进一步梳理了引发算法价格合谋的大数据算法,即监督算法、平行算法、信号算法和自主学习算法,并指出垄断协议的认定困境给算法价格合谋行为的反垄断法规制带来了巨大挑战,提出应该采取事前并购审查、引入市场研究机制等补救措施加以应对。[5]不过,也有https://mp.weixin.qq.com/s?__biz=MzA4NzUxNjQ2MA==&mid=2651151347&idx=1&sn=b6e0f36c89555f0ce17acde48e440bc6&chksm=8bc9cfb0bcbe46a62bf3942b7cfea1bd7e28b707bed2dda2029e76b13001443e3ced2745ed1e&scene=27
12.一类面向动态模糊数据的学习算法研究学位尤其是面对海量数据中的不确定数据,更需要机器学习算法的参与。因此,本文主要针对动态模糊数据,提出了一类动态模糊机器学习算法,包括:动态模糊局域线性嵌入算法;动态模糊单参数嵌入学习算法;动态模糊关系学习算法和动态模糊自主学习算法等。 综上所述,本文的创新点主要体现在从动态模糊数据具有的特征出发,引用动态模糊集和https://d.wanfangdata.com.cn/thesis/Y1637981
13.密码算法工程师怎么考呢?需要哪些条件?好考吗?可以参加相关培训课程、自主学习密码算法工程师所需的专业知识和技能,包括密码学原理、加密算法、解密算法、密钥管理、安全协议等方面的知识。 参加考试:按照考试安排,按时参加考试。考试形式通常为线上机考,题型可能包括选择题、简答题或实际操作等。 领取证书:在通过考试后,你将收到密码算法工程师证书和认证号码,这将https://m.sohu.com/a/786833893_121968535
14.人工智能重塑商业:从畅想到实际行动科技空客开始采用人工智能,将过去生产项目中的数据与当前A350生产项目中提供的实时数据相结合,通过模糊匹配和自主学习算法发现生产问题的规律。在某些领域,这套系统为约70%的生产故障匹配到了之前用过的解决方案,速度近乎实时。埃文斯描述了AI助力整个空客生产线快速学习、应对商业挑战的过程: https://www.ceconline.com/it/ma/8800090814/01/
15.机器学习驱动中医诊断智能化的发展现状问题及解决路径(3)针对“病”“证”分类目标,综合选用合适的ML算法,以设计、优化、完善更适合智能辨病辨证的智能分类自主学习算法[61]。丁琪等[62]基于DL在处理非线性、复杂多层数据方面的优势,将四诊信息作为输入层,证型、治法为隐藏层,方剂、药物为输出层,通过DL的反向传播反馈以调整缺失值,建立了“症-病-证-药”的关联https://www.91xueshu.com/l-zyjclllw/90042.html
16.升学e网通打造智能系统,助力考生科学填报志愿依托先进的AI自主学习算法,考生只需输入高考分数、位次以及所选科目,系统将迅速且精确地为用户筛选出理想的院校名单。 为了让每一位家长和考生都能得到更为贴心的建议,我们精心设置了多重个性化选项,允许考生根据自身偏好筛选院校,如:设定心仪的省份、筛选公立或民办性质院校、探寻具备特色专业的学府、定位所需的专业类https://tech.china.com/article/20240612/062024_1533108.html
17.避免公共领域算法决策价值偏差公共领域算法决策必须直面算法价值偏差问题并加以妥善解决。 “算法黑箱”带来算法决策价值偏差 “算法黑箱”指人们能看到输入算法的数据和算法输出的结果,但不具备专业知识的人无法理解算法的计算过程,算法的运行逻辑呈现“黑箱”状态。在大数据时代,以人工神经网络为代表的机器学习算法基于训练数据进行自主学习生成算法模型https://k.sina.cn/article_7517400647_1c0126e4705903ww22.html