把共和党当纳粹?谷歌的算法也会有疏漏

这两周硅谷最不受人待见奖估计要颁给谷歌了。上周早些时候,如果使用谷歌搜索"CaliforniaRepublicanParty"(加州共和党),跳出来的搜寻结果在思想倾向一栏的第一位赫然写着“纳粹主义”。

对,你没看错,就是在谷歌搜索结果的首页右侧的“知识栏”(Google’sKnowledgeGraph),美国共和党被冠上了“纳粹思想倾向”的帽子。这一下就惹毛了美国共和党的7000多万选民。

本周还要颁出的“最佳冤大头”奖,也花落谷歌。

谷歌:我比窦娥还冤呀!这是有人在维基百科捣的鬼!我们不过是把维基百科的信息呈献给大家。我们也是受害者!

然而,一波未平一波又起,随后,谷歌又被爆出在其搜索页面发现了一张被恶搞的照片。照片中,加州共和党参议员、川普支持者TrudyWade的头像下方被加入了红色粗体字BIGOT(“一家之长”)字样。

这到底是怎么一回事?难道真的是谷歌自己的搜索算法失灵?还是其中另有阴谋?美国加州大选正热火朝天地进行,谷歌给共和党闹的各种幺蛾子到底缘何?咱们今天就去探探究竟!

故事的来龙去脉

在谷歌搜索把共和党标注了“纳粹主义”后,美国共和党人不淡定了!

谷歌你这么做实在“太丢脸”了!加州共和党党魁KevinMaCarthy首先跳出来。

紧接着川普总统的儿子发推特谴责谷歌歧视保守派,比Instagram还不要脸!据说当年Instagram给太子爷的照片加了个“此人有害,可能致死”的标签。一直怀恨在心的小唐纳德这下终于可以一石二鸟把俩公司都给怼了!

(川普儿子:停止歧视保守派!)

谷歌赶紧回应KevinMaCarthy的推特,表示自己真是冤啊!我们网站顶多是抓取了维基百科的条目信息!是有人在维基百科上故意做了手脚,导致我们即时获取的信息出现了“纳粹”的字样。

那么谷歌到底是在哪个环节出了差错呢?

而此次问题的关键所在,就是谷歌搜索第二步检查机制的疏漏。

谷歌回应,谷歌在整个事件中对于网站信息并没有任何手动更改。这是一起“借刀杀人”事件—有人蓄意破坏维基百科内容从而导致谷歌搜索结果出问题。

但谷歌也有错。由于谷歌系统中错误检测机制的疏漏,没有及时报告并删除错误信息。

(谷歌:我们没有人为改内容,是错误检测机制出了错。这种情况只是偶尔发生。)

而同时,维基百科与维基百科基金会(WikimediaFoundation)也在谷歌发声后,回复:

为何谷歌要抓取维基?为何要将结果显示在页面上最突出的位置?这就要从谷歌的发家史说起了。

“很多人都说是维基百科造就了谷歌”,作为创始人之一的Larry如是说到。

谷歌吃水不忘挖井人,它也为维基百科的发展助了一臂之力。

从2015年起,谷歌将自身的搜索算法更新,将维基百科信息的排名前置。这导致了两个结果:首先,维基百科的地位被提高;其次,其他网站想要被前置也要学维基百科的信息呈现模式。

维基百科的另一位创始人JimmyWales曾提到,平均每年,维基百科60-70%的信息流量(traffic)来自谷歌。维基百科一直都是谷歌搜索结果的前三名,并且通常都是首位。搜索结果首位就意味着会有36.4%的点击量,而前三则会有58.4%的点击量。

可以说,维基百科也会受益于谷歌的“抓取”。并且,虽然维基百科是非营利性质的,但是谷歌公司,以及其两位创始人,每年都会向维基百科基金捐助数百万美金来支持其运转。

这个占据了20%页面内容的大“豆腐块”,通常来自维基百科的内容抓取。但实际上其潜在价值要超乎你的想象。

而很多时候,用户都是误打误撞从右侧的“知识栏”点击进入了一些商业用途的网站。

可以说,谷歌与维基百科已经成为了“形影不离”的好朋友。

维基百科自诞生以来就是以内容“人人可改”而受广大用户欢迎。但是,改是改得容易,改得对不对可就不能保证了。由于维基百科是非营利项目,没有官方审查人员,审核、编辑等工作靠的都是志愿者们。因此,出现错误也很常见。这也是为什么维基百科在回应此次谷歌“纳粹门”事件时所说的那样-没办法呀。

还有媒体表示,维基百科的公信力实际上是被谷歌高估了。维基百科实际上就是一个社区论坛网站(CommunityConversation),很多内容的确切性有待商榷。

而此次“纳粹门”事件中,恶搞者正是发现了维基百科的这条软肋,以及谷歌错误检测机制不完备的这个漏洞,从而得以成功下手。

屋漏偏逢连夜雨

对于此次信息错误,维基百科还表示:“感恩错误,因为这给我们一个可以更正事实的机会!”

估计谷歌就没那么感恩这次错误了,因为人家接下来又犯了一个类似的错误。

谷歌搜索结果中,共和党参议员TrudyWade的照片中被加入了红色粗体字BIGOT(“一家之长”)字样。这再一次激怒了共和党民众。

这一次,谷歌的解释还是:此时真的跟我们无关!这张图片源自一个学生的博客,但是上传人的信息未知。

随后,谷歌立即删除了此图片。

(谷歌:我们道歉,但是图真的不是我们改的。不知道哪个人把一张学生博客里的图片放了进来。)

同时,谷歌希望大家都能够通过谷歌官方验证身份后再上传图片,从而避免此类事件的再次发生。

(谷歌:请先验明正身再上传图片)

但是,小探好奇,这类事件真的可以避免吗?为此,小探采访了一位搜索引擎方面的工程师老S。

根据老S的理解,谷歌在两次事件中,并没有技术层面的错误。虽然在第一次Bug中,谷歌表示自己的错误检测机制出现了问题。但是,就目前的技术水平来看,想要做到机器识别所有恶意、不正确信息,根本不太可能。这是因为,谷歌在抓取维基百科的信息时,要随时抓随时用,目前还没有一种算法能够即时识别不正确信息并提醒管理员更正。

目前,很多错误检测机制还需要人工的辅助。换句话说,人工举报是最好的避免犯错的方法。

那就靠人力呗?小探表示好奇。

“除非能雇佣200万个人来每天逐一检查”,老S一脸无奈地表示。

这样看来,谷歌真是冤啊!

不过,谷歌搜索引擎出的bug真不是第一次了。大约十年前,2009年1月31日晚上,谷歌搜索的搜索引擎的结果全部出现一条警告语。“该网站可能含有恶意软件,有可能会危害您的电脑”(Thissitemayharmyourcomputer)。其间,Google的网站管理员中心无法访问,并显示“服务器故障”(ServerError)。整个系统故障持续了40多分钟。

之后,谷歌在官方博客中证实,这是一次人为失误。谷歌当时一直在和一家非营利组织StopBadware.org合作。这个组织会对各个网址进行是否存在恶意软件的信息标注,并制成一份“恶意网站”名单。由于这个名单是人工审核并添加的,而员工不小心把名单上的恶意网站多添加了一个地址“/”,从而导致所有包含“/”的网址皆被认为包含可能伤害计算机的软件。

看来,谷歌你以后只能自求多福了!

真相真的只有一个?

虽然谷歌已经多次道歉并删除了不实信息内容及图片,但是共和党人们对于谷歌依旧不依不饶。

最主要的一点原因就是目前正是加州大选如火如荼的季节。而加州,作为美国第三大州,世界第五大经济独立体,在美国的政治影响力举足轻重。而此次谷歌出的两个Bug,恰好就在加州大选初选开始的前一周。共和党人的愤怒,自然不足为奇。

6月5日,加州大选初选开始。从此次初选结果来看,民主党的票数虽然领先,但和共和党的差距并不大。目前来看,我们并不知道谷歌的这两个乌龙事件是否影响了此次选举。

(共和党竞选人获得约125万张选票,民主党候选人获得约160万张选票;途中红色为共和党选取,蓝色为民主党选区)

传统上,加州一直是蓝营民主党的天下。尤其是在硅谷,左翼势力十分强大,而“政治正确”的倾向愈演愈烈。这也是支持川普的著名投资人彼得蒂尔(PeterThiel)搬离硅谷的原因之一。

在科技大公司,政治正确近年来也成为了人们诟病的对象。谷歌去年由于开除了一名言论不当的员工,公司内许多右翼势力员工就准备发起示威游行。虽然最后不了了之,但我们已经看到了即使是科技公司,也不能和政治完全撇清关系。

希望此次谷歌闹的乌龙事件,不会是又一场政治风波的序曲。

不过,反正我们吃瓜群众也用不了谷歌,有啥风波我们也不用怕……

THE END
1.什么是算法?(翻译文章)算法的概念来自于哪个数学家“算法”一词源自波斯学者Abdullah Jafar Muhammad ibn Musa Al-Khwarizmi的名字,他是九世纪的数学家和天文学家。他的工作为代数和数学算法过程的发展奠定了基础。他经常被称为“代数之父”。Al-Khwarizmi 对算法定义的贡献是深远的: 算法是一种定义明确的计算程序,由一组有限的步骤组成,接受一个或多个输入并产生https://blog.csdn.net/qq_20245171/article/details/143428003
2.科技名词算法algorithm科技博览科普博览资讯核心提示:算法algorithm定义:解决给定问题的确定的计算机指令序列,用以系统地描述解决问题的步骤。学科:计算机科学技术_理论计算机科学_算法设计与分析相关名词:指令 程序 软件开发图片来源:视觉中国【延伸阅读】算法是解题方案准确而完整的描述,是一系列解决问题的清晰指令,代表着用系统的方法描述解决问题的策略机制。也就http://www.agricoop.net/news/show.php?itemid=21242
3.算法基础入门概述著名计算机科学家沃思(NiklausWirth)提出一个公式:算法 + 数据结构 = 程序,其中算法是程序的灵魂。在数学和计算机科学/算学之中,算法/演算法/算则法(algorithm)为一个计算的具体步骤,常用于计算、数据处理和自动推理。精确而言,算法是一个表示为有限长列表的有效方法。算法应包含清晰定义的指令用于计算函数。http://baijiahao.baidu.com/s?id=1658978532936320587&wfr=spider&for=pc
4.百科常见的加密算法有哪些?一文了解区块链中常见的加密算法。 0x00 密码学 互联网世界,密码无处不在。中心化的系统存在账户,有账户就有账户名和密码,密码可以说是标识账号归属的最重要手段之一。 我们来看维基百科怎么阐释 密码学。 密码学(英语:Cryptography)可分为古典密码学和现代密码学。在西欧语文中,密码学一词源于希腊语 kryptós“隐https://maimai.cn/article/detail?fid=380988923&efid=UWcLYeEnR7bgyIXld5eUrQ
5.算法随意问技术百科算法标签下的所有问题http://tool.suiyiwen.com/tag/%E7%AE%97%E6%B3%95
6.什么是极光算法,极光算法的应用领域与发展历程–云服务器CVM网1.极光算法百科 极光算法是一种基于表面密度函数的流体*算法,主要用于计算液体的运动与形态变化。早期由斯坦福大学的JosS*教授在2003年提出,后来又得到了很多人的改进和发展。 极光算法的核心思想是将液体表面完整而真实地呈现出来,以及利用表面上的力来计算液体运动的影响。它与传统的粒子法和网格法不同,可以有效地防https://cvmecs.com/23779.html
7.算法算法 百科解释目录 1 概述 2 历史发展 3 算法分类 4 算法特征 5 算法的描述 目录 1 概述 2 历史发展 3 算法分类 4 算法特征 5 算法的描述 算法- 概述 求解问题类的、机械的、统一的方法,它由有限多个步骤组成,对于问题类中的每个给定的具体问题,机械地执行这些步骤就可以得到问题的https://www.mscbsc.com/cidian/baikeapb
8.算法“算法”是简易百科的Tags,Tags信息表是通过对词条“算法”进行分类和标记,以便用户更好地了解和搜索相关内容。通过使用Tags,用户可以更方便地查找和比较不同词条之间的相似性和差异性,从而更好地理解和掌握相关知识。同时,简易百科的tags还可以帮助用户发现新的兴趣点https://www.isolves.com/e/tags/?tagname=%E7%AE%97%E6%B3%95
9.百科什么是思维算法(AoT)?百科| 什么是思维算法(AoT)? 摘要 思维算法 (AoT) 是人工智能 (AI) 领域的一种突破性方法,彻底改变了 AI 模型的思考和推理方式 。 币界网报道: 作者:Aimen Noor,CoinTelegraph;编译:五铢, 一、思维算法(AoT)的解释 AoT 通过模仿人类思维过程来增强 AI 推理能力,提高解决问题的适应性和效率。https://m.528btc.com/news/116212848.html
10.算法算法(Algorithm)是指解题方案的准确而完整的描述,是一系列解决问题的清晰指令,算法代表着用系统的方法描述解决问题的策略机制[1]。也就是说,能够对一定规范的输入,在有限时间内获得所要求的输出。如果一个算法有缺陷,或不适合于某个问题,执行这个算法将不会解决这个问题。不同的算法可能用不同的时间、空间或效率来https://baike.sogou.com/v105662.htm
11.算法本专题为您整理有关于算法的行业信息及相关加密资产动态。 Float Protocol 降低短期波动性的稳定币。 DefiDollar 尝试成为稳定币的指数,使用 DeFi 基本元素保持在美元附近,并补贴抵押率。 Stand Cash 具有储备资产机制的算法稳定币。 Fei Protocol 去中心化、可扩展且公平的稳定币。 https://www.btcbaike.com/zt/37awt.html
12.粒子群算法(ParticleswarmoptimizationPSO)百度百科版本 粒子群算法,也称粒子群优化算法或鸟群觅食算法(Particle Swarm Optimization),缩写为 PSO, 是由J. Kennedy和R. C. Eberhart等开发的一种新的进化算法(Evolutionary Algorithm – EA)。 PSO 算法属于进化算法的一种,和模拟退火算法相似,它也是从随机解出发,通过迭代寻找最优解,它也是通过适应度来评价https://cloud.tencent.com/developer/article/1555832
13.算法在数学和计算机科学之中,算法(Algorithm)为一个计算的具体步骤,常用于计算、数据处理和自动推理。精确而言,算法是一个表示为有限长列表的有效方法。算法应包含清晰定义的指令用于计算函数。 来自维基百科: 算法 综合 百科 VIP 热门 动态 论文 精华暂无数据参考https://zhuanzhi.ai/topic/2001515932557420/baike
14.遗传算法遗传算法遗传算法(Genetic Algorithm)是一种模拟生物进化过程的优化算法。它是通过模拟自然选择、遗传交叉和变异等生物遗传学中的基本原理来搜索最优解的方法。遗传算法在解决复杂问题、优化函数、机器学习等领域具有广泛应用。 遗传算法的基本思想是通过对候选解进行编码,以构建一个称为"染色体"的表达式。这些染色体通过交https://vebaike.com/doc-view-1808.html
15.一文通俗解释什么是哈希算法!什么是哈希算法?币种百科在了解比特币投资和区块链技术中,哈希算法可以说经常出现,币圈戏言说唱有嘻哈,算法有哈希。关于“算法”一词,目前国内用户使用的比较模糊,有时指共识机制,有时指具体的Hash算法,作为区块链算法,哈希算法一直让普通大众感到晦涩难懂,那么,什么是哈希算法?接下来币圈子小编就来给大家通俗的讲解一下哈希算法是什么?希望https://m.jb51.net/blockchain/929884.html
16.图像算法工程师岗位职责要求图像算法工程师是做什么的职位百科|图像算法工程师职位招聘信息 26994| 11 图像算法工程师是指跟踪前沿研究成果,持续优化现有图像识别算法,提升图像识别性能的高级人才。 岗位要求: 中级图像算法工程师 学历要求: 本科 适合专业: 数学与应用数学,软件工程 专业技能要求: C/C++ Matlab https://mbaike.51job.com/zhiwei/73031
17.Capon算法学术百科提供全面的“Capon算法”相关文献(论文)下载,论文摘要免费查询,Capon算法论文全文下载提供PDF格式文件。Capon算法中文、英文词汇释义(解释),“Capon算法”各类研究资料、调研报告等。https://wiki.cnki.com.cn/HotWord/1409906.htm
18.网络流—最大流51CTO博客二、Dinic算法(百科讲解) Dinic算法是网络流最大流的优化算法之一,每一步对原图进行分层,然后用DFS求增广路。Dinic算法最多被分为n个阶段,每个阶段包括建层次网络和寻找增广路两部分。 Dinic算法的思想是分阶段地在层次网络中增广。它与最短增广路算法不同之处是:最短增广路每个阶段执行完一次BFS增广后,要重新启https://blog.51cto.com/u_15888102/5878460
19.物流怎么收费?按公斤/吨/方/趟算法大全「行业百科」按公斤/吨/方/趟算法大全「行业百科」 物流怎么收费?当发货量比较大且货物体积较大的时候,走物流是比较合适的运输方式,不同的物品的收费都是不一样的,轻货是按照立方收货,有的是按照公斤,装载量比较大就是按照吨,接下来就和上海物流公司小编一起了解一下物流怎么收费。https://www.gml.cn/Mobile/MArticles/wlzmsfagjdftsfdqxybk_page1.html
20.一文看懂人工智能里的算法(4个特征+3个算法选择Tips)算法没有高级和低级之分,快速便宜的解决问题才是目的,一味追求复杂的算法(例如:深度学习),相当于“用大炮打蚊子” 有时候有多种算法可以解决同一个问题,用最低的成本和最短的时间解决问题才是目的。根据不同环境选择合适的算法很重要。 百度百科+维基百科 https://easyai.tech/ai-definition/algorithm/
21.进化计算词条广场 人物百科 企业百科 词条卡合作 百度收录 登录/注册 赞(3) | 阅读(152) 进化计算编辑 本词条由“匿名用户” 建档。在计算机科学中,进化计算是受生物进化启发的用于全局优化的一系列算法,以及研究这些算法的人工智能和软计算的子领域。在技术方面,它们是具有元启发式或随机优化特征的基于群体的https://vibaike.com/124823/?ivk_sa=1024320u