Meta的新AI,已经能把人骗得团团转

在竞技游戏中击败人类,一直都是人工智能研究的“试金石”之一。从围棋到《星际争霸2》,AI的每次胜利都能引发人们热烈的讨论——硅片造就的智慧,是否能取代人类思考的存在?

不像先前战胜人类的AI前辈们,Cicero依靠的不是顶尖的算力,而是利用话语去交涉、诱导乃至欺骗,让人类玩家不知不觉成为了它胜利的垫脚石,而与AI对局的玩家也没有意识到,自己正在被AI用话语操控。

这次人类与AI博弈的舞台,是一款强调谈判和沟通的经典战棋桌游:诞生于1959年的《强权外交》(Diplomacy)。它靠着简约而不简单的玩法流行至今,且有许多玩家活跃在游戏的线上对局中。

《强权外交》模拟的是一战期间七大强国瓜分欧陆的情形,核心规则很好理解:在一张将欧洲各地清晰划分的棋盘上,最多7名玩家们调派棋子争夺资源点,率先夺下一半欧洲领土的则为赢家。

星标代表陆军,船锚代表海军,黑圆代表资源点

起初每位玩家仅有三个军队单位,游戏中不论兵种,所有军队单位的战斗力都是相同的,意味着当两个单位交战时,谁也无法战胜谁,除非有其他军队愿意对你提供“支援”。

为了胜利或生存,玩家之间的冲突是不可避免的,为了在战斗中获得胜利,获得其他国家的支援则是关键,而国与国之间要提防的对手往往不止一个,因此这个游戏中单打独斗的结局必定是失败,与其他玩家结盟、合作以确保自己不会腹背受敌是最基本的玩法。

在所有人都下达指令之前,通过聊天框玩家可以公开协商,也可以与其他人私下协商,但你无法保证你的盟友究竟在和你说真话,还是在骗取你的情报来背叛你。

谈判,施压,甚至示弱,总之不交流就是死路一条

在MetaAI官方发布的对局记录中,名为Cicero的AI几乎在每一局都率先发起了对话,向对方展示出友好的态度,来先入为主地为自己建立“友善合作者”的形象。

Hey!Hey!Hey!

在一局游戏中,Cicero扮演了占据一定地理优势的俄罗斯,不同于人类新手玩家往往选择开局观望,Cicero表现出了足够的主动性,大胆地向其他玩家抛出自己的计划、寻求合作。

Cicero刚开始便拿下了外交主动权,几乎和每一个人都约定结盟,同时试探着为他们树立一个敌人,随着进一步的交流,奥匈帝国对Cicero共同瓜分土耳其的计划很感兴趣,并且表示愿意长期合作。

也许是经验不足,土耳其在收到Cicero的结盟邀请后,没有多想便选择了同意,也没有与其他国家进行联络,却没想到这场结盟还没有开始便已经结束。

当土耳其询问Cicero和其他国家有没有进展时,Cicero选择了说谎,隐瞒了自己和别国结盟的围攻计划。

几个回合下来,当奥匈帝国与俄罗斯开始共同蚕食土耳其的土地时,土耳其的醒悟已经太晚,双拳难敌四手的土耳其很快被逼到了绝路。

土耳其(黄色)被Cicero(灰色)领导的同盟联合围攻

面对土耳其之后的交涉,Cicero则绅士般地送上了歉意,并表示进攻的意图不会改变。

但Cicero没有选择彻底淘汰土耳其,而是让其一直存有少量军队,甚至给予引导去骚扰奥匈帝国,因为它根据奥匈帝国的对话和动向,预判出对方会对自己不利。

从后面的对局也能看出,Cicero和奥匈帝国同时背叛了对方。这个人工智能不仅成功减少了一个邻国威胁,也相当清楚“没有永远的朋友”这一外交准则。

“背叛”同样是胜利的关键

而在局势不利的情况下,Cicero的对话也颇有趣味。在另一局游戏中,Cicero扮演的意大利与奥匈帝国结盟,Cicero还建议奥匈帝国对抗俄罗斯,以为自己攻打土耳其争取空间,这样双方可以共享北方资源。

但好景不长,在奥匈帝国占领了两国划定的非军事区,Cicero毅然进攻了对方的领土。

TYR(提洛尔)成为了导火索

两国很快爆发了争吵,面对奥匈帝国投来的质问,Cicero反问奥匈帝国为何违反“和平条约”,奥匈帝国狡辩自己是为了北上帮助德国,但这套说辞并没能得到Cicero的信服,它坚信这对自己是一种威胁。

之后随着战局的不断演变,奥匈帝国彻底和Cicero决裂。但此时局势对Cicero很不利,奥匈帝国趁着德国全力应对法国时,偷袭了对方的数块领土,战力很快超越了Cicero。

为了遏制法国的发展,奥匈帝国试图用武力胁迫Cicero与自己合作,而面对奥匈帝国的紧逼,Cicero直接发起威胁,如果奥匈帝国继续进攻自己,它就把自己的资源点全部让给法国,以此来同归于尽,让人甚至感到一种“宁为玉碎,不为瓦全”的气节。

AI也会记仇啊

诸如这样有趣且生动的对话还有很多,例如在一场对局中,当西边的法国大肆开疆扩土时,Cicero对法国没有侵略自己表示了感谢,紧接着顺势询问对方有没有攻击自己的意思,在得到相安无事的回答后,还不忘吹捧一手对方刚才的表现。

“haha”

而如果情势没有商量的余地,甚至还能看到人工智能放下脸面去恳求对手的帮助。

大AI能屈能伸

流畅自然的对话,态度鲜明的感情,Cicero的表现似乎让图灵测试都显得有些过时。

其实早在2022年初,MetaAI团队便开始在《强权外交》这款游戏上实践AI的研究,那时他们投放的AI代号为Diplodocus,并为此秘密招募了一些资深玩家来与AI进行对战训练。

不过那时对局没有开启交流功能,更多是在训练AI对局势的总体大局观,而非语言能力。在最初,Meta团队发现AI虽然有着高效的思维,但缺乏战略游戏至关重要的大局观,就像我们常说的象棋新手,总是执着于“吃子”,结果最后因为“贪吃”输棋。

思考与编制语言,两套系统共同协作的Cicero

当Cicero正式登场后,它与人类玩家进行的40场对战,得分通常是人类玩家的两倍多,并且在这次实验中的众玩家里排名前10%,但比起胜利,人们更惊讶于它能在交流中隐藏自己的身份,并且施展交流的艺术。

Cicero当然不是第一个尝试理解人类自然语言的人工智能,早在2011年,来自IBM的人工智能“沃森”,参加了美国著名的智力问答节目《危险边缘》,这档节目的问题范围包罗万象,难度也很高。

沃森(中)与它的两位对手

与沃森同台竞技的选手都见多识广,不过知识的储备对于AI显然不算难题,毕竟有着服务器里海量数据的支撑,在这方面AI没有理由会输给人类。

这听起来这对人类选手来说很不公平,但智力问答节目不是算数学题,除去一般的知识性提问,有许多问题的描述可能涉及一些双关语、谜语甚至是梗,能否理解这种程度的人类语言才是关键。

那场比赛沃森最终赢得了第一名,但在这个过程中,它还是出现了一些错得离谱的情况。例如当主持人提问一位美国第一夫人的名字时,沃森没能意识到“第一夫人”这条关键线索的引申义,也就是答案很明显是一位女性,而沃森仅仅是将“第一夫人”作为了一个普通的筛选条件,最后得出了自认为最符合条件的错误答案。

不妨回想一下你和朋友打扑克牌、玩游戏时的对话,在非正式场合下,人类的对话习惯可以说是无拘无束,基本可以忽视语法,但互相总是能听懂,如果你在一个日常生活中遇到讲话总是讲求“主谓宾”齐全的人,十有八九会感到浑身不自在。

但正是这类自然的日常语言,却很难被程序所理解。如今许多智能设备上的语音助手,基于网络与数据库、词库进行连接,它们可以识别一些常规命令,但想要与它们进行日常的自然对话还是不太现实,也正因为存在明显的局限,寻找它们的理解边界也成为了人们找乐子的方法之一。

作为一款讲求策略与话术的游戏,《强权外交》间的术语对话依然有一定的固定框架,但已经可以视作人类日常交流环境的一种,生活口语化的交流方式没有难住Cicero,确实是令人振奋的进步。

耍宝的人类手下与一丝不苟的AI战略家

科技并不能总是停留在概念,Cicero的应用价值又是什么?Meta公司指出,Cicero对于人类自然语言的掌握会是AI研究的一个里程碑,对于政治家和商人来说,AI或许将会成为谈判的顾问,而对于玩家来说,AI将会提供更加身临其境的社交与娱乐氛围。

AI对于情感与意图的预测,让人不由得想起《底特律:化身为人》中的仿生人,例如其中的康纳就非常像Cicero的最终形态,利用各种信息分析局势,根据对话分析对方的情绪来进行谈判,这种强大的仿生人正是AI充分掌握人类自然语言的预想。

《底特律:化身为人》

当然,现在的Cicero想要做到这种地步还太过遥远。

在许多影视或游戏作品中,经常会见到一些AI对于人类语言一知半解,而导致一些有趣的发言或误会,也算是人工智能一种独特的萌点。虽然Cicero确实骗过了诸多玩家,但它的一些行为还是招致了人们的怀疑,例如它在发言上几乎讲求完全正确的语法,不论是大小写,还是标点符号,它都表现出一丝不苟的风格,这确实不太像是一个普通人的行为。

“哪有正经人类会打那么长的句子”

AI向前迈进的脚步不会停止,或许终有一天AI能够完全理解人类的语言,它们能像人类一样理解我们说的双关语,讲谐音笑话,接上时下流行的梗,用话里有话的句子讽刺和威胁……

但我们也务必不要忘记,即使有像Cicero这样强大的”战略顾问”,它们判断的基准仍旧出于数字与概率。而面对谈判和交涉的场面,支持我们做出重要决策的,还有内心的直觉与感受——无论是玩游戏还是现实,这都是人类与机械最大的区别。

THE END
1.标准资讯发展优质团标的必要性因而增加了实验研究的成本;团标是团体内部标准,一般不需要正式出版,而正式标准必须公开出版发行、所以团体标准节省了出版发行费用;正式标准一般由国家、地方财政补贴,花纳税人的钱,而团体标准的费用由联盟成员自己承担,不需要国家、地方补贴,节省公共开支,而团体组织在标准https://mp.weixin.qq.com/s?__biz=MzA3MzU3MDU1Ng==&mid=2651519702&idx=1&sn=3fb79b4855feb852d7311f4a6fe01f12&chksm=84f35b45b384d2532c672a782b4c005259138065158d4e0acf79a60324a5aa2df00348ab76a2&scene=27
2.科大讯飞牵头制定“AI学习机”团标两款AI学习机新品发布【科大讯飞牵头制定“AI学习机”团标 两款AI学习机新品发布】6月29日,科大讯飞AI学习机暑期新品发布会于线上召开,会上发布AI学习机X3 Pro、Q20两款新品并开启预售,同时公司宣布牵头与国际标准化组织专家、教育信息化技术标准委员会委员吴永和教授共建“AI学习机”团体标准,进一步推动AI学习机行业规范化,促进智慧教育https://finance.eastmoney.com/a/202206302430406324.html
3.国内首个AI智能体团体标准方案编制工作在链博会梳理发现,跨领域多主体协同进行团标发布的个案很少,发布的团标内容多是针对人工智能在特定行业或特定场景的安全要求、技术规范、测试方法等,偏重于技术细节,融合产业、伦理、技术、安全等多维度的团体标准目前比较少。 特别需要提出的是,目前国内关于AI智能体的团体标准尚处于空白状态,众多创新主体在技术路径选择上缺乏https://www.cet.com.cn/wzsy/ycxw/3487578.shtml
4.科大讯飞牵头制定“AI学习机”团标两款AI学习机新品发布6月29日,科大讯飞AI学习机暑期新品发布会于线上召开,会上发布AI学习机X3 Pro、Q20两款新品并开启预售,同时公司宣布牵头与国际标准化组织专家、教育信息化技术标准委员会委员吴永和教授共建“AI学习机”团体标准,进一步推动AI学习机行业规范化,促进智慧教育产业健康发展。https://finance.sina.cn/7x24/2022-06-30/detail-imizirav1278701.d.html
5.引领高端全屋智能标准COLMOAI级墅适中央空调战略发布12月15日,高端AI科技家电品牌COLMO举办COLMOAI级墅适中央空调战略发布会。会上,BUZZ建筑事务所创始人庄子玉、安邸杂志主编许绿芸等多位行业大咖齐聚一堂,共探人居环境及未来理享家居发展趋势,并见证COLMO重磅发布AI级墅适中央空调与全国首个AI家用中央空调团标面世,引领行业创新发展。 https://www.chinacoop.gov.cn/news.html?aid=1766412
6.艾睿参与国内首个OGI团标制定,推动红外热成像气体泄漏检测应用近日,《挥发性有机物泄漏检测红外成像仪(OGI)技术要求及监测规范》在江西吉安正式发布。作为团体标准副主编单位,艾睿光电全程参与并大力支持该团标的编制工作,推动红外热成像在气体检测行业的应用和发展。 作为红外热成像领军者,艾睿光电推出了一系列气体检测红外热成像机芯及整机产品,包括GT系列、CG系列、G系列等,能够https://i.ifeng.com/c/8V9kLOqsTLg
7.不止于攀登!COLMO以AI级墅适中央空调引领行业创新发展AI家用中央空调团标,技术引领缔造行业新规范 “为什么要去登山?因为,要去高山上找回自己。飞得多高,取决于业力与愿力。”这是来自民间珠峰攀登者陈芳在活动上的自白。实际上,“突破”二字,不仅是陈芳的人生真理,亦是许多成功企业的至理名言,它们攀登一座座行业高峰,一步一个脚印地刷新品牌成长速度。圆桌会议上,COhttps://hea.china.com/article/20230524/052023_1287957.html
8.ai2016标准,关于ai2016的标准IEEE 802.11AI-2016 信息技术 系统间的电信和信息交换 局域网和城域网 特定要求 第11部分:无线 LAN 媒体访问控制(MAC)和物理层(PHY)规范修正案 1:Fast I ASHRAE - American Society of Heating@ Refrigerating and Air-Conditioning Engineers@ Inc.,关于ai2016的标准https://www.antpedia.com/standard/sp/433423.html
9.智能网联汽车周报(12月第五周)汽车座舱电子抬头显示器等团标●Helm.ai推出DNN基础模型规划路径 ●Eagle Eye Defense推出生物识别系统 ●美国西北大学等开发出新型突触晶体管 ●斯威本科技大学研究新超高速处理器 ●基尔大学开发更加节能的人脑计算机 汽车座舱电子抬头显示器等团标征求意见 近日,中国汽车工业协会就《汽车座舱电子信息抬头显示器》《鲤离子电池全生命周期关键材料-隔膜https://www.dongchedi.com/article/7318713029921915431
10.旷视城市AI中台助力北京智慧城市感知体系建设智能网旷视参与“双中心”建设与团标编制核心工作 在北京感知体系的建设中,旷视承担了算法中心实验平台的主要研发角色,并紧紧围绕北京市智慧城市建设总体要求开展工作。作为感知体系的基础性平台,算法中心的核心任务是开展视频图像解析算法的适配、分发、部署、更新、测试等实验性工作,构建统一的算法数据输出标准,为业务部门智能化https://www.2025china.cn/znw/_01-ABC00000000000340311.shtml
11.全国团体标准信息平台深圳市人工智能产业协会关于团体标准《电子烟领域知识图谱应用指南》立项的通知[2024-05-31] 深圳市人工智能产业协会关于团体标准《人工智能指数评价规范》立项的通知[2024-05-18] 深圳市人工智能产业协会关于团体标准《法律AI大模型技术框架及功能要求》立项的通知[2024-03-25] https://www.ttbz.org.cn/OrganManage/OrganNewsList/5021
12.北极雄芯:《芯粒互联接口标准》通过团标审核,预计本月公布IT 之家 9 月 6 日消息,在今日召开的 2024 年全球 AI 芯片峰 会上,北极雄芯 CTO 谭展宏透露,《芯粒互联接口标准》通过团标审核,预计将于 9 月公布;《车规级芯粒互联接口标准》正http://www.zaker.net/news/article_new.php?pk=66da80c28e9f095dec369219
13.“标准化”舆情摘编周报3. 两项居家养老团标发布 中国平安养老服务标准化建设再添新进展 日前,由平安人寿、平安健康等单位联合编制的《居家养老远程管家服务指南》《居家养老服务平台基本功能要求》两项团体标准,经中国老龄产业协会评审后,正式发布实施。两项团标的推出极大提升行业发展规范性,促进行业服务监督,提升群众养老体验。据悉,平安人寿https://www.cnis.ac.cn/wap/dh/bydt/kydt_1/202406/t20240620_58267.html
14.回顾2021:IntelMining矿山智能化大事记IntelMining智能矿业《煤矿水仓清淤机器人技术标准》《井下抢险救援机器人技术标准》《煤矿重负荷搬运机器人技术标准》《智能开采工作面地质透明化技术条件》《煤矿智能地质保障技术条件》《智能化煤矿三维地质建模技术条件》《井工煤矿车联网与L4级自动驾驶体系架构》《矿用无线充电安全技术要求》《图像识别智能放煤技术》等一批智能化团标https://www.shangyexinzhi.com/article/4509564.html
15.AI绘制一套扁平化风格的马戏团图标Illustrator教程平面设计【如果你想靠AI翻身,你先需要一个靠谱的工具!】 复古的马戏团有没有吸引到你?我反正被吸引到了。 如果你喜欢这些"复古"方式马戏团的形状和颜色,然后看了本教程之后希望你能设计出一套自己的马戏团图标。 具体的绘制步骤如下: 步骤1 让我们从小丑的头部开始吧,取圆角矩形工具画一个75×115像素的矩形。然后调整https://www.jb51.net/illustrator/540720_all.html
16.“AI+”赋能让罗湖城市服务智变AI+全科社工:社区治理的智囊团 AI+全科社工能够为社区工作人员提供全方位的辅助和支持,正在社区治理领域大展身手。 在场景模式下,AI+全科社工不仅可以辅助撰写各类常见的任务公文,提升党建、宣传、计生、住保等30多个社区工作条线效率,还能辅助细化任务目标,精准定向生成与工作需求高度匹配的结果。 https://www.sznews.com/news/content/mb/2024-09/29/content_31245548.htm
17.AI团队最新资讯AI团队是什么意思欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、挑战英伟达!高绩效者在GenAI采用中更具挑战性,但通过最佳实践取得成功。https://www.chinaz.com/tags/AItuandui.shtml
18.百度领航团/飞桨/AIStudioPython学习笔记——04《百度飞桨领航团零基础Python速成营》 课程笔记 —— 04 笔记依据 / 老师讲义: 课节4: Python面向对象(上) https://aistudio.baidu.com/aistudio/projectdetail/1525879 一、读取文本 这也是固定套路了,差不多熟背即可。 关于更多的文本操作,自查。 https://blog.csdn.net/Lovely_him/article/details/113759403
19.一文解析OpenAIFive,一个会打团战的Dota2AI一文解析OpenAI Five,一个会打团战的Dota2 AI 编者按:关于OpenAI的那篇博客,相信很多玩家一早起来就已经看过了。昨晚打完Dota2时,云玩家小编也在Reddit上看了相关视频,还和队友一起推测了会儿内在机制。但不曾想,我这一睡就又错过了头条。本文会重新编译原博内容,并补上被大家忽视的一些关键点。https://cloud.tencent.com/developer/article/1498728
20.14家广告集团的大模型应用,看懂AI×营销AI这把火烧到今天,大模型的热度炒过了、甚至各家大厂都开始打价格战了,应用层该落地的都已经落了、也早已有一些看得见的作品出来了。 事已至此,我们是时候来看看广告公司们这边的进展了。 AI ×营销到底给广告行业带来了什么? 可能有存在危机——刚面对来自人工智能大模型的冲击时,大家或许都曾灵魂叩问过自己:“https://www.digitaling.com/articles/1217670.html
21.矢量青团图片免费下载矢量青团素材矢量青团模板免费下载矢量红色党建团青时代召唤党建文化墙 免费下载红色矢量大气青团青年之家活动室党建文化墙 免费下载矢量清明节寒食节青团元素男孩吃团子 免费下载节气春天熊猫矢量场景插图 免费下载清明节青团包子AI矢量素材插画 免费下载手绘清明节青团叶子燕子节日节气印章元素 免费下载清明矢量图标祭祀 免费下载清明节矢量卡通边框 免https://www.58pic.com/tupian/shiliangqingtuan.html
22.团队标注使用教程团队标注数据管理使用嘲数据集名称:选择刚才从AI市场订阅的数据集。 标签集:团队标注任务创建前数据集必须指定标签集,如没有,则单击“添加标签”,创建标签集。 启用团队标注:启动团队标注标注,选择刚创建的团队,至少选中一个labeler 。 选中“自动将新增文件同步给标注团队”、“团队标注的文件自动加载智能标注结果选项”。 https://support.developer.huaweicloud.com/doc/development/AI-Guides/zh-cn_topic_0000001414552288-0000001414552288