上周,比尔·盖茨在他的官方博客上发布长文,表示五年内每个人都将拥有AI私人助理Agent——无论你是否在办公室工作,并称“它们将彻底改变我们的生活方式”。
比尔·盖茨提到的AI私人助理,能响应自然语言,根据其对用户的深度了解完成各种任务,被称为“代理”(Agent)。
和InflectionAI推出的聊天机器人Pi不同,Agent可以在不同应用程序中执行不同任务,它们会不断了解用户,从而不断改进。
如果你想做一个APP,你不需要写代码,学设计。只需要告诉Agent你想要什么,它就能编写代码,进行UI设计,并将APP发布到在线商店。
“谁能赢得个人助理Agent,那才是大事。因为你将永远不会再去搜索网站,永远不会再去生产力网站,你永远不会再去亚马逊。”
实际上,比尔·盖茨在博文中提到,他已经“思考Agent近30年了,并在1995年的《未来之路》一书中写到过它们,但由于AI的进步,它们直到最近才变得实际可行”。
以下是全文翻译:
AI即将彻底改变你使用电脑的方式
时至今日,我仍然像当初和保罗·艾伦刚创立微软时那样热爱软件。尽管几十年来软件已经取得了很大改进,但在许多方面它仍然相当愚蠢。
即便是最好的网站也不能完全了解你的工作、个人生活、兴趣和人际关系,而且软件的能力有限,无法像亲密朋友或私人助理那样为你做事。
这种类型的软件,能回应自然语言并根据对用户的了解完成许多不同的任务,被称为Agent(代理)。我对Agent进行了近30年的思考,并在我1995年的书TheRoadAhead(《通往未来之路》)中提及,但由于人工智能的进步,Agent直到最近才变得实用起来。
Agent不仅会改变每个人与计算机的交互方式,还将颠覆软件行业,引领我们从键入命令到点击图标以来计算机领域最大的革命。
人人都有私人助理Agent
一些批评者指出,软件公司以前也做过这种东西,但用户并不怎么接受它们。(大家仍拿Clippy开玩笑,Clippy是我们曾在MicrosoftOffice中提供的数字助理,后来被弃置一边。)
那么,为什么人们会使用Agent?
“Clippy是一个机器人,而不是Agent。”
我们现在用的人工智能工具大部分都只是机器人而已。它们仅限于一个应用程序,并且通常只在你写入特定单词或请求帮助时才会介入。这是因为它们不记得你的使用习惯,也就不会变得更好,不会学习你的任何偏好。Clippy是一个机器人,而不是Agent。
Agent将如何影响四大领域?
Agent最激动人心的地方是它会让如今过于昂贵的服务变得平民化,例如医疗健康、教育、生产力、娱乐与购物等四个领域。
医疗健康
如今,人工智能在医疗保健领域主要是处理一些行政任务。例如,Abridge、NuanceDAX和NablaCopilot可以在医生就诊期间帮助记录音频,并撰写笔记供医生审阅。
真正的转变将在Agent能够帮助患者进行基本分诊、就处理健康问题提供建议,并决定是否需要求诊时出现。
这些临床医生Agent还会帮助医护人员做出决策,提高工作效率。(例如,像GlassHealth这样的应用程序可以分析患者摘要并为医生提出诊断建议。)贫困国家人民将尤其受益,因为那里的许多人根本没有机会看医生。
毕竟医疗事关生死,临床医生Agent的推广速度会比较慢。人们也需要看到医疗Agent总体是好的,尽管它们不完美无缺,也会犯错误。当然,人类也会犯错误。
目前,患者能否获得医疗保健也是一个问题。
如今,每周一次的心理治疗似乎是一种奢侈服务。但实际上仍有许多需求未得到满足,许多本可以从心理疗法中获益的患者却没有机会得到治疗。例如,RAND公司发现,在所有需要心理健康护理的美国退伍军人中,有一半没有得到治疗。
在你允许的情况下,它还可以通过你的智能手表监测你的身体反应——比如当你和老板谈论问题时你的心脏是否开始加速跳动——并建议你什么时候应该去看人类心理治疗师。
教育
但文本机器人只是第一阶段——Agent将开辟更多的学习机会。
例如,很少有家庭负担得起1v1家教。如果辅导Agent能捕捉到1v1家教的有用之处,它将为每个学生提供针对性指导。例如,当辅导Agent知道一个孩子喜欢Minecraft和TaylorSwift,它将用Minecraft来教学生计算几何的体积和面积,用TaylorSwif的歌词教他们讲故事和押韵。这种学习体验将更加丰富——例如,有图形和声音——而且比现在的文字辅导更加个性化。
生产力
这个领域的竞争已经进入了白热化。微软正在将Copilot作为Word、Excel、Outlook和其他服务的一部分。谷歌也在用AssistantwithBard和其生产力工具做类似的工作。这些类似Copilot的协助工具可以做很多事情,比如把书面文件变成幻灯片,用自然语言回答电子表格的问题,并从每个人的观点里总结邮件主题。
而Agent能做更多。拥有一个Agent就像有一个人专门帮你完成各种任务。如果你愿意,Agent也可以独立完成。如果你有一个商业想法,Agent会帮你写一份商业计划,创建一个演示文稿,甚至能生成产品的大概图像。公司会让员工直接咨询Agent,并参与每次会议,以便回答问题。
“如果你的朋友刚做了手术,Agent会提议送花并帮你订购。”
娱乐与购物
人工智能已经可以帮你挑选新电视,推荐电影、书籍、节目和播客。我投资的Likewise公司最近推出了Pix,它可以让你提问(“我喜欢罗伯特·雷德福的哪部电影,我可以在哪里看?”),然后根据你过去的喜好推荐电影。Spotify最近推出了一款人工智能DJ,不仅会根据你的喜好播放歌曲,还会与你交谈,甚至能叫出你的名字。
Agent不仅会提供建议,它们还将帮助你付诸行动。如果你想购买相机,你的Agent将为你阅读所有测评,总结后给出推荐,并在你决定后为你下单。如果你告诉Agent你想看《星球大战》,它会知道你是否已订阅了合适的流媒体服务。如果没有,它会主动为你注册。如果你不知道自己想看什么,它会给出定制化建议,然后想办法播放你选择的电影或节目。
你还可以获得根据你的兴趣量身定制的新闻和娱乐内容。CurioAI能就你提出的任何话题创建定制化播客,它是未来趋势的一个缩影。
Agent对科技行业带来何种冲击波?
简而言之,Agent几乎可以在任何活动和生活领域提供帮助,对软件行业和社会范围产生深远的影响。
在计算机行业,我们聊平台——应用程序和服务赖以构建的技术。Android、iOS和Windows都是平台。Agent将成为下一个平台。
"要创建一个新的应用程序或服务,你只需要告诉你的Agent你想要什么。"
距离实现还有哪些技术挑战?
目前还没有人知道Agent的数据结构是什么样的。为了创建私人Agent,我们需要一种新型的数据库,它可以细腻地捕捉你的兴趣和各种关系,并在保护隐私的同时快速检索信息。我们已经看到到了存储信息的新方式,例如向量数据库,它可能更适合存储机器学习模型生成的数据。
另一个未解决的问题是人们将与多少个Agent进行交互。你的个人Agent会与你的心理治疗师Agent和数学导师Agent分离吗?如果是这样的话,你希望它们何时彼此合作,何时保持各自独立?
"如果你的Agent需要与你联系,它将与你交谈或在你的手机上显示。"
你将如何与你的Agent互动呢?公司正在探索各种选择,包括应用程序、眼镜、吊坠、胸针,甚至是全息影像。所有这些都是可能性,但我认为在人与Agent的互动方面,首个重大突破将是耳机。如果你的Agent需要与你联系,它将与你交谈或在你的手机上显示信息("你的航班延误了,你想等待还是需要帮助重新预订?")。如果你愿意,它会监控进入你耳朵的声音,并通过屏蔽背景噪音、放大难以听清的语音、或让你更容易理解口音重的人说话来增强它的效果。
还有其他挑战。例如,目前还没有一个标准协议允许Agent们互相交谈;成本需要降低,让每个人都能负担;如何向Agent发出简单指令的同时得到正确回答;如何防止出现“幻觉”(即人工智能自信地给出了不符合事实的回答),尤其是在精确度要求极高的健康领域,还要确保Agent不会因为偏见而伤害人们。我们不希望Agent做它们不该做的事。(不过比起流氓Agent,我更担心人类罪犯利用Agent干坏事。)
隐私和其他重大问题
随着这一切的出现,网络隐私和安全问题将变得比现在更加紧迫。你会希望自己掌握Agent访问信息的权利,这样你就可以确信你的数据只与你选择的人和公司共享。
但有一些问题不会由公司和政府来决定。例如,Agent可能影响我们与朋友、家人的互动方式。今天,你可以通过记住他们生活的细节,比如他们的生日,来表达你对他们的关心。但当他们知道是你的Agent提醒你并负责送花时,这对他们来说还有意义吗?
但我们离那个未来还很远。与此同时,Agent时代正在赶来。在接下来的几年里,它们将彻底改变我们的生活方式,无论是线上还是线下。