OpenAI秘密武器曝光!Q*推理能力大爆发,逼近AGIL2里程碑

上周,一张OpenAI内部通往AGI最新路线图,在全网掀起热议。

不过,大家其实对它都很熟悉——就是曾经的Q*。

根据路透社在5月份看到的内部文件,OpenAI团队正在全力研究Strawberry项目。

Strawberry具体是如何运作,即使在OpenAI内部也是高度保密的。

文件显示,Strawberry模型的目的,是为了使公司的AI不仅能生成查询答案,还能提前计划,足够自主且可靠地浏览互联网,进行OpenAI所称的「深度研究」。

而这个目标,根据对十多位AI研究人员的采访,目前尚未有任何AI模型实现。

路透社表示,Strawberry就是去年的Q*,后者在OpenAI内部已经实现突破。

当被问询到Strawberry的更多细节时,OpenAI发言人表示——

知情人士表示,OpenAI希望Strawberry的创新能显著提高其AI模型的推理能力,并补充说,Strawberry涉及了一种AI模型在经过非常大的数据集预训练后的一种特殊处理方式。

而路透社采访的研究人员表示,推理是AI达到人类或超人类智能的关键。

研究者表示,在AI背景下的推理,就需要一个模型让AI能提前计划,反映物理世界的运作,并且可靠地解决复杂的多步骤问题。

改进AI模型的推理能力,被认为是解锁这些模型潜力的关键。有了推理能力,模型在进行重大科学发现、规划构建新的软件应用上,都会有可观的提升。

SamAltman此前也曾表示,今后AI领域最重要的进展,将「围绕推理能力展开」。

而其他巨头,如谷歌、Meta、微软等,都在尝试不同技术,来改进AI模型的推理能力。

沿着目前的路线,有可能实现让LLM将想法和长期规划纳入其预测方式吗?图灵三巨头之一的LeCun对此持唱衰态度。

他坚决认为,LLM不具备类人的推理能力。

要克服这些挑战,对OpenAI来说Strawberry就是关键。最近几个月,OpenAI曾私下向开发者和外部人士暗示过,即将发布具有显著先进推理能力的技术。

据悉,Strawberry包括一种被称为「后训练」的特殊方法,即在OpenAI的生成式AI模型已经在大量通用数据上「训练」后,调整基础模型以特定方式优化其性能。

模型开发的后训练阶段涉及「微调」等方法,这一过程几乎如今所有的LLM都在用,比如RLHF。

知情人士表示,Strawberry类似于斯坦福大学在2022年开发的一种方法——「自我教导推理者」(Self-TaughtReasoner,简称STaR)。

论文作者之一,斯坦福教授NoahGoodman表示,STaR使AI模型能够通过迭代创建自己的训练数据,来「自我提升」到更高的智能水平。

理论上,可以让语言模型实现超越人类水平的智能。

结果显示,在算术、数学文字题和常识推理中,STaR能够有效地将少量的少样本提示转化为大量的推理数据集,从而显著提升性能。在CommonsenseQA上,STaR比少样本基线提高了35.9%,比直接预测答案的微调基线提高了12.5%,其表现与一个大30倍的微调模型相当(72.5%对73.0%)。

文件显示,为了实现这一目标,OpenAI正在创建、训练和评估被称为「深度研究」数据集的模型。

OpenAI非常希望模型能够利用这些能力,通过一个称为「CUA」的计算机使用Agent来自主浏览网络,并根据其发现采取行动来进行研究。

此外,OpenAI还计划测试其在软件和机器学习工程师工作中的应用能力。

就在2024年7月初的一次全员会议上,OpenAI内部曾对一个神秘研究项目做了展示。

据称,它所展现出的推理能力,已经达到了类人的水平。

结合前文的信息,路透怀疑这可能与Strawberry有关,但目前还无法确定。

L1:聊天机器人,具有对话能力的AI。

L2:推理者,像人类一样能够解决问题的AI。

L3:智能体,不仅能思考,还可以采取行动的AI系统。

L4:创新者,能够协助发明创造的AI。

L5:组织者,可以完成组织工作的AI。

OpenAI表示,我们目前正处在第一级别,不过很快会达到第二个级别,即推理者。

所谓推理者,也就是指可以解决博士水平的基本问题的系统。

OpenAICTO曾透露,OpenAI接下来将致力于研究在特定任务上博士级别的智能,也许就在一年或一年半之后实现。

2023年11月,OpenAI的神秘Q*项目,引爆整个AI社区。

泄露出来的信息,Q*的能力,是能够解决小学阶段的数学问题。

虽然在大多数人看来,这并不是什么令人印象深刻的事,但这的确是朝向AGI迈出的一大步,堪称重要的技术里程碑。

因为Q*解决的,是以前从未见过的数学题。

Ilya做出的突破,使OpenAI不再受限于获取足够的高质量数据来训练新模型,而这,正是开发下一代模型的主要障碍。

那几周内,Q*的演示一直在OpenAI内部流传,所有人都很震惊。

据悉,OpenAI的一些人认为Q*可能是OpenAI在AGI上取得的一个突破。AGI的定义是:「在最具经济价值的任务中,超越人类的自主系统」

所以,Q*究竟是啥呢?

这要从一项1992年的技术Q-learning说起。

斯坦福博士SilasAlberti由此猜测,Q*很可能是基于AlphaGo式蒙特卡罗树搜索token轨迹。下一个合乎逻辑的步骤是以更有原则的方式搜索token树。这在编码和数学等环境中尤为合理。

随着几位AI大佬的下场,大家的观点,愈发不谋而合了。

AI2研究科学家Nathan激动地写出一篇长文,猜测Q假说应该是关于思想树+过程奖励模型。并且认为Q*假说很可能和世界模型有关!

他猜测,如果Q*(Q-Star)是真的,那么它显然是RL文献中的两个核心主题的合成:Q值和A*(一种经典的图搜索算法)。

A*算法的一个例子

话说,OpenAI最近似乎没有多大动静了。

在这个演示中,主管让GPT-4o表演了多种语调,比如激情四射版、悄悄话版等。

GPT-4o可以即时听懂Huet的命令,立马做出正确的反应,在场观众给出欢呼。

接下来,Huet向ChatGPT出示了金门大桥的手绘图,让它猜猜自己在哪里。

ChatGPT马上猜出来这是哪个大桥,并说出Huet在旧金山,还认出了他在纸上的手写字——「BonjourDeveloper」!

随后,Huet又迅速给了它一堆任务,比如认出查理芒格的书,随机翻一页后迅速总结书页大意等等,ChatGPT没有任何迟疑,迅速给出了正确答案,效率令人惊叹。

随后,Huet从视频中提取了6帧,然后把这6帧发给了GPT-4oVision,让它描述自己看到了什么。

在雾气弥漫的浓密森林深处,一只色彩斑斓的青蛙小心翼翼地沿着覆盖苔藓的树枝前行。它明亮的绿色身体上点缀着醒目的黑黄图案,在茂密的植被中显得格外显眼。

在这条危险的路径上,青蛙保持警觉。每一步都很慎重,粘性的脚趾牢牢抓住粗糙的树皮。树枝轻轻摇晃,显示出它精妙的平衡感。

到达树枝的边缘时,青蛙评估着前方的空隙。突然,它爆发出一股能量,跃了过去。但就在后腿推离时,脚滑了一下。短暂地悬在空中,青蛙笨拙但安全地落回树枝上。

尽管有些失误,这只坚韧的两栖动物重新站稳了脚跟,展示了野生环境中生命的顽强。它毫不气馁,准备进行下一次跳跃,坚定不移。

最后,Huet展示了voiceengine的神奇功能。

他先录了一段自己的语音,然后把刚才Sora生成的树蛙视频发给voiceengine,下一秒,上面那段树蛙视频的长故事,就用他的声音被读了出来!观众们掌声雷动。

然后,这段故事又被VoiceEngine用法语、日语重新读了一遍(感觉翻译的淘汰又近了一步)。

在产品层面,OpenAI已经做到了如此先进的地步,如果再加上Strawberry的推理能力,OpenAI离AGI的实现,恐怕是要很近了。

THE END
1.AIPlus–提供专业的AI服务,AI问答AI写作AI绘画,MidjourneyAI写作 — 写一下AI AI写作神器,写论文、写会议纪要 AI文档、思维导图、文档总结、AI翻译、智能搜索 内置AI工具 内置大量AI快捷工具, 实现快速翻译、润色、 扩缩写、续写、思维导图生成等 AI对话 快捷唤起AI 直接与GPT进行对话 使用当前先进模型 AI对话窗口 http://ai.lansejingyu.com/
2.AI应用之智能体介绍毕昇智能体四、智能体研发 五、AI大模型应用技术栈 六、AI应用展望 一、LLM介绍 LLM (Large LanguageModels) 是指大型语言模型,通常是指像GPT(Generative Pre-trained Transformer)这样的预训练模型,它们能够处理和生成自然语言文本。 LLM 在自然语言处理领域扮演着重要角色,其主要特点是能够学习大规模文本数据的统计规律,并利用https://blog.csdn.net/mzh200801/article/details/138907400
3.AIPlus输入文字即可生成视频。AI Plus在线生成视频,中文版本使用,文字生成视频,图生视频,不限视频数量,生成各类新媒体广告视频,AI人工智能算法,自由创作。 AI Plus的适用人群 【职场人士】营销策划、数据分析、文案撰写、周报月报,满足办公的各种需求,提升工作效率! https://app.mi.com/details?id=com.aiplus.pro
4.AIPlus智能助理安卓版下载AIPlus智能助理手机版下载v1.0.1AIPlus智能助理是一款基于人工智能的聊天写作生成器软件,可快速生成高质量的文章、答案、对话等内容,功能强大且易于操作,能够智能分析用户输入文本并生成相关文章草稿,帮助用户提高写作效率。软件内置多种排版工具和同义词、相关词汇,能够智能组织文章位置,提供精准的排名预测和多种修饰图片的功能,是一款十分实用的辅助写作https://www.juxia.com/sjwy/ruanjian-521387.html
5.写给小白的AI入门科普其次,AI的研究目的,是让一个“系统”具备智能。 这个“系统”,可以是一套软件程序,也可以是一台计算机,甚至是一个机器人。 第三,什么样的水平,才叫做真正的智能。 这是问题的关键。目前看来,能够像人一样感知、理解、思考、判断、决策,就是实现了人工智能。 https://mp.weixin.qq.com/s?__biz=Mzg4MDY5OTgwMw==&mid=2247668114&idx=1&sn=17406d60ca0cd30b722bd2227e944a17&chksm=ce394568847ec9e0ddba5de3adb5e9c370f9cfa29a302f098b5b2dbc972b07918054b56a31b1&scene=27
6.AIPlus之智能助理与服务机器人预约报名AIPlus活动关于AIPlus AI Plus 是促进人工智能融入产品设计和商业创新的交流平台。 通过邀请制主题分享聚会,AI Plus帮助参与者围绕人工智能技术和产品,进行广泛深入探讨,协助科技公司和技术专才、学研机构和投融资企业达成以下目标: 1)嘉宾主题分享,激发产品和商业灵感; https://www.huodongxing.com/event/7396095536500
7.ChatPlusAIenAppStore【ChatPlusAI亮点:实时·自动化·全流程】 - 轻松管理多店铺:多店聚合、多客服管理,支持买家星标,黑名单、自动翻译等; - 智能跟单促转化:从进店咨询开始,催单催付催好评等护航全流程; - AI机器人接待提人效:7X24h在线,实时回复,精准回复买家问题; https://apps.apple.com/mx/app/chatplusai/id1635496522
8.ChatPlusAI(乐聊)Shopee虾皮服务市场ChatPlusAI支持桌面系统Windows和Mac,移动系统iOS和Android. 人工智能技术小语种识别准确率超95%全链路数据诊断 了解更多 服务商信息 公司名称:上海炯信信息科技有限公司 入驻类型:软件服务 入驻时间:2023-01-22https://service.shopeecb.cn/software-support/2005/product-22
9.Mind+软件AI人工智能教程AI人工智能功能介绍Mind+集成了大量各种AI应用,能满足广大中小学老师和创客对于AI人工智能知识学习的各种需求,不管是纯软件应用为主的图像识别、语音识别、文字处理等功能,还是开源硬件中的语音、图像等传感器的控制Mind+都可以轻松玩转。人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和https://mindplus.dfrobot.com.cn/ai
10.知网AI学术研究助手开通试用访问网址:https://aiplus.cnki.net 试用时间:即日起至11月30日 产品简介:CNKI AI学术研究助手(CNKI AI for Academic),是人工智能时代同方知网研发的赋能教育、科研和学习全场景的AI辅助研究工具。AI学术研究助手将专业可信的华知大模型、知网高质量文献与教育科研场景紧密结合,围绕前沿探索、文献研读、成果创作与知识https://lib.shu.edu.cn/info/1023/5444.htm
11.使用深度学习做自动驾驶,“PlusAI”希望在未来1使用人工智能进行自动驾驶的相关研发正在成为下一代解决方案,我们此前报道的comma.ai、Drive.ai、momenta均是使用人工智能、深度学习做L3、L4解决方案的公司。 我近期接触的“PlusAI”也是一家使用深度学习做自动驾驶解决方案的公司,成立于2016年,在美国硅谷、北京、西安设有研发中心。PlusAI与包括斯坦福、西安交大在内https://36kr.com/p/1721587269633
12.如何让人类与人工智能合作来改善业务英语演讲根据波士顿咨询公司和麻省理工大学最近的调查,全球有18%的公司都在推动AI的发展,希望借此盈利。 Those companies focus 80 percent of their AI initiatives on effectiveness and growth, taking better decisions 这些公司80%的人工智能计划都集中在效率和增长上,以做出更好的决策, not replacing humans with AI to https://www.kekenet.com/Article/202006/612840.shtml
13.知网AI学术研究助手CNKI AI学术研究助手 https://aiplus.cnki.net 【使用方法】 打开微信扫码登录AI学术研究助手个人账号后,填写相关信息后自动关联成功。 扫码观看产品演示视频(更多详见CNKI知网同学微信视频号) 【资源简介】 CNKI AI学术研究助手(CNKI AI for Academic),是人工智能时代同方知网研发的赋能教育、科研和学习全场景的AI辅助http://tsg.bsnc.cn/info/1036/2658.htm
14.双语学习大国崛起之——中国人工智能产业蓬勃发展自2000年以来,我国政治、经济、文化不断进步,近年来在大数据时代下,人工智能产业更是蓬勃发展。在11月24日刚刚结束的世界互联网大会·互联网发展论坛上,专家和政府权威人士对于新冠疫情下的人工智能深入剖析,可见未来人工智能领域将会给中国和世界更多惊艳。 https://www.lxplus.com/news/detail_2351.html