大模型工具学习探索

导读大模型已经展示出在复杂场景下调动各类工具以解决复杂任务的能力。其深度的语义理解、广泛的世界知识,以及强大的推理和规划能力,共同使得人工智能在模拟人类使用工具的过程中展现出巨大的潜力。在此背景下,基础模型(FoundationModel)的工具学习(ToolLearning)应运而生,该领域的目标是让基础模型能够根据人类的指示和操作来使用工具,以解决特定任务。然而,无论是从理论研究还是实际应用的角度来看,该领域都面临着众多机遇和挑战。本文将介绍清华大学在工具学习领域的一些重要研究成果,并详细介绍其开源的交互式网页搜索中文问答框架WebCPM、BMTools和AgentVerse工具包。希望这些工作能够帮助读者深化对大模型工具学习领域的理解,同时也欢迎更多的研究者和开发者参与到这些工具包的使用和开发中来,共同推进大模型工具学习范式的发展。

1.工具学习背景(Background)

2.工具学习框架(Framework)

3.工具学习应用(Application)

4.问答环节

编辑整理|王帅

内容校对|李瑶

出品社区|DataFun

01

工具学习背景Background

1.工具与智能(ToolsandIntelligence)

工具是人类能力的延伸,旨在提高生产力和效率,以及解决问题。人与动物本质区别在于工具,人可以非常熟练地创造和使用工具。纵观历史,人类一直是工具发明和操作的主要推动者。

GPT-4等基础模型(FoundationModel)展示了其在理解人类意图、自动化复杂过程、解读多模态信息等方面的巨大潜力。同时也引发了如下问题:人工智能是否可以像人类一样使用工具?

基于大模型、基础模型(FoundationModel),上述问题的回答是Yes!主要原因如下:

上图给出了一些工具学习场景的典型应用:

2.工具学习的分类(CategorizationofToolLearning)

现有工具学习主要可以分为两类,工具增强学习(Tool-augmentedLearning)和工具导向学习(Tool-orientedLearning),其核心差异在于学习过程中,是通过工具执行来增强基础模型(工具为AI服务),还是通过基础模型优化工具的使用(AI为工具服务)。

工具增强学习利用各种工具的执行结果,增强基础模型性能。在这一范式中,工具执行结果被视为辅助生成高质量输出的外部资源。将工具作为额外资源辅助模型生成,如解决大模型生成过程中的时效性不足或事实性不准确的问题。如用户想了解今天Twitter的Trending,大模型可以调用Twitter的API,得到这些Trending后,再进行生成。

02

框架Framework

1.工具学习框架

一个通用的工具学习框架,类似强化学习MDP的架构,包含人类用户角色和四个关键组成部分:工具集、控制器、感知器和环境。

工具学习框架的整体流程始于人类用户,具体如下:

(1)意图理解IntentUnderstanding

在ChatGPT之前更多是NLP场景下的任务,大家的共识是模型理解语言比较困难。ChatGPT出现后,大模型基于InstructionTuning技术,具备了非常强的理解人类指令潜在意图的能力,可依据人的指令去解决真实场景下用户的Query问题。

大模型将NLP任务包装为多种instruction格式,进行大规模有监督的精调(Fine-Tuning),实现从指令空间到模型认知空间映射的学习。上述训练后的大模型具备了在未学习过的指令上的泛化能力,且随着模型的增大,训练数据量的增大及diversity的增强,其泛化能力会越来越强。

工具学习场景下意图理解面临两方面的挑战:

(2)工具理解ToolUnderstanding

在大模型中,除了需要模型对人类指令进行准确理解外,模型对工具的理解同样至关重要。首先,模型需要理解工具的功能;其次,模型需要知道如何在特定的任务中使用这些工具。在ChatGPT出现之前,主要的模式是通过记录人类使用工具的行为,并让模型模拟这些行为以实现工具使用的学习。而随着ChatGPT的出现,我们可以通过PromptLearning,即在Prompt中给出工具的描述,让大模型理解并应用工具。这种基于Prompt的方式目前已经成为大模型使用工具的主流方法。具体Prompting有如下两种:

提供一个描述任务的提示(prompt)来引导模型生成正确的输出。在Prompt中描述API的功能、输入输出格式、传参方式等,使得模型理解API如何使用。如下图,Zero-shotPrompting给出了forecastweatherAPI,描述其功能、返回信息等,然后去解决“下周北京的平均气温是多少”的问题。

优点:不需要为每个新任务重新训练模型,节省了大量的计算资源;并且可以快速适应新任务,只需为任务编写新的提示即可。

缺点:性能通常不如使用特定任务训练数据进行Fine-tuning的方法;且编写有效的提示需要一定的技巧和经验。

不仅给出任务描述性提示,还要直接展示少量(few-shot)的使用工具的示例,模型通过模拟人类的行为,理解如何使用工具。如下图,Few-shotPrompting给出了调用API的示例(如何回答问题—明天上海的温度),然后再让大模型利用API去解决问题。

优点:利用少量示例帮助模型理解任务,提高了模型的性能。比Zero-shotPrompting更灵活,可以应对更多种类的任务。

缺点:需要选择有代表性的示例,这需要一定的专业知识和经验。对于一些复杂的任务,可能需要更多的示例才能达到满意的性能。

(3)规划与推理PlanningandReasoning

大模型除了理解工具和人类的指令,还须具备规划和推理能力。

依据规划与环境是否交互,模型的推理分成两种:

大模型首先生成多个候选答案,然后自评估答案的优劣,最后选择最优的答案。

模型生成一个静态规划(给出未来任务列表),不与环境交互,适用于简单的场景。

如果Prompt指令合理,早期的预训练语言模型(PretrainedLanguageModels)已经具备理解和使用上下文的incontext能力,可将high-level的任务有效地分解为mid-level的规划,而无需进一步的训练。

大模型默认解决方案,不断根据每一步的成败以及环境和人类的反馈,动态跟进该规划,直至整个流程完成。

方案1:

上篇论文通过设定valuefunction限定了模型在每种场景下可做的任务,模型在某一场景下,只在上述的限制任务集合中进行选择,可以保证模型的可执行。

方案2:

可解决多步或多工具场景下的复杂问题的模型

不同工具之间的依赖关系

不同工具并行化执行(模型的生成是流式的)

(4)训练策略TrainingStrategies

大模型下,虽然直接Prompting就可以让模型学会使用工具,但在具备一定数据的特定场景下,进行微调通常都会有收益,除非数据的质量有问题。大模型学习使用工具的方式有两种:

2.WebCPM

(1)WebGPT介绍

2021年12月WebGPT的发布标志着基于网页搜索的问答新范式的诞生,该篇工作(Nakano,Reiichiro,etal."WebGPT:Browser-assistedquestion-answeringwithhumanfeedback."arXivpreprintarXiv:2112.09332(2021))可以算是工具学习领域最早期的工作,其做法为基于人类记录的大量搜索引擎使用的行为数据进行有监督Fine-Tune和强化学习,使得大模型学会使用搜索引擎。该文证明只需6000条数据就可让模型很好地学会如何使用搜索引擎,且能力会超越人类专家。

(2)WebCPM介绍

(3)WebCPM搜索交互界面

(4)WebCPM数据集

WebCPM的数据集包含5500对高质量的问题-答案对以及十万多条真实用户网页搜索行为。

LFQA数据样例特点:

(5)LFQApipeline框架

WebCPM建模包含两类模型:

Action预测模块(预测在该平台的下一个action,大约10个action,建模为一个多分类任务)

Query生成模块(生成搜索的query,用文本生成来实现,P(Qt+1|St))

Fact抽取模块(对当前页面抽取摘要)

(6)整体pipeline评测

WebCPM工作是在ChatGPT3.5发布之前,当时的基础模型与ChatGPT还是有一定的差距,随着CPM模型的改进,当前内部测试发现可以远超人类水平。

3.其他工作

(1)WebShop

大模型如何学会使用亚马逊购物网站?可以类似搜索引擎,构建WebShop:

(2)Toolformer

WebCPM和WebShop都需要让大模型学习大量人类标注数据,如何让大模型可以触类旁通学习,降低人类标注成本或降低人类的参与度?

动机:

方法:

步骤:

给定一个纯文本数据集,构建出一个带有API调用的数据集,然后在此数据集上做微调

Toolformer这项工作展示了大模型具备很强的自学的能力,大模型可自主学习工具,并可不断提升工具使用的能力。

(3)ToolCreation

在证实大模型可以使用工具后,我们的ToolCreation工作在整个领域首先提出了模型作为工具创造者的想法。在21世纪之前,通常认为人类是工具创造和使用的主要主体,而基础模型的出现可能颠覆这一观念,创造工具不再是人类专有的能力。

每个任务其实最好都是能用工具解决,现实场景下不一定存在最适合解决该任务的工具,可以通过大模型生成解决该任务的工具。人类创造的工具都是为人类设计,为人类设计的工具不一定是最好的,大模型可以定义更加适合自己的工具接口,该接口不一定适合人类使用。通过初步验证,大模型可以将一个简单工具API升级为具有更好功能的工具,基础模型可能具有自发创造工具的潜力。

所以我们提了这样一个框架,给定任何一个query,我们会让模型先去做一遍工具的生成。具体包含四个步骤:creation、Decision、Execution、Rectification。

这个过程会持续进行,直到模型创造出一个能够有效解决当前任务的工具,就可以跳出这个循环。这种设计使模型具有了持续学习和自我优化的能力,从而提升了其解决问题的效率和效果。

通过实验发现增加工具生成,使得解决实际任务的能力增强,相较PoT和CoT都有显著的提升。

工具的创造过程从本质上说是降低了后续任务的难度。如果只有一个质量很差的工具,那么可能需要付出巨大的精力才能使用这个工具来解决一个复杂的任务。所以,从这个角度出发,引出我们工作的核心理念:先创造工具,再用这个工具去解决任务。

03

应用Application

1.开源平台BMTools

(1)ChatGPT插件

OpenAI发布了支持联网、解决数学计算的插件ChatGPTPlugins,被称为OpenAI的“AppStore”。然而,由于目前其仅支持部分OpenAIPlus用户,大多数开发者仍然无法使用。

(2)BMTools介绍

为解决这个痛点,我们推出了BMTools工具学习包,一个基于语言模型的开源可扩展工具学习平台。

我们将各种调用流程统一到一个框架上,使整个工具调用流程标准化、自动化。开发者可通过BMTools,使用给定的模型(ChatGPT、GPT4)调用多种工具接口,实现特定任务或功能。

BMTools具有如下一些特性:

2.ToolBench

ToolBench项目,可以帮助开发者构建开源、大规模、高质量的指令调优数据,促进构建具有通用工具使用能力的大语言模型。

ToolBench工具包特性如下:

构建过程:

ToolBench基于BMTools,在有监督数据中训练大语言模型。所有的数据都是由OpenAIAPI自动生成并由开发团队进行过滤,数据的创建过程很容易扩展。

ToolLLaMA

通过ChatGPT对LLaMA和ChatGPT的答案和工具使用链进行自动评估。

评估结果如下(分数越高越好),ToolLLaMA在不同场景下与ChatGPT的性能相同或更好。

3.工具学习必读PaperList

04

问答环节

Q1:WebCPM是否针对网络中网页搜索质量低,进行搜索结果过滤等设计?

A1:WebCPM针对页面低质量搜索内容进行了过滤。

Q2:在不同语言上的效果如何,例如在中文任务上的效果怎么样?

A2:WebCPM背后的基础模型CPM是由面壁智能与OpenBMB开源社区开发的百亿参数中文语言模型,占据多个中文领域语言模型排行榜前列。

Q3:WebCPM和WebGLM的区别?

WebGLM则是一个基于大语言模型(LLM)的联网问答聊天机器人,其工作流程是固定且流程化的,包括搜索、页面检索、页面信息摘取和总结等步骤。这一框架为进一步提升每一步骤的能力提供了极好的基础,随着每一步骤能力的增强,最终的模型效果有可能超越现有的大模型。

INTRODUCTION

秦禹嘉

清华大学

博士生

秦禹嘉,男,清华大学计算机系2020级直博生。主要研究方向为大规模语言模型的高效预训练与下游智能化应用,曾在ACL、NAACL、EMNLP、ICLR、NeurIPS等会议发表多篇一作论文。

THE END
1.比较好用的学习工具网站推荐学习工具推荐网比较好用的学习、工具网站推荐 如果大家有什么比较好用的网站,在评论区评出来哦,一起进步!!嘻嘻!! 英语学习 1、作文语法批改 https://www.gingersoftware.com/grammarcheck 1 2、英语语法修改 https://www.grammarly.com/ 1 3、英语语法修改 https://www.nounplus.net/grammarcheck/https://blog.csdn.net/weixin_45552475/article/details/124323754
2.免费自学网站有哪些?值得收藏的学习网站推荐→MAIGOO知识普特英语听力网:提供英语学习免费教程,英语学习资讯,英语考试资料,英语学习资源,英语学习工具,英语学习方法,英语四六级资料,英语学习资料。【官网链接】 学UI设计的网站 腾讯CDC:关注互联网视觉设计、交互设计、用户研究、前端开发。【官网链接】 花瓣网:用于素材收集,是非常棒的素材库。【官网链接】 https://www.maigoo.com/goomai/232416.html
3.跳出CSDN,十大优质编程学习网站推荐在学习的过程中,如何将这些平台结合起来形成有效的学习策略是至关重要的。可以从基础知识入手,逐渐过渡到实战项目,通过不断的练习和反馈提升编程能力。 除了推荐这些优质网站,了解当前AI技术的发展也不可忽视。如今,AI绘画和AI写作等工具的崛起正重新定义创作的方式。例如,AI绘画工具能够通过简单的指令生成复杂的艺术作品https://m.sohu.com/a/807255960_121798711/
4.推荐几个稀奇古怪功能学习工具网站,太好用了!今天就推荐几个有趣实用工具网站,图像编辑工具,编程学习网址,招聘职位自动生成网站等;想要什么搜什么~省时省力文章末尾有获取方式 橡皮擦 一句话:是一个免费实用的图片在线编辑工具 简洁明了:该网站通常设计简洁,无广告干扰,用户能够轻松找到所需功能并进行操作。 http://m.blog.itpub.net/70041388/viewspace-3041527/
5.推荐130个特别良心的学习网站heiheidou导航页(工具集) 世界各国网址大全: http://www.world68.com/ 小森林导航:http://www.xsldh6.com/ 简捷工具:http://www.shulijp.com/ NiceTool.net 好工具网:http://www.nicetool.net/ 现实君工具箱(综合型在线工具集成网站):http://tool.uixsj.cn/ https://www.cnblogs.com/itheidou/p/13832835.html
6.免费英语词典+学习工具推荐以后有添加都会放进Hey!English这个豆列,欢迎关注。也欢迎在这篇日记留言好用好玩的工具,我会放进豆列,一起进步。 感觉有用,先点赞再收藏吧!这样才能让更多人看到噢? END. 快要长草的微博:@白小天呀 偶尔更新游记攻略&胡思乱想的公众号:卡宾的屋(hicabin) 英语英语学习留学读书https://www.douban.com/note/701501947/
7.括号315括号315(kh315.com)是一个AI工具推荐和AI学习网站,为您提供AI写作、AI绘画、AI办公、AI视频等AI工具推荐,AI创作、AI深度学习、AI提示词创建等学习教程,是学习使用AI不可或缺的网站。http://www.kh315.com/
8.5个超好用的AI工具网站推荐功能!极其强大使用却很简单!对于初次接触 AI 工具网站的用户来说,推荐大家从「即时 AI」开始使用,一个是因为这是国内开发的 AI 软件,使用起来更流畅稳定;另一个是因为这款软件的学习成本较低,界面简单易操作,全中文的系统也方便用户理解,能够更好、更快地实现熟练操作,从而让 AI 工具更好地服务于我们的生活和工作。这款工具在线就能免费https://js.design/special/article/ai-tools-website.html
9.实用精选!25个设计师必收的超实在设计与工具网站优设网高素质的网页模板,更加有效的项目管理工具,丰富的设计灵感来源,实用可靠的生产力工具,这些都能从不同的层面加速你的网页设计项目。也许今天推荐的网站和工具中,有不少你听说过,甚至已经开始使用了,但是有些可能是你一直在搜索的。 学习资料 The UDX Book https://www.uisdc.com/25-awesome-resources-for-designers/
10.130个常用的学习网站,建议收藏!今天推荐一些学习资源给大家,当然大家可以留言评论自己发现的优秀资源地址。 搞学习 找书籍 冷知识 / 黑科技 写代码 资源搜索 小工具 导航页(工具集) 看视频 学设计 搞文档 找图片 搞学习 TED(最优质的演讲):https://www.ted.com/ 谷粉学术:https://gfsoso.99lb.net/scholar.html https://www.jianshu.com/p/8e9fb9c6ea43
11.学习工具[新东方]教育头条官网教育资讯[新东方]教育头条是一个专业教育资讯平台,主要提供英语、考研、四六级、留学、托福、雅思、GRE、GMAT、SAT、ACT等各类考试辅导及其最新教育新闻资讯,力争为不同受众提供专业的教育服务。http://tool.xdf.cn/
12.金三银四跳槽季,为了年后offer,我竟然撸完了这50场1000多道面经三,学习工具推荐 1. 写博客是很好的习惯,各大博客网站多看多想 2. 每个知识点掰开揉碎要讲的东西很多,不能浅尝辄止。 3. 看书很重要,知识体系会有一个完整的整合过程。 基本好书可以多看几遍,比如一些经典教材,深入理解JVM,Effective Java,java并发和深入剖析tomcat,图解系列,MySQL技术内幕,从paxos到zk一致性,有https://maimai.cn/article/detail?fid=1589559958&efid=HMnVzUsEaNASGCiWLCQB4Q
13.爱资料工具爱资料工具(toolnb.com),为开发运维提供全面的在线工具箱,已开发工具400款,包含开发工具,运维工具,常用工具,SEO站长工具等,是好用,方便的在线工具网站.https://www.toolnb.com/
14.推荐27个在线学习WordPress资源网站最适合:希望获得建立和优化 WordPress 网站的全面资源的初学者和小企业主。 学习风格:以教程为主导,结合实用指南、比较和工具,为网站创建过程提供支持。 19. WPCrafter.com视频 通过实践视频教程直观地学习 WordPress。 WPCrafter.com提供适合初学者的分步视频指南,让您轻松有趣地掌握WordPress。 https://www.wbolt.com/learn-wordpress.html
15.regex101正则表达式在线测试学习工具Regular expression tester with syntax highlighting, explanation, cheat sheet for PHP/PCRE, Python, GO, JavaScript, Java, C#/.NET, Rust.https://regex101.com/
16.1纳米学习网站导航探索生物科技价值的新媒体门户网站 数学中国 数学建模网络平台 沐风网 免费CAD教程网 【学习工具】大学生更多? Notion 综合性笔记和项目管理工具 Evernote 强大的笔记和知识管理工具 Quizlet 提供学习卡片和自测功能的学习工具 Todoist 简单易用的任务管理工具 http://www.1nami.com/
17.阿里云开发者社区:服务于云开发者的学习成长交流平台Claude AI 是一款强大的对话式 AI 工具 ,但由于网络限制等原因 ,国内用户访问 Claude 的官方网站或使用集成 Claude 的第三方应用可能会遇到困难 283 2 2 大模型服务小助手 | 1月前 | 机器学习/深度学习 API Python | 博文 | 来自: 阿里云百炼 阿里云百炼上线Qwen2.5-Turbo模型,可支持100万超长上https://developer.aliyun.com/
18.程序员:推荐六个国外高质量的技术网站,大神必备!多语言支持:VisuAlgo网站支持多种语言,包括英语、中文、马来语等,用户可以根据自己的语言习惯选择相应的语言进行学习。 算法可视化工具:VisuAlgo网站还提供了一些算法可视化工具,如图形算法工具、字符串算法工具等,帮助用户更加深入地了解算法和数据结构的应用场景和实际应用。 https://cloud.tencent.com/developer/article/2333667
19.收藏史上最全最实用的运营工具库,你想要的都在!这阵子,我抱着复盘的心态,认认真真整理了1年来我用过的所有运营工具、网站,结果我特么又惊呆了。 我总共整理了21类运营工具,共163个网站、素材、APP 依次包括: 1、微信公众号排版类 2、微信公众号第三方运营工具类 4、互联网运营学习、营销类网站 https://www.niaogebiji.com/article-18192-1.html
20.菜鸟教程菜鸟教程(www.runoob.com)提供了编程的基础技术教程, 介绍了HTML、CSS、Javascript、Python,Java,Ruby,C,PHP , MySQL等各种编程语言的基础知识。 同时本站中也提供了大量的在线实例,通过实例,您可以更好的学习编程。..http://runoob.com/
21.单词卡学习工具和课本解答QuizletQuizlet是一款人工智能支持的学习工具,能让您学习任何知识。今天就开始利用我们的在线教学卡片、游戏和专家编写的解答进行学习。https://quizlet.com/
22.2024年12款国内网课平台/App推荐练习: 海量真题试卷,个性化推荐练习,智能分析薄弱点,同步复习全覆盖。 学习小工具:单词查询、计算器、语文作文、英语作文、古文助手等实用小工具众多,使学习更有效率。 高途课堂 图片来自于gaotu100.com,版权属于原作者 网站地址:https://www.gaotu100.com/ https://www.extrabux.cn/chs/guide/6435200
23.25个ai智能写作网站全盘点,300%解放内容生产力!Closers Copy是一款不使用 GPT-3 的 AI 编写软件,GPT-3 是许多其他解决方案青睐的机器学习模型。根据他们的网站,“这些模型没有接受过撰写营销文案的训练。Closers Copy 提供了一个 Facebook 社区和课程来学习他们的工具。 特点 协作——金额取决于你购买的等级 https://boardmix.cn/article/ai-writing-websites/