大模型工具学习探索

导读大模型已经展示出在复杂场景下调动各类工具以解决复杂任务的能力。其深度的语义理解、广泛的世界知识,以及强大的推理和规划能力,共同使得人工智能在模拟人类使用工具的过程中展现出巨大的潜力。在此背景下,基础模型(FoundationModel)的工具学习(ToolLearning)应运而生,该领域的目标是让基础模型能够根据人类的指示和操作来使用工具,以解决特定任务。然而,无论是从理论研究还是实际应用的角度来看,该领域都面临着众多机遇和挑战。本文将介绍清华大学在工具学习领域的一些重要研究成果,并详细介绍其开源的交互式网页搜索中文问答框架WebCPM、BMTools和AgentVerse工具包。希望这些工作能够帮助读者深化对大模型工具学习领域的理解,同时也欢迎更多的研究者和开发者参与到这些工具包的使用和开发中来,共同推进大模型工具学习范式的发展。

1.工具学习背景(Background)

2.工具学习框架(Framework)

3.工具学习应用(Application)

4.问答环节

编辑整理|王帅

内容校对|李瑶

出品社区|DataFun

01

工具学习背景Background

1.工具与智能(ToolsandIntelligence)

工具是人类能力的延伸,旨在提高生产力和效率,以及解决问题。人与动物本质区别在于工具,人可以非常熟练地创造和使用工具。纵观历史,人类一直是工具发明和操作的主要推动者。

GPT-4等基础模型(FoundationModel)展示了其在理解人类意图、自动化复杂过程、解读多模态信息等方面的巨大潜力。同时也引发了如下问题:人工智能是否可以像人类一样使用工具?

基于大模型、基础模型(FoundationModel),上述问题的回答是Yes!主要原因如下:

上图给出了一些工具学习场景的典型应用:

2.工具学习的分类(CategorizationofToolLearning)

现有工具学习主要可以分为两类,工具增强学习(Tool-augmentedLearning)和工具导向学习(Tool-orientedLearning),其核心差异在于学习过程中,是通过工具执行来增强基础模型(工具为AI服务),还是通过基础模型优化工具的使用(AI为工具服务)。

工具增强学习利用各种工具的执行结果,增强基础模型性能。在这一范式中,工具执行结果被视为辅助生成高质量输出的外部资源。将工具作为额外资源辅助模型生成,如解决大模型生成过程中的时效性不足或事实性不准确的问题。如用户想了解今天Twitter的Trending,大模型可以调用Twitter的API,得到这些Trending后,再进行生成。

02

框架Framework

1.工具学习框架

一个通用的工具学习框架,类似强化学习MDP的架构,包含人类用户角色和四个关键组成部分:工具集、控制器、感知器和环境。

工具学习框架的整体流程始于人类用户,具体如下:

(1)意图理解IntentUnderstanding

在ChatGPT之前更多是NLP场景下的任务,大家的共识是模型理解语言比较困难。ChatGPT出现后,大模型基于InstructionTuning技术,具备了非常强的理解人类指令潜在意图的能力,可依据人的指令去解决真实场景下用户的Query问题。

大模型将NLP任务包装为多种instruction格式,进行大规模有监督的精调(Fine-Tuning),实现从指令空间到模型认知空间映射的学习。上述训练后的大模型具备了在未学习过的指令上的泛化能力,且随着模型的增大,训练数据量的增大及diversity的增强,其泛化能力会越来越强。

工具学习场景下意图理解面临两方面的挑战:

(2)工具理解ToolUnderstanding

在大模型中,除了需要模型对人类指令进行准确理解外,模型对工具的理解同样至关重要。首先,模型需要理解工具的功能;其次,模型需要知道如何在特定的任务中使用这些工具。在ChatGPT出现之前,主要的模式是通过记录人类使用工具的行为,并让模型模拟这些行为以实现工具使用的学习。而随着ChatGPT的出现,我们可以通过PromptLearning,即在Prompt中给出工具的描述,让大模型理解并应用工具。这种基于Prompt的方式目前已经成为大模型使用工具的主流方法。具体Prompting有如下两种:

提供一个描述任务的提示(prompt)来引导模型生成正确的输出。在Prompt中描述API的功能、输入输出格式、传参方式等,使得模型理解API如何使用。如下图,Zero-shotPrompting给出了forecastweatherAPI,描述其功能、返回信息等,然后去解决“下周北京的平均气温是多少”的问题。

优点:不需要为每个新任务重新训练模型,节省了大量的计算资源;并且可以快速适应新任务,只需为任务编写新的提示即可。

缺点:性能通常不如使用特定任务训练数据进行Fine-tuning的方法;且编写有效的提示需要一定的技巧和经验。

不仅给出任务描述性提示,还要直接展示少量(few-shot)的使用工具的示例,模型通过模拟人类的行为,理解如何使用工具。如下图,Few-shotPrompting给出了调用API的示例(如何回答问题—明天上海的温度),然后再让大模型利用API去解决问题。

优点:利用少量示例帮助模型理解任务,提高了模型的性能。比Zero-shotPrompting更灵活,可以应对更多种类的任务。

缺点:需要选择有代表性的示例,这需要一定的专业知识和经验。对于一些复杂的任务,可能需要更多的示例才能达到满意的性能。

(3)规划与推理PlanningandReasoning

大模型除了理解工具和人类的指令,还须具备规划和推理能力。

依据规划与环境是否交互,模型的推理分成两种:

大模型首先生成多个候选答案,然后自评估答案的优劣,最后选择最优的答案。

模型生成一个静态规划(给出未来任务列表),不与环境交互,适用于简单的场景。

如果Prompt指令合理,早期的预训练语言模型(PretrainedLanguageModels)已经具备理解和使用上下文的incontext能力,可将high-level的任务有效地分解为mid-level的规划,而无需进一步的训练。

大模型默认解决方案,不断根据每一步的成败以及环境和人类的反馈,动态跟进该规划,直至整个流程完成。

方案1:

上篇论文通过设定valuefunction限定了模型在每种场景下可做的任务,模型在某一场景下,只在上述的限制任务集合中进行选择,可以保证模型的可执行。

方案2:

可解决多步或多工具场景下的复杂问题的模型

不同工具之间的依赖关系

不同工具并行化执行(模型的生成是流式的)

(4)训练策略TrainingStrategies

大模型下,虽然直接Prompting就可以让模型学会使用工具,但在具备一定数据的特定场景下,进行微调通常都会有收益,除非数据的质量有问题。大模型学习使用工具的方式有两种:

2.WebCPM

(1)WebGPT介绍

2021年12月WebGPT的发布标志着基于网页搜索的问答新范式的诞生,该篇工作(Nakano,Reiichiro,etal."WebGPT:Browser-assistedquestion-answeringwithhumanfeedback."arXivpreprintarXiv:2112.09332(2021))可以算是工具学习领域最早期的工作,其做法为基于人类记录的大量搜索引擎使用的行为数据进行有监督Fine-Tune和强化学习,使得大模型学会使用搜索引擎。该文证明只需6000条数据就可让模型很好地学会如何使用搜索引擎,且能力会超越人类专家。

(2)WebCPM介绍

(3)WebCPM搜索交互界面

(4)WebCPM数据集

WebCPM的数据集包含5500对高质量的问题-答案对以及十万多条真实用户网页搜索行为。

LFQA数据样例特点:

(5)LFQApipeline框架

WebCPM建模包含两类模型:

Action预测模块(预测在该平台的下一个action,大约10个action,建模为一个多分类任务)

Query生成模块(生成搜索的query,用文本生成来实现,P(Qt+1|St))

Fact抽取模块(对当前页面抽取摘要)

(6)整体pipeline评测

WebCPM工作是在ChatGPT3.5发布之前,当时的基础模型与ChatGPT还是有一定的差距,随着CPM模型的改进,当前内部测试发现可以远超人类水平。

3.其他工作

(1)WebShop

大模型如何学会使用亚马逊购物网站?可以类似搜索引擎,构建WebShop:

(2)Toolformer

WebCPM和WebShop都需要让大模型学习大量人类标注数据,如何让大模型可以触类旁通学习,降低人类标注成本或降低人类的参与度?

动机:

方法:

步骤:

给定一个纯文本数据集,构建出一个带有API调用的数据集,然后在此数据集上做微调

Toolformer这项工作展示了大模型具备很强的自学的能力,大模型可自主学习工具,并可不断提升工具使用的能力。

(3)ToolCreation

在证实大模型可以使用工具后,我们的ToolCreation工作在整个领域首先提出了模型作为工具创造者的想法。在21世纪之前,通常认为人类是工具创造和使用的主要主体,而基础模型的出现可能颠覆这一观念,创造工具不再是人类专有的能力。

每个任务其实最好都是能用工具解决,现实场景下不一定存在最适合解决该任务的工具,可以通过大模型生成解决该任务的工具。人类创造的工具都是为人类设计,为人类设计的工具不一定是最好的,大模型可以定义更加适合自己的工具接口,该接口不一定适合人类使用。通过初步验证,大模型可以将一个简单工具API升级为具有更好功能的工具,基础模型可能具有自发创造工具的潜力。

所以我们提了这样一个框架,给定任何一个query,我们会让模型先去做一遍工具的生成。具体包含四个步骤:creation、Decision、Execution、Rectification。

这个过程会持续进行,直到模型创造出一个能够有效解决当前任务的工具,就可以跳出这个循环。这种设计使模型具有了持续学习和自我优化的能力,从而提升了其解决问题的效率和效果。

通过实验发现增加工具生成,使得解决实际任务的能力增强,相较PoT和CoT都有显著的提升。

工具的创造过程从本质上说是降低了后续任务的难度。如果只有一个质量很差的工具,那么可能需要付出巨大的精力才能使用这个工具来解决一个复杂的任务。所以,从这个角度出发,引出我们工作的核心理念:先创造工具,再用这个工具去解决任务。

03

应用Application

1.开源平台BMTools

(1)ChatGPT插件

OpenAI发布了支持联网、解决数学计算的插件ChatGPTPlugins,被称为OpenAI的“AppStore”。然而,由于目前其仅支持部分OpenAIPlus用户,大多数开发者仍然无法使用。

(2)BMTools介绍

为解决这个痛点,我们推出了BMTools工具学习包,一个基于语言模型的开源可扩展工具学习平台。

我们将各种调用流程统一到一个框架上,使整个工具调用流程标准化、自动化。开发者可通过BMTools,使用给定的模型(ChatGPT、GPT4)调用多种工具接口,实现特定任务或功能。

BMTools具有如下一些特性:

2.ToolBench

ToolBench项目,可以帮助开发者构建开源、大规模、高质量的指令调优数据,促进构建具有通用工具使用能力的大语言模型。

ToolBench工具包特性如下:

构建过程:

ToolBench基于BMTools,在有监督数据中训练大语言模型。所有的数据都是由OpenAIAPI自动生成并由开发团队进行过滤,数据的创建过程很容易扩展。

ToolLLaMA

通过ChatGPT对LLaMA和ChatGPT的答案和工具使用链进行自动评估。

评估结果如下(分数越高越好),ToolLLaMA在不同场景下与ChatGPT的性能相同或更好。

3.工具学习必读PaperList

04

问答环节

Q1:WebCPM是否针对网络中网页搜索质量低,进行搜索结果过滤等设计?

A1:WebCPM针对页面低质量搜索内容进行了过滤。

Q2:在不同语言上的效果如何,例如在中文任务上的效果怎么样?

A2:WebCPM背后的基础模型CPM是由面壁智能与OpenBMB开源社区开发的百亿参数中文语言模型,占据多个中文领域语言模型排行榜前列。

Q3:WebCPM和WebGLM的区别?

WebGLM则是一个基于大语言模型(LLM)的联网问答聊天机器人,其工作流程是固定且流程化的,包括搜索、页面检索、页面信息摘取和总结等步骤。这一框架为进一步提升每一步骤的能力提供了极好的基础,随着每一步骤能力的增强,最终的模型效果有可能超越现有的大模型。

INTRODUCTION

秦禹嘉

清华大学

博士生

秦禹嘉,男,清华大学计算机系2020级直博生。主要研究方向为大规模语言模型的高效预训练与下游智能化应用,曾在ACL、NAACL、EMNLP、ICLR、NeurIPS等会议发表多篇一作论文。

THE END
1.学习工具沪江学习工具专题提供移动互联学习App,沪江App-移动互联,精彩学习人生!http://m.hujiang.com/app/?source=pc
2.学习工具图片大全学习工具高清图片下载蓝色的桌子上摆放着各种各样的学习工具顶部视图 knolling 平面布置的工作区办公桌风格设计学校和办公用品与复制空间绿松石蓝彩色纸张背景最小的风格。女性博客社交媒体模板 绿色背景上的各种学习工具平躺学校用品组成 白色宣传教育简约中性笔大条纹笔记背景图片 https://www.51miz.com/so-tupian/178942.html
3.学习工具教日语,我们是专业的 登录 能力测试 五十音图 刷题程序 能力测验https://www.xmjriyu.com/index/study_tool/
4.学习工具什么是学习工具? 学习工具是各种平台提供的一组包容性功能,可帮助所有学习者阅读、写作、数学和交流。 探索其他包容性课堂资源: 为学生提供包容性写作工具 (交互式培训) 辅助功能学习网络研讨会:包容性课堂学习工具 (Microsoft 教师中心课程) 为每位学生提供包容性课堂 https://support.microsoft.com/zh-cn/office/eff7f7e3-7e21-42f0-a6f1-da7027f98261
5.学习工具是什么意思学习工具的翻译音标读音用法例句学习工具 释义 aid to learning 学习工具;https://www.iciba.com/%E5%AD%A6%E4%B9%A0%E5%B7%A5%E5%85%B7/
6.学习工具推荐软件学习工具推荐软件是当今教育产业中的一个热门话题。随着移动互联网的快速发展,越来越多的学生和教师开始使用各种学习工具软件来辅助学习和教学。本文将介绍一些热门的学习工具推荐软件,并分析它们的特点和优势。 我们将介绍几个常用的学习工具推荐软件。其中之一是Quizlet,它是一个非常受欢迎的学习工具软件,可以帮助学生背http://www.gdjyzb.com/jyzb/28.html
7.学习工具软件哪个好学习工具应用app下载学习工具软件排行榜爪游控学习工具专区为用户提供海量学习工具应用app下载,学习工具软件哪个好,学习工具软件排行榜,找好用的学习工具应用就到爪游控下载。https://www.zhuayoukong.com/softtags/20597_3.html
8.学习小工具学习小工具 拼音速读练习 [语文] 学习语文必经之路 进入 成语大全 [语文] 成语大全,成语词典,包含3万多条成语记录…成语查询服务提供模糊查找,指定位置查找,接龙 进入 口算练习 [数学] 加、减、乘、除口算题库,提高正确率和口算速度 进入 反义词 [语文] https://www.boledao.com/
9.学习管理工具下载学习管理(Knowledge Management) 的指利用管理学的方法,通过计划、组织、领导、控制等手段,把学习程序化,流程化,规范化,创建更新最佳方案 , 从而达到高效学习的目的。这里整合了多种学习管理的工具,供大家选择。想了解更多国内外最新的绿色免费软件,下载更多内容,尽在华军软件下载! https://m.onlinedown.net/tag/104778.htm
10.线上教育学习方法工具网站APP一网打尽,一定有你想找的因为疫情,教师的教学方式,学生的学习模式,都从原来传统单一的课堂教学,变成了基于网络的“空中课堂”,这需要我们不断学习、筛选利用网络资源和工具。即使疫情结束后,在教学中也可以利用这些资源,更好地达到教学目的。 现在是互联网社会,网络已经深入我们的生活和学习,只要愿意,网上的资源无穷无尽,关键是如何选择。资源https://www.jianshu.com/p/fb0fe4c11691
11.2024年国外最适合学习用的20个AI工具在本文中,我从2023年国外500多种AI工具中挑出最适合学习用的20 个AI 工具,这些工具可以自动化流程、分析数据、做出预测并协助完成不同的任务,最终帮助学习者在学业上取得成功。 最适合学习用的 20 个 AI 工具 人工智能工具可以通过各种方式帮助学生提高学习和学习成绩,例如个性化学习、辅导和家庭作业帮助、语言学习、http://www.360doc.com/content/24/0323/17/5315_1118118846.shtml
12.10个远程教育工具推荐,随心学习不受限在当今快节奏的社会中,远程教育工具正以其卓越的创新和便捷性引起了广泛关注。这些远程教育工具为教育者们和学习者们提供了一种全新的教学或学习方式,打破了传统教育的束缚,让教育变得更加自由灵活。本篇文章将介绍10种远程教育的软件,助力教学变得更加简单快捷! https://boardmix.cn/article/10-distance-education-tools/
13.2024年宁夏教师招聘学习策略的分类4.学习工具的利用 善于利用参考资料、工具书、电脑与网络等。 5.社会资源的利用 善于利用老师的帮助以及通过同学间的合作与讨论来加深对内容的理解。 学习策略的目的就是帮助学习者控制学习的信息加工系统,以便有效地储存和提取信息。它伴随着学习者的学习过程而发生的一种心理活动,这种心理活动是一种对学习过程的安排https://nx.offcn.com/html/2024/02/128514.html
14.2022/2023学年第二学期《军事理论》课程学习指导书2、学习平台或学习工具的使用(操作)方法: 电脑端:http://bucea.fanya.chaoxing.com/portal 手机端①应用市场搜索“超星学习通”,下载并安装; ②浏览器访问链接 http://app.chaoxing.com/,下载并安装App; ③微信扫描下面的二维码,请选择在浏览器打开,并下载。 https://wzb.bucea.edu.cn/jljx/5667d50886cd4d8aa350d8016d265567.htm
15.7个学生必备学习工具APP[1] 7个学生必备学习工具APP(上) 3964播放 05:16 [2] 7个学生必备学习工具APP(下) 3103播放 待播放 为你推荐 01:32 舞蹈初学者必学步伐详细动作分解教程 808播放 01:30 新手学插花课程-餐桌花的搭配及插花 2381播放 15:08 学生必看!俞敏洪讲的学习方法真的很 10.3万播放 02:54 【https://open.163.com/newview/movie/free?pid=QIAL6N2R9&mid=PIAL6N33C
16.所有的青少年都应该知道有关学习障碍的事实不仅仅需要讲义,他们还需要有意义的视觉材料,如多感官学习工具和灵活的测试方法,这些方法可以让学生以他们觉得舒服的方式展示他们所学到的东西。 有学习障碍的学生需要差异化的教学 众所周知,所有的学生都需要各种各样的学习材料和更多的时间来处理信息。他们还需要老师对他们的个人学习风格做出更积极的回应。在特殊教育https://www.chunyuyisheng.com/pc/topic/518798/
17.希沃学习机全新发布,引领线上学习新方式深耕教育行业多年,希沃无疑更了解老师、学生、家长对学习工具的需求,相信这款学习机的面世,也能够真正帮助孩子提升网课学习效果,在未来的学习中,陪伴孩子不断进步。https://www.seewo.com/article/detail/507
18.完全基于Java的开源深度学习平台,亚马逊的大佬带你上手为了简化 Java 开发人员在深度学习上的痛点,我们推出了 DJL 未来实验室计划:致力于打造一个极简的 Java 运行环境,创造属于 Java 自己的深度学习工具箱。你可以轻松在线使用,或者离线使用它们来构建你的深度学习应用。我们的目标是,将深度学习更好的贴近 Java 开发者。 https://cloud.tencent.com/developer/article/1824152
19.工具类app排行榜软件大全工具类app排行榜推荐下载PP助手为您提供工具类app排行榜大全推荐,在这里我们为您提供工具类app排行榜软件下载资源,工具类app排行榜安卓版本、官方版本&老版本下载地址合集,还可查阅相关工具类app排行榜攻略大全,欢迎到PP助手下载。https://wap.pp.cn/topic/493911/