NeurIPS2024大模型知识表示的“知识回路”假说,深入理解大模型的知识机理显式实验神经网络

尽管大模型在常识理解、科学知识运用以及推理决策能力等方面展现出显著潜力,但仍存在如幻觉等知识偏差问题。这些问题引发了关于大模型知识表示、存储和处理机制的深入探讨:大模型的知识处理方式是否类似于人脑?其能力是否可能超越人类?

知识图谱通过符号化方式显式描绘实体与概念之间的关系,而语言模型则依赖神经网络和注意力机制隐式连接知识元素。以多跳推理为例,知识图谱提供可解释且可控的显式推理路径,而语言模型则通过隐含在参数空间中的注意力权重寻找答案,因而在解释性和可靠性方面存在不足。

为进一步探究大模型的知识处理机制,本文提出了“大模型知识表示的‘知识回路’(KnowledgeCircuits)假说”。该假说认为,大模型在处理知识时,实体、概念和关系通过参数激活逐步构成闭合回路,从而为构建更可靠、可控且安全的大模型知识学习框架和方法提供新的思路。

一、引言

尽管大模型在常识、科学知识的理解及推理决策能力等方面已展示出较强的潜力,其仍面临幻觉等知识谬误问题,由此引发了一系列对大模型知识表示、存储和处理机理的深入探讨:大型模型的知识处理方式是否与人脑相似?其能力是否能超越人类?

知识图谱通过符号表示明确刻画实体和概念间的关系,而语言模型则依赖神经网络和注意力机制隐式关联知识元素。以多跳推理为例,知识图谱提供可解释、可控的显式路径,而语言模型在隐式参数空间中依赖注意力等权重找到答案,导致解释性和可靠性不足。

为深入理解大模型的知识机理,本文被提出大模型知识表示的“知识回路”(KnowledgeCircuits)假说,认为大模型知识处理过程中的实体、概念和关系是通过参数激活逐步形成闭合回路,以助于发展更可靠、可控、安全的大模型知识学习架构和方法。

二、大模型的知识回路发现

回路的定义

“回路”是指在神经网络模型中执行特定任务的一个可解释子图。目前,语言模型主要采用Transformer架构,可将其视为一个有向无环图G。每个Transformer层包含多头注意力机制和前馈神经网络(MLP),并且每一层都是一个多头注意力机制和一个前馈网络的组合。

考虑一个注意力头(位于第l层的第j个注意力头),它对前一层的残差流进行操作。设,其中I表示输入嵌入,注意力头可被视为处理所有前层注意力头和MLP及输入嵌入的累积输出。

同样,MLP节点处理所有前层的注意力头、MLP和输入嵌入的累积输出,输出节点O则处理输入嵌入和所有注意力头及MLP的输出。Transformer模型中的残差连接可以用以下公式表示:

我们专注于回答事实上的开放领域问题的任务,目标是预测给定主题-关系对(s,r)的目标实体o。知识三元组k=(s,r,o)通常以自然语言提示的形式呈现给模型,用于下一个标记预测(例如,“法国的官方语言是____”)。

在回路的构建中,对于原始模型中的计算图的每一条边,我们计算了从计算图中删除该边后,语言模型预测o的Logits与移除之前的差异,如果对于预测性能影响在Threshold以内,则可以认为该边对于存储该知识并没有贡献,则去除该边,经过遍历后,我们则可以获得最终的知识回路。

在得到了知识回路后,我们该如何确保构建了准确的回路呢?这里,被发现的知识回路应该是Transformer知识存储中特定区域的准确表示,因此,它应该能够独立地表示知识。

为了验证构建的知识回路是否准确,我们使用验证数据集构建特定类型的知识回路,并在测试集上测试其性能。通过比较与原模型的性能变化,使用Hit@10指标评估目标实体o在前十个预测标记中的排名。

实验结果显示,构建的知识回路保留了语言模型大部分的能力,并在某些知识类型上有所提升,表明知识回路主要负责知识存储,避免了其他信息的干扰。

三、知识回路的分析

图中的例子中,经过分析不同层的输出后我们发现在MLP第17层之后,目标知识在信息流中作为Top-oneToken出现,而在该层之后,其概率一直在增加。

从发现的回路中可以看出,连接到MLP17的边是(L14H13->MLP17),(L14H7->MLP17)和(L15H0->MLP17)。

而注意头L14H7是一个MoverHead,它将信息从主体的位置France移动到最后一个标记。最终,MLP17集成了这些信息从而将最终结果French作为最终的Topone输出。

四、知识编辑情况下的知识回路的变化

“知识编辑”是近年来兴起的一项技术,旨在对语言模型中的特定知识进行精确修改。然而,当前的知识编辑方法存在一个普遍问题,那就是它们往往会对模型中的非编辑部分产生影响,即所谓的局部性不足。为了探讨这一问题,我们分析了知识编辑过程中知识回路的变化。

本研究中,我们选择了两种不同的编辑方法——ROME和Fine-Tuning(FT),并在实验中均聚焦于MLP的第二个线性层进行编辑。通过具体案例的分析,我们观察到尽管ROME和FT都能有效地将新知识注入模型,但在知识回路层面,两种方法的工作机制有所不同。

对于像ROME这样的方法,我们注意到模型修改了称为MoverHead的组件的信息流动。编辑后,模型中的MoverHead(如L15H3)能够正确地提取出“Intel”这一信息,这意味着ROME是通过修改特定层的MLP,使模型能够在最后一层Token的位置上获得正确的知识。

相比之下,FT类方法似乎是在编辑层中就赋予了新知识较高的Logit值,这直接改变了模型对新知识的认知。这意味着在FT方法下,新知识在较早的编辑层中就已经具有较高的概率,从而影响了模型的最终输出。

然而,无论是ROME还是FT,它们都未能完全避免对模型其他部分的影响。例如,在未经编辑的情况下,模型可以正确回答“创建WindowsServer的公司”这一问题,但在经过知识编辑后,使用ROME和FT的模型都给出了错误的答案。

从知识回路的角度来看,编辑的信息似乎影响到了与之无关的知识回路,导致了意料之外的结果偏差。

五、幻觉与In-ContextLearning情况下知识回路的现象

与此同时,我们还发现知识回路有助于理解语言模型中的幻觉现象以及In-ContextLearning(即情境学习,简称ICL)的能力。

当知识回路中缺乏有效的MoverHead,或者MoverHead选择了不正确的信息时,模型可能会产生幻觉。

例如,在提示“TheofficialcurrencyofMalaysiaiscalledthe”时,正确答案“Ringgit”和错误答案“Malaysian”在第15层之前的rank分布非常接近。然而,在第16层,MoverHead(L15H10)提取了“Malaysian”一词的信息,这导致模型最终输出了错误的答案。

而在ICL的场景中,我们的分析表明,相较于零样本学习(Zero-shotLearning),当加入示范示例(Demonstrations)时,知识回路中会出现一些新的注意力头。

六、总结

在本文中,我们提出了大模型知识表示的“知识回路”假说,即稀疏的回路子图用来进行知识的存储、处理与表达。知识回路表明了语言模型的知识存储不仅仅是单独的模块,还存在着不同组件之间的协同合作。实验结果表明,知识回路不仅有助于我们更深入地理解模型的行为,还在构建更为稳健的知识编辑方法方面展现了巨大的潜力。

llustrationFromIconScoutByIconScoutStore

-TheEnd-

扫码观看!

本周上新!

“AI技术流”原创投稿计划

TechBeat是由将门创投建立的AI学习社区(

投稿内容

//前沿资讯解说/心得经历讲述//

投稿须知

投稿方式

发送邮件到

melodybai@thejiangmen.com

关于我“门”

将门是一家以专注于数智核心科技领域的新型创投机构,也是北京市标杆型孵化器。公司致力于通过连接技术与商业,发掘和培育具有全球影响力的科技创新企业,推动企业创新发展与产业升级。

将门成立于2015年底,创始团队由微软创投在中国的创始团队原班人马构建而成,曾为微软优选和深度孵化了126家创新的技术型创业公司。

如果您是技术领域的初创企业,不仅想获得投资,还希望获得一系列持续性、有价值的投后服务,欢迎发送或者推荐项目给我“门”:

THE END
1.初学者:神经网络(2)机器学习练习4:神经网络上一篇文章中我们说神经网络的基本结构,神经网络训练的基本原理,这篇文章我们先来说一说神经网络中一个特别重要的东西---激活函数。 还是引用上一篇文章的老图。 如果按照上图的结构来输出最终的结果,那么计算过程如下: hj=i=1nxicijy=j=1mwjhj 现在开始解释这个式子: https://blog.csdn.net/flyless_sparrow/article/details/144398237
2.练习构建和训练神经网络在本单元中,你将使用 Keras 构建和训练分析文本情绪的神经网络。 若要训练神经网络,你需要数据来对其进行训练。 你将使用 Keras 随附的IMDB 电影评论情绪分类数据集,无需下载外部数据集。 IMDB 数据集包含 50,000 条电影评论,并且已分别对这些评论进行正面 (1) 或负面 (0) 的评分。 该数据集中的 25,0https://docs.microsoft.com/zh-cn/learn/modules/analyze-review-sentiment-with-keras/2-build-and-train-a-neural-network/
3.本期课程深入探讨神经网络的核心结构与工作来自与非网本期课程深入探讨神经网络的核心结构与工作原理。从前馈神经网络的构建讲起,介绍反向传播算法和自动梯度计算技术,这些是训练深度学习模型的关键。课程还将讨论神经网络参数优化过程中的主要问题,为理解深度学习模型的高效训练提供必要的知识。 L与非网的微博视频 小窗口 ?收藏 转发 评论 ?1https://weibo.com/1768387552/5112254494933678
4.神经网络基础知识及实用教程.pdf普通高等教育“十一五”规划教材 神经网络实用教程 张良均 曹晶 蒋世忠 编 主审 胡学钢 机械工业出版社 内容简介: 本书基于MATLAB 6.5/7 提供的神经网络工具箱,介绍了神经网络常用算法、优化算法及其混合编程 实现。全书共分为6 章,分别结合实例介绍了人工神经网络概述,实用神经网络模型与学习算法,神经网 络算法优化https://max.book118.com/html/2019/0407/8125143124002015.shtm
5.人工神经网络实用教程人工神经网络实用教程 人大经济论坛-经管之家:分享大学、考研、论文、会计、留学、数据、经济学、金融学、管理学、统计学、博弈论、统计年鉴、行业分析包括等相关资源。 经管之家是国内活跃的在线教育咨询平台! 经管之家新媒体交易平台 提供"微信号、微博、抖音、快手、头条、小红书、百家号、企鹅号、UC号、一点资讯https://bbs.pinggu.org/jg/kaoyankaobo_kaoyan_3682880_1.html
6.神经网络15本教程part2,PDF格式part3包括:7.人工神经网络与肓信号处理 8.人工神经网络-第六代计算机的实现 part4包括:9.人工神经网络建造 10.二进前项人工神经网络-理论及应用 part5包括:11.人工神经网络理论及应用 12.人工神经网络技术及应用 13.大脑设计 适应性行为的起源 part6包括:14.人工神经网络实用教程 15.基于神经网络的智能诊断 https://www.iteye.com/resource/llq994300-2013654
7.神经网络训练中回调函数的实用教程腾讯云开发者社区神经网络训练中回调函数的实用教程 作者| Andre Ye 编译| VK 来源| Towards Data Science ?回调函数是神经网络训练的重要组成部分 ? 回调操作可以在训练的各个阶段执行,可能是在epoch之间,在处理一个batch之后,甚至在满足某个条件的情况下。回调可以利用许多创造性的方法来改进训练和性能,节省计算资源,并提供有https://cloud.tencent.com/developer/article/1692424
8.hopfeild神经网络hopfield神经网络数学模型【1】《人工神经网络实用教程》 【2】浙江工业大学《人工智能导论》 视频 【3】《人工网络使用教程》 1. 离散Hopfield神经网络模型 1.1 网络拓扑模型 Hopfield属于反馈性神经网络,它作为一个动力系统可以最终到达一个稳态; 在离散Hopfield网络里,稳态是联想记忆的一个目标值; https://blog.51cto.com/u_16213632/8010451
9.B站上有哪些学习资源?2、Python教程_600集Python从入门到精通教程(懂中文就能学会) https://www.bilibili.com/video/BV1ex411x7Em/?p=146 3、千锋python全套视频教程,400全集,史上最经典 https://www.bilibili.com/video/BV15W41147rq/?p=105 4、Tensorflow 搭建自己的神经网络 (莫烦 Python 教程) https://www.douban.com/note/770877638/
10.AI数字人:人工智能虚拟数字人的新趋势与应用云典AI智库模型训练:? 使用深度学习技术和神经网络算法对数据进行训练,提取关键特征。 人机交互设计:设计用户界面和交互方式,使得AI数字人能够自然流畅地与人进行交流。 优化调试:对AI数字人进行优化和调试,不断改进其性能和表现。 通过以上步骤,可以成功制作出具有高度智能化和交互性的AI数字人,为各行各业带来更多便利和创新https://cosoh.com/aishuzirenrengongzhi/
11.山东师范大学信息科学与工程学院研究生招生1.《实用软件设计模式教程》,徐宏喆等编著,清华大学出版社,2009. 2.《大话设计模式》,程杰主编,清华大学出版社,2007. 《网络信息安全技术》课程简介 课程名称:网络信息安全技术 英文名称:Computing Network SecurityInformation 课程类别:专业选修课 总学时:36学时 https://m.okaoyan.com/kaoyanshop/sdsfdx/xxkxygcxy/
12.深度学习教程卷积神经网络解读深度学习教程 | 深度学习的实用层面 深度学习教程 | 神经网络优化算法 深度学习教程 | 网络优化:超参数调优、正则化、批归一化和程序框架 深度学习教程 | AI应用实践策略(上) 深度学习教程 | AI应用实践策略(下) 深度学习教程 | 卷积神经网络解读 深度学习教程 | 经典CNN网络实例详解 深度学习教程 | CNN应用:目https://www.showmeai.tech/article-detail/221
13.计算机网络技术实用教程华为云帮助中心为你分享云计算行业信息,包含产品介绍、用户指南、开发指南、最佳实践和常见问题等文档,方便快速查找定位问题与能力成长,并提供相关资料和解决方案。本页面关键词:计算机网络技术实用教程。https://support.huaweicloud.com/topic/197493-3-J
14.主要是matlab的实用教程应用软件相关资料下载几个关于matlab下的bp神经网络的源代码 cell migration resource imaging icsmatlab 基于MATLAB的PLL仿真程序 matlab Simulink的混合动力汽车正向仿真软件的开发 小波边缘检测matlab程序matlabxby.rar matlab 文件 小波与傅里叶分析基础 在matlab中 非常不错的QPSK在matlab中的仿真教程 https://download.eeworld.com.cn/detail/hellopinkgirls/413179
15.深度学习实战教程(四):卷积神经网络在前面的文章中,我们介绍了全连接神经网络,以及它的训练和使用。我们用它来识别了手写数字,然而,这种结构的网络对于图像识别任务来说并不是很合适。本文将要介绍一种更适合图像、语音识别任务的神经网络结构——卷积神经网络(Convolutional Neural Network, CNN)。说卷积神经网络是最重要的一种神经网络也不为过,它在最https://cuijiahua.com/blog/2018/12/dl-10.html
16.实用资料RNN和LSTM资源目录收集大全–爱玩吧长期短期记忆:对LSTM网络教程 http:/ / / / / lstm Juergen people.idsia.ch ~。 严格执行解释 apaszke.github.io lstm-explained.html http:/ / 递归神经网络教程 1部分(介绍RNNs):http://www.wildml.com/2015/09/recurrent-neural-networks-tutorial-part-1-introduction-to-rnns/ https://www.aiwanba.net/post/3216.html
17.AutoCAD二次开发实用教程(普通高等教育“十二五”规划教材)已选AutoCAD二次开发实用教程 33.80 已选AutoCAD二次开发实用教程 C语言程序设计教程 Basic程序设计教程 神经网络设计 AutoCAD二次开发实用教程 (教材)培训课程设计与开发数量: - + 图文详情 更多卖家15个卖家在售 短评(243)98.76%好评 写短评 匿名用户 10分 课本类的书,意义不大,讲的基本上都是基础的基础http://product.m.dangdang.com/23436490.html
18.电子商务实用教程教案(精选8篇)篇1:电子商务实用教程教案 内容提要 本书是从应用的角度介绍电子商务相关知识的实用教材。全书共分9章,分别为:电子商务概述,电子零售:B2C与C2C,B2B电子商务,电子支付,EDI 技术,网络营销,电子商务安全,电子商务物流,移动电子商务。每章都由“学习目标”、“引例”、“理论综述”、“案例分析”和“训练与拓展”五大https://www.360wenmi.com/f/file479vy8af.html
19.深度学习全教程吴恩达教程内容收集整理自网络,如有侵权,请联系删除! 目录 01.神经网络和深度学习 1.第一周 深度学习概论 1.1 欢迎 1.2 什么是神经网络? 1.3 用神经网络进行监督学习 1.4 为什么深度学习会兴起? 1.5 关于这门课 1.6 课程资源 2.第二周 神经网络基础 2.1 二分分类 https://www.flyai.com/article/801
20.[MATLAB语言实用教程]图书价格书籍图片网购评论正版书籍MATLAB智能算法30个案例分析(第2版)matlab宝典matlab语言编程MATLAB实用教程 MATLAB智能算法人工智能神经网络算法 郁磊、史峰、王辉、胡斐 著 / 北京航空航天大学出版社 / 2015-09 / 平装 萌兽书店 上海市徐汇区 萌兽书店 全新 ¥48.02 2024-06-04 上书 加入购物车 收藏 MATLAB语言实用教程 马莉 https://www.kongfz.com/topic/533406/
21.深度学习PyTorch极简入门教程中文PDF高清版电子书下载这是一个深度学习PyTorch极简入门PDF教程,共有18个章节,涵盖深度学习Python必备知识点、框架、神经网络、项目实战、卷积神经网络等内容,是一个不错的深度学习PyTorch教程。 内容 深度学习概述 深度学习Python必备知识点 Anaconda与Jupyter Notebook 深度学习框架PyTorch https://www.jb51.net/books/900836.html