《图持续学习》综述

与传统持续学习类似,CGL也从限制模型参数的变化、隔离和保护对以前学习的任务重要的参数,以及回放先前任务的代表性数据以提醒模型先前学习的模式(图2)的角度来处理问题。然而,CGL的一个关键挑战是必须适当地保留数据的拓扑结构,这是图数据中包含的关键信息。在本节中,我们将按照这一分类介绍CGL技术,这也在表1中总结。

基于正则化的方法

由于遗忘的原因是模型参数在适应新任务后被修改,传统的基于正则化的方法[91]、[92]增加了惩罚项以防止参数发生剧烈变化。然而,这些方法并没有显式地保留图数据的拓扑结构。针对这一不足,拓扑感知权重保持(TWP)[2]提出通过对模型权重的正则化显式地保留在先前任务上学到的拓扑。

基于记忆回放的方法

基于记忆回放的方法通过使用来自先前任务的代表性数据重新训练模型来防止遗忘。传统的持续学习方法处理单个数据而不涉及交互,可以简单地采样并存储在缓冲区中。然而,对于图上的学习,基于记忆回放的方法将会遇到记忆爆炸的挑战[1]。在生成节点(一个数据点)的表示时,图神经网络(GNNs)通常会聚合来自多跳邻居的信息。因此,要重新生成单个节点的表示,就必须存储来自呈指数级扩展的邻域的信息。在密集图上,内存消耗很容易变得难以处理[1]。由于这个挑战,经验回放图神经网络(ER-GNN)[83](图4(a))选择忽略图拓扑,仅存储单个节点的属性以重新生成表示。

CGL与图基础模型

促进图基础模型训练

构建图基础模型的一个有前途的方法是设计策略来微调预训练的LLMs,使其接受分词化的图输入,以便图结构知识与语言数据中包含的知识对齐。然而,这样的连续训练不可避免地会触发灾难性遗忘问题,因为图数据与用于预训练LLMs的语言数据位于显著不同的领域。因此,在这个过程中,CGL技术和一般的持续学习技术变得不可或缺。

此外,理想的图基础模型,无论是基于预训练的LLMs之上开发还是从零开始训练,都应通过持续整合新出现的数据来维持一个最新的知识库。然而,这个持续学习过程也可能引起遗忘问题,这也是当前LLMs面临的问题。在这种情况下,应开发CGL技术来解决这个问题。

此外,当新的图数据对应于不同的领域时,例如,模型可能同时遇到生物网络数据和分子图数据,跨领域学习也可能触发遗忘问题。在这种情景下,可以开发领域增量学习(domain-IL)CGL技术来解决问题。

开发大型图模型的潜在高效方式

与LLMs不同,LLMs在NLP任务中展示了令人印象深刻的性能,而大模型对于图数据的有效性仍然是一个问题。基于参数隔离的CGL模型在可能显著增加大小的扩展数据集上学习,模型的大小相应扩展。因此,它提供了一种潜在的解决方案,通过逐步扩展模型和数据集从零开始开发大型图模型。一方面,逐步学习任务而不是同时针对所有任务优化模型可能会降低优化难度。另一方面,CGL方法只会在必要时分配新参数[3],这可以帮助缓解大型模型中的参数冗余问题。此外,现有的大型预训练图模型通常是特定于领域的[128],极大地限制了它们的能力。幸运的是,这一挑战可能通过利用在领域增量学习(domain-IL)下工作的CGL技术来解决,该技术旨在连续跨多个不同领域训练给定的图学习模型。

THE END
1.《数据流驱动:C++构建AI模型持续学习新范式》综上所述,运用 C++开发基于数据流的人工智能模型持续学习系统具有巨大的潜力和广阔的应用前景。通过深入理解数据流持续学习的原理,精心设计系统架构,巧妙运用 C++的特性和技术,我们能够构建出高效、智能、适应未来发展需求的持续学习系统,为推动人工智能技术在各个领域的深度应用奠定坚实的基础。https://cloud.tencent.com/developer/article/2478635
2.机器学习与深度学习:差异解析简介:机器学习与深度学习作为两大核心技术,各自拥有独特的魅力和应用价值。尽管它们紧密相连,但两者之间存在着显著的区别。本文将从定义、技术、数据需求、应用领域、模型复杂度以及计算资源等多个维度,对机器学习与深度学习进行深入对比,帮助您更好地理解它们之间的差异。 https://developer.aliyun.com/article/1645659
3.增量学习介绍增量式学习adp1.1 什么是增量学习 人类有终身不断获取、调整和转移知识的能力,虽然在我们的一生中,我们确实倾向于逐渐忘记之前学习过的知识,但只有在极少的情况下,对新知识的学习会灾难性地影响已经学到的知识,这样的学习能力被称为增量学习的能力。 具体来讲,「增量学习的能力就是能够不断地处理现实世界中连续的信息流,在吸收https://blog.csdn.net/chumingqian/article/details/134869454
4.连续学习与概念表征连续学习(Continual Learning或CL),又称终身学习(Lifelong Learning)是指人类所具有的可持续学习的能力。目前,人工智能(AI)中的机器学习(Machine Learning或ML)还缺乏连续学习的能力,在连续学习的过程中会出现困扰AI领域长达30年之久的著名“灾难性遗忘”问题: 例如在学会了识别数字“0”和“1”之后,再学“2”和https://nimi.cuc.edu.cn/gnbzylxxx/mainm.htm
5.软考高级——信息系统项目管理师(第4版)思维导图模板软考高级——信息系统项目管理师,根据第四版(2023年新版教材)进行编写,内容详细,根据思维导图,可以快速对重点知识进行整理记忆,方便快捷,欢迎大家克隆学习https://www.processon.com/view/654c455f8f11b40fe56ece43
6.江西专升本《数学分析》考试大纲之萍乡学院2.增量——微分公式,可导与连续的关系. 考核要求:1.理解并掌握导数的定义,掌握导数的几何意义,了解导数的物理意义. 2.了解增量——微分公式,掌握可导与连续的关系.了解费马定理、达布定理. 2.2导数的运算法则 考核内容:1导数的四则运算法则,反函数的求导法则. http://www.jxztc.com/show-938-318228-1.html
7.神经网络与深度学习20210719061352.pdf神经网络与深度学习.pdf,《神经网络与深度学习》 Neural Networks and Deep Learning 邱锡鹏 xpqiu@ 2019 年4 月6 日 2 2019 年4 月6 日 常用符号表 x 标量 x ∈ d d 维列向量 [x1 , ··· , x ] d 维行向量 d [x , ··· , x ]T or [x ; ··· ; x ] d 维列向量 1https://max.book118.com/html/2021/0719/6143212224003214.shtm
8.零基础如何学习abaqus?SIMULIAAbaqusCFD流体动力学仿真分析剪力闭锁:网格过于稀疏,导致单元无法模拟连续体的变形;沙漏模式:缩减积分单元缺少积分点,单元有变形而积分点无应变能 6、求解器设置 时间和增量步的关系:在静力分析中,荷载的施加与分析步时长为线性关系,即默认t=0时刻荷载=0,t=1时刻荷载全部施加。若为弹性问题,则只需求解一个整体刚度矩阵,在一个增量步中即可https://www.ruanfujia.com/10644120/
9.第三篇学术研究第四章经济学陈敏之指出,孙冶方同志对“商品”的论述有矛盾之处,认为商品应当和社会分工相联系(《向冶方同志学习;发展商品经济理论》,经济研究1993年第2期)。李家镐论述了张闻天的“生产关系两重性”相关观点,以此对部分现实问题进行解释,并澄清了许多对生产力与生产关系的误解(《张闻天同志的生产关系两重性理论》,经济研究1993年https://www.sssa.org.cn/bzjz/679018.htm
10.高质量转型发展学习心得体会(精选16篇)充分的全面的备课后,那上课更是一门艺术。我们要向四十分钟要质量,对与课堂语言的组织,课堂学习的调动,都要求教师有着很高的素养。对学生积极性的.调动,能激发学生学习的兴趣。兴趣是最好的教师,所以对学生积极性能有很好的促进作用。发挥小组合作学习的优势,让学生在学习中能够很好的互助学习。 https://m.oh100.com/a/202301/5893961.html
11.专访台湾奥美:全联经济美学7年创意策略,经典案例必学干货(福利)根据数据显示,30岁以上的全联会员占比高达91%,核心客群平均年龄在40-55岁间。随着以往的获客增量触及到天花板,全联意识到除了核心客群“婆妈”之外,需要把年龄段扩容,下放至年轻人的世界。 但这并不是容易的一步,甚至牵一发而动全身,一旦准备拉拢年轻人的注意力,品牌沟通的方式势必要大改——毕竟,没有哪个年https://www.digitaling.com/articles/633457.html
12.银行职员年度考核总结(精选25篇)1、学习的.积极主动性还不够,因家庭因素、工作开展因素的客观因素的影响,导致存在学习的连续性不足,存在业务素质提高不快,对旧有知识回顾不足的问题,学习效率低的情情况。 2、创新意识和积极意识不足,在自觉主动学习方面,与年轻大学生相比还存在必须的差距,不能有效的结合自身专业特长和岗位实际进行业务创新或针对https://www.ruiwen.com/zongjie/6988362.html
13.机器学习中期望风险经验风险结构风险的初步学习冒泡~小李又上线啦~今天学习了几个概念,故做如下整理: 首先,要区别这几个概念,我们要先引入损失函数的概念。 损失函数 定义:损失函数就一个具体的样本而言,模型预测的值与真实值之间的差距。 对于一个样本(xi,yi)其中yi为真实值,而f(xi)为我们的预测值。使用损失函数L(f(xi),yi)来表示真实值和预测值之间https://www.jianshu.com/p/073a00d69acf
14.深度学习中的连续学习与遗忘问题一、连续学习的挑战 连续学习,又称为增量学习或在线学习,指的是模型在学习新任务的同时,保留对旧任务的知识的能力。这种学习方式对于构建具有长期记忆和适应性的智能系统至关重要。然而,传统的深度学习模型在面对连续学习任务时,往往会出现所谓的“灾难性遗忘”现象,即模型在学习新任务时会快速丧失对之前任务的https://baijiahao.baidu.com/s?id=1791385353368146851&wfr=spider&for=pc
15.单片机教程17.AD和DA的学习但是在工业检测系统和日常生活中的许多物理量都是模拟量,比如温度、长度、压力、速度等等,这些模拟量可以通过传感器变成与之对应的电压、电流等电模拟量。为了实现数字系统对这些电模拟量的检测、运算和控制,就需要一个模拟量和数字量之间相互转换的过程。这节课我们就要学习这个相互转换过程。https://www.hqew.com/tech/circuit/1645330.html
16.柯华庆:通观经济学原理通观经济学认为,历史上的任何政府都是有为的,区别在于是消极作为还是积极作为,是为了社会的强者还是为了社会的弱者。通观经济学秉持关系价值论、共有共享资本论,突破公有制与私有制的二元划分,采取区间数来讨论合作剩余,主张连续性的共有制。通观经济学,需要六个基本概念。区间数理论和讨价还价博弈,都是其合适的分https://www.aisixiang.com/data/142441.html