AAAI2024针对存储受限在线持续学习的流数据总结方法算法样本实验数据流大模型

在这一工作中,我们提出了一个流数据总结方法,以提升基于重放的在线持续学习方法中memory的信息量。通过将流中的信息进行整合,总结样本相比于原始样本对于原始数据分布更具有代表性。在较小的额外计算开销下,SSD帮助显著提升了重放的效果,尤其是在memory空间受限时。该方法的有效性启发后续的工作为构建memory设计更好的方法。

持续学习(ContinualLearning,CL)的目标是在一个任务序列中持续地累积知识。但由于对过去所有任务的数据进行存储以及微调(fine-tuning)不论对存储还是计算资源都是不现实的,持续学习面临着对过去知识的灾难性遗忘(CatastrophicForgetting)问题。基于记忆重放(MemoryReplay)的方法维护一个较小的空间存储过去任务的知识,并在训练当前任务时混合过去的数据。通过对过去知识的直接接触,记忆重放方法在较小的额外资源消耗下取得了在持续学习任务上稳定的性能提升。过去已经有很多工作设计了给定memory时更好的训练方法,但memory中的样本所包含的信息量却一直没有得到充分的研究。

当存储空间非常受限时,memory中所存储的每个样本所包含的信息量都非常重要。我们提出,仅使用少量的原始样本,存储空间并没有得到充分的利用。因此,我们在这篇工作中提出了一个全新的流数据总结方法(SummarizingStreamData,SSD)。如图所示,我们将在线持续学习中的数据流进行总结,得到一些富含信息量的总结样本(SummarizedSamples)。这些样本相比同等数量的原始图片对整体原始数据分布更具有代表性,从而大幅提升了记忆重放的效果。在有限的额外计算量下,流数据总结取得了在多个在线持续学习任务上稳定的性能提升。

二、流数据总结方法2.1在线类别增量持续学习任务

持续学习是一个在减少对过去知识遗忘的前提下持续学习新的任务的方法。持续学习可以根据任务划分方式分为任务增量学习和类别增量学习。其中,类别增量学习(task-incremental)提供了任务编号,根据不同的任务编号可以使用不同的神经网络;而类别增量学习(class-incremental)则不提供任务编号,且在不同的任务中数据的类别没有重叠。

对于更普遍的离线持续学习,算法可以在每个任务上进行多轮微调达到收敛。但是在现实场景中,我们往往不知道不同任务的边界,数据往往是以流的形式进行获取。因此,在线持续学习就是一种模拟现实场景的更实用的任务。其中,每个数据都只会流过一次,并且不会有任务编号提供。本文所研究的就是最具挑战性的在线类别增量持续学习任务(onlineclass-incrementalcontinuallearning)。

2.2流数据总结

我们提出流数据总结方法以增加memory中存储的样本的信息量,从而达成对空间更好的利用。方法的流程如上图所示。

2.2.1DynamicMemory

首先,我们设计了一个dynamicmemory以同时包含总结样本和原始样本。当数据流带来新的类别时,memory中指定数量的空间会由这一新类别的图像初始化。此后,这些位置的图像将会固定,只由总结过程进行更新而不会被其他图像直接替换。memory中的其他未初始化位置会按照正常的持续学习方法使用原始图像进行随机替换。这样,memory中的空间可以被充分地利用。

2.2.2数据总结

流数据总结的主要目的是增加样本的信息量,以减少有限数量的样本与原始数据分布之间的差异。因此,我们使用与原始数据之间的训练梯度距离作为总结样本更新的损失函数:

其中,M代表memory,B代表mini-batch,D代表距离度量函数。

2.3过去辅助总结

除了训练梯度之外,我们提出对在持续学习中积累的知识进行更好的利用,来帮助当前任务的信息总结。

2.3.1总结模型训练

由于训练梯度的计算依赖于一个特定的模型结构,在实际实现中,这一模型往往会同步进行更新以提供更丰富的梯度监督信号。对于持续学习,在整个训练过程中类别数并不是固定的。因此,在新类别加入到数据流中时,往往涉及到模型的重新初始化。如果只将模型在当前任务的数据上进行更新,得到的训练梯度将会失去过去知识的信息。因此,我们提出将memory中包含的过去任务的真实图像也加入到总结模型的训练中,帮助模型建立更好的决策边界。

2.3.2关系匹配

我们将过去的总结样本提取的特征作为锚点,约束当前正在进行总结的样本和真实样本对这些锚点有一致的关系:

\代表了从前者中除去后者剩下的部分。关系匹配有助于在memory中建立更好的总结样本整体分布。整体的训练损失函数由训练梯度和关系的匹配组成:

三、实验结果

我们在多个在线持续学习benchmark上进行了实验。上图展示的是memory容量为100时在CIFAR-100上的持续学习平均精度。当容量受限时,原始图像所能携带的信息量是非常有限的。我们提出的SSD方法大幅提升了memory中的信息丰富程度,从而以较少的额外训练开销显著提升了持续学习的性能。下表中展示了在更多设置中的实验结果:

为了更好地说明我们方法的有效性,我们将总结前后的样本对比可视化展示如下:

一个可以观察到的普遍规律是总结样本相比原始样本具有更丰富的颜色信息。对于第一排中的兰花类别,初始化的样本是黄色的,但是实际更多的数据是粉色的。通过将图像中的黄色部分转换为粉色,总结图像一方面纠正了bias,另一方面保留了多样性。对于第二排和第三排的自行车和罐头类别,总结给图像带来了更丰富的结构和纹理信息。这些总结样本相比原始样本包含了更加丰富的信息,从而帮助达成了更好的记忆重放效果。

四、结论

IllustrationFromIconScoutByDelesignGraphics

-TheEnd-

扫码观看!

本周上新!

“AI技术流”原创投稿计划

投稿内容

//前沿资讯解说/心得经历讲述//

投稿须知

投稿方式

发送邮件到

chenhongyuan@thejiangmen.com

关于我“门”

将门是一家以专注于数智核心科技领域的新型创投机构,也是北京市标杆型孵化器。公司致力于通过连接技术与商业,发掘和培育具有全球影响力的科技创新企业,推动企业创新发展与产业升级。

将门成立于2015年底,创始团队由微软创投在中国的创始团队原班人马构建而成,曾为微软优选和深度孵化了126家创新的技术型创业公司。

如果您是技术领域的初创企业,不仅想获得投资,还希望获得一系列持续性、有价值的投后服务,欢迎发送或者推荐项目给我“门”:

THE END
1.增量学习介绍增量式学习adp解决灾难性遗忘最简单粗暴的方案就是使用所有已知的数据重新训练网络参数,以适应数据分布随时间的变化。尽管从头训练模型的确完全解决了灾难性遗忘问题,但这种方法效率非常低,极大地阻碍了模型实时地学习新数据。而增量学习的主要目标就是在计算和存储资源有限的条件下,在稳定性-可塑性困境中寻找效用最大的平衡点。 https://blog.csdn.net/chumingqian/article/details/134869454
2.增量学习:让AI能够持续适应新数据的能力腾讯云开发者社区在人工智能领域,随着数据的不断增长和应用的不断扩展,AI系统需要具备持续适应新数据的能力。传统的机器学习方法往往需要重新训练整个模型,这在大规模数据和复杂任务下效率较低。而增量学习作为一种新兴的学习方法,可以让AI系统在不丢失之前学习的知识的情况下,通过增量地学习新数据来提高性能。本文将介绍增量学习的基本https://cloud.tencent.com/developer/news/1230521
3.当小样本遇见增量学习,智能如何实现,超详细最新综述来袭!2.2 基于元学习的方法 在小样本学习或增量学习中,元学习方法可以利用已有知识来解决当前学习问题,并通过不断积累知识来提高系统的稳定性和可靠性。我们将基于元学习的FSCIL方法细分为基于原型的方法和元过程的方法。原型学习旨在识别代表给定数据集的一组原型范例,并根据数据点与现有原型的相似性对新的数据点进行分类或https://www.cvmart.net/community/detail/8256
4.基于增量学习和主动学习的垃圾邮件识别新方法会议摘要:垃圾邮件识别是计算机取证领域的重要研究内容.多数垃圾邮件识别方法未能有效地考虑用户兴趣邮件识别结果的影响.提出了一种基于增量学习和主动学习的垃圾邮件识别新方法.为获得最有效特征,在特征选择阶段综合考虑了单词信息和非单词信息;接着,为减少待标注样本选择时间,提出了一种基于投影的不确定样本选择方法;最后,在https://d.wanfangdata.com.cn/Conference/8842934
5.小学语文新课标学习心得体会(精选21篇)《语文课程标准》的实质要求,切实转变观念,克服以往在语文教学中忽视学生的主体地位,过分追求学科知识系统的错误倾向,真正确立语文教育的新理念,通过课堂教学,全面提高学生的整体语文素养,注重提高学生的语文实践能力,积极倡导,促进学生主动发展的学习方法,拓宽学习和运用的领域,注重联系生活,跨学科的`学习和探究式学习,使https://www.yjbys.com/xuexi/xinde/2630664.html
6.新课标解读培训心得(精选22篇)我们首先要依托新课标中的课程结构和育人目标,明确学习任务群的定位和功能,准确理解每个学习任务群的学习内容和教学提示,围绕学习主题,以学习任务为导向,整合学习情境、学习内容、学习方法、学习资源,设计基于大任务、大单元、真实情境的语文实践活动,引导学生在运用语言文字的过程中学习语文,学会学习。注重语文与生活的结https://www.ruiwen.com/word/xinkebiaojiedoupeixunxinde.html
7.万文长字总结“类别增量学习”的前世今生开源工具包任务增量学习,是最简单的Continual Learning的场景。在这种场景下,无论是训练阶段还是测试阶段,模型都被告知了当前的任务ID。 这种特性导致了一些task specific component的方法出现,如packNet[3]提前为每个任务确定卷积的filter的掩码图。再如HAT会动态的根据任务为卷积训练掩码图。当给定任务ID后,则选择相应的掩码进行https://www.thepaper.cn/newsDetail_forward_17451573
8.incrementallearning代码回复什么是增量学习(Incremental Learning)? 增量学习是一种机器学习方法,它允许系统能够动态地进行学习和更新,以适应新的数据和信息。与传统的批量学习方法不同,增量学习是一个连续的过程,模型会随着新的数据不断增量训练。这种学习方式非常适用于数据流环境下,其中数据源不断产生,并且需要快速适应新的情况。 为什么需要增https://wenku.baidu.com/view/3072cf0ad7d8d15abe23482fb4daa58da0111cab.html
9.武汉大学夏桂松团队:面向遥感图像解译的增量深度学习针对场景识别、目标检测、地物分类和变化检测等典型解译任务,提出了系列增量学习方法。知识蒸馏、网络扩展和记忆回放都已用于平衡新知识学习和旧知识巩固。面向合成孔径雷达图像解译的增量学习研究集中于目标识别模型的类别增量学习。现有研究普遍采用记忆回放解决旧类别遗忘问题。因此,研究重点包括如何选择具有代表性的旧类别样https://www.myzaker.com/article/66d80289b15ec052091c4f18
10.找对学习方法,让你的团队脱胎换骨增量式学习需要更专注、更不容易分心,也更安全的模拟我们工作环境的空间,类似于“新兵训练营”,让我们在其中操练最佳工作方式,获得反馈,再次尝试。 转变式学习则需要一个熟悉却又开放的框架——类似于“游乐场”,可以放大我们的习惯和滋生这些习惯的文化,以便我们对这些习惯和文化加以研究,想象并尝试新的存在方式。 https://36kr.com/p/1103537880451584
11.2020届计算机科学方向毕业设计(论文)阶段性汇报复现了业界领先的基于深度学习的跨年龄人脸识别模型并在少量测试数据集上做了数值上的检验和对比。 张哲恺 图排序的硬件加速器设计 Gorder图排序算法的简单介绍,硬件加速Gorder的基本思路,模拟实验结果。 蒋泽天 多图的批量协同匹配与在线增量式匹配方法第一阶段工作汇报 https://zhiyuan.sjtu.edu.cn/html/zhiyuan/announcement_view.php?id=3709
12.浅谈初中学生英语自主学习能力的培养摘要:随着终身学习思想的提出和语言教学的日趋交际化,促进学生的自主学习已成为教学界关注的热门话题。本文探讨了自主学习的内涵并着重从运用多样的教学方法,激发学生自主学习英语的兴趣;给学生学法指导,帮助学生掌握自主学习的基本方法;培养学生良好的课外学习习惯;健全完善评价体系,关注学习过程增量;转变教师的角色,构建学http://www.bzsjks.cn/xuekejiaoyan/13322.html
13.工作方案范文15篇老师们十分重视培养学生的学习方法,各学科针对学生的薄弱环节制订措施,进行针对性的辅导,特别是使学生能认真上课,听课,积极动脑,认真完成作业等。认真组织了家长函授学习活动,进行家校联系,提高教育效率。 值得一提的是,我们组的田冬梅老师,她爱学习,工作从不讲价钱,学校本学期多次给她布置的工作任务时间短,任务重,三https://www.wenshubang.com/fangan/3068469.html
14.陈刚千字文学习方法抖音直播带货与粉丝数据分析简介:每天晚上八点五十直播教学习方法 千字文学习方法创始人 一生只做一件事,让0-13岁爱玩的孩子爱上学习。 家庭教育特聘指导专家 ?中欧国际工商学院MBA 高级心理咨询师 17岁读书逆袭重点211 运营、老师建联@一壶觞 数据概览 https://dy.feigua.cn/bloggeropen/D8E39759885B3C9210F1880C17161613
15.学前教育发展共同体帮扶方案(精选17篇)(4)一次送教活动。每学期XX区实验幼儿园选派骨干教师送教下园,通过开展示范性教学,同课异构活动,传授先进的保育教育理念和教育方法等,针对性地提高教师业务能力。 (5)一次观摩学习。结对园XX区实验幼儿园每学期到示范园观摩学习,围绕“合理安排幼儿园一日生活”“创设丰富的教育环境”“游戏活动的开展”等内容开展https://www.unjs.com/fanwenku/416684.html
16.机器学习顶刊汇总:EESNat.Commun.EnSMACSAMIES&T等成果(<14个月)和来自基于物理模型的模拟数据来实现电池容量和退化模式的晚期寿命估计(2~4年),其不同之处在于如何利用廉价且现成的物理模拟数据:1)方法1是一种数据增强方法,将早期实验老化和模拟数据组合成一个增强数据集,用于训练机器学习模型以估计三种退化模式的容量和状态;2)方法2是一种增量学习方法,首先使用模拟https://www.shangyexinzhi.com/article/5029661.html
17.基于元学习的小样本增量攻击识别模型这种情况可以归为类增量(class-incremental)学习,即:i)学习器应可以在不断增多新类的数据中学习;ii)由于计算需求、存储预算和数据隐私等各种问题,将新数据与旧数据集结合进行再训练模型通常是不可行的。上述类增量学习方法通常会导致稳定性-可塑性困境,即,过多地关注新任务的学习范式,由于灾难性的遗忘(catastrophic https://zhuanlan.51cto.com/art/202108/678578.htm