在线持续学习中的领域自适应问题–上海交通大学类脑智能应用与技术中心

在线持续学习是深度学习领域的一个重要研究方向,旨在解决传统深度学习方法在处理动态数据时的局限性。传统的深度学习算法通常在静态的数据集上进行离线训练,将训练后的模型部署到实际应用中,并在部署后不再更新模型。然而,现实世界中的数据往往与训练数据集不完全相同,且是动态变化的。新的数据不断产生,旧的数据可能过时或失效。传统的静态模型往往无法适应这种变化。

举个例子来说,当我们将源域上训练的深度神经网络部署到测试环境,即目标域时,目标域上的模型性能会因为域偏移而恶化。在自动驾驶中,一个训练完成的模型可能由于天气、运行区域、传感器等的不同而在测试时表现出显著的性能下降。实际应用中,测试集与训练集不完全匹配是十分普遍的。并且由于难以预知环境将会发生怎样的变化,需要在与环境不断交互的过程当中,学习到在新的场景下更准确的数据表示,从而保持任务的性能。这就是一个在线持续域适应的问题。

片上持续在线学习是SNN的一个具有潜力的应用场景。

基于小批量/单样本的在线持续域适应面临一系列的挑战。首先,单样本更新导致模型的归一化统计参数难以准确估计。模型的归一化统计参数是指,由一个批量中所有样本的特征计算出的均值与方差。批归一化统计(BatchNorm)是目前深度学习中非常普遍的一种做法,可以缓解梯度爆炸/消失、减少过拟合风险、增加模型收敛速度、减少模型对于训练参数的依赖等。基于少量/单个样本计算出的统计信息是有偏的,而基于有偏的统计参数计算的归一化值会不准确,导致模型性能下降。同时,基于单个样本产生的损失更新模型会导致模型更新不稳定。由于样本间质量参差不齐,不同样本的特征很可能有较大差异,导致产生的模型更新方向不稳定。

本章节中,介绍一些小批量/单样本更新的方法。

图1重新校准BN层统计参数,并仅更新仿射参数[1]

式(1):BN层特征计算公式;式(2):BN层统计参数均值与方差的计算公式

实际上,仅是通过BN层统计参数的重计算便能大幅提升自适应的性能。图2展示了不同情况下图像的特征分布。方法(a)Source是采取源域统计量与源模型仿射参数,方法(b)BN是采取目标域统计量与源模型仿射参数。结合式(1)来看,方法(b)作归一化时,其μ与σ来自目标域数据,而γ与β来自源域。方法(c)Tent是采取目标域统计量,并基于最小化熵更新仿射参数。即在方法(b)基础上,基于目标域数据更新γ与β。方法(d)Oracle采用目标域数据监督训练模型,是我们所期望的特征分布。

四张子图中,最后侧的黄色部分均是没有噪声的图像在源域模型上的特征分布。如图2(a)所示,如果直接将目标域数据应用到源域模型上,模型提取的特征分布会与未加噪的数据有较大的不同,从而造成性能的下降。如图2(b)所示,方法(b)调整了带噪数据特征分布的位置和宽窄。可以发现仅是调整BN层参数后,带噪数据的特征分布就已大幅接近目标域数据监督训练的结果。方法(a)的错误率可能高达80%多,而调整统计参数为目标域数据统计参数后,可以把错误率降到20%左右。方法(c)在(b)的基础上,对数据分布的形状也做出了一定的调整,可以令错误率再下降大概1-3个百分点。

图2带有高斯噪声的CIFAR100-C图像的特征分布[1]

实际上目前以基于BN的模型为预训练网络进行适应的方式,都极大依赖于BN层参数的调整。但是这种方式的缺点也显而易见。因为要对统计参数有一个校准的估计值,要求一个batch的中有较多的样本。如表1所示,当batchsize为32的时候,Tent准确率为85.5。但是batchsize降低到16、8的时候,准确率会降低到35.1、16.7。同时可以观察到,在batchsize为16、8的时候,发生了灾难性遗忘。由于较小的batchsize估计的统计参数不准,仅使用未加任何修改的Tent的话,是难以在小样本、单样本上进行适应的。这实际上不符合现实生活中数据流式输入的场景。但是由于目前的主流预训练模型都是基于BN实现的,后续很多实现小样本、单样本自适应的方法其实是基于改进的BN统计参数估计方法。

表1不同batchsize下Tent的性能[2]

如表2所示,在将原始BN模块替换为改进后的模块(MECTA)[2]后,将Tent在batchsize为16时的准确率从35提升到了71。当然MECTA中除了用到所介绍的自适应滑动更新BN层的方法外,还采取了稀疏剪枝、按需训练一类的策略,提升效果是共同作用下的结果。

但是这种方法实际还是依赖于小批量的统计数据分布,会导致当batchsize进一步减小时,当前小批量的计算的分布统计参数漂移大,导致性能下降。但是其提出的从数据中动态估计滑动平均参数以及剪枝的思想是可以借鉴的。

表2MECTA对于Tent的提升作用[2]

2.利用数据增广估计单样本的BatchNorm统计参数

另一种方法是利用数据增广估计单样本的BN参数。如图3所示,谷歌斯坦福在2022年提出AugBN[3],借助单样本的多个增强估计了单样本的BN层统计参数。它实际上是对一个样本施加多次数据增强,然后用原样本与增强后的样本一起计算BN统计参数,再与源模型参数加权平均。前面介绍的的MECTA是在batch的维度上面滑动平均,而AugBN是在源域统计数据单样本和多个增强的统计数据上面加权平均。

图3AugBN:利用数据增广估计BN层统计参数[3]

由于数据增强样本的分布难以控制,所以不是为所有的增广样本分配与原样本相同的权重,把增广样本的权重设置为1/2n,其中n为数据增强数目。实际实验时,n=2,即对单样本进行两次增强;k=5,m=5,就是说每次用五种数据增强的组合作用到x上。

由于AugBN需要跑次不同的先验值,实际使用时,,再用熵最小的top3结果进行投票。就是说,AugBN实际只解决了流式样本更新时每次只有单个样本可用的问题。但实际上它需要有多次的前向过程,增加了推理过程的计算量。但是之所以需要那么多次前向过程,是因为其本身是一种非参数化的方法,需要依据多次迭代的投票找出分类。如果结合在线适应的一些无监督loss可能可以减少前向的次数。表3展示了AugBN在各数据集上的性能,在分类方面,与直接使用源模型相比,AugBN在CIFAR-10-C上取得了17%的相对提升,并且与现有的方法相比也有不错的表现。但在ImageNet-C上的准确率仍仅有25%左右。

表3AugBN在各数据集上性能

3.利用InstanceNorm修正BatchNorm统计参数

NIPS2022年发表的NOTE提出了一种利用instancenorm(IN)修正batchnorm值的方法[4]。在介绍NOTE之前,我们来大致了解一下不同的norm方法。如图4所示,BatchNorm是针对一个channel计算当前channel的均值、方差进行标准化,Layernorm是针对单个样本的所有channel进行均值、方差的计算,InstanceNorm是针对单个样本、单个channel的特征图进行标准化,GroupNorm是针对单个样本的成组特征进行标准化。

图4不同的归一化方法图示[6]

图5非独立同分布流式样本示意图[4]

具体来说,NOTE提出的均值、方差估计公式如式(4)所示。

表4NOTE在各数据集上性能

图6不同样本分布偏移程度与batchsize下各算法的性能

从前面几种方法介绍中也可以看出,基于BN层的自适应有以下几个问题:

基于此,作者将三种策略用于SAR中以提升基于GN进行自适应的性能:

不同方法在ImageNet-C(severity5)上单样本适应的性能如表5所示,总体上来说,SAR在达到较高准确率的同时,具有较低的复杂度,并且不需要额外的数据。与方法[3]比,在ImageNet-C上达到了更高的准确率。

表5不同方法在ImageNet-C(severity5)上单样本适应的性能

本文主要介绍了目前小批量/单样本在线自适应的一些挑战和可能的解决方法。具体来说,介绍了

综合而言,在标签和输入分布难以预知的情况下,基于流式输入进行稳定、在线的学习并避免灾难性遗忘,仍然是深度学习领域的一个复杂且重要的问题。在线持续学习为我们提供了机会去构建更加灵活、智能的模型,以应对不断变化的现实世界需求,推动算法落地于实际生活中。

[1]D.Wang,E.Shelhamer,S.Liu,B.Olshausen,andT.Darrell,“Tent:FullyTest-timeAdaptationbyEntropyMinimization.”arXiv,Mar.18,2021.doi:10.48550/arXiv.2006.10726.

[3]A.Khurana,S.Paul,P.Rai,S.Biswas,andG.Aggarwal,“SITA:SingleImageTest-timeAdaptation.”arXiv,Sep.07,2022.doi:10.48550/arXiv.2112.02355.

[4]T.Gong,J.Jeong,T.Kim,Y.Kim,J.Shin,andS.-J.Lee,“NOTE:RobustContinualTest-timeAdaptationAgainstTemporalCorrelation.”arXiv,Jan.11,2023.doi:10.48550/arXiv.2208.05117.

[5]S.Niuetal.,“TowardsStableTest-TimeAdaptationinDynamicWildWorld.”arXiv,Feb.23,2023.doi:10.48550/arXiv.2302.12400.

THE END
1.人工智能时代的教育模式变革科学技术自适应学习平台利用AI算法创建交互式学习体验。这些平台根据学生的回答和表现自动调整难度和内容,为每个学生提供量身定制的学习体验。自适应学习平台可以通过识别学生知识空白,提供额外的支持,并通过即时反馈促进理解,从而提高学习效率。 虚拟现实和增强现实 虚拟现实(VR)和增强现实(AR)等身临其境的技術正被用于创造引人https://www.mengjiangou.cn/kxjs/36930.html
2.什么是自适应学习自适应学习简介自适应学习(adaptive learning)是一种基于学习者的个体差异和学习需求,为每个学习者提供定制化的学习内容和学习路径的学习方式。自适应学习通常使用人工智能、机器学习、数据挖掘等技术,通过对学习者的学习行为和反馈数据的分析,为学习者提供个性化的学习内容和学习路径,以提高学习效果和学习满意度。 https://cloud.tencent.com/developer/techpedia/1763
3.感知自适应在线学习平台轻量的学习平台 包含图文、动画、微课视频、三维课件的知识点,通过基于微信小程序等HTML5技术轻应用的在线学习方式,实现高效跨平台移动在线学习。 自适应学习路径 基于细颗粒度知识点以及知识点之间知识图谱关系,结合学生掌握情况,实现个性化学习路径推荐。 高效的知识编辑 http://www.chu-jiao.com/page/50.htm
4.科技与教育融合:在线学习真的能打破知识壁垒吗?在快速发展的信息时代,科技的不断进步为在线学习开辟了新的可能性。为了更有效地推动在线学习的进步,以下是一些重要的发展建议。首先,教育机构应加强与科技企业的合作,开发更加个性化和互动性的学习平台。这种合作不仅能吸引更多的资源,还能够利用企业的技术优势,提升学习体验。例如,通过引入人工智能技术,创造出适https://baijiahao.baidu.com/s?id=1816053141372736436&wfr=spider&for=pc
5.ASP中小学在线学习云平台最新社区版自适应手机端v1.0源码下载该系统属于在线网校整站系统、html5响应式,企业商学院、职业考证、中小学、党校、政府企业都可以使用,可以适合各行业的学习平台。 响应式自适应各种移应用终端,同一个后台,数据即时同步,方便操作。 注:可以直接部署(内涵部署教程)也可以自行编译(编译选择any cpu) https://www.jb51.net/codes/763293.html
6.一文读懂自适应学习的背后原理,在线教育创业者必看!雷峰网雷锋网按:上个月,我们转载了胡天硕老师的《揭秘自适应学习的背后原理(第一集)》,其详细阐述了为何要做自适应学习的原因,以及一套自适应学习系统应该包括哪些环节。而今天的这篇,依然来自胡老师撰写的自适应学习系列,属于中篇。在这篇文章里,胡老师将自适应学习从最低等级的Level 0讲到最高等级Level 4,并为每一https://www.leiphone.com/news/201708/nWTWN1okgbbUAsn9.html
7.驰声听说在线自适应学习平台驰声听说在线,专注为K12学校提供英语听说自适应产品,采用自主研发的人工智能语音测评引擎,构建英语听说“学、练、评、测”教学全闭环。驰声听说在线,让英语听说教与学更高效。https://www.91tszx.com/
8.科技新星AI驱动的自适应学习系统革新教育模式随着人工智能(AI)技术的迅猛发展,它开始渗透到各个行业,包括教育。AI驱动的自适应学习系统正成为新的教育革命。在这种系统中,学生可以根据自己的学习速度和理解能力来调整教学内容和难度,从而实现个性化教学。 自适应学习系统如何工作 自适应学习系统通常包含以下几个关键部分:用户模型、认知分析器、推荐引擎和反馈机制。https://www.gkmhatqkj.com/ke-ji/494203.html
9.面向在线教育的自适应学习框架构建及系统设计研究自适应学习 自适应学习框架 系统设计 在线教育https://cdmd.cnki.com.cn/Article/CDMD-10200-1021631035.htm
10.开题报告:智能教育视角下基于眼动追踪的在线学习认知模型及自适应全国教育科学规划课题开题报告(附研究思路模板、可修改技术路线图三个)《智能教育视角下基于眼动追踪的在线学习认知模型及自适应机制研究》 课题开题报告一、课题基本信息课题名称:智能教育视角下基于眼动追踪的在线学习认知模型及自适应机制研究课题来源:教育部人文社会科学研究项目课题类型:应用研究课题负责人及主要成员:https://www.renrendoc.com/paper/370581158.html
11.在线学习RBF神经网络的模型参考自适应控制器.pdf在线学习RBF神经网络的模型参考自适应控制器.pdf,2001年第2期 般机发展 【文章蕾号) 1005—3751(2001)02—0005—03 在线学习RBF神经网络的模型参考自适应控制器 ModelReferen~~AdaptiveController ofOn—lineLearningRBFNem-alNetworks 朱明星 龚蓬(安徽大学自动化系,https://max.book118.com/html/2017/0321/96259798.shtm
12.LiveNAS神经增强型实时流媒体通过在线学习改进实时视频摄取? LiveNAS 媒体服务器执行在线学习,并使用超分辨率 DNN 将原始视频流转换为更高质量。两个新颖的组件在这里运行:内容自适应在线学习引擎,它动态调整 GPU 使用以进行资源效率train(第 6.1 节);以及支持多个 GPU 的 4K 超分辨率的超分辨率处理器(第 6.2 节)。 https://blog.csdn.net/qq_39373811/article/details/119484752
13.科学网—[转载]群视角下的多智能体强化学习方法综述首先围绕多智能体强化学习及其面临的挑战,概述了多智能体强化学习基础和面临的挑战,简要介绍了多智能体强化学习范式、分布式、协同对抗等前沿研究重点;其次从“群”视角出发,区分规模可扩展与种群自适应,分类归纳多种学习方法,其中将规模可扩展多智能体强化学习方法分为集合置换不变性、注意力机制、图与网络理论、平均场https://blog.sciencenet.cn/home.php?mod=space&uid=3472670&do=blog&id=1422698
14.高顿教育联合创始人吴江华:AI将会降低在线教育的边际成本高顿教育自适应学习探索之路走得比国外晚一些,吴江华告诉亿欧早在2010年可汗学院(Khan Academy)已经发布了自适应学习系统的一个版本,但是当时国内整个市场还没有考虑到这个市场,在线教育主要还是基于录播课的形式,大多数人认为探索自适应学习投入大产出少。 https://www.gaodun.com/news/1054734.html
15.中小学智能个性化学习领导品牌提分利器智能教育自适应学习晓果智学AI学习系统,是湖南果实智能科技有限公司自主研发,以高级算法为核心的自适应学习引擎,拥有高度知识产权,并获得国家专利认证。 大数据是未来教育发展的基础,未来的在线教育机构首先应是大数据机构,因此湖南果实智能科技首先打造面向未来的教学系统——晓果智学AI一对一学习系统。晓果智学AI学习系统以艾宾浩斯遗忘曲线https://www.xiaoguoai.cn/
16.真人在线免费解题为何变成了“香饽饽”?猜想:成为自适应学习新基建? 虽然国外自适应学习技术已经比较成熟,但国内相关公司在自适应的技术上仍处于萌芽阶段。以拍照搜题为例,产品大多只能提供简单的错题本功能,个别产品虽然应用了一些相对更为复杂的逻辑,但却不能提供真正意义上的教学。因而不适合学习新的知识点,尤其是理解起来相对困难的知识点。 https://m.thepaper.cn/wap/resource/jsp/newsDetail_forward_10330297
17.101种最热门的EdTech工具“Times Table Rock stars是一个在线学习平台,让中小学生参与日常的时间表练习。它的自适应问题生成器能巧妙地排序,以提供可测量的改进时间表,增加信心和数学乐趣。 动画主题和激励性奖励制度吸引了学生、教师和家庭。孩子们可以自己练习,与其他学生竞争,完成适合他们能力的家庭作业,在线或使用移动应用程序。 https://36kr.com/p/829435155242882.html