CVPR2022OralLASAT:一种基于可学习攻击策略的对抗训练新范式cvpr鲁棒性算法神经网络

近日,由中科院信工所、香港中文大学(深圳)和腾讯AILab共同提出的一种可学习的对抗训练框架LAS-AT,被CVPR2022(Oral)顺利接收。通过引入“可学习的攻击策略”,LAS-AT可以学习自动产生攻击策略以提高模型的鲁棒性。该框架由一个使用对抗样本进行训练以提高鲁棒性的目标网络和一个产生攻击策略以控制对抗样本生成的策略网络组成。在不同数据集上的实验结果展现了LAS-AT的优越性。

一、问题背景

1.大多数现有的方法仅利用手工制定的攻击策略来生成AE,即仅使用固定的攻击策略来生成AE,限制了模型的鲁棒性;

2.大多数方法只使用一种攻击策略,而目前已有研究指出在对抗训练的不同阶段中使用固定的攻击策略会使得模型的鲁棒性受限。

在本文中,我们通过引入“可学习的攻击策略”,即LAS-AT,提出了一个新颖的对抗训练框架,它可以学习自动产生攻击策略以提高模型的鲁棒性。

二、方法介绍

LAS-AT方法的总体框架如图所示:

LAS-AT框架图:它由一个策略网络和一个目标网络组成。这两个网络是具有竞争关系的。对于策略网络,在给定一个干净的图像时,策略网络会生成一个对应的针对该样本的攻击策略;对于目标网络,AE生成器会根据攻击策略和目标网络来生成一个AE,用于训练目标网络。同时,目标网络也会分别给予AE生成器和策略网络一个监督信号。

2.1目标网络

目标网络是一个用于图像分类的卷积神经网络,可以表示为,其中表示的是估计标签,表示一张输入图像,表示神经网络的参数。

2.2策略网络

策略网络生成对抗攻击的策略进而去控制对抗样本的生成,其输入的是一个样本,输出的是一个策略。由于策略网络的参数是逐步被更新的,在不同的训练阶段中,根据目标网络的鲁棒性的情况,给定相同的样本作为输入也会给出不同的策略。令表示一种策略,其中每个元素表示的是一个攻击参数。

表示的是策略值空间,参数有个选项,并且被编码成one-hot向量。在不同的攻击参数下每个参数选项的意义是不同的。比如对于PGD攻击来说,它有三个攻击参数,即攻击步长的大小,攻击迭代数,以及最大的攻击扰动强度。

每一个参数有个可选值,比如攻击步长的取值范围为,攻击迭代数的取值范围为。这些攻击参数的可选值的一个组合可以看作是一个策略。策略网络在给定输入时输出策略的条件概率分布,其中是输入图片,是策略网络的参数。

2.3对抗样本生成器

给定一个干净的样本,对抗样本的生成过程可以被定义为:

其中表示的是一个干净的样本,表示的是其对应的对抗样本,是一个攻击策略,表示的是目标网络的参数,表示的是PGD攻击。

2.4对抗训练公式化表述

标准对抗训练有固定的攻击策略,可以表示为:

其中,并且表示的是人为设定的攻击策略。是训练集,表示的是交叉熵损失函数,其用于衡量对抗样本的预测标签与真实标签之间的距离。在本文中,我们没有使用基于人为设定的策略的样本,而是使用一个策略网络去自动生成基于策略的样本。在论文中对抗训练的策略可以公式化表示为:

与标准的对抗训练相比,最与众不同的地方在于对抗样本的生成方式。标准对抗训练采用的是人为设定的策略去求解内部优化问题。然而本文中我们是使用策略网络根据条件概率分布去产生一个样本依赖策略,即我们提出的策略是可以学习的,其对抗样本的生成包含策略网络参数,这会导致损失函数是两个网络参数的函数。

由论文提出的对抗训练的公式可知,目标网络和策略网络是有一种相互竞争的关系,即最小化和最大化相同的损失函数。目标网络学习调整参数去抵御对抗攻击策略生成的对抗样本,而策略网络根据给定的攻击目标网络的样本去提高攻击策略。

在一开始的训练阶段,目标网络是非常脆弱的,一个弱的攻击就可以使它分类出错,此时,策略网络可以很容易的生成有效的攻击策略,并且策略是多种多样的,因为弱的攻击策略和强的攻击策略都可以成功攻击目标网络。

随着训练过程的进行,目标网络变得越来越鲁棒,策略网络不得不去学习生成更强对抗样本的攻击策略。因此,这种博弈机制可以随着策略网络的生成策略的提高逐步促进目标网络的对抗鲁棒性。

2.5损失函数2.5.1评估鲁棒性损失为了引导策略网络的学习,我们提出了一种新的度量方式去评估对抗攻击,主要使用的是目标网络单步更新的鲁棒性。具体地,一个攻击策略首先被用作去创造一个对抗样本,并且该对抗样本通过一阶梯度下降法去单步调整目标网络的参数。如果更新后的目标网络能够正确预测由其它攻击策略生成的对抗样本的标签,则此时可以说该攻击策略是有效的。评估鲁棒性的损失函数可以表述为:

其中,是更新目标网络的参数,是步长,是由攻击策略生成的对抗样本。2.5.2预测干净样本损失

一个好的攻击策略应该不仅可以提高目标模型的鲁棒性也能够保持预测干净样本的准确率。在本论文中我们也考虑了单步更新目标模型在预测干净样本的性能,评估攻击策略的损失函数可以被定义为:

2.5.3总损失函数

结合以上两个损失函数项,本论文方法的对抗训练总损失函数可以表述为:

其中,和表示为和的权衡系数。

2.6.优化

我们提出一个算法交替优化这两个网络的损失函数。给定参数,优化目标网络的子问题可以表述为:

给定一个干净的样本,策略网络生成一个策略分布,从该条件分布中随机采样出一个策略,并用该策略去生成对抗样本。利用以下梯度下降法去更新目标模型的参数:

其中表示的是在一个批次中的样本数量,表示的是学习率。

给定,优化策略网络的参数的子问题可以描述为

其中

在这个优化问题中,最大的挑战在于对抗样本生成的过程是不可微的,即梯度信息不能通过对抗样本被反向传播到攻击策略的调整中。

另外,还有其它很多不可微的操作,如关系到对抗攻击中迭代次数的选择等,它们很难将梯度信息反向传播到策略网络中。在该论文中我们利用强学学习算法去解决以上不可微的问题,具体过程请参见原文。

三、实验结果

3.1与其他AT模型比较

下表分别为不同对抗训练的方法在CIFAR10、CIFAR100以及TinyImagenet三种不同数据集上鲁棒性的实验结果。可以发现,在大多数攻击场景下,论文中提出的三种方法对抗训练出的模型的性能都优于其它方法对抗训练出的模型,而且在很多情况下,论文中的方法不仅提高了基础模型的鲁棒性,而且提高了干净样本分类的精度。

Cifar-10结果

Cifar-100结果

Tiny-ImageNet结果

3.2超参数选择

我们将论文中方法与其他超参数搜索方法进行了比较,包括经典的超参数搜索方法(随机搜索)和两种自动超参数搜索方法。从下图可以看出,论文中的方法在所有攻击场景下对抗训练出的模型都达到了最佳的鲁棒性性能。

为了研究LAS-AT的工作原理,我们分析了策略网络在不同训练阶段的攻击策略分布。最大扰动强度的范围设定为3到15,下图所示为对抗训练期间最大扰动强度的分布演变情况。

在对抗训练开始时,分布覆盖了最大扰动强度的所有可选值。每个值都有选择的机会,这确保了对抗样本的多样性。随着对抗训练的进行,小扰动强度的百分比降低。在后期,最大扰动强度的分布被几个大值占据。

这一现象表明,策略网络逐渐增加大扰动强度的百分比,以生成更强的对抗扰动,进而目标网络的鲁棒性通过使用强对抗样本进行训练而逐渐增强。

3.3鲁棒性实验

我们也在WRN-70-16上测试了方法的有效性。实验表明LAS-AWP可以提高模型的鲁棒性,实现更高的鲁棒性精度。在CIFAR-100上,Cui等人为LBGAT训练WideResNet34-20(WRN-34-20),并在没有额外的真实或合成数据的情况下实现了最先进的稳健性。在WRN-34-20上,LAS-AWP也可以达到更高的鲁棒性精度。结果见表5。

3.4消融实验

为了验证目标函数中每个元素的有效性,我们在CIFAR-10上用ResNet18进行消融实验。在我们的损失中,除了损失,我们还提出了两个额外的损失项来指导策略网络的学习,即评估稳健性的损失和预测清洁样本的损失。我们通过使用、&、&和&&,分别训练四个LAS-PGD-AT模型。用一组对抗性攻击方法对训练好的模型进行攻击。结果显示在下表中。分类精度是评价指标。“clean”代表使用干净图像进行测试,而其他攻击方法使用AE进行测试。

四、总结

我们通过引入“可学习攻击策略”的概念,提出了一个新颖的对抗训练框架,它由目标网络和策略网络构成。在博弈机制下,策略网络根据目标模型的鲁棒性学习产生动态的攻击策略,用于对抗样本的生成,而不是使用纯手工的方法。为了指导策略网络的学习,我们还提出了两个损失项,并在三个基准数据集上进行了广泛的实验评估,以证明所提方法的优越性。

IllustrationbyRobin'sPixelfromIconScout

-TheEnd-

扫码观看!

本周上新!

多家技术企业招聘来啦!

多家技术企业招聘来啦!有求必应的小将收集到来自TechBeat技术社群内技术企业的招人需求,包含来自微软亚研、腾讯、小红书等企业算法工程师等正式及实习岗位,欢迎有需求的大家向这些公司投递简历哦!

扫描了解详情~

关于我“门”

将门是一家以专注于发掘、加速及投资技术驱动型创业公司的新型创投机构,旗下涵盖将门创新服务、将门技术社群以及将门创投基金。

将门成立于2015年底,创始团队由微软创投在中国的创始团队原班人马构建而成,曾为微软优选和深度孵化了126家创新的技术型创业公司。

如果您是技术领域的初创企业,不仅想获得投资,还希望获得一系列持续性、有价值的投后服务,欢迎发送或者推荐项目给我“门”:

THE END
1.科技巨头推出新一代人工智能算法预计将彻底改变数据处理效率新算法的核心技术 人工智能领域的最新进展显示了一个重大突破:新一代的人工智能算法,其核心技术在于一种全新的神经网络架构设计。该设计能够显著提高计算机学习和数据处理的速度与效率。这意味着未来的人工智能系统将能够更快地分析大量复杂数据,从而在医疗、金融、交通等行业中发挥更大的作用。 https://www.vjvqxysd.cn/bai-jia-dian/512055.html
2.机器学习找不到创新点?三种特征选择的方法包你拿下顶会!3.提供了七个黑盒AI模型在合成和真实世界网络入侵数据集上的实证比较。 4.开源了基于XAI的特征选择框架,供社区使用和扩展。 轻量级特征选择 shap-select框架 文章解析 文章介绍了一种新的特征选择框架shap-select,该框架通过在验证集上对目标变量与原始特征的SHAP值进行线性或逻辑回归,并根据回归系数的符号和显著性水https://www.bilibili.com/read/cv40067807
3.深入探索神经网络反向传播算法是最基本的优化算法,每次更新参数都是基于当前样本的梯度计算。虽然收敛速度较快,但由于随机性较大,容易受到噪音的影响,收敛不稳定。 算法在SGD的基础上引入了动量项,可以加速模型训练,并且在梯度方向改变时有一定的惯性,有利于减少参数更新时的震荡。 算法根据参数的历史梯度调整学习率,可以自适应地调整各个参数的学习https://www.jianshu.com/p/2548f5df22f1
4.《光谱学与光谱分析》2023年,第43卷,第02期最后,利用所训练出的模型对太赫兹频域高频区域图像进行盲去噪,并用重建图像分别与原始成像结果和传统太赫兹去噪算法结果进行比较,分别从主观和客观两个方面评价了不同算法对太赫兹频域高频图像的去噪效果。实验结果表明,通过该算法实现了极限空间分辨率约为157 μm,去噪后图像极限空间分辨率处的瑞利判据鞍-峰比约为0.623,http://www.sinospectroscopy.org.cn/readnews.php?nid=97530
5.独家发布!10个2024年新算法跑10个测试集!2024新算法每个算法都是独立.m文件,高效管理,所有结果均可一键运行自动保存,可用于算法对比、学习、改进等等,趁现在知道的人少,先用先发,可定制改进算法和各种应用。 一、10个2024年新算法介绍 1.苦鱼优化算法(Bitterling Fish Optimization,BFO) 摘要:苦鱼是自然界中为了生存而表现出智能行为的典型例子。苦鱼用牡蛎产卵的https://blog.csdn.net/2301_82017165/article/details/136943200
6.几种现代优化算法的比较研究(通用7篇)【导语】下面是小编为大家整理的几种现代优化算法的比较研究(共7篇),供大家参考借鉴,希望可以帮助到有需要的朋友。 篇1:几种现代优化算法的比较研究 几种现代优化算法的比较研究 摘要:现代优化算法主要包括遗传算法、蚁群算法、禁忌搜索算法.这些算法主要是解决优化问题中的难解问题.由于这些算法在求解时不依赖于梯度https://www.hrrsj.com/wendang/qitafanwen/760240.html
7.2022下半年盘点:20+主流数据库重大更新及技术要点汇总在即将发布的新版本中,PieCloudDB Database将为用户带来内核和云原生平台多方位的大幅提升,包括极速vacuum、全新的缓存实现、极速Analyze、用户数据存储的分布式处理增强、HDFS/NAS支持,Kafka支持以及ETL/ELT增强等多个重大新特性。? 云原生、分布式发展如火如荼 https://www.51cto.com/article/744621.html
8.人教版三年级数学上《口算两位数加两位数》教学反思范文(通用10篇)在新知的教学上,我通过创设学生熟悉的跳绳场景,在生活情境中使学生经历提出数学问题——列出算式——探究算法——巩固算法的过程。其中探究算法这一部分,我们先研究不进位加法,我通过组织学生小组活动,让学生充分阐述自己的算法,在交流中不自觉的对算法进行比较,一方面使学生感受算法的多样化,另一方面寻找最优化算法。在https://www.ruiwen.com/jiaoxuefansi/3461381.html
9.一种边缘计算环境中功耗优化的负载任务迁移算法在边缘计算架构中,边缘节点处于远离云计算中心的地理位置,其对迁移时间的影响不可忽视,所以在边缘环境中的任务迁移调度算法必然要考虑到迁移时间对服务质量带来的影响。另外一方面,目前尚未存在针对边缘计算的功耗、CPU利用率和温度等度量指标对节点任务进行优化调度的算法,而边缘计算本身也是一个近几年来出现的新概念,https://wenku.baidu.com/view/5b4900a368d97f192279168884868762caaebba8.html
10.基础研究新进展和新成果非线性光学晶体、量子信息和通信、超强超短激光研究居国际前列;纳米材料和纳米结构、蛋白质结构与功能、脑与认知、动物克隆、创造新物质的分子工程学、古生物学、海洋科学等领域取得系列创新成果,整体研究水平显著提高,在国际上产生重要影响;数学机械化、辛几何算法等方面保持我国特色和优势。 https://www.most.gov.cn/ztzl/jqzzcxxqx/jqzzcxxqxxtp/200606/t20060612_33902.html
11.美颜技术近几年的数据图片分析怎么写帆软数字化转型知识库美颜技术在过去几年的发展中取得了显著的进步,其普及率、用户群体、技术多样性和复杂性都得到了极大的提升。未来,美颜技术将继续在算法优化、新功能开发和应用场景扩展上实现创新和突破。随着人工智能和深度学习技术的不断进步,美颜技术将更加注重个性化和自然化,通过深度学习算法实现更为精准的面部识别和优化调整。同时https://www.fanruan.com/blog/article/357819/
12.果蝇优化算法的加权策略研究AET关键词: 加权因子;果蝇优化算法;线性递减策略;先增后减策略 果蝇优化算法FOA(Fruit Fly Optimization Algorithm)是由台湾博士潘文超于2011年提出的,与蚁群算法和粒子群算法类似,是基于动物群体觅食行为演化出的一种寻求全局优化的新方法[1-3]。它不同于顺序执行的传统智能算法,而是以果蝇群体自组织性和并行性为基础,http://www.chinaaet.com/article/3000004316
13.科学网—[转载]进化集成学习算法综述【摘 要】进化集成学习结合了集成学习和进化算法两方面的优势,并在机器学习、数据挖掘和模式识别等领域被广泛应用。首先对进化集成学习算法的理论基础、组成结构及分类情况进行了概述。然后根据进化算法在集成学习中的优化任务,从样本选择、特征选择、集成模型参数组合优化、集成模型结构优化以及集成模型融合策略优化几个方面https://wap.sciencenet.cn/blog-951291-1312816.html
14.OpenAI公布强化学习新算法,可控制复杂机器人OpenAI公布强化学习新算法,可控制复杂机器人 近日,OpenAI 发布了一种新型的强化学习算法:近端策略优化(Proximal Policy Optimization,简称 PPO),这种算法不但在性能上比肩甚至超过当前最先进的方法,而且更容易实现和调试。由于 PPO 易于使用并且性能优秀,OpenAI 已将其设为默认的强化学习算法。https://cloud.tencent.com/developer/article/1109341