只是因为在人群中多看了你一眼,再也没能忘掉你容颜丨智言智语

近日,中科院自动化所图像与视频分析组针对大规模长尾目标检测任务提出了一种新颖的动态类别抑制(AdaptiveClassSuppressionLoss,简写为ACSL)方法,通过我们的大规模多级多卡分布式训练框架LargeDet来进行模型训练,彻底摆脱了对于数据集类别分布的依赖,无需显示划分头部类别和尾部类别,有效避免了人为分组带来的训练不一致和训练不充分的问题,真正实现数据集无缝地迁移,而不需要进行数据集的统计分布以及超参数调整,同时性能上取得了显著提升。ACSL在经典的长尾目标检测数据集LVIS上取得了显著的性能提升(+5.18%mAP),检测器在尾部类别的精度(+14.34%APr)。此外,在大规模检测数据集OpenImages上也取得了大幅度的性能提升(+5.2%AP),并且支持多标签学习以及类别嵌套学习。

什么是长尾分布?

一般头部类别通常包含数十万甚至上百万个训练样本,而尾部类别只包含数个至数十个训练样本。如在日常生活中不同类别的物体出现的频率相差极大:既包括日常生活中常见的猫、狗、汽车,也包括难得一见的东北虎和大熊猫。

这种现象反映到数据集上就是各个类别呈现一个长尾分布的态势,极少数的类别拥有大量的训练样本(头部类别),但是大量的类别样本数却非常的稀少(尾部类别)。随着数据集规模的扩大,类别数的增多,长尾分布的问题也就愈发地明显。

OpenImages是现存最大的目标检测数据集,总共包含170万张图片和600个类别。该数据集面临着严重的长尾分布问题,比如其头部类别“树木”包含多达29万张训练图像,但是尾部类别“炸弹”仅仅包含6张训练图像,它们之间的图片数量相差48333倍之多。面对严重的长尾分布问题,神经网络在训练过程中会被头部类别所主导,尾部类别由于缺少训练样本,精度往往非常差,导致整体精度的下降。

图1.LVIS数据集各类别的样本数量分布示意图。x轴表示按照图片数量降序排序过后的类别标号,y轴表示类别对应的图片数量

长尾分布的应对方法

现有经典的解决长尾问题的方法(比如EQL和BAGS)主要通过类别分组的方式来解决。他们首先统计各个类别的样本数量,并且将样本数量相近的类别分到同一组中。在训练过程中,由于头部类别和尾部类别被分到了不同的组别,头部类别并不直接对尾部类别产生抑制,从而保护了尾部类别的充分学习。

但是这些分组的方法存在两个弊端:

(1)在分组边界两端的类别训练不一致。

(2)网络对于不同组之间的易混淆的类别缺乏判别力。

除此之外,分组方法依赖于具体数据集的类别分布先验。当应用于不同的数据集时,此类方法需要重新对数据集的类别分布进行统计,并且需要进行实验调参来确定最优的分组策略,从而限制了此类方法的通用性和可迁移性。

动态类别抑制损失

结合上述分析,我们认为对于长尾数据集来说,一个通用有效的方法应该具有如下的性质:

基于上面的两个原则,团队设计了一种新型动态类别抑制损失ACSL,无需统计各个类别的样本数量,将所有类别均视为尾部类别,依据网络对每个类别每个样本的学习状态动态地产生抑制梯度。ACSL的设计源于如下的设计思路:属于某个类别的样本会默认地对其他类别产生抑制梯度使其输出较低的得分。对于属于类别A的样本,如果网络已经能够很好地区分类别A和类别B,那该样本无需对类别B产生抑制梯度,以避免类别B接收到过度的抑制梯度。如果网络在类别A和B之间产生混淆,我们便需要施加对类别B的抑制梯度以维持网络的判别力。

对于长尾分布数据集,由于头部类别样本会对尾部类别产生过量的抑制,导致尾部类别精度差。我们因此设计了一个动态类别抑制损失ACSL来保护尾部类别的学习,并且不破坏网络对易混淆类别的判别性。如式(1)所示,ACSL在每类损失项的前面乘了一个二值的权重项。对于类别k对应的权重,由于当前样本属于类别k,所以将其值设为1。对于其他类别i≠k,如果其输出属于第i类的概率大于一个固定的阈值ξ,说明对于该样本来说,网络很容易将类别i和类别k混淆,因此需要保留该样本对类别i的抑制梯度来保证网络对类别i和k的判别性。换句话说,此时要设置为1。当小于固定的阈值ξ时,说明网络已经能够很好地区分类别i和类别k了,为了避免对尾部类别产生过多的抑制,被设置为0。上述过程的公式化表述如式(2)所示。ACSL对的导数如式(3)所示。

为了更好地理解动态类别抑制损失,我们结合图2对比了对动态类别抑制损失和二值交叉熵损失的区别。图2表示二值交叉熵损失和ACSL对同一个样本的处理方式。该样本属于A类别,对于二值交叉熵损失来说,每个类别的损失的权重项均设置为1。对于ACSL来说,由于网络在A类别和D类别上都有比较高的得分,说明网络容易对这两个类别产生混淆,所以要保留对类别D的抑制梯度,其权重设置为1。对于类别B,C,E来说,网络产生的得分较低,所以将其对应的权重设置为0,可以避免对尾部类别产生过度的抑制作用,保护尾部类别的精度。

图2.二值交叉熵损失和动态类别抑制损失示意图。

实验验证

我们在经典的长尾目标检测数据集LVIS(v0.5)来探究ACSL的有效性。我们采用了ResNet50-FPN检测器进行实验。除了最后分类的损失函数外,其他的结构均保持一致。如表1所示,ACSL可以大幅度提高检测器的性能。当ξ等于0.7时,检测器的精度为26.36%,超过2倍训练策略的baseline4.08%。同时,我们也发现,ACSL带来的精度提升主要来自于rare类别和common类别,说明我们的方法对尾部类别具有明显的优势。

表1.LVIS数据集下的消融实验

为了验证ACSL的泛化性能,我们同时在大网络ResNet101、ResNeXt101以及强检测器CascadeRCNN上进行了实验。从表2中可以看出,ACSL在大网络和强检测器上均有稳定的性能提升,特别是在和上。

表2.ACSL在不同网络以及检测框架上的性能

为了探究ACSL的通用性,我们在大规模长尾数据集OpenImages上也进行了实验验证。由于OpenImages数据集具有170万训练数,因此这里利用了我们ECCV2020提出的大batchsize分布式训练框架LargeDet来加速训练。在此基础上,ACSL同样也带来了5%以上的精度提升,将ResNet50-FPN在OpenImages上的精度提升到了60.3%。如表3所示,ACSL在不同的主干网络下均能取得显著的性能提升。

表3.ACSL在OpenImages数据集上的实验结果

此外,我们对比了ACSL和baseline在一些尾部类别上的精度,如表4所示,发现ACSL可以极大地提高尾部类别的性能,在类别“Facepowder”甚至可以取得(+63.1%AP)的绝对精度提升。

表4.OpenImages数据集上尾部类别精度提升对比

典型应用

图3.手机端应用示意图

图4.卷烟零售终端智能分析评价系统示意图

图7.智慧交通车纹大数据平台

论文标题:TongWang,YousongZhu,ChaoyangZhao,WeiZeng,JinqiaoWangandMingTang.AdaptiveClassSuppressionLossforLong-TailObjectDetection.

参考文献:

1.JingruTan,ChangbaoWang,BuyuLi,QuanquanLi,WanliOuyang,ChangqingYin,andJunjieYan.Equalizationlossforlong-tailedobjectrecognition.InIEEE/CVFConferenceonComputerVisionandPatternRecognition(CVPR),June2020

2.YuLi,TaoWang,BingyiKang,ShengTang,ChunfengWang,JintaoLi,andJiashiFeng.Overcomingclassifierimbalanceforlong-tailobjectdetectionwithbalancedgroupsoftmax.InIEEE/CVFConferenceonComputerVisionandPatternRecognition(CVPR),June2020

3.TongWang,YousongZhu,ChaoyangZhao,WeiZeng,YaoweiWang,JinqiaoWang,andMingTang.LargeBatchOptimizationforObjectDetection:TrainingCOCOin12minutes.InEuropeanConferenceonComputerVision(ECCV),August2020

THE END
1.重尾分布,长尾分布,肥尾分布和随机游走(Heavytailed,Long本文主要讨论重尾分布,长尾分布,肥尾分布三者的联系,同时顺带讨论了一下 Random walk 中的 Lévy flight 和 Brownianmotion。主要内容参考自 Wikipedia 和 Rick Wicklin 的博文Fat-tailed and long-tailed distributions。其实我们讨论重尾长尾肥尾,数学上并没有一个明确的对于尾(tail)的定义,但这也并不妨碍我们进行https://blog.csdn.net/dymodi/article/details/54231728
2.概率分布细谈:厚尾长尾幂律指数在人类行为和社交网络等社会学数据分析中,"厚尾" "长尾" “幂律” “指数”等数学术语频繁出现,新手阅读文献时往往摸不着头脑。在这篇文章中,我将逐一梳理这些常见概念的关系。 0. 指数分布 在介绍厚尾分布之前,我们需要先理解一个基础连续概率分布——指数分布。指数分布一般用来刻画独立随机事件发生的时间间隔。https://www.jianshu.com/p/b7e06c4839b2
3.长尾分布在分类和回归问题中很重要什么是长尾分布对于这个名词,不是很理解,查找资料得出长尾分布数据集的含义。 二、长尾分布数据 2.1 什么是长尾分布 长尾分布数据是一种偏态分布,是指几个类别(亦叫头类)包含大量的样本,而大多数类别(亦叫尾类)只有非常少量的样本。 即一小部分标签(即头部标签)有很多数据实例,而大多数标签(即尾部标签)只有很少数据实例的不平https://blog.51cto.com/u_16213624/10998293
4.长尾级联流行度预测模型训练方法及预测方法5.但是,目前还没有研究从数据服从长尾分布的角度来解决级联预测效果低下的回归问题。技术实现要素:6.本发明的目的旨在针对传统方法直接回避长尾数据带来的预测准确率不高、可解释性低等技术现状,提供一种直面长尾级联信息数据的流行度预测模型及训练方法,利用解耦思想,进行分步训练,以此来提高流行度预测准确率,能够作为https://www.xjishu.com/zhuanli/55/202111169186.html
5.白颈长尾雉形态特征白颈长尾雉繁殖方式→MAIGOO百科中文学名: 白颈长尾雉 拉丁学名: Syrmaticus ewllioti 别称: 横纹背鸡 界: 动物界 门: 脊索动物门 纲: 鸟纲 目: 鸡形目 科: 雉科 属: 长尾雉属 种: 白颈长尾雉 分布区域: 中国 目录 生长与分布 栖息环境 分布范围 形态及特征 生活习性 繁殖方式 价值及其他 种群现状 保护级别 https://www.maigoo.com/citiao/229755.html
6.规模经济思想的核心范文(一)医药商业企业长尾分布 从图2中国医药商业100强销售分布曲线的特征进行观察,中国医药商业行业的结构属于长尾结构(长尾理论所研究的结构),百强企业总销售额为2 764亿元(中国医药商业协会,2008),前10强企业占据了50%的市场份额,剩余90家医药商业企业销售收入累计占50%[4]。如果将所有医药商业企业销售分布图作出,长https://www.gwyoo.com/haowen/240241.html
7.ToB新视角:小程序生态评估方法探索优设网2. 做好抽样方案:长尾分布下分群抽样 B 端商户作为生态中的供给“群体”,具有内在群体结构,每个商户为生态提供的价值并不均匀,在生态内可获得的资源也不均匀。符合“贫者愈贫,富者愈富”的马太效应。 少数行业头部商户,自身体量规模大、品牌效应强,如家政行业的 58 到家、快递行业的顺丰等,属于各自行业内寡头玩家https://www.uisdc.com/miniprogram-assess-ways
8.信息学院在计算机视觉领域取得多项重要成果(第三期)尽管学术界在相关领域已经取得很多进展,但由于视觉关系的类别空间具有本质性的长尾分布和高度多样化的类内变化特征,识别视觉关系仍然具有挑战性。为了解决这些问题,研究人员提出了一种新的具有自适应消息传播机制的置信感知二分图神经网络,通过对场景图上下文语意依赖的稀疏性进行更为灵活有效的建模,从而进一步的改善了目前https://sist.shanghaitech.edu.cn/2021/0506/c2858a63430/page.htm
9.我所35篇论文被2022国际计算机视觉与模式识别大会(CVPR)接收近年来,长尾分布数据的视觉识别问题受到了越来越多的关注。通过大量的实验,我们发现在相同的训练设置,不同的模型初始化下,长尾数据训练出的模型表现出相当大的差异,这体现出了长尾学习中巨大的不确定性。为了减轻这种不确定性,我们提出了一种多专家网络的嵌套式的协同学习方法(NCL),它由两个部分组成,即嵌套个体学习https://www.1633.com/article_univ/217359.html
10.长尾年代(长尾理论)书评美国《联线》(Wired)杂志发表了总编克里斯?安德森(Chris Anderson)的文章:“长尾”。副标题是“别老掂着从榜顶的几个巨无霸里多榨几百万出来。娱乐的未来在码流低浅的那头无数个细微市场那儿”。“低浅的那头”,其实就是帕累托分布的尾巴;“无数个细微市场”,其实也就是托夫勒的全民个性化消费。安德森的神https://book.douban.com/review/1095674/
11.鼠类杂谈黄鼠分布于黑龙江、新疆、内蒙古等地,常见于山地草原。该物种的模式产地在西伯利亚色楞格河。 亚种:长尾黄鼠阿尔泰亚种,分布于新疆(阿尔泰山)等地。长尾黄鼠东北亚种,分布于黑龙江等地。长尾黄鼠天山亚种,分布于阿拉套山、新疆(伊犁天山、乌鲁木齐以西北天山)等地。 http://cdcp.gd.gov.cn/jkjy/jkzt/xdybmswkz/content/post_3439706.html
12.《长尾理论》读后感(通用13篇)《长尾理论》读后感 篇4 刚刚开始以为会描述长尾分布和正态分布的对人的启示意义:如何辨别潜在长尾分布和正态分布项目,并且利用一定的技巧将其推为长尾分布,可能同以前略览过的《黑天鹅现象》一书类似。细细看来,发现并非如此。 本书的话,大致描述的是一个长尾分布的项目存在的条件如何,这其中包括生产工具的普及从https://www.cnfla.com/duhougan/1328952.html
13.统计学入门第1章:不确定性的数学表达:指数分布狗熊会我们从中挑选出仅出险一次的4333张保单,绘制它们的索赔额直方图,如图1.5.4所示。可以看到,图1.5.4展示的情况与我们的猜想一致,大部分车险的索赔金额都集中在5000以内,且不同赔付区间内的保单占比随着赔付金额的增大而逐渐递减,这也是一个典型的长尾分布。https://www.shangyexinzhi.com/article/4456335.html
14.指数分布定义指数分布虽然不能作为机械零件功能参数的分布规律,但是,它可以近似地作为高可 靠性的复杂部件、机器或系统的失效分布模型,特别是在部件或机器的整机试验中得到广泛 的应用。指数分布比幕分布趋近0的速度慢很多,所以有一条很长的尾巴。指数分布很多时候被 认为是长尾分布。互联网网页链接的出度入度符合指数分布指数分布https://www.renrendoc.com/paper/215823448.html
15.土壤性质空间分布的空间预测模型(6页)土壤Cu含量的频率分布直方图表现为右侧长尾分布,说明该区土壤表层Cu含量的空间分布是非常不均匀的。 Cu含量的指示编码变换共使用了5个门槛值,相应指示编码的半方差图(图3)和半方差模型的拟合参数(表1)均由统计计算软件R中的geoR模块计算获得,半方差函数拟合采用的是权重最小二次方方法(WLS)。本研究中仅使用了5个https://max.book118.com/html/2023/0826/8073136073005124.shtm
16.Long因为图片级别的数据易于生成或收集,baseline模型也简单,目前主要的长尾分布研究都集中在图片分类领域。不过随着去年Facebook发布的LVIS(Large Vocabulary Instance Segmentation)数据集(https://arxiv.org/abs/1908.03195),越来越多的人也开始关注起了Instance级别的长尾分布分布问题(物体检测和实例分割),我会在下一节更新https://www.zhihu.com/column/p/158638078
17.起底亚马逊eBay和Etsy卖家分布情况,他们都呈现出这样一个定律从以上三张图可看出,每个平台上的卖家分布情况略有不同,这突出了TOP卖家的不同销售表现。从长尾分布情况来看,Etsy上TOP卖家的规模并不如eBay。虽然亚马逊TOP卖家数量少于eBay,但总体而言,他们创造了更多的GMV(网站交易总额)。Etsy上有21%的评论都流向了前1%的卖家,亚马逊上有42%的评论流向了前1%的卖家,eBay上则有https://www.cifnews.com/article/40788
18.银喉长尾山雀—拍自生态城永定州公园银喉长尾山雀的尾羽健全,活动敏捷,姿态多变,能很快习惯在鸟笼中生活,有一定的观赏价值。[9]银喉长尾山雀是中国较为常见的一种森林鸟类,分布广,数量丰富。主要以昆虫为食,在森林害虫控制方面作用很大,[10]银喉长尾山雀被列入国家林业局发布的《国家保护的有益的或者有重要经济、科学研究价值的陆生野生动物名录》。https://www.meipian.cn/50ola2h2
19.竞赛专题数据预处理如何处理数据中的坑?1. 查看Label分布 对长尾分布数据取log 2. 观察关联 绘制热力图,观察各个数值属性与Label的关联度,去除关联程度非常低的属性。越是白色越是关联紧密,可以观察Label跟哪些属性关联更紧密 3. 去除异常点 通过2找到和Label相关性最强的特征,绘制散点图以及箱型图剔除异常点。不过具体问题需要具体分析,有的异常出现可能https://maimai.cn/article/detail?fid=1321163961&efid=9yH23aG36RwtiOeB78-A8A
20.中国私募量化简史:策略投顾业态及展望基金频道量化竞争格局走向一九现象会越来越明显,长尾分布让头部品牌溢价能力越来越强。股票量化领域的头部效应要明显高于期货领域,这个跟市场容量与技术路径有关系。国内现阶段的格局还没有达到一种寡头垄断阶段,在走向这个过程中还存在不少变数。 外资私募管理人(WFOE)陆续进入国内,是否会对国内的量化格局形成冲击?拿股票高频策略https://funds.hexun.com/2019-09-09/198487973.html