武汉大学等发布ReID最新综述!囊括三大视觉顶会,提出新基准方法AGW|TPAMI2021模态算法

行人重识别(PersonRe-Identification,简称Re-ID),是一种利用计算机视觉技术来检索图像或者视频序列中是否存在特定行人的AI技术,在智慧城市等监控场景中具有重要的应用意义和前景。

本文介绍我们最新的IEEETPAMI综述论文《DeepLearningforPersonRe-identification:ASurveyandOutlook》,该文作者来自武汉大学、起源人工智能研究院(IIAI)、北理工、英国萨里大学、Salesforce亚洲研究院。

知乎原文:

首先非常感谢领域内的前辈和各位大佬,为该综述提供了非常充实的素材和基础。

这里先总结该综述的几个主要贡献点:

2、展望:

1)一个新的评价指标mINP,用来评价找到最困难匹配行人所需要的代价;

2)一个强有力的AGW方法,在四种不同类型的Re-ID任务,包括12个数据集中取得了较好的效果;

3)从五个不同的方面讨论了未来Re-ID研究的重点和难点,仅供大家参考。

前言

根据个人理解,本文总结Re-ID技术的五大步骤:

2)行人框生成,从视频数据中,通过人工方式或者行人检测或跟踪方式将行人从图中裁切出来,图像中行人将会占据大部分面积;

3)训练数据标注,包含相机标签和行人标签等其他信息;

4)重识别模型训练,设计模型(主要指深度学习模型),让它从训练数据中尽可能挖掘“如何识别不同行人的隐藏特征表达模式”;

5)行人检索,将训练好的模型应用到测试场景中,检验该模型的实际效果。

如下图所示:

图1.构建行人重识别系统的五个主要步骤。包括:1)数据采集,2)行人框生成,3)训练数据标注;4)重识别模型训练,5)行人检索

全文的综述和展望都是围绕这五个步骤来展开和讨论的。针对以上五个步骤的一些约束条件,本文将ReID技术分为Closed-world和Open-world两大子集。

Closed-world概括为大家常见的标注完整的有监督的行人重识别方法,Open-world概括为多模态数据,端到端的行人检索,无监督或半监督学习,噪声标注和一些Open-set的其他场景。

Closed-worldRe-ID

这一章节主要介绍大家常用的封闭世界(Closed-world)Re-ID设置,一般包含以下假设:

(1)通过图像或视频,可见光(RGB)摄像机捕捉行人;

(2)行人由boundingboxes框出;

(3)有足够多的被标注训练数据;

(4)标注的数据标签通常都是正确的;

(5)queryperson必须出现在galleryset中。

根据方法设计流程,将其分为特征学习,度量学习和排序优化三个部分。研究人员的方法通常针对这三方面进行改进,侧重点不同。

有的是提出了新颖的特征学习方法,有的提出有效的度量损失函数,也有的是在测试检索阶段进行优化。在本章节末尾,还概括了现有的常用数据集和评价指标,以及现有SOTA的优缺点分析。

2.1特征学习方法

图2.四种主要的Re-ID特征学习方法

2.2度量学习方法

图3.三种常见的Re-ID度量学习(损失函数)方式

早期的度量学习主要是设计不同类型的距离/相似度度量矩阵。深度学习时代,主要包括不同类型的损失函数的设计及采样策略的改进:

2.3排序优化

用学习好的Re-ID特征得到初始的检索排序结果后,利用图片之间的相似性关系来进行初始的检索结果优化,主要包括重排序(re-ranking)和排序融合(rankfusion)等。

图4.重排序示例

2.4数据集和评价

主要包括现有的一些常用图像和视频数据集的概括,以及现有方法SOTA的一些总结和分析,希望综述里面的一些分析能够在大家进行模型设计时提供一些思路和帮助。具体分析详见原文。

Open-WorldRe-ID

由于常规的Closed-worldRe-ID在有监督的实验场景中已经达到或接近瓶颈了,现在很多的研究都更偏向于Open-WorldRe-ID场景,也是当前Re-ID研究的热点。根据Re-ID系统设计的五个步骤,本章节也从以下五个方面介绍:

1)多模态数据,所采集的数据不是单一的可见光模态;

2)端到端的行人检索(End-to-endPersonSearch),没有预先检测或跟踪好的行人图片/视频;

3)无监督和半监督学习,标注数据有限或者无标注的新场景;

4)噪声标注的数据,即使有标注,但是数据采集和标注过程中存在噪声或错误;

5)一些其他Open-set场景,查询行人找不到,群体重识别,动态的多摄像头网络等。

3.1多模态(异构)数据

总体而言,异构的行人重识别问题需要解决的一大难题是不同模态数据之间的差异性问题

3.2端到端Re-ID(End-to-endPersonSearch)

3.3半监督和无监督的Re-ID

为了缓解对标注数据的依赖,半监督和无监督/自监督现在成为了当前研究的热点,在CV顶会上呈爆炸之势。本文也主要分成两个部分:无监督Re-ID(不需要标注的源域)和无监督域自适应Re-ID(需要标注的源域数据或模型):

考虑到无监督学习也是现在研究的热点,本文也对现有的SOTA做了一个简单的总结和分析,可以看到现在的_无监督学习方法已经是效果惊人了,未来可期_。如下表所示:

表1.现有无监督学习方法在常见数据集上的效果

3.4噪声鲁棒的Re-ID

主要针对标注数据或者数据采集中产生的一些噪声或错误等,方法包括:

3.5Open-setRe-IDandBeyond

主要针对一些其他开放场景进行一些探讨,如1)galleryset中query行人没有出现的场景;2)GroupRe-ID:行人群体匹配的问题;3)动态的多摄像头网络匹配等问题

展望

4.1新的评价指标mINP

考虑到实际场景中,目标人物具有隐匿性,很多时候要找到其困难目标都非常难,给侦查工作带来麻烦。mINP主要目的是为了衡量Re-ID算法用来找到最难匹配样本所要付出的代价,

4.2新的基准方法AGW

主要是在@罗浩的Bagoftricks(感谢)上做的一些改进,主要包括:1)Non-local注意力机制的融合;2)Generalized-mean(GeM)Pooling的细粒度特征提取;3)加权正则化的三元组损失(WeightedRegularizationTriplet(WRT)loss):

图5.AGW方法的示意图

在审稿人的建议下,我们在四种不同类型的任务(图像Re-ID,视频Re-ID,跨模态红外Re-ID和PartialRe-ID)的12个数据集上均对我们提出的新指标mINP和AGW方法进行了测评,在大多数情况下,我们的方法都能够取得比较好的效果。具体的实验结果和分析可以参考我们的论文和补充材料,希望我们的方法和评价指标能对大家有一些帮助。

4.3对未来一些研究方向的思考

这一部分也是紧扣前面提出的五个步骤,针对五个步骤未来亟待解决的关键问题或者热点问题进行归纳。由于每个人理解上的认知偏差,这里的建议仅供大家参考:

后记:很多内容在这里都没办详细描述,具体的细节还请大家移步原文、补充材料以及源代码。因能力有限,部分描述不一定完全客观正确,希望大家能够理解。希望我们的综述能够给领域内的同行提供一些帮助和借鉴。

THE END
1.算法:挑战与治理理论可以说,算法正在重塑我们对世界的理解方式。 人工智能概念自1956年被提出以来,经历了多次重大演化。2015年以来,人工智能研究向以神经网络为核心的深度学习方向飞速发展,支撑了目前的大部分智能应用场景。2022年以来,以OpenAI发布ChatGPT为标志,人工智能进入大模型时代,这其中的关键是通过算法设计,能够高效利用海量的无标注https://www.workercn.cn/c/2024-02-27/8163054.shtml
2.“算”无遗“策”——算法合规简记与解构但其上的两部法律和司法解释,仅是对算法进行了概括式的归类保护,并未予以明确的具化分类。 直至2021年9月,国家互联网信息办公室(以下简称“网信办”)发布《关于加强互联网信息服务算法综合治理的指导意见》(以下简称“《指导意见》”),完整提出了健全算法安全治理机制、构建算法安全监管体系、促进算法生态规范发展的https://www.grandwaylaw.com/guofengshijiao/4486.html
3.视频AI方案:数据+算力+算法,人工智能的三大基石算力解构算法随着信息技术的迅猛发展,人工智能(AI)已经逐渐渗透到我们生活的各个领域,从智能家居到自动驾驶,从医疗诊断到金融风控,AI的应用正在改变着我们的生活方式。而数据、算法和算力,正是构成人工智能技术的三大核心要素,它们之间相互关联、相互影响,共同推动着人工智能的发展。 https://blog.csdn.net/weixin_43194037/article/details/136658759
4.2020级硕士研究生于卓含提出进化压缩感知模型新算法文章提出四种结合自然启发优化算法的压缩感知模型框架。算法通过自然启发优化算法引导压缩感知系统寻找高维稀疏的scRNA-seq数据的稀疏模块字典和层次,并利用吸引算子和搜索算子来提高原始数据的重构精度。并针对重构后的高维稀疏scRNA-seq数据进行差异基因分析、聚类分析、基因富集和KEGG分析,揭示该模型的有效性 。https://www.1633.com/article_univ/110768.html
5.2021山西省公务员考试行测试题参考答案及解析2021山西省公务员考试行测试题参考答案及解析 1.【答案】D。坚持把发展经济着力点放在实体经济上,坚定不移建设制造强国、质量强国、网络强国、数字中国 2.【答案】B。只争朝夕,不负韶华 中公解析:A项直接相关。“扶贫必扶智,治贫先治愚”是2016年7月20日习近平总书记在东西部扶贫协作座谈会上的讲话上提出的观点,https://gd.offcn.com/html/2021/03/251351.html
6.科技创新2030—“新一代人工智能”重大项目2021年度项目申报指南研究基于因果关联的决策理论和反事实推断方法,构建因果强化 学习框架,刻画环境、动作和激励之间的多层因果关联与耦合, 形成知识引导、数据驱动和行为探索相结合的因果推理和反事实 推理基础模型和算法; 研究基于因果的机器学习泛化理论和可解 释性框架,提出基于因果的去除伪关联表征学习机理,突破模型 泛化瓶颈问题,提升模型https://news.0haochuangkou.com/article-6-8109.html
7.人工智能顶会CVPR2021收录西湖大学王东林课题组最新成果总结来说,王东林课题组提出的算法效率来自两个方面:在局部子空间上的探索(图2b)和对探索空间的约束(图5b)。与以往在全局空间中探索的工作不同,PSST使用了一种针对少样本问题的Pareto探索方法。PSST将少样本辅助问题分解为多目标约束子问题,并对主任务达到最佳性能的偏好区域进行识别。实验表明,该改进方法的探索空间https://www.westlake.edu.cn/academics/School_of_Engineering/NEWS/202104/t20210423_9583.shtml
8.安全事件周报(08.0108.07)CISA公布了2021顶级恶意软件的名单 成千上万的黑客涌向“黑暗公用事业”C2即服务 微软阻止Tutanota用户使用自己的服务 美国网络空间大使提名人提出愿景巨大的议程 印度撤回了《个人数据保护法案》 量子加密候选算法SIKE被单核CPU一小时破解 乌克兰击落了100万个用于虚假信息的机器人 https://cert.360.cn/warning/detail?id=50b323ce19f33b008d7febb0479141be
9.2021本文提出了提高深度强化学习算法比较的严谨性的实用方法:具体而言,对新算法的评估应该提供分层的自举置信区间、跨任务和运行的性能概况以及四分位数。本文强调,在许多任务和多次运行中报告深度强化学习结果的标准方法会使人很难评估一种新的算法是否代表着比过去的方法有一致的、可观的进步,作者通过经验性的实验说明了https://www.jiqizhixin.com/articles/2022-08-19-13
10.百变冰冰!手把手教你实现CVPR2021最新妆容迁移算法来源丨AI算法与图像处理 编辑丨极市平台 大家好,今天是周日,周日不休息, 今天给大家分享一个 CVPR 2021 的最新工作,关于妆容迁移的。挺好玩的,下面我会简单介绍论文,并带大家手把手跑一下demo。如果有用,大家帮忙点个在看,分享朋友圈鼓励一下,谢谢啦。 https://www.cvmart.net/community/detail/5106
11.西安决策参考中国人民银行金融市场司司长邹澜在日前国新办的新闻发布会上透露:截至2021年底,我国的数字人民币试点场景已经超过808.51万个,累计开立个人钱包2.61亿个,交易金额875.65亿元。国务院办公厅日前公布的《要素市场化配置综合改革试点总体方案》提出,支持在零售交易、生活缴费、政务服务等场景试点使用数字人民币,这将对数字人民币http://www.xalib.org.cn/info/73022.jspx
12.华东师范大学2021年博士生招生章程,部分试行新的“博士津贴方案2、依据“华东师范大学博士研究生培养质量提升三年行动计划(2019-2021)”,部分试点院系试行新的“博士津贴方案”,据此方案博士生津贴待遇标准为每年6万元(每月0.5万元)。2021年参与试点的院系有信息学部(计算机科学与技术学院、软件工程学院、数据科学与工程学院、通信与电子工程学院)、经管学部(经济学院、工商管理学院、https://www.zhuanzhi.ai/document/2bdee6262f66c7ad574ba82afa9d2b05
13.《自动化学报》:基于小样本学习的图像分类技术综述今日头条Qi等[77]提出将迁移学习和增量学习进行结合, 通过对分类器的权重进行处理来实现增量零训练. 该算法利用卷积神经网络作为特征提取器以共享参数, 对新样本进行特征提取后, 产生一个分类权重向量, 将其扩展进预训练的分类器权重中, 以适应对新样本的分类任务. https://www.elecfans.com/news/1732827.html
14.收集上千AI算法开“商城”,这家企业想让百业都用上AI丨寻找深圳而且,极视角旗下的极市平台设立了“打榜计划”,将大量算法开发项目放到平台让开发者进行竞技,排名靠前的开发者可以获得真实项目进行开发,并持续享有分成收益,目前极市平台已聚集15万开发者。 极视角开发平台 2021年,极视角推出新招:AI千星计划,计划精选1000种算法免费开发,“不限行业,不限场景,只要痛点真实,我们可以免https://static.nfapp.southcn.com/content/202108/27/c5681424.html
15.抛物线焦半径的新算法及其应用高中数学教与学2021年21期抛物线焦半径的新算法及其应用,抛物线,焦半径,新算法,圆锥曲线是高考必考内容,通常以压轴题的形式出现,难度大,运算繁琐.笔者经过研究,得到了抛物线的焦半径、弦长计算的创新表达式,可https://read.cnki.net/web/Journal/Article/GSJX202121007.html
16.图像分类VisionTransformer理论解读+实践测试Vision Transformer是2021年谷歌在ICLR上提出的算法,算法原理并不复杂,但是其价值是开创性的。它首次将NLP领域火热的Transformer模型架构移植到了CV领域,打破了这两个领域壁垒,并取得不错的成效。 论文名称: An Image Is Worth 16x16 Words: Transformers For Image Recognition At Scale 论文链接:https://arxiv.orghttps://cloud.tencent.com/developer/article/2113432
17.立方早知道中国将推新一轮“房改”/A股又掀回购潮,“宁王”大中国将推动新一轮“房改” 10月26日,经济观察网获悉,8月25日国务院常务会议审议通过的《关于规划建设保障性住房的指导意见》文件(国发【2023】14号文,以下简称“14号文”),近期已传达到各城市人民政府、各部委直属机构。由于该文件明确提出“用改革创新的办法,在大城市规划建设保障性住房”、“推动建立房地产业转型https://www.dahecube.com/article.html?artid=178970
18.JRT0221—2021人工智能算法金融应用评价规范.pdf本文件由中国人民银行提出。 本文件由全国金融标准化技术委员会(SAC/TC180)归口。 II JR/T0221—2021 人工智能算法金融应用评价规范 1范围 本文件规定了人工智能算法在金融领域应用的基本要求、评价方法、判定准则。 本文件适用于开展人工智能算法金融应用的金融机构、算法提供商、第三方安全评估机构等。 https://max.book118.com/html/2024/0122/7161163054006033.shtm
19.[喜乐]双色球2021年088期新算法,值得一看!红球三胆 01,14,24 红球五胆 01,10,14,24,32 绝杀一红 29 绝杀三红 23,26,29 绝杀六红 16,17,19,23,26,29 蓝球三胆 08,09,14 蓝球五胆 03,05,08,09,14 绝杀一蓝 01 绝杀三蓝 01,02,04 绝杀六蓝 01,02,04,07,11,12 复式8+2 https://8.78500.cn/ssqyuce/7407191.html