基于视频的人体异常行为识别与检测方法综述

关键词:人体异常行为;行为识别;异常行为检测;视频监控;特征提取;数据集

0引言

1人体异常行为

1.1异常行为的定义

对于“行为”这一概念,西方学者曾给出如此定义:行为是人类与周围环境做出最基本的有意义的交互[9].文献[10]指出,动物行为包含姿势、动作和环境三个要素.人作为一种高级动物,其行为同样具备如上要素,然而相比于动物行为,人的行为具有更深层的意义及社会性.不同环境下的同一行为会被解读成不同的含义,如在赛场挥拳可视为喝彩,而在街头挥拳则可能被理解成抗议.可见,对行为的判别既要考虑人体动作或姿态对环境造成的影响,又要兼顾环境对于行为的约束作用.

关于“异常”,一般情况下,是指不同于正常状态的现象,如文献[11]将视频场景中的小概率事件定义为异常.对于人体行为而言,违反社会道德及法律或不符合当前场景下的行为均可视为异常,如在操场上奔跑可视为正常,在狭窄的车厢内奔跑则被看作异常.

综上,对人体异常行为作出如下定义,即:当前场景下,目标做出的一切不适宜的动作、姿态或事件等.该定义下,常见的单人异常行为有:摔倒、越界、遗失物品、携带危险物品、损坏公共设施等;常见的多人异常行为有:打斗、持刀行凶、抢劫、推搡、偷窃、踩踏等[12].此外,表1还给出了异常行为判别技术常用场景及各场景下的特定异常行为[13-15].

1.2异常行为的特点与分类

2特征提取方法

特征提取是指从视频数据中提取关键信息用以表征行为的过程,提取特征的好坏直接影响异常行为识别与检测算法的速度和准确率.对近些年特征提取方法研究成果进行总结,具体如下.

2.1基于人体外观和运动信息的特征提取方法

人体的运动信息常通过光流场[21]、运动历史图[18]等方法进行表征.此类方法在普通场景下识别准确率较高,但在背景复杂、人群密集的场景中难以获得理想的效果.对此,文献[22]基于外观和运动信息构建混合动态纹理模型,提出了时空异常联合检测方法,实现了拥挤场景下的异常行为检测.针对人群密集场景,文献[23]将加速度信息与光流特征融合,构造混合光流直方图作为特征描述子,应用稀疏表示的方法实现了异常行为检测.

2.2基于运动轨迹的特征提取方法

基于运动轨迹的特征提取方法通过获取物体在运动过程中的位置、长度、速度等信息构造特征.在该方面,Wang等[24]提出密集轨迹算法,该方法密集采样特征点、提取特征点轨迹特征并编码,通过支撑向量机进行分类.之后,Wang等继续改进特征正则化方式和特征编码方式,提出改进的密集轨迹算法,实现了人体行为识别[25].

基于运动轨迹的异常检测,其主要思想是在训练阶段获得正常轨迹的模式,之后在测试阶段将目标轨迹与正常轨迹比较,当目标轨迹发生重大偏离时,判断其行为异常.Junejo等[26]利用轨迹的大小、位置、速度、加速度和时空曲率特征训练动态贝叶斯网络,实现了异常行为检测.文献[27]跟踪目标的运动轨迹并基于频率分析,应用上下文感知方法实现异常行为检测.针对视频段内的小范围异常,Yang等[28]提出基于轨迹分割和多示例学习的局部异常检测方法.文献[29]利用稀疏重构法重构行为轨迹,并将最小残差法用于异常行为检测中.文献[30]在目标跟踪和轨迹分析方法的基础上,建立稀疏异常检测模型,实现了多目标联合异常检测.文献[31]利用轨迹运动模式特征生成隐马尔可夫模型,从而实现视频中的异常行为检测.利用轨迹分析人体行为的方法,其识别效果很大程度上依赖于对目标跟踪的准确性,当目标数量较小时,此类方法一般可满足识别需求,但对拥挤场所或复杂场景存在一定局限.

2.3基于时空兴趣点的特征提取方法

2.4基于二维人体骨骼信息的特征提取方法

基于二维人体骨骼信息的特征提取方法是通过姿态估计,获取人体关键部位的位置和状态信息,从而构建特征向量来描述人体行为.运用此类方法时,一般需进行人体检测和骨骼关节点检测,并利用目标跟踪算法对关键点进行跟踪,用以辅助人体行为识别.Fujiyoshi等[40]利用人体头部与四肢5个关键节点来表征人体姿态,利用这些点与重心形成的矢量构造特征向量描述人体行为.随着姿态估计算法研究的不断深入,应用于行为识别的关键点数量不断增长,现能够获取的关键点信息超过20个.同时,姿态估计方法的精度和速度也不断提升,可识别的人数不断增加.在对多人姿态估计的研究中,主要有自顶向下和自底向上两种方式.自顶向下的方式首先通过检测算法获得人形轮廓,然后使用估计检测器检测出轮廓内的关键点,进而连接所有关键点获取人体姿态[41],这种方式较为直观,便于理解,骨骼信息提取精度较好.自底向上的方式则是先检测出一幅图像内所有人体部位,然后通过聚类等方法将所有关键点进行连接并分组,拼接成每个人的骨架图[42],这种方式的最大特点是只需对图片进行一次检测,并且检测速度不受图像内人数影响.

基于人体骨骼信息的姿态估计不易受光线和背景变化的影响,具有较好的鲁棒性和适应性,被广泛应用于异常行为判别技术[43-44].相比图像特征,骨骼特征更为紧凑、结构更强、对人体运动的描述更加具体.基于骨骼信息的特征提取方法为异常行为识别与检测技术开辟了新的思路.

2.5基于三维人体骨骼信息的特征提取方法

骨骼特征提取的方法主要有基于人工设计的特征手动提取方法和基于深度学习的特征自动提取方法.在手动提取骨骼特征方面,文献[48]利用关节的高度、速度、位置等特征识别了人体的摔倒行为.文献[49]提取单个关节的运动特征和多个关节的关系特征作为人体运动识别的综合特征,从运动学和空间几何学的角度发掘了人体运动时的关节特征,获得较好的识别效果.这一类利用关节之间角度和运动特征识别人体行为的方法能够较好地反应人体运动的实际规律,易于理解和表达,但在识别过程中建立的模型较为复杂,计算量较大.在自动提取骨骼特征方面,Pham等[50]构造了由骨骼姿势及其运动组成的紧凑图像表示的骨骼位置运动特征,利用自适应直方图均衡化算法对特征进行增强,并应用基于DenseNet结构的深度卷积神经网络,实现了骨架序列与其动作标签之间端到端的映射.类似地,文献[51]将三维骨骼序列中的时空信息编码成三幅二维图像,并将其动态特性编码成图像中的颜色分布,即关节轨迹图,三幅关节轨迹图相互提供补充信息,实现了高效的行为表征.

基于三维人体骨骼特征进行人体异常行为判别时,不易受到人体外形差异的影响,特别是在光线变化、出现阴影等情况下,基于三维骨骼信息的特征可提高智能视频监控系统的识别能力和检测精度,在背景复杂、噪声较多时同样具有较好的鲁棒性.

2.6基于深度学习的特征提取方法

基于深度学习的特征提取方法是利用深度神经网络直接从图像中学习深度特征[56],在使用时需根据特征提取的规则设计网络结构并通过训练和学习获得网络参数.相比于人工设计特征如时空特征、外观及运动特征等,深度神经网络提取的特征可解释性较差,但它对于数据库的依赖较小,提取特征较为客观,对于不同视频数据中的光线变化、遮挡、视角转换等问题具有更好的普适性.一些情况下,可将原始视频和图像直接传入深度神经网络并输出结果,实现端到端的异常行为判别.常用的深度神经网络主要涉及卷积神经网络、递归神经网络等.

2.6.1基于三维卷积神经网络的特征提取

2.6.2基于双流卷积神经网络的特征提取

2.6.3基于递归神经网络的特征提取

相比于其他的特征提取方法,基于深度学习的特征提取方法不必定义提取的具体特征,可以通过较少的预处理、借助自身的多层隐藏节点直接从原始数据中学习有用特征[75].同时,基于深度学习的特征提取方法易与大数据进行结合,在多种场景下取得较好的应用效果.

2.7基于深度图像的特征提取方法

3异常行为判别

取合适的特征表征行为信息后,需根据提取特征的特点及应用场景选择合适的异常行为判别方法.如引言所述,对异常行为的判别可大致分为以异常行为识别为主和以异常行为检测为主两类.

3.1异常行为识别方法

3.2异常行为检测方法

异常行为识别在实际应用中存在以下问题:(1)实际应用中单个目标异常行为样本较少;(2)当视频中人数众多、遮挡严重时,单个人体目标行为识别的精度下降,同时人数的增加使得计算量增大;(3)在拥挤场景中,对每种行为进行标记成本较高,同时无法保证标记能够覆盖全部异常行为.此时,异常行为检测方法就显得格外重要.异常行为检测方法仅将行为分为正常和异常两个类别,从大量的视频数据中学习经验,实现像素级、帧级或视频级的异常行为判别.针对不同场景,采集的视频数据及标签的制作各不相同,基于不同的数据形式,异常行为检测方法可分为有监督、半监督和无监督三种.

3.2.1有监督异常行为检测方法

3.2.2半监督异常行为检测方法

半监督学习是通过学习一部分已知标签的样本和一部分未知标签的样本,从而将输入数据映射到标签.相比于异常数据,获取正常数据相对容易,因此,半监督方法在异常行为检测任务中使用较多.在半监督异常行为检测方法中,仅需对正常样本进行标记,在训练阶段从视频中学习正常模式,在测试阶段计算当前模式与正常模式的相似度,将偏离正常模式的检测视为异常模式.从模型的原理出发,半监督异常行为检测方法可分为基于重构模型的异常行为检测和基于预测模型的异常行为检测.

THE END
1.[行为识别综述]Goingdeeperintoactionrecognition:Asur左边的这张图是行走的模型,它由一系列3维结构建模。右图是将WALKER 框架扩展到行人识别。 全局表征 通常来说,从视频中构建准确的3D模型是困难并且花销昂贵的,因此,许多解决方案避免使用3D建模和选择在全局或局部的表示一个行为。 (1)全局表示(Holistic representations):动作识别是基于人体结构、形状和运动的全局表示https://blog.csdn.net/dlh_sycamore/article/details/89280697
2.行为识别(actionrecognition)目前的难点在哪?借助高清摄像头对关键岗位和关键作业区域进行严密监控,运用图像识别算法,提取出关键点的位置信息,深度https://www.zhihu.com/question/264575930/answer/57256907884
3.[ML]HumanActivityRecognition人体动作/姿态识别文献综述知乎:基于深度学习的人体动作识别算法总结,桑燊 文章主要列出了一些相关的数据集以及深度学习的方法包括基于无监督学习的行为识别、基于卷积神经网络的行为识别、基于循环神经网络以及一些拓展模型的方法。当然,这里面提到的很多模型都不是最新的技术,还有很多最新的模型和技术都没有包含进来。 https://www.jianshu.com/p/3d409966fe64
4.基于事件的视觉研究综述(SNN部分阅读笔记)Gulico概括:重点介绍了为解锁事件摄像机的卓越性能而开发的应用程序和算法。 我们会从事件摄像头的工作原理,可用的实际传感器及其使用的任务(从低视力(特征检测和跟踪,光学流等)到高视力(重建, 细分,识别)。 我们还将讨论开发用于处理事件的技术,包括基于学习的技术,以及针对这些新型传感器的专用处理器,例如脉冲神经网络。 https://gulico.github.io/2020/07/27/Event-based-Vision-A-Survey/
5.视频中动作识别任务综述但是由于深度数据获取不易,基于深度数据的动作识别在应用上也有其局限性,所以目前基于视频的动作识别是动作识别领域中的主要研究方向。而本文所研究的基于视频的动作识别可以定义为给定动作视频,通过动作识别算法处理后输出视频中动作类别标签的过程。 2 视频中动作识别任务的相关方法https://www.fx361.com/page/2020/0704/6828487.shtml
6.基于深度学习的视频动作识别研究除此之外,基于所设计的残差网络本文构建了双流动作识别模型,针对双流网络缺乏时空特征交互的缺点,模型采用多级融合策略并结合多层级深度特征对识别结果进行联合决策,以充分发掘双流模型的时空表征潜力。最后通过PCA算法对融合后的特征描述子降维后,训练多分类SVM(Support Vector Machine)作为分类器实现对动作的识别。实验结果https://cdmd.cnki.com.cn/Article/CDMD-10617-1020416353.htm
7.动作识别综述(RecentAdvancesinVideoGroup-Skeleton-Based Human Action Recognition in Complex Events 一种新的基于GCN的算法GS-GCN,用于复杂事件中的动作识别,针对复杂事件挑战中大规模以人为中心的视频分析的解决方案。与仅考虑单个人的行为的常规方法不同,所提出的方法研究了不同人之间的潜在行为关系。使用多个MS-G3D从多个人中同时提取骨骼特征。由于https://www.pianshen.com/article/57621994012/
8.基于深度学习的视频人体动作识别算法研究人体动作识别作为视频分析中一个非常重要的组成部分,其已经在多个重要领域发挥至关重要的作用,包括视频监控、人机交互、自动驾驶等等。传统的人体动作识别主要基于RGB图像或视频,但由于尺度、光照变化以及背景噪声等因素的影响,效果不尽如人意。近年来,得益于深度传感器的发展以及人体骨骼关键点检测算法的成熟,越来越多的研https://xuewen.cnki.net/CMFD-1021747961.nh.html
9.面向教室嘲的举手动作识别算法的研究与实现举手算法识别场景动作候选区域 华中科技大学硕士学位论文I摘要随着视觉技术的发展,在教育信息技术领域,自动化的课堂观察成为一个重要问题。通过观察课堂中教师和学生的行为及其交互特征,有助于对学生进行客观的评估,对教师因人而异的制定教学计划,改善老师的教学质量。举手动作作为最为典型的学生动作行为,其检测和识别是自https://www.docin.com/p-2313523248.html
10.基于深度学习的表情动作单元识别综述邵志文,周勇,谭鑫,马利庄,刘兵,姚睿.{{custom_author.name_cn}}基于深度学习的表情动作单元识别综述[J]. 电子学报, 2022, 50(8): 2003-2017. https://doi.org/10.12263/DZXB.20210639 SHAO Zhi-wen,ZHOU Yong,TAN Xin,MA Li-zhuang,LIU Bing,YAO Rui.{{custom_author.name_en}}Survey of Expressionhttps://www.ejournal.org.cn/CN/10.12263/DZXB.20210639
11.浅谈动作识别TSN,TRN,ECO腾讯云开发者社区[3]人脸识别算法演化史【获取码】SIGAI0420. [4]基于深度学习的目标检测算法综述【获取码】SIGAI0424. [5]卷积神经网络为什么能够称霸计算机视觉领域?【获取码】SIGAI0426. [6]用一张图理解SVM的脉络【获取码】SIGAI0428. [7]人脸检测算法综述【获取码】SIGAI0503. https://cloud.tencent.com/developer/article/1346320
12.人体动作识别与评价——区别,联系及研究进展基于视频的人体动作识别算法 综述[J]. 计算机应用研究, 2020, 37(11): 3213-3219. HUANG Q Q, ZHOU F Y, LIU M Z. Survey of human action recognition algorithms based on video[J]. Application Research of Computers, 2020, 37 (11): 3213-3219. [26] PATRONA F, CHATZITOFIS A, ZARPALAS Dhttps://engine.scichina.com/doi/pdf/7116E3A9710B43F4A9D433FAC83F47F7
13.深度图像的获取及其处理.docx目标检测与跟踪是计算机视觉领域的一个重要应用。在深度图像中,我们可以使用各种目标检测算法来检测并跟踪目标,如基于特征的方法、基于深度学习的方法等。5、动作识别动作识别是计算机视觉领域的一个重要应用。在深度图像中,我们可以使用各种动作识别算法来识别人体的动作,如基于特征的方法、基于深度学习的方法等。https://m.renrendoc.com/paper/298490443.html
14.FCSResLNet:动作识别任务上的可接受更长输入的深度残差LSTM网络对于基于图像的识别任务,局部高频信息通常包含丰富的内容,如纹理或边缘信息,在该信息的基础上可进一步提取更大范围的形状和空间关系等低频信息。然而,视频中的局部高频运动信息通常对动作识别没有任何意义,并且很难通过简单地堆叠短程卷积提取远程运动信息。对于动作识别研究来说,由于受主流GPU内存能力限制的原因,目前输入https://news.sciencenet.cn/htmlpaper/2022/10/2022101211122288776270.shtm
15.FG2024Workshop花样滑冰人体动作识别挑战赛与研讨会启动!计算机视觉和机器学习在人体动作理解中的应用 面向专业运动的2D/3D感知技术 细粒度人体动作识别 人体动作分割或定位 开集动作识别 细粒度动作评估 面向人体动作理解的轻量化架构设计 人体动作理解大规模数据集 人体动作理解技术综述 官网 SkatingVerse官网:https://skatingverse.github.io/ https://www.jiqizhixin.com/articles/2024-03-21
16.基于深度强化学习的视觉反馈机械臂抓取系统AprilTag是一个基准视觉库,通过在物体上粘贴Apriltag标签,利用识别算法,确定标签坐标系和摄像头坐标系的关系,即可得到物体的位姿,在增强实现、机器人和相机校准等领域广泛使用。 AprilTag视觉标签与二维码有相似之处,但是降低了视觉标签的复杂度,抗光和抗遮挡性能比较好,能够快速的检测视觉标签信息,并计算相机与标识码之间https://m.elecfans.com/article/2106029.html
17.opencv在人脸识别动作识别作用opencv的人脸识别算法opencv在人脸识别动作识别作用 opencv的人脸识别算法 1:人脸检测的介绍以及综述: 现在人脸检测已经成为我们生活必不可少的一个部分,比如西电进宿舍刷脸(我从来没有成功过),现在基于深度学习的人脸检测算法大致分为以下三类: 基于级联的人脸检测算法。 基于两阶段的人脸基于级联的人脸检测算法。检测算法。https://blog.51cto.com/u_14405/11276453
18.生物传感范文11篇(全文)在基于加速度传感器的运动识别研究中,不仅同一种动作可以被识别,运动的强度也可以被识别。徐川龙[8]提出了一种基于多种时域统计特征的5种走路模式(站立、走路、跑步、上楼和下楼)的识别算法。进而针对3种相似的走路模式难以区分的问题,提出了基于小波能量和四分位间距的走路模式识别算法,细分了3种走路模式(正常走、https://www.99xueshu.com/w/ikeyub412j7q.html