基于3D卷积神经网络的行为识别:3DConvolutionalNeuralNetworksforHumanActionRecognitionPonys

相应提出了一种3D卷积,对三幅连续帧用一个3D卷积核进行卷积(可以理解为用三个二维卷积核卷积三张图)。

3D神经网络结构图:

input—>H1

神经网络的输入为7张大小为60*40的连续帧,7张帧通过事先设定硬核(hardwiredkernels)获得5种不同特征:灰度、x方向梯度、y方向梯度、x方向光流、y方向光流,5个channels一共33个maps。对于这个做法,原文这么解释“相比于随机初始化,通过先验知识对图像的特征提取使得反向传播训练有更好的表现”。对此我的理解是,梯度表征了图像的边沿的分布,而光流则表征物体运动的趋势,3DCNN通过提取这两种信息来进行行为识别。

H1—>C2

用两个7*7*3的3D卷积核对5个channels分别进行卷积,获得两个系列,每个系列5个channels共23个maps。然后为卷积结果加上偏置套一个tanh函数进行输出。(典型神经网。)

卷积后map大小为54*34.

C2—>S3

2x2池化,下采样

S3—>C4

为了提取更多的图像特征,用三个7*6*3的3D卷积核分别对各个系列各个channels进行卷积,获得6个系列,每个系列依旧5个channels的大量maps。然后加偏置套tanh。

C4—>S5

3X3池化,下采样。

S5—>C6

C6—>output

经典神经网络模型两层之间全链接,output的节点数目随标签而定。

老师说:“看图说话”,上图:

训练:

同CNN,本网络使用典型的随机初始化——反向传播算法进行训练。反向传播的算法在NN中的实现以前已经说过,请翻博文。不知到CNN中会不会有改进,具体方法以后贴一CNN论文出来。

效果:

使用3DCNN对3个标签的veido(CellToEar,ObjectPut,Pointing)进行行为识别,效果与其他三种行为识别方法进行对比。发现在前两中标签下效果怒好与其他方法,Pointing则略逊。

MORE:在与其他方法进行对比的时候作者积极歪歪了各种特征我不知道他在说什么。另外,作者以后可能回访出DBN版本的行为识别,或非监督版本的3DCNN。

从这篇论文看出,目前的DL研究方法仍然十分Tricky,网络的搭建和参数的选择很大程度上依赖直觉与实验,这个就比较考研研究人员的天赋与……………………资源了。不知到什么时候才能有系统的NN设计方法出来。(还是已经有了我不知道?)

THE END
1.基于神经网络的图像压缩技术腾讯云开发者社区基于神经网络的图像压缩技术 (本文由软件工程师 Nick Johnston 和 David Minnen 发布) 在互联网之中,数据压缩技术可以说无处不在 —— 您在线观看的视频,分享的图片,听到的音乐,甚至是您正在阅读的这篇博客。压缩技术使得您可以快速且高效地分享内容。如果没有数据压缩,我们在获取所需的信息时,时间与带宽的开销会https://cloud.tencent.com/developer/article/1033691
2.基于神经网络的推荐系统模型神经网络模型通常用于推荐系统基于神经网络的推荐系统模型 近年来,推荐系统在各种商业领域得到了广泛的应用。 为用户提供建议的平台。协同过滤算法是推荐系统中使用的主要算法之一。这种算法简单、高效;然而,数据的稀疏性和方法的可扩展性限制了这些算法的性能,并且很难进一步提高推荐结果的质量。因此,提出了一种将协同过滤推荐算法与深度学习技术相https://blog.csdn.net/qq_41853536/article/details/80030322
3.博士学位论文密级 博士学位论文 基于神经网络的词和文档语义向量表示方法研究 作者姓名 指导教师 学位类别 学科专业 培养单位 来斯惟 赵军 研究员 中国科学院自动化研究所 工学博士 模式识别与智能系统 中国科学院自动化研究所 2016 年 1 月 Word and Document Embeddings based on Neural Network Approaches By Siwei Lai A http://arxiv.org/pdf/1611.05962
4.基于BP神经网络的多传感器数据融合技术优化AET摘要:传统的数据融合算法要求获得比较精确的对象数学模型,对于复杂的难于建立模型的场合无法适用。为解决上述问题,提出了一种基于BP神经网络算法的多传感器数据融合方法,对对象的先验要求不高,具有较强的自适应能力。仿真结果表明,采用BP神经网络对传感器数据进行融合处理大大提高了传感器的稳定性及其精度,效果良好。 http://www.chinaaet.com/article/171658
5.数据库实现神经网络神经网络python库深度神经网络算法,是基于神经网络算法的一种拓展,其层数更深,达到多层,本文以简单神经网络为例,利用梯度下降算法进行反向更新来训练神经网络权重和偏向参数,文章最后,基于Python 库实现了一个简单神经网络算法程序,并对异或运算和0-9字符集进行预测。 一、问题引入 https://blog.51cto.com/u_16099277/7652077
6.基于深度神经网络的行为识别基于深度神经网络的行为识别 丁雪琴 开通知网号 【摘要】: 近年来,伴随着社会信息化程度的提高,作为计算机视觉代表性任务之一的视频行为识别,因其在智能监控、自动驾驶、媒体分析和机器人等领域具有广泛的应用前景,受到了越来越多研究者的关注。同时在深度学习等技术蓬勃发展的背景下,涌现出大量基于深度神经网络的视频https://cdmd.cnki.com.cn/Article/CDMD-10300-1021778892.htm
7.基于区域的卷积神经网络机器之心基于区域的卷积神经网络 基于区域的卷积神经网络 (Region-based Convolutional Neural Network) 通常运用于图像物体检测的任务中,是对多种基于区域的深度学习方法的统称。 目标检测 (object detection) 指的是在给定的图像中精确找到某种或者某些物体的位置,并且标注出该位置的物体的类别。该任务最主要的流程就是找到某https://www.jiqizhixin.com/graph/technologies/826d6977-c832-4a3b-b997-448fcf72cdb7
8.《基于深度学习神经网络的自动驾驶技术研究》9000字.docx《基于深度学习神经网络的自动驾驶技术研究》9000字.docx 11页内容提供方:02127123006 大小:99.44 KB 字数:约1.17万字 发布时间:2023-11-03发布于湖北 浏览人气:17 下载次数:仅上传者可见 收藏次数:0 需要金币:*** 金币 (10金币=人民币1元)https://m.book118.com/html/2023/1102/8135113122006002.shtm
9.KinectforWindowsSDK开发入门(十):手势识别上:基本概念如果项目只需要识别几个简单的手势,那么使用基于算法或者基于神经网络的手势识别就足够了。对于其他类型的项目,如果有兴趣的话可以投入时间来建立可复用的手势识别引擎,或者使用一些人家已经写好的识别算法,接下来本文介绍几种常用的手势,并演示如何使用算法的方法来识别他们,手势识别的另外两种方法由于其复杂性本文不做https://www.hqew.com/tech/fangan/588922.html
10.科学网—[转载]一种基于深度神经网络的临床记录ICD自动编码方法摘要:随着国际疾病分类(international classification of diseases,ICD)编码数量的增加,基于临床记录的人工编码难度和成本大大提高,自动ICD编码技术引起了广泛的关注。提出一种基于多尺度残差图卷积网络的自动ICD编码技术,该技术采用多尺度残差网络来捕获临床文本的不同长度的文本模式,并基于图卷积神经网络抽取标签之间的层次https://blog.sciencenet.cn/blog-3472670-1280973.html
11.让神经网络“脑补”图像细节!复旦大数据学院医学影像人工智能实验为了建模图像的全局相似性,我们从数学的角度出发,基于神经网络提出了深度秩一分解与重建框架。图像的秩一成分代表了图像的自相似性特征,这是建模图像的一种有效手段。因此,我们通过如下图所示的方式分解图像,从而一定程度上保持图像的全局相似性。 图4. 图像秩一分解示例:左图为秩一分解示例,右图为不同方法秩一https://sds.fudan.edu.cn/b7/ef/c17412a440303/page.htm
12.评述:基于光学神经网络(ONN)的图像传感器技术资讯资讯信息在这些应用中,一方面为了保证分析结果的准确性,所拍摄的数字图像的分辨率通常都比较高,因此做图像处理时对算力和内存的占用都比较大,耗时也比较长;另一方面,一幅图片中通常只有一部分内容是有用的(如图1所示),尤其是对神经网络算法来说自然图像都包含稀疏信息,是可压缩的。为了解决这一问题,新一代的成像系统设计不https://b2b.csoe.org.cn/news/show.php?itemid=170
13.SpikingJelly是一个基于PyTorch,使用脉冲神经网络(SpikingSpikingJelly是一个基于PyTorch,使用脉冲神经网络(Spiking Neural Network, SNN)进行深度学习的框架。 SpikingJelly的文档使用中英双语编写:https://spikingjelly.readthedocs.io。 安装 以前所未有的简单方式搭建SNN 快速好用的ANN-SNN转换 CUDA增强的神经元 设备支持 https://gitee.com/mirrors/SpikingJelly