基于ResNeXt的人体动作识别被引量：8

Human action recognition based on ResNeXt

下载PDF

导出

摘要人体动作识别是计算机视觉领域的核心研究方向之一,在很多场合都有应用。深度卷积神经网络在静态图像识别方面已取得了巨大成功,并逐渐扩展到视频内容识别领域,但应用依然面临很大挑战。为此提出一种基于ResNeXt深度神经网络模型用于视频中的人体动作识别,主要包括:①使用新型ResNeXt网络结构代替原有的各种卷积神经网络结构,并使用RGB和光流2种模态的数据,使模型可充分地利用视频中动作外观及时序信息;②将端到端的视频时间分割策略应用于ResNeXt网络模型,同时将视频分为K段实现对视频序列的长范围时间结构进行建模,并通过测试得到最优视频分段值K,使模型能更好地区分存在子动作共享现象的相似动作,解决某些由于子动作相似而易发生的误判问题。通过在动作识别数据集UCF101和HMDB51上进行的测试表明,该模型和方法的动作识别准确率性能优于目前文献中的一些模型和方法的性能。 Human action recognition is one of the core research directions in the field of computer vision and is applied in many occasions.Deep convolutional neural networks have achieved great success in static image recognition and have gradually expanded into the field of video content recognition,but they still face great challenges in applications.This paper proposes a deep neural network model based on ResNeXt network for human action recognition in video.The main innovations of this paper include:①The new ResNeXt network structure was used to replace the original convolutional neural network structure.Two kinds of modal data of RGB and optical flow was collected to make full use of the appearance and temporal order information in the video.②The end-to-end video time segmentation strategy was applied to the proposed ResNeXt network model.The video was divided into K segments to model the long-range time structure of the video sequence,and the optimal value of K was obtained through tests,which enables the model to better distinguish the similar actions with sub-action sharing phenomenon and solve the problems of misjudgment that are easy to emerge due to similar sub-actions.Tests performed on the widely used action recognition data sets UCF101 and HMDB51 showed that the action recognition accuracy of the proposed model and method is better than that of the models and methods in the existing literature.

作者蒋圣南陈恩庆郑铭耀段建康 JIANG Sheng-nan;CHEN En-qing;ZHEN Ming-yao;DUAN Jian-kang(School of Information Engineering,Zhengzhou University,Zhengzhou Henan 450000,China)

机构地区郑州大学信息工程学院

出处《图学学报》 CSCD 北大核心 2020年第2期277-282,共6页 Journal of Graphics

基金国家自然科学基金项目(U1804152,61806180)。

关键词动作识别 ResNeXt 视频时间分割数据增强多模态 action recognition ResNeXt video temporal segmentation data enhancement multimodal

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

同被引文献57

1郭浩,张晰,安居白,李冠宇.基于船舶AIS信息的可疑船只监测研究[J].交通信息与安全,2013,31(4):67-72. 被引量：11
2刘丹,王鑫,片锦香.基于李代数的人体手臂惯性动作捕捉算法[J].沈阳工业大学学报,2017,39(1):73-77. 被引量：3
3凌佩佩,邱崧,蔡茗名,徐伟,丰颖.结合特权信息的人体动作识别[J].中国图象图形学报,2017,22(4):482-491. 被引量：10
4钱银中,沈一帆.基于层次部件树结构的动作识别判决模型[J].模式识别与人工智能,2017,30(10):885-893. 被引量：1
5王雪梅,刘震,倪文波.基于MEMS传感器的手臂运动测量和识别方法[J].中国惯性技术学报,2017,25(6):701-707. 被引量：18
6唐超,张苗辉,李伟,曹峰,王晓峰,童晓红.融合局部与全局特征的人体动作识别[J].系统仿真学报,2018,30(7):2497-2506. 被引量：6
7王松,党建武,王阳萍,杜晓刚.实时动作识别方法研究[J].计算机工程与应用,2017,53(3):28-31. 被引量：9
8牟军敏,陈鹏飞,贺益雄,张行健,朱剑峰,荣昊.船舶AIS轨迹快速自适应谱聚类算法[J].哈尔滨工程大学学报,2018,39(3):428-432. 被引量：25
9赵晓叶,王豪聪,吉训生,彭力.基于新投影策略的人体行为识别方法研究[J].计算机工程与科学,2018,40(9):1617-1623. 被引量：3
10张儒鹏,于亚新,张康,刘梦,尚祖强.基于OI-LSTM神经网络结构的人类动作识别模型研究[J].计算机科学与探索,2018,12(12):1926-1939. 被引量：21

引证文献8

1曾庆喜,彭辉.基于ResNeXt-GRU和聚类采样的人体行为识别[J].成都信息工程大学学报,2022,37(1):40-45.
2童金茂.基于机器视觉的篮球投篮打手动作识别方法[J].兰州文理学院学报（自然科学版）,2022,36(2):86-90. 被引量：2
3范云峰.基于改进ICP算法的人体运动训练动作捕捉模型设计[J].九江学院学报（自然科学版）,2022,37(2):70-73. 被引量：2
4晏国良.基于动作捕捉的舞蹈视频动作识别技术研究[J].赤峰学院学报（自然科学版）,2022,38(9):48-52. 被引量：5
5倪汉杰,初秀民,张彬鹏,蒋仲廉.基于改进Cascade⁃RCNN的内河航标检测算法[J].中国航海,2022,45(3):99-105. 被引量：5
6王小虎.海上船舶融合识别算法研究与改进[J].南方能源建设,2023,10(4):131-137. 被引量：1
7郭宗洋,刘立东,蒋东华,刘子翔,朱熟康,陈京华.基于语义引导神经网络的人体动作识别算法[J].图学学报,2024,45(1):26-34. 被引量：1
8李松洋,王雪婷,陈相龙,陈恩庆.基于骨骼点动态时域滤波的人体动作识别[J].图学学报,2024,45(4):760-769.

二级引证文献15

1林恒青.基于改进OpenPose算法的篮球动作识别系统设计[J].通化师范学院学报,2022,43(12):78-83. 被引量：2
2乔万俊,赵庆.基于端到端的英语翻译器语音自动纠正系统研究[J].自动化与仪器仪表,2023(3):240-244.
3于茜,齐飞,田广昊.基于超宽带定位和改进SVM的舞蹈动作识别系统研究[J].自动化与仪器仪表,2023(6):138-142.
4王晓晴.基于高分辨率遥感影像的船舶航标漂移监测方法[J].舰船科学技术,2023,45(16):173-176.
5许龙铭.基于改进PERCLOS的疲劳驾驶检测系统的设计[J].现代电子技术,2023,46(22):41-45. 被引量：1
6潘萍,彭高丰,潘凌云.基于开源框架的人机交互危险姿态识别系统设计[J].自动化与仪器仪表,2023(10):95-98.
7陈晓坚.基于动作捕捉技术和Unity 3D的演示系统设计[J].自动化与仪器仪表,2023(12):144-147. 被引量：1
8陆志欣,田涵宁,郭国伟.基于改进YoloV4的电网变压器油液渗漏检测方法[J].计算机测量与控制,2024,32(2):85-92. 被引量：1
9闵令通,范子满,窦飞阳,吕勤毅,李鑫.基于表观细粒度辨别网络的近海船舶目标检测方法[J].遥测遥控,2024,45(2):1-9.
10莫丽娅,黄铭.基于多传感器数据的虚拟现实翻译机器人交互自动化系统设计[J].自动化与仪器仪表,2024(3):189-192. 被引量：1

1张建涛,韩金尅,冯文晴,丘仕锋,钟丙枝.闪变检测新方法探讨[J].电工技术（下半月）,2016(10):5-6.
2党伟超,张泽杰,白尚旺,龚大力,吴喆峰.基于改进双流法的井下配电室巡检行为识别[J].工矿自动化,2020,46(4):75-80. 被引量：9
3余娟娟.新媒体营销背景下的网红直播电商模式探析[J].电子商务,2020,0(5):11-12. 被引量：21
4丁开彦.高危场所安全警示管理系统中RFID的应用[J].计算机产品与流通,2020,0(2):159-159.
5郑闪闪,杭建忠,孙小英,金鹿江,朱潇敏.苯基三甲氧基硅烷改性纳米纤维素纸基阻隔涂层的制备及性能[J].高分子材料科学与工程,2020,36(3):120-125. 被引量：12
6张润春,王玉珍,李树华,张静.不同浓度左乙拉西坦对高热惊厥患儿病情复发及血清相关指标的影响[J].中国现代医学杂志,2020,30(10):107-111. 被引量：11
7莫润阳,胡静,王成会,陈时.群振动气泡的非线性声响应及空化分析[J].陕西师范大学学报（自然科学版）,2020,48(3):39-47. 被引量：2

图学学报

2020年第2期

浏览历史

内容加载中请稍等...

基于ResNeXt的人体动作识别被引量：8

同被引文献57

引证文献8

二级引证文献15

相关作者

相关机构

相关主题

浏览历史

基于ResNeXt的人体动作识别 被引量：8

同被引文献57

引证文献8

二级引证文献15

相关作者

相关机构

相关主题

浏览历史

基于ResNeXt的人体动作识别被引量：8