基于改进型C3D神经网络的动作识别技术被引量：2

Action Recognition Technology Based on Improved C3D Neural Network

下载PDF

导出

摘要 Facebook提出的C3D三维卷积神经网络虽然能达到良好的视频动作识别准确率,但是在速度方面还有很大的改进余地,而且训练得到的模型过大,不便于移动设备使用。本文利用小型卷积核能够减少参数的特点,对已有网络结构进行优化,提出一种新的动作识别方案,将原C3D神经网络常用的3×3×3卷积核分解成深度卷积和点卷积(1×1×1卷积核),并且在UCF101数据集和ActivityNet数据集训练测试。结果表明,与原C3D网络进行对比:改进后的C3D网络准确率比C3D提升了2.4%,在速度方面比C3D提升了12.9%,模型大小压缩到原来的25.8%。 Although the C3D convolutional neural network proposed by Facebook can achieve good video action recognition accuracy, there is still much room for improvement in terms of speed, and the model obtained by training is too large to be used by mobile devices. This paper uses small convolutional kernels to reduce the characteristics of parameters, optimizes the existing network structure, and proposes a new action recognition scheme, which decomposes the 3×3×3 convolutional kernel commonly used in the original C3D neural network into deep convolution and point convolution(1×1×1 convolution kernel), and training tests on the UCF101 dataset and ActivityNet dataset. The results show that compared with the original C3D network, the improved C3D network accuracy is 2.4% higher than C3D, 12.9% faster than C3D in speed, and the model size is compressed to 25.8%.

作者廖小东贾晓霞 LIAO Xiao-dong;JIA Xiao-xia(Eigth System Department,North China Institute of Computing Technology,Beijing 100083,China)

机构地区华北计算技术研究所系统八部

出处《计算机与现代化》 2019年第3期32-38,共7页 Computer and Modernization

关键词动作识别卷积分解识别速度模型压缩 action recognition convolution decomposition recognition speed model compression

分类号 TP391.41 [自动化与计算机技术—计算机应用技术] TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献2

1王松,党建武,王阳萍,杜晓刚.实时动作识别方法研究[J].计算机工程与应用,2017,53(3):28-31. 被引量：9
2黄凯奇,陈晓棠,康运锋,谭铁牛.智能视频监控技术综述[J].计算机学报,2015,38(6):1093-1118. 被引量：402

二级参考文献213

1王素玉,沈兰荪.智能视觉监控技术研究进展[J].中国图象图形学报,2007,12(9):1505-1514. 被引量：82
2Bouwmans T, El Baf F, Vachon B. Background modeling using mixture of Gaussians for foreground detection: A survey. Recent Patents on Computer Science, 2008, 1(3) 219-237.
3Wojek C, Dollar P, Schiele B, Perona P. Pedestrian detection: An evaluation o{ the state o{ the art. IEEE Pattern Analysis and Machine Intelligence, 2012, 34(4): 743-761.
4Yilmaz A, Javed O, Shah M. Object trackingt A survey. ACM Computing Surveys (CSUR), 2006, 38(4) 1-29.
5Wang X. Intelligent multi-camera video surveillance: A review. Pattern Recognition Letters, 2012, 34 (1) : 3-19.
6Wu Y, Lira J, Yang M H. Online object tracking: A bench- mark//Proceedings of the IEEE International Conference on Computer Vision and Pattern Recognition. Portland, USA, 2013 2411-2418.
7Andreopoulos A, Tsotsos J K. 50 years of object recognition: Directions forward. Computer Vision and Image Understanding, 2013, 117(8) 827-891.
8Zhang X, Yang Y H, Han Z, et al. Object class detection: A survey. Association for Computing Machinery Computing Surveys (CSUR), 2013, 46(1) : 1311-1325.
9Morris B T, Trivedi M M. A survey of vision-based trajectory learning and analysis for surveillance. IEEE Transactions on Circuits and Systems for Video Technology, 2008, 18(8): 1114-1127.
10Aggarwal J K, Ryoo M S. Human activity analysis: A review. ACM Computing Surveys, 2011, 43(3): 16.

共引文献409

1刘海锋.煤矿智能化升级平台建设及运维保障研究[J].工矿自动化,2021,47(S01):32-35. 被引量：8
2梁平汉,郭宇辰,赵玉兰.地方政府建设智能视频监控系统的影响因素研究[J].复旦公共行政评论,2023(2):20-45.
3张兴国,周英迪,石新雨,罗霄月,顾杨旸.一种球机视频全景拼接及空间化方法[J].测绘科学,2022,47(5):203-211. 被引量：1
4汪辉,高尚兵,周君,周建,张莉雯.基于YOLOv3的多车道车流量统计及车辆跟踪方法[J].国外电子测量技术,2020,39(2):42-46. 被引量：15
5于长秋.论住房抵押贷款的证券化[J].金融理论与实践,2000(3):33-35. 被引量：1
6吴投文.论艺术家的孤独体验[J].湖北大学学报（哲学社会科学版）,2000,27(2):59-62. 被引量：7
7施巍松,孙辉,陈彦明.基于边缘计算的新型视频监控系统展望[J].自动化博览,2018,35(12):60-63. 被引量：5
8罗日成,方梦鸽,李志前,李稳,邹德华,李浙.基于传感器信息综合的带电作业安全防护系统[J].中国安全科学学报,2018,28(10):73-78. 被引量：4
9常玉兰,栗红梅,庄超明.浅析视频监控系统中设备的身份认证问题[J].国外电子测量技术,2018,37(11):5-9. 被引量：3
10向翼凌,何伟.面向校园安全的视频区域入侵检测算法[J].武汉工程大学学报,2019,41(1):93-97. 被引量：4

同被引文献18

1罗坚,唐琎,赵鹏,毛芳,汪鹏.基于3D结构光传感器的老龄人异常行为检测方法[J].光学技术,2016,42(2):146-151. 被引量：7
2杨曙光.一种改进的深度学习视频分类方法[J].现代计算机（中旬刊）,2017(3):66-69. 被引量：5
3李梦洁,董峦.基于PyTorch的机器翻译算法的实现[J].计算机技术与发展,2018,28(10):160-163. 被引量：16
4肖焕侯,史景伦.基于C3D和视觉元素的视频描述[J].华南理工大学学报（自然科学版）,2018,46(8):88-95. 被引量：1
5武利秀,桑庆兵.基于卷积神经网络的无参考混合失真图像质量评价[J].光学技术,2018,44(5):555-561. 被引量：7
6智洪欣,于洪涛,李邵梅.基于时空域深度特征两级编码融合的视频分类[J].计算机应用研究,2018,35(3):926-929. 被引量：4
7陈莹,何丹丹.基于贝叶斯融合的时空流异常行为检测模型[J].电子与信息学报,2019,41(5):1137-1144. 被引量：9
8胡正平,赵梦瑶,辛丙一.结合全局与局部视频表示的视频异常检测算法[J].模式识别与人工智能,2020,33(2):133-140. 被引量：6
9胡学敏,陈钦,杨丽,余进,童秀迟.基于深度时空卷积神经网络的人群异常行为检测和定位[J].计算机应用研究,2020,37(3):891-895. 被引量：15
10邢凯,李彬华,陶勇,王锦良,何春.基于FPGA的运动目标实时检测跟踪算法及其实现技术[J].光学技术,2020,46(2):158-166. 被引量：23

引证文献2

1张娓娓,陈绥阳,陈锐.视频监控下利用改进型C3D-RF的人群异常行为检测[J].光学技术,2021,47(2):187-195. 被引量：6
2张瑷涵,刘翔,石蕴玉,刘思齐.基于深度学习的双流程短视频分类方法[J].计算机工程,2022,48(7):277-283. 被引量：2

二级引证文献8

1施新凯,张雅丽,李御瑾,赵佳鑫.基于YOLOv4改进算法的人群异常行为检测研究[J].现代计算机,2022,28(7):29-34. 被引量：1
2冯九龙,杨海涛,栾晓鹏,马营营,冯荟璇.基于5G多视频融合的流媒体应用探索与研究[J].现代信息科技,2022,6(5):60-63. 被引量：3
3刘兰淇,刘钟涛.基于单目视觉与深度神经网络的行为识别研究[J].无线电工程,2022,52(11):2072-2080. 被引量：1
4付燕,李珍珍,叶鸥.基于蒙特卡洛树搜索的视频异常场景监测方法[J].现代电子技术,2023,46(2):96-100. 被引量：2
5杨开岳,黄家嘉,郑颖龙,纪哲,顾博欣.剔除运动异常点优化后的人群异常智能监控方法[J].自动化与仪器仪表,2023(10):158-162.
6杨传杰,殷洁,汪雁,武文亚.突发公共安全事件监控视频异常行为监测仿真[J].计算机仿真,2024,41(1):243-246.
7王南.基于云计算的短视频媒体资源个性化推送方法[J].兵工自动化,2024,43(2):16-22. 被引量：2
8铁富珍.基于改进光流法的视频监控中人群异常行为检测算法[J].现代电子技术,2024,47(7):45-48. 被引量：1

1叶运生.一种基于卷积神经网络的车辆检测方法[J].农业装备与车辆工程,2019,57(2):44-48. 被引量：1
2袁功霖,侯静,尹奎英.基于迁移学习与图像增强的夜间航拍车辆识别方法[J].计算机辅助设计与图形学学报,2019,31(3):467-473. 被引量：18
3袁功霖,尹奎英,李绮雪.基于迁移学习的航拍图像车辆目标检测方法研究[J].电子测量技术,2018,41(22):77-81. 被引量：6
4陈昀,蔡晓东,梁晓曦,王萌.权重量化的深度神经网络模型压缩算法[J].西安电子科技大学学报,2019,46(2):132-138. 被引量：9
5何娟,杨楠,谭洪瀚.基于优化双目视觉识别方案的输电线路监控研究[J].电力科学与工程,2019,35(3):31-36. 被引量：2
6王鑫,于重重,马先钦,陈秀新.基于语义分割-对抗的图像语义分割模型[J].计算机仿真,2019,36(2):191-195. 被引量：1
7钟乐乐,曾献奎,吴吉春.基于高斯过程回归的地下水模型结构不确定性分析与控制[J].水文地质工程地质,2019,46(1):1-10. 被引量：8
8刘年生,张家豪.基于Haar特征的中文车牌识别系统[J].集美大学学报（自然科学版）,2019,24(2):139-144. 被引量：1
9丁小雪,罗延安,何秉承,潘峰,张宇,李博,J.P.Draayer.SD配对壳模型对质量数A～130区原子核的形状渡越研究（英文）[J].原子核物理评论,2018,35(4):511-517.
10何宛余,李春,聂广洋,杨良崧,王楚裕.深度学习在城市感知的应用可能——基于卷积神经网络的图像判别分析[J].国际城市规划,2019,34(1):8-17. 被引量：16

计算机与现代化

2019年第3期

浏览历史

内容加载中请稍等...

基于改进型C3D神经网络的动作识别技术被引量：2

参考文献2

二级参考文献213

共引文献409

同被引文献18

引证文献2

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

基于改进型C3D神经网络的动作识别技术 被引量：2

参考文献2

二级参考文献213

共引文献409

同被引文献18

引证文献2

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

基于改进型C3D神经网络的动作识别技术被引量：2