利用深度神经网络的无监督视频表示被引量：2

Deep neural network based unsupervised video representation

下载PDF

导出

摘要在计算机视觉领域中,大多数的视频表示方法都是有监督的,需要大量带有标签的训练视频集,但标注大量视频数据会花费极大的人力和物力.为了解决这个问题,提出了一种基于深度神经网络的无监督视频表示方法.该方法利用改进的稠密轨迹(iDT)算法提取的视频块交替地训练深度卷积神经网络和特征聚类,得到可提取视频特征的深度卷积神经网络模型;通过视频的中层语义特征,实现了无监督视频表示.该模型在HMDB 51行为识别数据库和CCV事件检测数据库上分别进行了动作识别和事件检测的实验,获得了62.6%的识别率和43.6%的检测率,证明了本文方法的有效性. Most video representation methods arc supervised in the field of computer vision,requi-ring large amounts of labeled training video sets which is expensive to scale up to rapidly growing data. To solve this problem,this paper proposes an unsupervised video representation method u-sing deep convolutional neural network. The improved dense trajectory （iDT） is utilized to extract the video blocks which alternately train the convolutional neural network and clusters. The deep convolutional neural network model is trained by iteratively algorithm to get the unsu-pervised video representations. The proposed model is applied to extract features in HMDB 51 and CCV datasets for tasks of motion recognition and event detection respectively. In the experi-ments ,a 62.6% mean accuracy and a 43.6% mean average prevision （mAP） are obtained respec-tively which proves the effectiveness of the proposed method.

作者吴心筱伍堃 WU Xinxiao;WU Kun(Beijing Laboratory of Intelligent Information T＇cchnology,Beijing Institute of Technology, Beijing 100081,China.)

机构地区北京理工大学智能信息技术北京市重点实验室

出处《北京交通大学学报》 CAS CSCD 北大核心 2017年第6期8-12,共5页 JOURNAL OF BEIJING JIAOTONG UNIVERSITY

基金国家自然科学基金(61673062 61472038)~~

关键词无监督学习卷积神经网络视频表示 unsupervised learning convolution neural networks video representation

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

同被引文献10

1管皓,薛向阳,安志勇.深度学习在视频目标跟踪中的应用进展与展望[J].自动化学报,2016,42(6):834-847. 被引量：83
2朱煜,赵江坤,王逸宁,郑兵兵.基于深度学习的人体行为识别算法综述[J].自动化学报,2016,42(6):848-857. 被引量：132
3李亚玮,金立左,孙长银,崔桐.基于光流约束自编码器的动作识别[J].东南大学学报（自然科学版）,2017,47(4):691-696. 被引量：5
4曹晋其,蒋兴浩,孙锬锋.基于训练图CNN特征的视频人体动作识别算法[J].计算机工程,2017,43(11):234-238. 被引量：21
5蒋宏宇,吴亚东,赵韦鑫,唐楷.面向用户行为理解的移动通讯数据可视分析[J].浙江大学学报（理学版）,2018,45(1):37-43. 被引量：5
6杨天明,陈志,岳文静.基于视频深度学习的时空双流人物动作识别模型[J].计算机应用,2018,38(3):895-899. 被引量：25
7李元良,史中权,李少辉,李嘉昕,陈富东,王瑞琪,丁汉祥.基于MEMS传感器的人体运动识别系统[J].计算机应用与软件,2018,35(8):243-248. 被引量：10
8姚萌,贾克斌,萧允治.基于单目视频和无监督学习的轻轨定位方法[J].电子与信息学报,2018,40(9):2127-2134. 被引量：6
9朱伟,吴耀祖,刘泽祥,张重阳.基于部位密集轨迹的人体行为识别[J].自动化技术与应用,2018,37(9):116-120. 被引量：3
10陈煜平,邱卫根.基于视觉的人体行为识别算法研究综述[J].计算机应用研究,2019,36(7):1927-1934. 被引量：21

引证文献2

1李龙,卿粼波,李诗菁,何小海.基于NVIDIA JetsonTX2的视频行为检测研究[J].计算机应用与软件,2020,37(3):156-159. 被引量：1
2郭洪涛,龙娟娟.基于深度神经网络和投影树的高效率动作识别算法[J].计算机应用与软件,2020,37(4):273-279. 被引量：2

二级引证文献3

1姜鑫,黄先飞,秦樊鑫,张珍明.不同土地利用方式下喀斯特地区岩石溶蚀速率及其驱动因素[J].云南农业大学学报（自然科学版）,2020,35(5):899-905. 被引量：7
2丁建立,袁梓瑞,王怀超.基于视频关键帧提取的快速T3D动作识别模型[J].计算机应用与软件,2024,41(8):182-188.
3高庆吉,徐达,罗其俊,邢志伟.基于深层动态特征双流网络的高效行为识别算法[J].计算机应用与软件,2024,41(9):175-181.

1李厚彪,樊庆宇,耿广磊.基于自适应同时稀疏表示的鲁棒性目标追踪[J].电子科技大学学报,2018,47(1):1-12. 被引量：2
2孙政,曹永康.基于消费级无人机采集图像的摄影测量在建筑遗产测绘中的精度评估——以吉祥多门塔为例[J].建筑遗产,2017(4):120-127. 被引量：13
3汪溁鹤,陈裕雄,马世龙,吕江花.实时鲁棒的频域空间目标跟踪方法[J].北京航空航天大学学报,2017,43(12):2457-2465. 被引量：2
4张文喜.基于模拟退火算法优化谱聚类的有杆泵抽油井故障诊断[J].化工管理,2018(3):208-208.
5张雨诗,邵艳琳,芦帅,钟科.种植体周围黏膜炎在药物干预前后龈沟液的代谢组学分析[J].口腔医学研究,2017,33(12):1306-1309. 被引量：4
6孔亚奇,郎丛妍,冯松鹤,王涛,殷梦霞.双流序列回归深度网络的视频火灾检测方法[J].中国科技论文,2017,12(14):1590-1595. 被引量：6
7陈晓方,钱荧灿,王雅琳,阳春华.基于主元导数特征聚类的加氢裂化动态调整区间识别[J].清华大学学报（自然科学版）,2018,58(1):81-86.
8李静.农村电网建设和改造中若干技术热点问题的思考[J].信息记录材料,2018,19(2):21-22. 被引量：2
9胡峰,杨梦.基于特征聚类的封装特征选择算法[J].计算机工程与设计,2018,39(1):230-237. 被引量：3
10骆正茂.结合卷积神经网络不同层的特征进行包类商品检索[J].计算机应用与软件,2018,35(1):195-199. 被引量：6

北京交通大学学报

2017年第6期

浏览历史

内容加载中请稍等...

利用深度神经网络的无监督视频表示被引量：2

同被引文献10

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

利用深度神经网络的无监督视频表示 被引量：2

同被引文献10

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

利用深度神经网络的无监督视频表示被引量：2