端到端增强特征神经网络的视频表情识别被引量：4

Video Expression Recognition Based on End-to-End Enhanced Feature Neural Network

下载PDF

导出

摘要以卷积神经网络结合循环神经网络搭建端到端的深度学习网络,提出一种增强特征的视频表情识别方法。其中,卷积神经网络采用传统的VGG-16-FACE模型作为初始模型,完成特征提取;循环神经网络采用具有记忆能力的长期短时记忆模型网络(LSTM)结合连续视频的帧间信息给出最优预测。首先,对VGG-16和LSTM模型分别进行独立训练。因预测结果很大程度取决于LSTM模型,针对LSTM的层数和输出神经元个数进行优化调试后,得到两层LSTM,发现输出维度为2 048时识别效果最好。考虑到增加负责特征提取的VGG模型对预测结果的影响比重,模型由独立训练2个模型连接为端到端的1个模型。实验中考虑到1层LSTM输出会造成特征丢失,在端到端模型的基础上加入跳层连接,增强特征输入,最终实验结果表明:在AFEW数据集上对视频表情识别的准确率从32. 88%提升到37. 34%,F1分数从0. 289 5提升到0. 339 9,证实了端到端增强特征混合神经网络的有效性。 In this paper,a convolutional neural network( CNN) combined with a recurrent neural network( RNN) is built into an end-to-end deep learning network,and a video feature recognition method with enhanced features is proposed. The traditional VGG-16-FACE model is used as the initial model to complete the feature extraction. The long-term short-term memory( LSTM) model network with memory capability is combined with the inter-frame information of continuous video to make the optimal prediction. At the beginning of the experiment, the VGG and LSTM models were independently trained,and the prediction results largely depended on LSTM. We optimized the number of layers and output neurons for LSTM,and then theexperiments show that the results are better when the two-layer LSTM and its output are both 2 048. Then considering the increase of the influence of the VGG model responsible for feature extraction on the prediction results,the model is connected by an independent training model to an end-to-end model. In addition,the loss of features is caused by one layer of LSTM. The cross-layer connection is added on the basis of the end-to-end model to enhance feature input. The final experimental result improves the accuracy of video expression recognition from 32. 88% to 37. 34% and F1 score from 0. 289 5 to 0. 339 9 on the AFEW data set. It also confirmed the effectiveness of the end-to-end enhanced feature hybrid neural network.

作者陈乐童莹陈瑞曹雪虹 CHEN Le;TONG Ying;CHEN Rui;CAO Xuehong(College of Telecommunications & Information Engineering, Nanjing University of Posts and Telecommunications, Nanjing 210003 , China;Department of Communication Engineering, Nanjing Institute of Technology, Nanjing 211167 , China)

机构地区南京邮电大学通信与信息工程学院南京工程学院信息与通信工程学院

出处《重庆理工大学学报（自然科学）》 CAS 北大核心 2019年第9期125-131,共7页 Journal of Chongqing University of Technology：Natural Science

基金国家自然科学基金青年项目(61703201) 江苏省自然科学基金青年项目(BK20170765)

关键词视频表情识别卷积神经网络循环神经网络深度学习 video expression recognition recurrent neutral network convolutional neutral network deep learning

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1李文书,何芳芳,钱沄涛,周昌乐.基于Adaboost-高斯过程分类的人脸表情识别[J].浙江大学学报（工学版）,2012,46(1):79-83. 被引量：14
2常祥,杨明.基于改进的卷积神经网络的图像分类性能[J].重庆理工大学学报（自然科学）,2017,31(3):110-115. 被引量：6

二级参考文献27

1王宇博,艾海舟,武勃,黄畅.人脸表情的实时分类[J].计算机辅助设计与图形学学报,2005,17(6):1296-1301. 被引量：14
2程剑,应自炉.基于二维主分量分析的面部表情识别[J].计算机工程与应用,2006,42(5):32-33. 被引量：9
3肖柏旭,张丽静.基于分流抑制机制的卷积神经网络人脸检测法[J].计算机应用,2006,26(B06):46-48. 被引量：4
4TIAN Y, KANADE T, COHN J. Evaluation of Gabor wavelet-based facial action unit recognition in image sequences of increasing complexity [C] // Proceedings of IEEE International Conference on Automatic Face and Gesture Recognition. Washington: IEEE, 2002:26-30.
5MULLER S, WALLHOFF F, HULSKEN F, et al. Facial expression recognition using pseudo 3-D hidden Markov models [C] // Proceedings of International Conference on Pattern Recognition. Quebec City : [ s. n. ], 2002:32 - 35.
6ZHANG Y, JI Q. Active and dynamic information fusion for facial expression understanding from image sequences [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2005, 27(5) : 699 - 714.
7KAPPOR A, QI Y, PICARD R W. Fully automatic upper facial action recognition [C] // Proceedings of Analysis and Modeling of Faces and Gestures. Nice, France: [s.n.], 2003: 195-202.
8LIU C, SHUM H Y. Kullback-Leibler boosting [C] // Proceedings of Computer Society Conference on Computer Vision and Pattern Recognition. Wisconsin: IEEE, 2003 : 587 - 594.
9BARTLETT M S, LITTLEWOET G, FRANK M, et al. Recognizing facial expression: machine learning and application to spontaneous behavior [C]//Proceedings of IEEE Computer Society Conference on Computer Vision and Pattern Recognition. San Diego: IEEE, 2005: 568- 573.
10PANTIC M, ROTHKRANTZ L. Facial action recognition for facial expression analysis from static face images [J]. IEEE Transactions on Systems, Man and Cybernetics:Part B, 2004, 34 (3) : 1449 - 1461.

共引文献18

1冯杰,屈志毅,李志辉.基于分类稀疏表示的人脸表情识别[J].软件,2013,34(11):59-61. 被引量：11
2杨凡,张磊.基于Gabor参数矩阵与改进Adaboost的人脸表情识别[J].计算机应用,2014,34(4):1134-1138. 被引量：10
3朱剑祥.基于改进的核主元回归的赖氨酸发酵软测量[J].信息技术,2015,39(11):105-108.
4许进文,赵启军,陈虎.一种改进的三维局部约束模型初始化方法[J].计算机技术与发展,2017,27(1):30-33.
5罗源,张灵,陈云华,朱思豪,田小路.基于层次结构化字典学习的人脸表情识别[J].计算机应用研究,2017,34(11):3514-3517. 被引量：2
6王信,汪友生.基于深度学习与传统机器学习的人脸表情识别综述[J].应用科技,2018,45(1):65-72. 被引量：14
7杨晋丹,杨涛,苗腾,朱超,沈秋采,彭宇飞,梅珀彰,党雨晴.基于卷积神经网络的草莓叶部白粉病病害识别[J].江苏农业学报,2018,34(3):527-532. 被引量：27
8张发勇,刘袁缘,李杏梅,覃杰.基于多视角深度网络增强森林的表情识别[J].计算机辅助设计与图形学学报,2018,30(12):2318-2326. 被引量：5
9薛先贵,黎路.浅析卷积神经网络的图像特征提取技术[J].科技视界,2019(7):83-84.
10薛建明,刘宏哲,袁家政,王雪峤,李青,杨少鹏.基于CNN与关键区域特征的人脸表情识别算法[J].传感器与微系统,2019,38(10):146-149. 被引量：11

同被引文献20

1李文书,何芳芳,钱沄涛,周昌乐.基于Adaboost-高斯过程分类的人脸表情识别[J].浙江大学学报（工学版）,2012,46(1):79-83. 被引量：14
2庄福振,罗平,何清,史忠植.迁移学习研究进展[J].软件学报,2015,26(1):26-39. 被引量：456
3袁姮,王志宏,姜文涛.基于频率簇模型的人脸识别[J].中国图象图形学报,2016,21(9):1166-1177. 被引量：3
4翟懿奎,刘健.面向人脸表情识别的迁移卷积神经网络研究[J].信号处理,2018,34(6):729-738. 被引量：18
5朱超平,杨艺.基于YOLO2和ResNet算法的监控视频中的人脸检测与识别[J].重庆理工大学学报（自然科学）,2018,32(8):170-175. 被引量：24
6贾澎涛,杨丽娜.基于多特征的视频场景分类[J].计算机应用研究,2018,35(11):3472-3475. 被引量：7
7马慧,孙万春,史君华,杨馨竹,郑集元.基于Curvelet变换的低分辨率人脸识别方法[J].重庆理工大学学报（自然科学）,2018,32(11):162-168. 被引量：5
8王素琴,高宇豆,张加其.基于生成对抗网络的遮挡表情识别[J].计算机应用研究,2019,36(10):3112-3115. 被引量：9
9叶杨,孙会龙,刘贞.一种自适应加权LDP的虚拟现实设备表情识别方法[J].重庆理工大学学报（自然科学）,2019,33(10):109-114. 被引量：3
10吕兵,刘玉贤,叶绍泽,闫臻.基于卷积神经网的CCTV视频中排水管道缺陷的智能检测[J].测绘通报,2019(11):103-108. 被引量：22

引证文献4

1戴蓉.基于面部生理特征和深度学习的表情识别方法[J].重庆理工大学学报（自然科学）,2020,34(6):146-153. 被引量：7
2唐武宾,童莹,曹雪虹.端到端增强卷积网络的视频人脸表情识别研究[J].软件导刊,2022,21(3):42-48.
3游小玲,蔡永香,王荟奥,杨岸霖.FEDDR:一套实用的地下排水管道缺陷智能检测系统[J].科学技术与工程,2023,23(7):2932-2944.
4张本文,高瑞玮,乔少杰.新型融合注意力机制的遮挡面部表情识别框架[J].重庆理工大学学报（自然科学）,2023,37(9):217-226. 被引量：2

二级引证文献9

1陈宇斌.基于改进核判别算法的视频运动人脸图像相似表情识别研究[J].齐齐哈尔大学学报（自然科学版）,2021,37(1):36-40. 被引量：1
2刘继明,张培翔,刘颖,张伟东,房杰.多模态的情感分析技术综述[J].计算机科学与探索,2021,15(7):1165-1182. 被引量：28
3冉建国,刘珩,张品,刘亚文,吕振坚.基于深度卷积对抗网络的迷彩设计方法[J].兵器装备工程学报,2021,42(11):264-269. 被引量：1
4冯欣,李永波,杨武.一种利用目标结构关系增强的行人重识别方法[J].重庆理工大学学报（自然科学）,2022,36(9):110-118. 被引量：1
5张家波,甘海洋,李杰.基于像素特征的微表情识别[J].重庆邮电大学学报（自然科学版）,2022,34(6):1013-1020.
6张本文,高瑞玮,乔少杰.新型融合注意力机制的遮挡面部表情识别框架[J].重庆理工大学学报（自然科学）,2023,37(9):217-226. 被引量：2
7郝秉华,吴华.多流残差网络结合改进SVM模型的面部表情识别[J].重庆理工大学学报(自然科学),2023,37(11):157-165.
8郭胜,蔡姗,邹雪,周珍胜,王林.基于加权多头并行注意力的局部遮挡面部表情识别[J].计算机系统应用,2024,33(1):254-262.
9朱智勤,孟骏,李嫄源,齐观秋,李华锋,姚政.基于再感知双模型联合训练的散焦模糊检测[J].重庆邮电大学学报（自然科学版）,2024,36(1):86-97.

1董兰芳,张军挺.基于深度学习与随机森林的人脸年龄与性别分类研究[J].计算机工程,2018,44(5):246-251. 被引量：9
2张晓宇.那些发霉的食物都发生了什么（英文）[J].英语画刊（高级）,2018(36):93-94.
3王李.基于混合神经网络的矿用干式变压器故障诊断研究[J].世界有色金属,2019,44(14):177-178. 被引量：4
4陈莉明,邓德祥.混合深度卷积神经网络对人脸年龄的分类[J].华中科技大学学报（自然科学版）,2019,47(3):104-108. 被引量：3
5王君,江泉,施秀荣,单君,张渊.实时超声造影评估颈动脉斑块稳定性的价值[J].肿瘤影像学,2019,28(4):223-226. 被引量：3
6安淑红.in a while 与 for a while 辨析[J].中小学英语教学与研究,2019,0(2):75-76.
7张长青,杨楠.基于混合神经网络的车牌字符识别技术[J].电子科技,2019,32(9):51-54. 被引量：6
8孟子超,杜文娟,王海风.基于迁移学习深度卷积神经网络的配电网故障区域定位[J].南方电网技术,2019,13(7):25-33. 被引量：41
9邵炜霞.大峡谷国家公园之旅[J].英语画刊（高级）,2018(28):92-92.
10崔冠军.基于多模态融合的情绪检测研究[J].电子技术与软件工程,2019(19):124-125. 被引量：1

重庆理工大学学报（自然科学）

2019年第9期

浏览历史

内容加载中请稍等...

端到端增强特征神经网络的视频表情识别被引量：4

参考文献2

二级参考文献27

共引文献18

同被引文献20

引证文献4

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

端到端增强特征神经网络的视频表情识别 被引量：4

参考文献2

二级参考文献27

共引文献18

同被引文献20

引证文献4

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

端到端增强特征神经网络的视频表情识别被引量：4