基于多尺度核特征卷积神经网络的实时人脸表情识别被引量：18

Real-time facial expression recognition based on convolutional neural network with multi-scale kernel feature

下载PDF

导出

摘要针对人脸表情识别的泛化能力不足、稳定性差以及速度慢难以满足实时性要求的问题,提出了一种基于多尺度核特征卷积神经网络的实时人脸表情识别方法。首先,提出改进的MobileNet结合单发多盒检测器(MSSD)轻量化人脸检测网络,并利用核相关滤波(KCF)模型对检测到的人脸坐标信息进行跟踪来提高检测速度和稳定性;然后,使用三种不同尺度卷积核的线性瓶颈层构成三条支路,用通道合并的特征融合方式形成多尺度核卷积单元,利用其多样性特征来提高表情识别的精度;最后,为了提升模型泛化能力和防止过拟合,采用不同的线性变换方式进行数据增强来扩充数据集,并将FER-2013人脸表情数据集上训练得到的模型迁移到小样本CK+数据集上进行再训练。实验结果表明,所提方法在FER-2013数据集上的识别率达到73.0%,较Kaggle表情识别挑战赛冠军提高了1.8%,在CK+数据集上的识别率高达99.5%。对于640×480的视频,人脸检测速度达到每秒158帧,是主流人脸检测网络多任务级联卷积神经网络(MTCNN)的6.3倍,同时人脸检测和表情识别整体速度达到每秒78帧。因此所提方法能够实现快速精确的人脸表情识别。 Aiming at the problems of insufficient generalization ability,poor stability and difficulty in meeting the real-time requirement of facial expression recognition,a real-time facial expression recognition method based on multi-scale kernel feature convolutional neural network was proposed.Firstly,an improved MSSD(MobileNet+Single Shot multiBox Detector)lightweight face detection network was proposed,and the detected face coordinates information was tracked by Kernel Correlation Filter(KCF)model to improve the detection speed and stability.Then,three linear bottlenecks of three different scale convolution kernels were used to form three branches.The multi-scale kernel convolution unit was formed by the feature fusion of channel combination,and the diversity feature was used to improve the accuracy of expression recognition.Finally,in order to improve the generalization ability of the model and prevent over-fitting,different linear transformation methods were used for data enhancement to augment the dataset,and the model trained on the FER-2013 facial expression dataset was migrated to the small sample CK+dataset for retraining.The experimental results show that the recognition rate of the proposed method on the FER-2013 dataset reaches 73.0%,which is 1.8%higher than that of the Kaggle Expression Recognition Challenge champion,and the recognition rate of the proposed method on the CK+dataset reaches 99.5%.For 640×480 video,the face detection speed of the proposed method reaches 158 frames per second,which is 6.3 times of that of the mainstream face detection network MTCNN(MultiTask Cascaded Convolutional Neural Network).At the same time,the overall speed of face detection and expression recognition of the proposed method reaches 78 frames per second.It can be seen that the proposed method can achieve fast and accurate facial expression recognition.

作者李旻择李小霞王学渊孙维 LI Minze;LI Xiaoxia;WANG Xueyuan;SUN Wei(School of Information Engineering,Southwest University of Science and Technology,Mianyang Sichuan 621010,China;Key Laboratory of Special Environmental Robotics in Sichuan Province(Southwest University of Science and Technology),Mianyang Sichuan 621010,China)

机构地区西南科技大学信息工程学院特殊环境机器人技术四川省重点实验室(西南科技大学)

出处《计算机应用》 CSCD 北大核心 2019年第9期2568-2574,共7页 journal of Computer Applications

基金国家自然科学基金资助项目(61771411) 四川省科技计划项目(2019YJ0449) 西南科技大学研究生创新基金资助项目(18ycx123)~~

关键词人脸表情识别卷积神经网络人脸检测核相关滤波迁移学习 Facial Expression Recognition(FER) Convolutional Neural Network(CNN) face detection Kernel Correlation Filter(KCF) transfer learning

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1刘帅师,田彦涛,万川.基于Gabor多方向特征融合与分块直方图的人脸表情识别方法[J].自动化学报,2011,37(12):1455-1463. 被引量：76
2尹星云,王洵,董兰芳,万寿红.用隐马尔可夫模型设计人脸表情识别系统[J].电子科技大学学报,2003,32(6):725-728. 被引量：9

二级参考文献16

1刘晓旻,谭华春,章毓晋.人脸表情识别研究的新进展[J].中国图象图形学报,2006,11(10):1359-1368. 被引量：61
2[1]Lawrfence R R. A tutorial on hidden markov models and selected application in speech recognition[J]. Proceeding of the IEEE, 1989, 77(2): 257-286
3[2]Ira C. Automatic facial expression recognition from video sequences using temporal Information: [Master Thesis][D].USA: University of Illinois at Urbana-Champaign, Dept.of Electrical Engineering, 2000
4[3]Alexander V L, Mark B. GeneMark.hmm: new solutions for gene finding[J]. Nucleic Acids Research, 1998, 26(4):1 107-1 115
5[4]Otsuka T, Ohya J. Recognizing multiple persons' facial expression using HMM based on automatic extraction of significant frames from image sequences[C]. In: Proc.Int. Conf. on Image Processing(ICIP-97). USA, 1997. 546-549
6[5]XiaoY, Chandrasiri N P, Tadokoro Y M Oda. Recognition of facial expressions using 2D DCT and neural network[J].Electronics and Communications in Japan, 1999, 82(7): 1-11
7刘晓旻,章毓晋.基于Gabor直方图特征和MVBoost的人脸表情识别[J].计算机研究与发展,2007,44(7):1089-1096. 被引量：26
8邓洪波,金连文.一种基于局部Gabor滤波器组及PCA+LDA的人脸表情识别方法[J].中国图象图形学报,2007,12(2):322-329. 被引量：36
9SHEN Lin-Lin JI Zhen.Gabor Wavelet Selection and SVM Classification for Object Recognition[J].自动化学报,2009,35(4):350-355. 被引量：14
10薛雨丽,毛峡,郭叶,吕善伟.人机交互中的人脸表情识别研究进展[J].中国图象图形学报,2009,14(5):764-772. 被引量：48

共引文献83

1刘娟,胡敏,黄忠.基于区域NSBP特征的加权证据融合表情识别[J].电子测量与仪器学报,2020(11):132-139. 被引量：2
2肖冰,王映辉.人脸识别研究综述[J].计算机应用研究,2005,22(8):1-5. 被引量：53
3章品正,王征,赵宏玉.面部表情特征抽取的研究进展[J].计算机工程与应用,2006,42(9):38-41. 被引量：6
4李文.人脸表情识别方法[J].电子科技,2007,20(6):63-68.
5李俊华,彭力.一种人脸表情分类的新方法——Manhattan距离[J].计算机工程与应用,2008,44(2):74-75. 被引量：5
6王一平,赵哲峰.用遗传算法改进HMM的语音识别算法[J].科技创新与生产力,2011(6):84-85.
7韦妍.人脸表情识别概述[J].网络安全技术与应用,2011(8):77-79. 被引量：3
8杜宁.人面部表情识别方法综述[J].黑龙江科技信息,2011(28):61-61.
9刘帅师,田彦涛,王新竹.基于对称双线性模型的光照鲁棒性人脸表情识别[J].自动化学报,2012,38(12):1933-1940. 被引量：6
10万川,田彦涛,刘帅师,陈宏伟.基于主动机器视觉的人脸跟踪与表情识别系统[J].吉林大学学报（工学版）,2013,43(2):459-465. 被引量：4

同被引文献110

1王克奇,石岭,白雪冰,王业琴.基于高斯-马尔可夫随机场的板材表面纹理分析[J].林业科技,2005,30(6):46-48. 被引量：5
2龚衍,舒宁.非参数吉布斯模型和多波段遥感影像纹理分割方法研究[J].武汉大学学报（信息科学版）,2007,32(7):581-584. 被引量：2
3周书仁,梁昔明,朱灿,杨秋芬.基于ICA与HMM的表情识别[J].中国图象图形学报,2008,13(12):2321-2328. 被引量：22
4邹超,汪秉文,孙志刚.基于机器视觉的织物疵点检测方法综述[J].天津工业大学学报,2009,28(2):78-82. 被引量：20
5王业琴,王辉.GMRF随机场在纹理特征描述与识别中的应用[J].计算机工程与应用,2011,47(25):202-204. 被引量：11
6向征,谭恒良,马争鸣.HOG在人脸识别中的性能研究[J].计算机工程,2012,38(15):194-196. 被引量：9
7吴泽鹏,郭玲玲,朱明超,贾宏光,宣明.结合图像信息熵和特征点的图像配准方法[J].红外与激光工程,2013,42(10):2846-2852. 被引量：34
8梁雪梅.基于增量学习和ASM的人脸表情分析与识别[J].计算机应用与软件,2014,31(3):171-174. 被引量：1
9刘海军,常东超,张凌宇.改进的局部方向模式纹理表示方法[J].中国图象图形学报,2014,19(4):520-526. 被引量：7
10李雅倩,李颖杰,李海滨,张强,张文明.融合全局与局部多样性特征的人脸表情识别[J].光学学报,2014,34(5):164-170. 被引量：29

引证文献18

1孙佳颖,刘新颖,姚双,沈艳,余冬华.基于数据融合与迁移学习的学生表情识别研究[J].智能计算机与应用,2021,11(11):180-184. 被引量：2
2叶杨,孙会龙,刘贞.一种自适应加权LDP的虚拟现实设备表情识别方法[J].重庆理工大学学报（自然科学）,2019,33(10):109-114. 被引量：3
3陆玉.探究跨连特征融合网络的面部表情识别技术[J].景德镇学院学报,2020,35(3):8-11.
4亢洁,李思禹.基于注意力机制的卷积神经网络人脸表情识别[J].陕西科技大学学报,2020,38(4):159-165. 被引量：5
5潘哲琦,付晓峰,陈旭坤.基于表情识别的情绪影集剪辑系统[J].电子技术与软件工程,2020(14):158-160. 被引量：1
6张立志,王冬雪,陈永超,孙华东,韩小为.基于GMRF和KNN算法的人脸表情识别[J].计算机应用与软件,2020,37(10):214-219. 被引量：2
7柳永翔,付晓峰,付晓鹃,周伟,潘哲琦.深度可分离CNN在表情识别中的应用研究[J].工业控制计算机,2020,33(10):71-73. 被引量：5
8涂毅晗,周慧,贾杰.等间隔矫正算法下稳定实时人脸跟踪监控技术[J].计算机仿真,2020,37(10):425-428.
9陆玉.人机交互中的人脸表情识别研究[J].北京印刷学院学报,2020,28(12):162-164. 被引量：3
10李军,李明.融合Multi-scale CNN和Bi-LSTM的人脸表情识别研究[J].北京联合大学学报,2021,35(1):35-39. 被引量：3

二级引证文献68

1张人,何宁.微表情识别研究综述[J].计算机工程与应用,2021,57(1):38-47. 被引量：12
2黄音,毛莉莎,张小帆,盛思诗,黄淑敏,甘佳,张薪薪.基于数字孪生讲台的在线沉浸式教学体系分析与流程设计[J].远程教育杂志,2021,39(1):51-62. 被引量：26
3李军,李明.融合Multi-scale CNN和Bi-LSTM的人脸表情识别研究[J].北京联合大学学报,2021,35(1):35-39. 被引量：3
4高婷婷,李航,殷守林.一种基于面部纹理特征融合的人脸表情识别方法[J].河北科技大学学报,2021,42(2):119-126. 被引量：6
5祁星晨,卓旭升.基于改进MTCNN算法的低功耗边缘人脸检测跟踪系统[J].电子技术应用,2021,47(5):40-44. 被引量：2
6吕俊霖,麦嘉铭,熊浩,蔡海真.基于深度学习的鱼类智能识别系统的设计与实现[J].渔业现代化,2021,48(3):90-96. 被引量：6
7尹鹏博,潘伟民,张海军.基于卷积注意力的轻量级人脸表情识别方法[J].激光与光电子学进展,2021,58(12):245-251. 被引量：9
8薛继伟,吕福娟,刘显德.基于改进ResNet的人脸表情识别研究[J].河南科学,2021,39(8):1205-1210. 被引量：3
9段文婷.智能翻译机器人人机交互模块自动优化方法[J].自动化与仪器仪表,2021(10):194-197. 被引量：3
10李健,马蓉蓉,韩超远,齐勇,何斌.基于SMPL-X模型的人体姿态与形状重构算法[J].陕西科技大学学报,2021,39(6):167-173. 被引量：1

1蒋向利.丘成桐：我相信中国可以培养出一流的科研人才[J].中国科技产业,2019,0(8):11-11.
2肖学聪.微世界,大课堂——微课在小学数学高年级教学中的应用分析[J].教育信息化论坛,2019,3(7):258-259.
3曹莉.变换方式,让沟通更有效——和低年级孩子的沟通技巧微事例[J].启迪,2019,0(8):49-50.
4王日宏,李永珺,张立锋.自适应尺度特征融合的异常重检跟踪算法[J].计算机工程与设计,2019,40(9):2660-2665. 被引量：1
5邹建成,王润玲,车满强,熊昌镇.稀疏卷积特征的实时目标跟踪[J].北方工业大学学报,2019,31(2):1-8.
6行业动态(比赛)[J].机器人技术与应用,2019(4):13-13.
7张柳,王晰巍,黄博,刘宇桐.基于字词向量的多尺度卷积神经网络微博评论的情感分类模型及实验研究[J].图书情报工作,2019,63(18):99-108. 被引量：26
8邵堃,雷迎科.基于相关滤波和离散度分析的帧同步识别[J].探测与控制学报,2019,41(4):78-83. 被引量：1
9彭佳铭,黄丽新(指导).魔方高手[J].小读者,2019,0(20).
10陈耀.媒介素养教育与高校思想政治教育的融合研究[J].教育理论与实践,2019,39(24):24-26. 被引量：7

计算机应用

2019年第9期

浏览历史

内容加载中请稍等...

基于多尺度核特征卷积神经网络的实时人脸表情识别被引量：18

参考文献2

二级参考文献16

共引文献83

同被引文献110

引证文献18

二级引证文献68

相关作者

相关机构

相关主题

浏览历史

基于多尺度核特征卷积神经网络的实时人脸表情识别 被引量：18

参考文献2

二级参考文献16

共引文献83

同被引文献110

引证文献18

二级引证文献68

相关作者

相关机构

相关主题

浏览历史

基于多尺度核特征卷积神经网络的实时人脸表情识别被引量：18