基于空时注意力网络的面部表情识别被引量：7

Spatial-temporal attention network forfacial expression recognition

下载PDF

导出

摘要基于视频序列的面部表情识别问题主要有两个特点:空时性和显著性。近年来,许多研究人员利用卷积神经网络、循环神经网络、三维卷积神经网络等深度学习方法处理该问题的空时特性。但是,面部表情的显著性问题却往往被忽视。随着注意力机制在深度学习网络中的应用发展,其能够有效地解决各类任务中的显著性问题。该文将空时注意力机制应用到面部表情识别中,使得深度网络更多地关注空时特征中的显著性。具体地,该文将空间注意力模块嵌入到卷积网络中,以使空域特征更加关注对表情识别重要的区域,将时间注意力模块嵌入到门控循环单元(gated recurrent units,GRU)后,使得时域特征更加关注信息丰富的视频帧。在RECOLA情感数据库上的实验表明,与一般的深度模型相比,该文的深度空时注意力网络显著提高了面部表情识别的性能。 Facial expression recognition(FER)based on video sequences has two main characteristics:spatio-temporal and significance.Of late,many researchers combined convolutional neural networks(CNNs),recurrent neural networks(RNNs)and 3D CNN to address the spatio-temporal characteristics.However,few works focus on the salient features of this issue.Meanwhile,with the development of the attention mechanism for deep learning,its effectiveness in the salient problem has attracted the interest of researchers.In this paper,we introduce the attention mechanism into FER,by which our deep network pays more attention to the salient extraction of spatial-temporal features.Specifically,a spatial attention module is inserted into the CNN networks to make the spatial feature extraction more objectively.A temporal attention module is inserted into the output of the gated recurrent units(GRU)at each step of a sequence,so that the temporal features pay more attention to the informative frames.We validate our approach on the RECOLA emotion database.A comparison of the results with attention and without attention shows that our deep attention network improves the performance compared to the general deep model.

作者冯晓毅黄东崔少星王坤伟 FENG Xiaoyi;HUANG Dong;CUI Shaoxing;WANG Kunwei(School of Electronics and Information,Northwestern Polytechnical University,Xi′an 710072,China;School of Automation and Information Engineering,Xi′an University of Technology,Xi′an 710048,China)

机构地区西北工业大学电子信息学院西安理工大学自动化与信息工程学院

出处《西北大学学报（自然科学版）》 CAS CSCD 北大核心 2020年第3期319-327,共9页 Journal of Northwest University（Natural Science Edition）

基金国家自然科学基金资助项目(61702419) 陕西省科技计划资助项目(2020GY-050,2018ZDXM-GY-186) 陕西省自然科学基础研究计划资助项目(2018JQ6090)。

关键词深度学习空时方法注意力机制面部表情识别 deep learning spatial-temporal method attention mechanism facial expression recognition

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1谢飞,穆昱,管子玉,沈雪敏,许鹏飞,王和旭.基于具有空间注意力机制的Mask R-CNN的口腔白斑分割[J].西北大学学报（自然科学版）,2020,50(1):9-15. 被引量：8
2张璟.基于卷积神经网络的人脸表情识别研究[J].电脑知识与技术,2019,15(6):212-213. 被引量：3
3彭先霖,张海曦,胡琦瑶.基于多任务深度卷积神经网络的人脸/面瘫表情识别方法[J].西北大学学报（自然科学版）,2019,49(2):187-192. 被引量：10

二级参考文献6

1孙正,宫芸芸,黄洁.白斑癌变危险因素与口腔白斑病分期体系的关系[J].中华口腔医学杂志,2001,36(5):364-366. 被引量：12
2卢官明,何嘉利,闫静杰,李海波.一种用于人脸表情识别的卷积神经网络[J].南京邮电大学学报（自然科学版）,2016,36(1):16-22. 被引量：49
3孙晓,潘汀,任福继.基于ROI-KNN卷积神经网络的面部表情识别[J].自动化学报,2016,42(6):883-891. 被引量：52
4何俊,蔡建峰,房灵芝,何忠文.基于LBP/VAR与DBN模型的人脸表情识别[J].计算机应用研究,2016,33(8):2509-2513. 被引量：21
5侯小红,郭敏.一种基于Harris-SIFT特征点检测的LBP人脸表情识别算法[J].西北大学学报（自然科学版）,2017,47(2):209-214. 被引量：21
6李勇,林小竹,蒋梦莹.基于跨连接LeNet-5网络的面部表情识别[J].自动化学报,2018,44(1):176-182. 被引量：99

共引文献18

1高如新,常嘉浩,杜亚博,刘群坡.基于改进YOLOv5s的煤矸石目标检测算法[J].电子测量技术,2023,46(13):95-101. 被引量：1
2赵亚民.二色补血草栽培技术[J].河北林果研究,2000,15(1):69-80. 被引量：4
3彭先霖,张海曦,胡琦瑶,温超.基于自发表情数据集预训练的多任务深度网络表情识别方法[J].计算机测量与控制,2019,27(7):248-252. 被引量：1
4张琦,张荣梅,陈彬.基于深度学习的图像识别技术研究综述[J].河北省科学院学报,2019,36(3):28-36. 被引量：48
5陈超,黄佳.基于深度学习的树莓派人脸与表情识别系统研究与设计[J].网络安全技术与应用,2019,0(12):50-52. 被引量：7
6管子玉,谢飞,任文研,沈雪敏,许鹏飞,王和旭.基于多任务学习的口腔白斑与扁平苔藓的分割与识别[J].西北大学学报（自然科学版）,2020,50(1):1-8. 被引量：5
7彭进业,曹煜,章勇勤,彭先霖,李展,王珺,张群喜,杨蕊.MeGAN:基于多任务增强生成对抗网络的图像合成[J].西北大学学报（自然科学版）,2020,50(3):311-318.
8陆玉.基于计算机视觉的表情识别方法研究[J].九江学院学报（自然科学版）,2020,35(2):81-83.
9眭海刚,黄立洪,刘超贤.利用具有注意力的Mask R-CNN检测震害建筑物立面损毁[J].武汉大学学报（信息科学版）,2020,45(11):1660-1668. 被引量：9
10谢飞,权媚阳,管子玉,段群.基于深度学习的腹部多器官图像分割[J].西北大学学报（自然科学版）,2021,51(1):1-7. 被引量：5

同被引文献63

1丁名都,李琳.基于CNN和HOG双路特征融合的人脸表情识别[J].信息与控制,2020,49(1):47-54. 被引量：17
2赵妍妍,秦兵,刘挺.文本情感分析[J].软件学报,2010,21(8):1834-1848. 被引量：543
3李婷婷,姬东鸿.基于SVM和CRF多特征组合的微博情感分析[J].计算机应用研究,2015,32(4):978-981. 被引量：83
4万千,费本华,宋莎莎.不同木质室内装饰空间审美偏好的ERP研究[J].林产工业,2017,44(5):26-30. 被引量：8
5陈珂,梁斌,柯文德,许波,曾国超.基于多通道卷积神经网络的中文微博情感分析[J].计算机研究与发展,2018,55(5):945-957. 被引量：75
6杨恢先,陈永,张翡,周彤彤.基于改进梯度局部二值模式的人脸识别[J].激光与光电子学进展,2018,55(6):118-125. 被引量：12
7彭小江.基于多模态信息的情感计算综述[J].衡阳师范学院学报,2018,39(3):31-36. 被引量：5
8江大鹏,杨彪,邹凌.基于LBP卷积神经网络的面部表情识别[J].计算机工程与设计,2018,39(7):1971-1977. 被引量：19
9裴颂文,杨保国,顾春华.网中网残差网络模型的表情图像识别研究[J].小型微型计算机系统,2018,39(12):2681-2686. 被引量：11
10欧中亚,山田宏尚.结合鲁棒PCA特征与随机森林的表情识别方法[J].计算机工程与设计,2018,39(2):580-584. 被引量：2

引证文献7

1陈磊.三维面部表情识别技术研究[J].中国高新科技,2020(14):144-145.
2刘继明,张培翔,刘颖,张伟东,房杰.多模态的情感分析技术综述[J].计算机科学与探索,2021,15(7):1165-1182. 被引量：33
3崔婷婷,于海霞.基于改进深度学习的动画人物面部表情生成方法的研究[J].九江学院学报（自然科学版）,2021,36(4):68-72. 被引量：1
4郭文强,冯春石,赵艳,侯勇严,徐成,李惟.基于贝叶斯网和迁移学习的人脸表情识别方法[J].陕西科技大学学报,2022,40(6):163-169. 被引量：2
5李嘉乾,张雷.应对复杂光照下的高精度表情识别方法[J].计算机工程与设计,2023,44(8):2489-2497.
6杨婷婷.基于模糊核判别分析的静态面部表情情绪识别方法[J].潍坊学院学报,2023,23(5):9-13. 被引量：1
7王坤侠,余万成,胡玉霞.嵌入混合注意力机制的Swin Transformer人脸表情识别[J].西北大学学报（自然科学版）,2024,54(2):168-176. 被引量：2

二级引证文献39

1陈然,赵晶,郝慧超,王凯伦.基于多模态深度学习的审美认知规律大规模测度方法[J].装饰,2021(7):106-111. 被引量：6
2张祖耀,王碧凌,摇若楷.面向群智共创的用户多模态信息设计[J].包装工程,2021,42(24):29-35. 被引量：7
3王小根,陈瑶瑶.多模态数据下混合协作学习者情感投入分析[J].电化教育研究,2022,43(2):42-48. 被引量：23
4包广斌,李港乐,王国雄.面向多模态情感分析的双模态交互注意力[J].计算机科学与探索,2022,16(4):909-916. 被引量：9
5冯广,江家懿,罗时强,伍文燕.基于话语间时序多模态数据的情绪分析方法[J].计算机系统应用,2022,31(5):195-202. 被引量：2
6刘颖,王哲,房杰,朱婷鸽,李琳娜,刘继明.基于图文融合的多模态舆情分析[J].计算机科学与探索,2022,16(6):1260-1278. 被引量：4
7赵之文.多模态情感分析技术的应用研究[J].现代信息科技,2022,6(10):78-81.
8洪惠群,沈贵萍,黄风华.表情识别技术综述[J].计算机科学与探索,2022,16(8):1764-1778. 被引量：6
9何畔,宁芳.多模态视角下露天矿安全双控管理系统移动端交互设计研究[J].机电产品开发与创新,2022,35(4):23-26.
10刘佳琳,李喆.多模态学习的研究热点、动态前沿与趋势分析--基于CiteSpace软件的可视化分析[J].卫生职业教育,2022,40(19):125-129. 被引量：1

1卢官明,程晓,李霞,闫静杰,李海波.基于遗传算法的多模态情感特征融合方法[J].南京邮电大学学报（自然科学版）,2019,39(5):41-47. 被引量：7
2孔祥鹏,吾守尔·斯拉木,杨启萌,李哲.基于迁移学习的维吾尔语命名实体识别[J].东北师大学报（自然科学版）,2020,52(2):58-65. 被引量：10
3塔什甫拉提·尼扎木丁,梁瑞宇,谢跃,赵力.采用原子表示模型的维吾尔语语音情感识别[J].信号处理,2020,36(1):9-17. 被引量：3
4刘芳,吴志威,杨安喆,韩笑.基于多尺度特征融合的自适应无人机目标检测[J].光学学报,2020,40(10):127-136. 被引量：33
5田明明,廖桂生,李云鹏,朱圣棋.超高速平台载雷达杂波特性与抑制方法[J].系统工程与电子技术,2020,42(2):301-308. 被引量：6
6李冉,栗苹,贾瑞丽.基于最优空时自适应处理的箔条云干扰抑制方法[J].制导与引信,2019,0(2):17-21.
7马国辉,罗云琪.基于深度学习GRU模型的电离层总电子含量预报[J].测绘与空间地理信息,2020,43(S01):212-215. 被引量：3
8孙鑫,王海东,路丽刚.煤层水力割缝转速对切割半径影响规律研究[J].煤炭工程,2020,52(5):116-120. 被引量：11
9孙陈影,沈希忠.LSTM和GRU在城市声音分类中的应用[J].应用技术学报,2020,20(2):158-164. 被引量：6
10窦金花,覃京燕.基于深度学习的产品外观意象情感计算服务平台研究[J].包装工程,2020,41(6):20-25. 被引量：10

西北大学学报（自然科学版）

2020年第3期

浏览历史

内容加载中请稍等...

基于空时注意力网络的面部表情识别被引量：7

参考文献3

二级参考文献6

共引文献18

同被引文献63

引证文献7

二级引证文献39

相关作者

相关机构

相关主题

浏览历史

基于空时注意力网络的面部表情识别 被引量：7

参考文献3

二级参考文献6

共引文献18

同被引文献63

引证文献7

二级引证文献39

相关作者

相关机构

相关主题

浏览历史

基于空时注意力网络的面部表情识别被引量：7