基于关键区域遮挡与重建的人脸表情识别

Facial Expression Recognition Based on Key Region Masking and Reconstruction

下载PDF

导出

摘要为了解决自然场景下人脸表情识别任务中的无用信息干扰和遮挡对识别性能的影响问题,提出一种基于关键区域遮挡与重建的人脸表情识别模型。利用多尺度特征提取网络,提取人脸图像的全局特征。根据68个人脸关键点划分出68个关键区域,并通过插值法提取68个关键区域的特征,同时采用注意力机制学习关键区域特征之间的先验关系。设计自监督的遮挡与重建模块,对关键区域特征进行随机遮挡,并利用已知区域信息来预测和重建被遮挡区域的特征,从而提高模型在自然场景下的表情识别性能。设计多个实验验证了该模型的泛化能力,并通过消融实验验证了模型中每个模块的有效性。实验结果表明,该模型在真实世界的情感面孔数据集(RAF-DB)和Occlusion-RAF-DB数据集上分别达到了88.44%和86.09%的识别准确率,相比于视觉Transformer(Vi T)等模型有效地提升了自然场景下人脸表情识别的性能。 To overcome the negative impact of irrelevant information interference and masking issues on the performance of facial expression recognition in the wild,this study proposes a facial expression recognition model based on key region masking and reconstruction.A multi-scale feature extraction network is first used to extract global features from facial images.Thereafter,the features of key regions,based on 68 facial landmarks,are extracted and encoded with attention mechanisms to learn prior relationships between the features of the key regions.To further enhance the discriminative capability of the extracted features for improved recognition performance,a key region masking and reconstruction module is designed based on self-supervised learning.This module aims to reconstruct randomly masked features of key regions using known region information.Extensive experiments are conducted to validate the generalization ability of the model,and ablation experiments confirm the effectiveness of each module in the model.The experimental results demonstrate that the model achieves recognition accuracies of 88.44%and 86.09%on the Real-world Affective Faces DataBase(RAF-DB)and the Occlusion-RAF-DB dataset,respectively,effectively improving the performance of facial expression recognition in natural scenarios compared to models such as Vision Transformer(ViT).

作者李晶李健陈海丰张倩王丽燕裴二成 LI Jing;LI Jian;CHEN Haifeng;ZHANG Qian;WANG Liyan;PEI Ercheng(School of Electronic Information and Artificial Intelligence,Shaanxi University of Science and Technology,Xi'an 710021,Shaanxi,China;School of Arts and Sciences,Shaanxi University of Science and Technology,Xi'an 710021,Shaanxi,China;School of Computer Science and Technology,Xi'an University of Posts and Telecommunications,Xi'an 710100,Shaanxi,China)

机构地区陕西科技大学电子信息与人工智能学院陕西科技大学文理学院西安邮电大学计算机学院

出处《计算机工程》 CAS CSCD 北大核心 2024年第5期241-249,共9页 Computer Engineering

基金国家自然科学基金(62306172) 国家土建结构预制装配化工程技术研究中心沈祖炎专项基金(2019CPCCE-K02) 陕西省自然科学基础研究计划项目(2022JQ-662) 2021年陕西科技大学教育信息化教学改革研究项目(JXJG2021-09) 陕西科技大学博士科研启动基金(126022325)。

关键词人脸表情识别多尺度关键区域特征注意力机制自监督学习遮挡与重建 facial expression recognition multiscale key region feature attention mechanism self-supervised learning masking and reconstruction

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1罗思诗,李茂军,陈满.多尺度融合注意力机制的人脸表情识别网络[J].计算机工程与应用,2023,59(1):199-206. 被引量：10
2王军,赵凯,程勇.基于遮挡感知卷积神经网络的面部表情识别模型[J].计算机工程,2021,47(10):242-251. 被引量：8
3冉瑞生,翁稳稳,王宁,彭顺顺.基于人脸关键特征提取的表情识别[J].计算机工程,2023,49(2):254-262. 被引量：5

二级参考文献13

1徐琳琳,张树美,赵俊莉.构建并行卷积神经网络的表情识别算法[J].中国图象图形学报,2019,24(2):227-236. 被引量：51
2徐峰,张军平.人脸微表情识别综述[J].自动化学报,2017,43(3):333-348. 被引量：47
3王善敏,帅惠,刘青山.关键点深度特征驱动人脸表情识别[J].中国图象图形学报,2020,25(4):813-823. 被引量：10
4杨旭,尚振宏.基于改进AlexNet的人脸表情识别[J].激光与光电子学进展,2020,57(14):235-242. 被引量：24
5兰凌强,李欣,刘淇缘,卢树华.基于联合正则化策略的人脸表情识别方法[J].北京航空航天大学学报,2020,46(9):1797-1806. 被引量：13
6张爱梅,徐杨.注意力分层双线性池化残差网络的表情识别[J].计算机工程与应用,2020,56(23):161-166. 被引量：15
7方明,陈文强.结合残差网络及目标掩膜的人脸微表情识别[J].吉林大学学报（工学版）,2021,51(1):303-313. 被引量：9
8尹鹏博,潘伟民,张海军.基于卷积注意力的轻量级人脸表情识别方法[J].激光与光电子学进展,2021,58(12):245-251. 被引量：11
9崔子越,皮家甜,陈勇,杨杰之,鲜焱,吴至友,赵立军,曾绍华,吕佳.结合改进VGGNet和Focal Loss的人脸表情识别[J].计算机工程与应用,2021,57(19):171-178. 被引量：26
10王军,赵凯,程勇.基于遮挡感知卷积神经网络的面部表情识别模型[J].计算机工程,2021,47(10):242-251. 被引量：8

共引文献19

1陈帅,李焕锋,沙杰,崔巍,刘梦园.基于YOLOv5的砂纸表面缺陷检测方法研究[J].电子测量技术,2023,46(14):73-79. 被引量：1
2梁晓萌,严明,吴杰.基于人工蜂群算法的Tor流量在线识别方法[J].计算机工程,2021,47(11):129-135. 被引量：5
3梁海军,刘长炎,陈宽明,孔建国.基于DCNN的管制员疲劳状态检测[J].科学技术与工程,2021,21(35):15277-15283. 被引量：8
4焦爽,范亚冰,孙立群,丁小龙.基于深度细节加强网络模型的去雨方法研究[J].电脑知识与技术,2021,17(35):80-84.
5冉瑞生,翁稳稳,王宁,彭顺顺.基于人脸关键特征提取的表情识别[J].计算机工程,2023,49(2):254-262. 被引量：5
6曾晴,曾小舟,申静.基于多层卷积神经网络的人脸表情识别方法[J].电脑知识与技术,2023,19(9):13-15. 被引量：3
7曾凤珍,王鹤玮,樊一鸣,陈瑶,张帆,刘强,贾杰,陆小锋.基于四元数与ViT模型的颈肩疾病康复患者疼痛表情分类研究[J].工业控制计算机,2023,36(7):77-78. 被引量：1
8丰芳宇,罗晓曙,蒙志明,王广宇.基于抗混叠残差注意力网络的人脸表情识别[J].计算机工程,2023,49(8):190-198. 被引量：3
9王海勇,潘海涛,刘贵楠.融合注意力机制和课程式学习的人脸识别方法[J].计算机科学与探索,2023,17(8):1893-1903. 被引量：3
10王斌,余本国.多尺度融合注意力机制的番茄叶病识别网络[J].计算机系统应用,2023,32(7):202-210. 被引量：1

1张博程,李威.基于特征融合和注意力机制的人脸表情识别[J].长江信息通信,2024,37(4):17-20.
2周燕,韦勤彬,廖俊玮,曾凡智,刘翔宇,周月霞.基于增强多层次特征融合的自然场景文本检测[J].佛山科学技术学院学报（自然科学版）,2024,42(3):1-13.
3孙国栋,闫丰亭,史志才.基于强化特征提取的视网膜血管分割[J].光电子．激光,2024,35(5):490-498.
4封晓燕,田琪,徐云峰,丛金玉,刘坤孟,王苹苹,魏本征.基于双编码特征提取路径的舌体分割方法[J].生物医学工程研究,2024,43(2):123-128.
5卢鹏涛,卢晨雨.基于YOLOv8的三阶段车牌检测[J].长江信息通信,2024,37(4):73-76.
6聂刚刚,饶洪辉,康丽春,李泽锋,刘木华.基于轻量化卷积神经网络的油茶病害识别[J].江西农业大学学报,2024,46(2):502-515.
7钟鼎文,廖永晖,吴宏京,陈文辉,黄贤裕,刘嘉欣,谢元财.“双轴十字法”模块化腹腔镜胰十二指肠切除术的可行性研究[J].赣南医学院学报,2024,44(4):392-395.
8温祥洁,王若男,钟亚萍,陈朝辉,李钰涛,黄语,方淑红.成都市某工业园区及周围表层土壤中全氟化合物的分布特征与风险评估[J].环境化学,2024,43(4):1292-1303.
9王芸菲.基于卷积神经网络的建筑物提取[J].航天返回与遥感,2024,45(2):144-152.
10梁其胜.2016~2020年太原市城区PM<sub>2.5</sub>时空分布特征及其影响因素分析[J].环境保护前沿,2024,14(2):236-245.

计算机工程

2024年第5期

浏览历史

内容加载中请稍等...

基于关键区域遮挡与重建的人脸表情识别

参考文献3

二级参考文献13

共引文献19

相关作者

相关机构

相关主题

浏览历史