-
题名基于自注意力的人脸表情识别算法研究
- 1
-
-
作者
刘一楠
王佳
简腾飞
曹少中
-
机构
北京印刷学院信息工程学院
贵州电网有限责任公司遵义凤冈供电局
-
出处
《北京印刷学院学报》
2024年第3期45-51,共7页
-
基金
北京市自然基金项目-北京市教委科技计划重点项目(KZ202010015021)
专业学位研究生联合培养基地建设-电子信息(21090223001)研究成果。
-
文摘
本文采用Swin Transformer和Vision Transformer网络,结合迁移学习的方法,对人脸表情识别任务进行了深入研究。为了验证不同网络的性能,选择了RAF-DB、Fer2013、CK+和JAFFE这四个常用的人脸表情数据集进行研究。通过对不同网络的不同模型进行对比,实验结果表明,Swin Transformer网络中的WMSA与SWMS自注意力结构更能够正确地关注表情特征,在数据集CK+、JAFFE、RAF-DB上分别达到了99.48%,95.60%和86.73%的识别准确率。实验结果最终验证了,在人脸表情识别任务中,基于自注意力机制的Transformer网络具有很大的潜力。
-
关键词
深度学习
表情识别
迁移学习
TRANSFORMER
自注意力
-
Keywords
deep learning
facial expression recognition
Transformer
self-attention
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于Mixer Layer的人脸表情识别
被引量:4
- 2
-
-
作者
简腾飞
王佳
曹少中
杨树林
张寒
-
机构
北京印刷学院信息工程学院
-
出处
《计算机系统应用》
2022年第7期128-134,共7页
-
基金
北京市自然基金和北京市教委联合项目(KZ202010015021)
北京市教育委员会科研计划(KM201910015003)
北京印刷学院科研项目(Ec202002,Eb202103)。
-
文摘
目前人脸表情识别研究多数采用卷积神经网络(CNN)提取人脸特征并分类,CNN的缺点是网络结构复杂,消耗计算资源.针对以上缺点,本文采用基于多层感知机(MLP)的Mixer Layer网络结构用于人脸表情识别.采用数据增强和迁移学习方法解决数据集样本不足的问题,搭建了不同层数的Mixer Layer网络.经过实验比较,4层Mixer Layer网络在CK+和JAFFE数据集上的识别准确率分别达到了98.71%和95.93%,8层Mixer Layer网络在Fer2013数据集上的识别准确率达到了63.06%.实验结果表明,无卷积结构的Mixer Layer网络在人脸表情识别任务上表现出良好的学习能力和泛化能力.
-
关键词
深度学习
迁移学习
表情识别
Mixer
Layer
图像识别
-
Keywords
deep learning
transfer learning
expression recognition
Mixer Layer
image recognition
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-