-
题名一种基于词频-逆文档频率和混合损失的表情识别算法
被引量:3
- 1
-
-
作者
蓝峥杰
王烈
聂雄
-
机构
广西大学计算机与电子信息学院
广西多媒体通信与网络技术重点实验室
-
出处
《计算机工程》
CAS
CSCD
北大核心
2023年第1期295-302,310,共9页
-
基金
广西科技重大专项(桂科AA21077007)。
-
文摘
面部表情能自然高效地表达人类的心理活动和思想状态,影响着人们的沟通交流过程。在诸多智能化应用中,人脸表情识别是人类与机器间建立情感交互的重要基础。在细粒度人脸表情识别任务中,由于特征提取网络对表情产生区域的关键特征处理不足,从而引发细节特征信息丢失问题。提出一种词频-逆文档频率注意力机制TF-IDF SPA,通过该机制调整表情产生关键区域的注意力分布,强化网络对该区域关键细节特征的提取能力。同时,为了应对表情识别任务中普遍存在的类间差异小、类内差异大的问题,设计一种改进型混合加权损失函数,以增强表情类内聚拢性同时增大类间距离。依据数据集中样本的数量分布情况,动态调整损失函数的分类权重值,从而强化模型对小数据量样本的学习能力。在此基础上,将结构简单的TF-IDF SPA模块与卷积层共同堆叠以构建人脸表情识别网络。实验结果表明,该网络具有较好的人脸表情识别性能,在FER2013和CK+数据集上的分类准确率分别达到73.52%和98.27%。
-
关键词
表情识别
FER2013数据集
ck+数据集
词频-逆文档频率
损失函数
注意力机制
-
Keywords
expression recognition
FER2013 dataset
ck+dataset
term frequency-inverse document frequency
loss function
attention mechanism
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-