-
题名一种基于词频-逆文档频率和混合损失的表情识别算法
被引量:2
- 1
-
-
作者
蓝峥杰
王烈
聂雄
-
机构
广西大学计算机与电子信息学院
广西多媒体通信与网络技术重点实验室
-
出处
《计算机工程》
CAS
CSCD
北大核心
2023年第1期295-302,310,共9页
-
基金
广西科技重大专项(桂科AA21077007)。
-
文摘
面部表情能自然高效地表达人类的心理活动和思想状态,影响着人们的沟通交流过程。在诸多智能化应用中,人脸表情识别是人类与机器间建立情感交互的重要基础。在细粒度人脸表情识别任务中,由于特征提取网络对表情产生区域的关键特征处理不足,从而引发细节特征信息丢失问题。提出一种词频-逆文档频率注意力机制TF-IDF SPA,通过该机制调整表情产生关键区域的注意力分布,强化网络对该区域关键细节特征的提取能力。同时,为了应对表情识别任务中普遍存在的类间差异小、类内差异大的问题,设计一种改进型混合加权损失函数,以增强表情类内聚拢性同时增大类间距离。依据数据集中样本的数量分布情况,动态调整损失函数的分类权重值,从而强化模型对小数据量样本的学习能力。在此基础上,将结构简单的TF-IDF SPA模块与卷积层共同堆叠以构建人脸表情识别网络。实验结果表明,该网络具有较好的人脸表情识别性能,在FER2013和CK+数据集上的分类准确率分别达到73.52%和98.27%。
-
关键词
表情识别
fer2013数据集
CK+数据集
词频-逆文档频率
损失函数
注意力机制
-
Keywords
expression recognition
fer2013 dataset
CK+dataset
term frequency-inverse document frequency
loss function
attention mechanism
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于SWA优化级联网络的表情识别方法
被引量:3
- 2
-
-
作者
张翔
史志才
陈良
-
机构
上海工程技术大学电子电气工程学院
-
出处
《电子科技》
2020年第9期16-20,共5页
-
基金
国家自然科学基金(61802252)。
-
文摘
为了提高表情识别技术的检测精度,文中提出了一种采用随机权重平均SWA优化级联网络的人脸表情识别方法。与单个卷积网络相比,多网络级联能得到更好的检测精度。相对于传统的SGD训练方法,SWA训练方法能增强级联网络中子网络的泛化能力,进一步提高模型的整体性能。通过在Fer2013数据集上测试实验发现,基于SWA方法训练采用加权求和法方式级联的网络模型识别准确率达到74.478%,相对于传统SGD方法训练的单网络模型提高了1.4%以上。另外,与其他典型方法相比,所提改进模型的识别准确率更高。
-
关键词
表情识别
卷积神经网络
随机权重平均
随机梯度下降法
fer2013数据集
网络级联
-
Keywords
expression recognition
convolutional neural network
stochastic weight averaging
stochastic gradient descent
fer2013 dataset
network cascade
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-