期刊文献+
共找到20篇文章
< 1 >
每页显示 20 50 100
Label distribution expression recognition algorithm based on asymptotic truth value
1
作者 HUANG Hao GE Hongwei 《Journal of Measurement Science and Instrumentation》 CAS CSCD 2021年第3期295-303,共9页
Ambiguous expression is a common phenomenon in facial expression recognition(FER).Because of the existence of ambiguous expression,the effect of FER is severely limited.The reason maybe that the single label of the da... Ambiguous expression is a common phenomenon in facial expression recognition(FER).Because of the existence of ambiguous expression,the effect of FER is severely limited.The reason maybe that the single label of the data cannot effectively describe complex emotional intentions which are vital in FER.Label distribution learning contains more information and is a possible way to solve this problem.To apply label distribution learning on FER,a label distribution expression recognition algorithm based on asymptotic truth value is proposed.Under the premise of not incorporating extraneous quantitative information,the original information of database is fully used to complete the generation and utilization of label distribution.Firstly,in training part,single label learning is used to collect the mean value of the overall distribution of data.Then,the true value of data label is approached gradually on the granularity of data batch.Finally,the whole network model is retrained using the generated label distribution data.Experimental results show that this method can improve the accuracy of the network model obviously,and has certain competitiveness compared with the advanced algorithms. 展开更多
关键词 facial expression recognition(fer) label distributed learning label smoothing ambiguous expression
下载PDF
Video expression recognition based on frame-level attention mechanism
2
作者 陈瑞 TONG Ying +1 位作者 ZHANG Yiye XU Bo 《High Technology Letters》 EI CAS 2023年第2期130-139,共10页
Facial expression recognition(FER) in video has attracted the increasing interest and many approaches have been made.The crucial problem of classifying a given video sequence into several basic emotions is how to fuse... Facial expression recognition(FER) in video has attracted the increasing interest and many approaches have been made.The crucial problem of classifying a given video sequence into several basic emotions is how to fuse facial features of individual frames.In this paper, a frame-level attention module is integrated into an improved VGG-based frame work and a lightweight facial expression recognition method is proposed.The proposed network takes a sub video cut from an experimental video sequence as its input and generates a fixed-dimension representation.The VGG-based network with an enhanced branch embeds face images into feature vectors.The frame-level attention module learns weights which are used to adaptively aggregate the feature vectors to form a single discriminative video representation.Finally, a regression module outputs the classification results.The experimental results on CK+and AFEW databases show that the recognition rates of the proposed method can achieve the state-of-the-art performance. 展开更多
关键词 facial expression recognition(fer) video sequence attention mechanism feature extraction enhanced feature VGG network image classification neural network
下载PDF
深度学习下融合不同模型的小样本表情识别 被引量:15
3
作者 林克正 白婧轩 +1 位作者 李昊天 李骜 《计算机科学与探索》 CSCD 北大核心 2020年第3期482-492,共11页
为了进一步提高人脸表情识别在小样本中的准确率,提出了一种深度学习下融合不同模型的小样本表情识别方法。该方法首先对单个卷积神经网络(CNN)模型进行比较,通过dropout层不同的节点保留概率p,筛选相对合适的CNN。之后采用尺度不变特... 为了进一步提高人脸表情识别在小样本中的准确率,提出了一种深度学习下融合不同模型的小样本表情识别方法。该方法首先对单个卷积神经网络(CNN)模型进行比较,通过dropout层不同的节点保留概率p,筛选相对合适的CNN。之后采用尺度不变特征变换(SIFT)算法提取出特征,使用SIFT提取特征的目的是提高小数据的性能。为了减少误差,避免过拟合,将所有模型进行汇总,采用简单平均的模型融合方法得到CNN-SIFT-AVG模型。最后,只采用少量样本数据来训练模型即可。该模型已在FER2013、CK+和JAFFE数据集上进行了验证实验。实验结果表明,该模型可以很大程度上提高小样本表情识别的准确率,并在FER2013、CK+和JAFFE数据集上产生了较优异的结果,与其他表情识别方法相比,准确率最大提升约6%。 展开更多
关键词 人脸表情识别(fer) 深度学习 尺度不变特征变换(SIFT) 模型融合 小样本
下载PDF
基于Gabor参数矩阵与改进Adaboost的人脸表情识别 被引量:10
4
作者 杨凡 张磊 《计算机应用》 CSCD 北大核心 2014年第4期1134-1138,共5页
针对目前人脸表情识别(FER)中Gabor特征维数高、计算量大并且存在特征冗余的问题,提出一种基于Gabor参数矩阵与改进Adaboost的人脸表情识别算法。首先,结合图像像素信息与Gabor小波核的参数定义Gabor参数矩阵;其次,在Adaboost中引入遗... 针对目前人脸表情识别(FER)中Gabor特征维数高、计算量大并且存在特征冗余的问题,提出一种基于Gabor参数矩阵与改进Adaboost的人脸表情识别算法。首先,结合图像像素信息与Gabor小波核的参数定义Gabor参数矩阵;其次,在Adaboost中引入遗传算法(GA)的思想改进其搜索性能,并利用改进的Adaboost选择与Gabor参数矩阵元素对应的最优特征来构建强分类器,从而通过特征选择的方法降低Gabor特征的维数和冗余,减少计算量;最后,在构建多个强分类器的基础上,提出多表情分类算法实现面部表情的分类识别。基于Matlab的实验结果表明,该算法的平均表情识别率为89.67%,且最优特征的选取效率得到明显提高。 展开更多
关键词 人脸表情识别 GABOR特征 GABOR小波 遗传算法 ADABOOST
下载PDF
基于类内分块PCA方法的人脸表情识别 被引量:5
5
作者 龚婷 胡同森 田贤忠 《机电工程》 CAS 2009年第7期74-76,共3页
主成分分析方法(PCA)是目前广泛应用在人脸等图像识别领域的重要手段。为了更准确地识别人脸的表情信息,有效抽取出图像中对表情识别贡献较大的局部特征,提出了一种类内分块PCA方法对人脸表情进行特征提取。首先对图像进行分块,再对分... 主成分分析方法(PCA)是目前广泛应用在人脸等图像识别领域的重要手段。为了更准确地识别人脸的表情信息,有效抽取出图像中对表情识别贡献较大的局部特征,提出了一种类内分块PCA方法对人脸表情进行特征提取。首先对图像进行分块,再对分块得到的所有子图像块利用PCA方法进行鉴别分析,并计算出各类训练样本的子空间,然后计算测试样本到各类子空间的距离,最后输入最近邻分类器得到分类结果。在JAFFE人脸表情库上进行的实验结果表明,使用该方法后获得的识别率优于传统的PCA方法。 展开更多
关键词 主成分分析方法 特征提取 类内分块PCA 人脸表情识别
下载PDF
基于多尺度核特征卷积神经网络的实时人脸表情识别 被引量:18
6
作者 李旻择 李小霞 +1 位作者 王学渊 孙维 《计算机应用》 CSCD 北大核心 2019年第9期2568-2574,共7页
针对人脸表情识别的泛化能力不足、稳定性差以及速度慢难以满足实时性要求的问题,提出了一种基于多尺度核特征卷积神经网络的实时人脸表情识别方法。首先,提出改进的MobileNet结合单发多盒检测器(MSSD)轻量化人脸检测网络,并利用核相关... 针对人脸表情识别的泛化能力不足、稳定性差以及速度慢难以满足实时性要求的问题,提出了一种基于多尺度核特征卷积神经网络的实时人脸表情识别方法。首先,提出改进的MobileNet结合单发多盒检测器(MSSD)轻量化人脸检测网络,并利用核相关滤波(KCF)模型对检测到的人脸坐标信息进行跟踪来提高检测速度和稳定性;然后,使用三种不同尺度卷积核的线性瓶颈层构成三条支路,用通道合并的特征融合方式形成多尺度核卷积单元,利用其多样性特征来提高表情识别的精度;最后,为了提升模型泛化能力和防止过拟合,采用不同的线性变换方式进行数据增强来扩充数据集,并将FER-2013人脸表情数据集上训练得到的模型迁移到小样本CK+数据集上进行再训练。实验结果表明,所提方法在FER-2013数据集上的识别率达到73.0%,较Kaggle表情识别挑战赛冠军提高了1.8%,在CK+数据集上的识别率高达99.5%。对于640×480的视频,人脸检测速度达到每秒158帧,是主流人脸检测网络多任务级联卷积神经网络(MTCNN)的6.3倍,同时人脸检测和表情识别整体速度达到每秒78帧。因此所提方法能够实现快速精确的人脸表情识别。 展开更多
关键词 人脸表情识别 卷积神经网络 人脸检测 核相关滤波 迁移学习
下载PDF
基于混合方法的人脸表情识别研究 被引量:2
7
作者 李斐 陈亚军 《计算机仿真》 CSCD 北大核心 2010年第8期218-221,共4页
针对人脸表情图像识别进行了研究,为了提高表情图像的识别率,提出了一种综合Gabor小波、离散余弦变换、支持向量机的人脸面部表情识别方法。采用ISOMAP算法对人脸面部表情的分类以及强度鉴别。利用Gabor小波变换的局部化特点滤掉人脸表... 针对人脸表情图像识别进行了研究,为了提高表情图像的识别率,提出了一种综合Gabor小波、离散余弦变换、支持向量机的人脸面部表情识别方法。采用ISOMAP算法对人脸面部表情的分类以及强度鉴别。利用Gabor小波变换的局部化特点滤掉人脸表情图像中的高频信息,提出结合离散余弦变换提取系数作为识别特征,并用支持向量机的训练样本构造表情强度模型,进行仿真实验。实验结果表明方法与传统的识别方法相比,系统具有良好的鲁棒性,达到较高的识别率,并能实现了人脸面部表情的分类和强度鉴别。因此充分证明了方法的有效性。 展开更多
关键词 人脸表情识别 离散余弦变换 混合方法
下载PDF
标签引导的生成对抗网络人脸表情识别域适应方法 被引量:6
8
作者 孙冬梅 张飞飞 毛启容 《计算机工程》 CAS CSCD 北大核心 2020年第5期267-273,281,共8页
传统的人脸表情识别方法主要针对实验室环境下的基本表情,难以应对现实场景中人类微妙和复杂的表情变化,并且目前自然环境人脸表情识别数据集普遍缺乏足够的训练数据。针对该问题,利用实验室环境下的数据库样本,提出以标签引导的生成对... 传统的人脸表情识别方法主要针对实验室环境下的基本表情,难以应对现实场景中人类微妙和复杂的表情变化,并且目前自然环境人脸表情识别数据集普遍缺乏足够的训练数据。针对该问题,利用实验室环境下的数据库样本,提出以标签引导的生成对抗网络表情识别域适应方法。将情感标签作为辅助条件,训练生成对抗网络的生成模型,把实验室环境的数据库样本转化为类似自然环境数据库的样本,以扩充自然环境数据库,同时基于扩充的数据库样本训练基本分类器VGG、Resnet等,从而学习自然环境的数据库的情感特征。在RAF_DB等自然环境人脸表情数据库上的实验结果表明,与Boosting-POOF和PixelDA方法相比,该方法扩充得到的数据库可使人脸表情识别率取得6%~9%的提升。 展开更多
关键词 生成对抗网络 情感标签 人脸表情识别 域适应 自然环境 数据库样本
下载PDF
结合差图像和Gabor小波的人脸表情识别 被引量:1
9
作者 丁志起 赵晖 《计算机应用与软件》 CSCD 2011年第4期47-49,共3页
提出一种结合差图像和Gabor小波变换的人脸特征提取方法,并使用支持向量机SVM(Support Vector Machines)进行人脸表情识别。对包含情感信息的静态灰度图像进行预处理,将眼睛和嘴巴等表情子区域从人脸中切割出来,求出其差图像,然后提取... 提出一种结合差图像和Gabor小波变换的人脸特征提取方法,并使用支持向量机SVM(Support Vector Machines)进行人脸表情识别。对包含情感信息的静态灰度图像进行预处理,将眼睛和嘴巴等表情子区域从人脸中切割出来,求出其差图像,然后提取差图像的Gabor特征,使用下采样降维减少特征向量的维数并进行归一化,最后使用SVM进行分类。与只从表情子区域提取Ga-bor特征的识别方法进行了比较,结果显示识别效果更好。 展开更多
关键词 人脸表情识别(fer) 差图像 GABOR小波 支持向量机(SVM)
下载PDF
类别平衡调制的人脸表情识别 被引量:1
10
作者 刘成广 王善敏 刘青山 《计算机科学与探索》 CSCD 北大核心 2023年第12期3029-3038,共10页
人脸表情识别(FER)旨在从人脸图片中判断表情的类别,在心理诊断、人机交互等领域有着广泛的应用前景。在实际任务中,不同表情数据的分布往往是不平衡的。数据的不平衡导致了各表情的特征分布不平衡和分类器优化不平衡,从而影响了表情识... 人脸表情识别(FER)旨在从人脸图片中判断表情的类别,在心理诊断、人机交互等领域有着广泛的应用前景。在实际任务中,不同表情数据的分布往往是不平衡的。数据的不平衡导致了各表情的特征分布不平衡和分类器优化不平衡,从而影响了表情识别模型的性能。为此,提出了一种类别平衡调制的人脸表情识别方法(CBM-Net),分别在特征学习阶段和分类器优化阶段对模型进行类别平衡调制。CBM-Net包括特征调制和梯度调制两个模块。特征调制模块通过在特征方向上增加类间的可分性与类内的紧密性,实现各类别的特征分布平衡。梯度调制模块利用批次训练样本的统计信息对各分类器的优化梯度进行反向调节,确保各类别的分类器收敛速度一致,使得各分类器性能同时达到最优。在四个流行的数据集上进行的定性和定量实验表明,CBM-Net在人脸表情识别的类别平衡调制上是有效的,与一众先进方法相比,效果也相当良好。 展开更多
关键词 人脸表情识别(fer) 类别不平衡 类别平衡调制 特征调制 梯度调制
下载PDF
基于改进轻量级秩扩展网络的人脸表情识别方法 被引量:1
11
作者 郑伟鹏 罗晓曙 蒙志明 《计算机工程》 CAS CSCD 北大核心 2022年第9期189-196,共8页
人脸表情识别作为人机交互的一种重要方法,广泛应用于智能医疗、公安测谎系统、车载安全系统等领域。现有人脸表情识别方法多数存在参数量冗余、计算成本高、特征表达瓶颈等问题。提出一种基于改进轻量级秩扩展网络ReXNet的人脸表情识... 人脸表情识别作为人机交互的一种重要方法,广泛应用于智能医疗、公安测谎系统、车载安全系统等领域。现有人脸表情识别方法多数存在参数量冗余、计算成本高、特征表达瓶颈等问题。提出一种基于改进轻量级秩扩展网络ReXNet的人脸表情识别方法。通过构建改进的ReXNet以提取人脸表情特征,在参数量较少的条件下解决特征表达瓶颈的问题,增强对表情局部特征的关注,获得高层次的表情特征,同时融合坐标注意力模块,将位置信息嵌入到通道注意力中,精准地定位和识别感兴趣的特征,建立位置信息与局部特征之间的长依赖关系,减少计算开销。在此基础上,将细化模块引入到改进的网络架构中,利用类别上下文信息细化分类结果,增强类间的分化效果,从而提高人脸表情识别的准确率。实验结果表明,该方法在RAF-DB和FERPlus数据集上的人脸表情识别准确率分别达到88.43%和88.8%,相比VGG16-PLD、SHCNN、ResNet+VGG等方法,具有较高的准确率和较优的鲁棒性。 展开更多
关键词 人脸表情识别 秩扩展网络 表达瓶颈 坐标注意力机制 细化模块
下载PDF
高斯核方向导数和RILPQ融合的人脸表情识别 被引量:1
12
作者 张鹏鹏 陈英 葛杨铭 《计算机与数字工程》 2017年第10期2013-2017,共5页
针对人脸表情识别中特征提取出纹理信息粗糙、边缘轮廓不清的问题,论文提出了一种基于高斯核方向导数与RILPQ相结合图像特征提取方法。在RILPQ算法中引入高斯核多方向导数形成滤波器,在支持向量机中进行表情分类,将算法应用于JAFFE数据... 针对人脸表情识别中特征提取出纹理信息粗糙、边缘轮廓不清的问题,论文提出了一种基于高斯核方向导数与RILPQ相结合图像特征提取方法。在RILPQ算法中引入高斯核多方向导数形成滤波器,在支持向量机中进行表情分类,将算法应用于JAFFE数据集表情数据集。实验结果为在滤波窗口半径为11像素,论文算法识别率最优,并高于LPQ算法、RLPQ算法识别率。同时也证明,高斯窗窗口半径和滤波方向对算法的表情识别率有影响。 展开更多
关键词 人脸表情识别(fer) 旋转不变局部相位量化(RILPQ) 各向高斯核函数及方向导数 支持向量机(SVM)
下载PDF
基于图卷积多标签学习的复合人脸表情识别 被引量:1
13
作者 武中华 《计算机系统应用》 2022年第1期259-266,共8页
传统的人脸表情识别方法主要针对六类基本人脸表情,但在现实场景下,存在更加丰富的由基本人脸表情组合而成的复合人脸表情,原先识别基本人脸表情的工作难以去识别复合人脸表情,并且复合人脸表情的数据集缺乏足够的训练数据.针对该问题,... 传统的人脸表情识别方法主要针对六类基本人脸表情,但在现实场景下,存在更加丰富的由基本人脸表情组合而成的复合人脸表情,原先识别基本人脸表情的工作难以去识别复合人脸表情,并且复合人脸表情的数据集缺乏足够的训练数据.针对该问题,提出基于图卷积多标签学习的复合人脸表情识别方法.通过特征提取网络提取到人脸表情的全局特征和感兴趣区域的局部特征,使用基本和复合人脸表情之间的先验知识和数据驱动方式,构建出表情类别关系图,利用图卷积网络来学习到表情类别分类器,最后进行复合人脸表情识别.在RAF-DB和Emotio Net数据集上的实验结果表明,与VGG19和ResNet50等方法相比,该方法可以使得复合人脸表情识别率取得约4%~5%的提升. 展开更多
关键词 复合人脸表情识别 图卷积网络 知识图 词向量 多标签学习
下载PDF
结合Gabor特征与Adaboost的人脸表情识别 被引量:48
14
作者 朱健翔 苏光大 李迎春 《光电子.激光》 EI CAS CSCD 北大核心 2006年第8期993-998,共6页
通过提取人脸图像的Gabor特征,结合Adaboost,进行人脸表情识别(FER)。针对Gabor特征维数高、冗余大的特点,引入Adaboost算法进行特征选择降低特征向量的维数。然后再以支持向量机(SVM)和最近邻分类法相结合组成分类器进行分类。该方法... 通过提取人脸图像的Gabor特征,结合Adaboost,进行人脸表情识别(FER)。针对Gabor特征维数高、冗余大的特点,引入Adaboost算法进行特征选择降低特征向量的维数。然后再以支持向量机(SVM)和最近邻分类法相结合组成分类器进行分类。该方法综合运用了Gabor特征对于人脸表情的良好表征能力、Adaboost算法的强大特征选择能力以及SVM在处理少样本、高维数问题中的优势。在JAFFE库上进行测试的结果验证了该法的有效性。从Adaboost所选择的特征集可知,在眼和嘴区域提取的特征,对于FER是最为重要的。 展开更多
关键词 人脸表情识别(fer) GABOR滤波器 ADABOOST 特征选择 支持向量机(SVM)
原文传递
自适应加权完全局部二值模式的表情识别 被引量:19
15
作者 胡敏 许艳侠 +2 位作者 王晓华 黄忠 朱弘 《中国图象图形学报》 CSCD 北大核心 2013年第10期1279-1284,共6页
为了有效地提取局部特征和全局特征以提高表情识别的性能,提出自适应加权完全局部二值模式(AWCLBP)的人脸表情识别算法。首先对人脸表情图像进行预处理分离出表情子区域,与此同时生成表情子区域的贡献度图谱(CM);然后对表情子区域和整... 为了有效地提取局部特征和全局特征以提高表情识别的性能,提出自适应加权完全局部二值模式(AWCLBP)的人脸表情识别算法。首先对人脸表情图像进行预处理分离出表情子区域,与此同时生成表情子区域的贡献度图谱(CM);然后对表情子区域和整幅表情图像进行完全局部二值模式变换提取3种特征(差值符号特征CLBP_S、差值幅值特征CLBP_M、中心像素特征CLBP_C)并连接3种特征生成级联直方图,并根据CM对表情子区域的级联直方图进行加权与整张图像的直方图进行融合;最后用卡方距离和最近邻方法进行分类识别。该算法在JAFFE库上进行了实验并和LBP、Gabor小波、活动外观模型进行了比较,验证了该算法的有效性。 展开更多
关键词 表情识别 完全局部二值模式 自适应加权 卡方距离 最近邻方法
原文传递
深度人脸表情识别研究进展 被引量:30
16
作者 李珊 邓伟洪 《中国图象图形学报》 CSCD 北大核心 2020年第11期2306-2320,共15页
随着人脸表情识别任务逐渐从实验室受控环境转移至具有挑战性的真实世界环境,在深度学习技术的迅猛发展下,深度神经网络能够学习出具有判别能力的特征,逐渐应用于自动人脸表情识别任务。目前的深度人脸表情识别系统致力于解决以下两个问... 随着人脸表情识别任务逐渐从实验室受控环境转移至具有挑战性的真实世界环境,在深度学习技术的迅猛发展下,深度神经网络能够学习出具有判别能力的特征,逐渐应用于自动人脸表情识别任务。目前的深度人脸表情识别系统致力于解决以下两个问题:1)由于缺乏足量训练数据导致的过拟合问题;2)真实世界环境下其他与表情无关因素变量(例如光照、头部姿态和身份特征)带来的干扰问题。本文首先对近十年深度人脸表情识别方法的研究现状以及相关人脸表情数据库的发展进行概括。然后,将目前基于深度学习的人脸表情识别方法分为两类:静态人脸表情识别和动态人脸表情识别,并对这两类方法分别进行介绍和综述。针对目前领域内先进的深度表情识别算法,对其在常见表情数据库上的性能进行了对比并详细分析了各类算法的优缺点。最后本文对该领域的未来研究方向和机遇挑战进行了总结和展望:考虑到表情本质上是面部肌肉运动的动态活动,基于动态序列的深度表情识别网络往往能够取得比静态表情识别网络更好的识别效果。此外,结合其他表情模型如面部动作单元模型以及其他多媒体模态,如音频模态和人体生理信息能够将表情识别拓展到更具有实际应用价值的场景。 展开更多
关键词 人脸表情识别(fer) 真实世界 深度学习 综述
原文传递
关键点深度特征驱动人脸表情识别 被引量:10
17
作者 王善敏 帅惠 刘青山 《中国图象图形学报》 CSCD 北大核心 2020年第4期813-823,共11页
目的人脸关键点检测和人脸表情识别两个任务紧密相关。已有对两者结合的工作均是两个任务的直接耦合,忽略了其内在联系。针对这一问题,提出了一个多任务的深度框架,借助关键点特征识别人脸表情。方法参考inception结构设计了一个深度网... 目的人脸关键点检测和人脸表情识别两个任务紧密相关。已有对两者结合的工作均是两个任务的直接耦合,忽略了其内在联系。针对这一问题,提出了一个多任务的深度框架,借助关键点特征识别人脸表情。方法参考inception结构设计了一个深度网络,同时检测关键点并且识别人脸表情,网络在两个任务的监督下,更加关注关键点附近的信息,使得五官周围的特征获得较大响应值。为进一步减小人脸其他区域的噪声对表情识别的影响,利用检测到的关键点生成一张位置注意图,进一步增加五官周围特征的权重,减小人脸边缘区域的特征响应值。复杂表情引起人脸部分区域的形变,增加了关键点检测的难度,为缓解这一问题,引入了中间监督层,在第1级检测关键点的网络中增加较小权重的表情识别任务,一方面,提高复杂表情样本的关键点检测结果,另一方面,使得网络提取更多表情相关的特征。结果在3个公开数据集:CK+(Cohn-Kanade dataset),Oulu(Oulu-CASIA NIR&VIS facial expression database)和MMI(MMI facial expression database)上与经典方法进行比较,本文方法在CK+数据集上的识别准确率取得了最高值,在Oulu和MMI数据集上的识别准确率比目前识别率最高的方法分别提升了0.14%和0.54%。结论实验结果表明了引入关键点信息的有效性:多任务的卷积神经网络表情识别准确率高于单任务的传统卷积神经网络。同时,引入注意力模型也提升了多任务网络中表情的识别率。 展开更多
关键词 人脸表情识别 关键点检测 多任务 注意力模型 中间监督
原文传递
融合时空域特征的人脸表情识别 被引量:5
18
作者 陈拓 邢帅 +1 位作者 杨文武 金剑秋 《中国图象图形学报》 CSCD 北大核心 2022年第7期2185-2198,共14页
目的人脸表情识别是计算机视觉的核心问题之一。一方面,表情的产生对应着面部肌肉的一个连续动态变化过程,另一方面,该运动过程中的表情峰值帧通常包含了能够识别该表情的完整信息。大部分已有的人脸表情识别算法要么基于表情视频序列,... 目的人脸表情识别是计算机视觉的核心问题之一。一方面,表情的产生对应着面部肌肉的一个连续动态变化过程,另一方面,该运动过程中的表情峰值帧通常包含了能够识别该表情的完整信息。大部分已有的人脸表情识别算法要么基于表情视频序列,要么基于单幅表情峰值图像。为此,提出了一种融合时域和空域特征的深度神经网络来分析和理解视频序列中的表情信息,以提升表情识别的性能。方法该网络包含两个特征提取模块,分别用于学习单幅表情峰值图像中的表情静态“空域特征”和视频序列中的表情动态“时域特征”。首先,提出了一种基于三元组的深度度量融合技术,通过在三元组损失函数中采用不同的阈值,从单幅表情峰值图像中学习得到多个不同的表情特征表示,并将它们组合在一起形成一个鲁棒的且更具辩识能力的表情“空域特征”;其次,为了有效利用人脸关键组件的先验知识,准确提取人脸表情在时域上的运动特征,提出了基于人脸关键点轨迹的卷积神经网络,通过分析视频序列中的面部关键点轨迹,学习得到表情的动态“时域特征”;最后,提出了一种微调融合策略,取得了最优的时域特征和空域特征融合效果。结果该方法在3个基于视频序列的常用人脸表情数据集CK+(the extended Cohn-Kanade dataset)、MMI(the MMI facial expression database)和Oulu-CASIA(the Oulu-CASIA NIR&VIS facial expression database)上的识别准确率分别为98.46%、82.96%和87.12%,接近或超越了当前同类方法中的表情识别最高性能。结论提出的融合时空特征的人脸表情识别网络鲁棒地分析和理解了视频序列中的面部表情空域和时域信息,有效提升了人脸表情的识别性能。 展开更多
关键词 人脸表情识别(fer) 深度学习 深度度量学习 三元组损失 特征融合
原文传递
面部表情分析进展和挑战 被引量:13
19
作者 彭小江 乔宇 《中国图象图形学报》 CSCD 北大核心 2020年第11期2337-2348,共12页
面部表情分析是计算机通过分析人脸信息尝试理解人类情感的一种技术,目前已成为计算机视觉领域的热点话题。其挑战在于数据标注困难、多人标签一致性差、自然环境下人脸姿态大以及遮挡等。为了推动面部表情分析发展,本文概述了面部表情... 面部表情分析是计算机通过分析人脸信息尝试理解人类情感的一种技术,目前已成为计算机视觉领域的热点话题。其挑战在于数据标注困难、多人标签一致性差、自然环境下人脸姿态大以及遮挡等。为了推动面部表情分析发展,本文概述了面部表情分析的相关任务、进展、挑战和未来趋势。首先,简述了面部表情分析的几个常见任务、基本算法框架和数据库;其次,对人脸表情识别方法进行了综述,包括传统的特征设计方法以及深度学习方法;接着,对人脸表情识别存在的问题与挑战进行总结思考;最后,讨论了未来发展趋势。通过全面综述和讨论,总结以下观点:1)针对可靠人脸表情数据库规模小的问题,从人脸识别模型进行迁移学习以及利用无标签数据进行半监督学习是两个重要策略;2)受模糊表情、低质量图像以及标注者的主观性影响,非受控自然场景的人脸表情数据的标签库存在一定的不确定性,抑制这些因素可以使得深度网络学习真正的表情特征;3)针对人脸遮挡和大姿态问题,利用局部块进行融合的策略是一个有效的策略,另一个值得考虑的策略是先在大规模人脸识别数据库中学习一个对遮挡和姿态鲁棒的模型,再进行人脸表情识别迁移学习;4)由于基于深度学习的表情识别方法受很多超参数影响,导致当前人脸表情识别方法的可比性不强,不同的表情识别方法有必要在不同的简单基线方法上进行评测。目前,虽然非受控自然环境下的表情分析得到较快发展,但是上述问题和挑战仍然有待解决。人脸表情分析是一个比较实用的任务,未来发展除了要讨论方法的精度也要关注方法的耗时以及存储消耗,也可以考虑用非受控环境下高精度的人脸运动单元检测结果进行表情类别推断。 展开更多
关键词 面部表情分析 人脸表情识别(fer) 卷积神经网络(CNN) 深度学习 迁移学习
原文传递
持续学习改进的人脸表情识别 被引量:3
20
作者 江静 邓伟洪 《中国图象图形学报》 CSCD 北大核心 2020年第11期2361-2369,共9页
目的大量标注数据和深度学习方法极大地提升了图像识别性能。然而,表情识别的标注数据缺乏,训练出的深度模型极易过拟合,研究表明使用人脸识别的预训练网络可以缓解这一问题。但是预训练的人脸网络可能会保留大量身份信息,不利于表情识... 目的大量标注数据和深度学习方法极大地提升了图像识别性能。然而,表情识别的标注数据缺乏,训练出的深度模型极易过拟合,研究表明使用人脸识别的预训练网络可以缓解这一问题。但是预训练的人脸网络可能会保留大量身份信息,不利于表情识别。本文探究如何有效利用人脸识别的预训练网络来提升表情识别的性能。方法本文引入持续学习的思想,利用人脸识别和表情识别之间的联系来指导表情识别。方法指出网络中对人脸识别整体损失函数的下降贡献最大的参数与捕获人脸公共特征相关,对表情识别来说为重要参数,能够帮助感知面部特征。该方法由两个阶段组成:首先训练一个人脸识别网络,同时计算并记录网络中每个参数的重要性;然后利用预训练的模型进行表情识别的训练,同时通过限制重要参数的变化来保留模型对于面部特征的强大感知能力,另外非重要参数能够以较大的幅度变化,从而学习更多表情特有的信息。这种方法称之为参数重要性正则。结果该方法在RAF-DB(real-world affective faces database),CK+(the extended Cohn-Kanade database)和Oulu-CASIA这3个数据集上进行了实验评估。在主流数据集RAF-DB上,该方法达到了88.04%的精度,相比于直接用预训练网络微调的方法提升了1.83%。其他数据集的实验结果也表明了该方法的有效性。结论提出的参数重要性正则,通过利用人脸识别和表情识别之间的联系,充分发挥人脸识别预训练模型的作用,使得表情识别模型更加鲁棒。 展开更多
关键词 深度学习 表情识别(fer) 人脸识别(FR) 预训练网络 持续学习 参数重要性正则
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部