基于多视觉描述子及音频特征的动态序列人脸表情识别被引量：10

Dynamic Facial Expression Recognition Based on Multi-Visual and Audio Descriptors

下载PDF

导出

摘要关于面部表情识别的应用也正在渗透至各个领域,如安全驾驶、商品销售、临床医学等等.本文对面部表情识别相关技术进行研究,主要工作及贡献如下:研究非约束条件下人脸动态表情识别,提出了一种基于多视觉描述子及音频特征融合策略的动态表情识别算法.借助多视觉描述子的空时局部特征描述实现动态表情特征的提取;而视频、音频特征的融合策略改善了表情识别性能.基于协方差矩阵及时间轴分段的动态规整,有效地解决了具有不同时长的动态表情序列的样本描述.为进一步改善表情识别模型的泛化性能,本文引入了基于多个体识别模型加权投票的集成识别模型.针对投票过程中的权值学习,提出了基于随机重采样的投票权重学习以及基于个体分类模型相对优势的投票权重学习方法.集成决策进一步改善了表情识别性能.基于AFEW5.0的动态表情库实验验证了算法的有效性. Communication in any form either verbal or non-verbal is vital to complete various daily routine tasks and plays a significant role in life.Facial expression is the most effective form of non-verbal communication and it provides a clue about emotional state,mindset and intention.Till now,facial expression recognition has been successfully applied to various fields such as safe driving,merchandise sales,clinical medicine,and so on.This thesis explores key techniques related to facial expression recognition.The main work and contributions are as follows.A dynamic facial expression recognition algorithm based on multi-visual descriptors and audio features is proposed under unrestricted conditions,in which dynamic facial feature extraction was conducted based on local spatial-temporal feature representation via multi-visual descriptors.Furthermore,the combination of video and audio features improves the recognition performance.Dynamic time warping based on timeline segmentation and covariance matrix proves to be effective in analyzing dynamic expression sequences of different time duration.To improve the generalization performance of facial expression recognition model,an integrated decision-making strategy based on weight voting by multiple individual recognition models is introduced.In order to effectively learning the weight for each individual recognition model,the method of voting weight learning by random re-sampling and the method of voting learning based on comparative advantages of individual recognition model are proposed.Finally the above ensemble model is applied and the recognition performance is further improved.Experiments on AFEW5.0 dataset validate the performance of the proposed dynamic facial expression algorithm.

作者李宏菲李庆周莉 LI Hong-fei;LI Qing;ZHOU Li(Institute of Microelectronics,Chinese Academy of Sciences,Beijing 100029,China;University of Chinese Academy of Sciences,Beijing 100049,China)

机构地区中国科学院微电子研究所中国科学院大学

出处《电子学报》 EI CAS CSCD 北大核心 2019年第8期1643-1653,共11页 Acta Electronica Sinica

基金国家自然科学基金(No.U1832217) 面向智能驾驶的新能源汽车电子开放平台建设与产业化(No.KFJ-STS-ZDTP-045)

关键词动态表情识别多视觉描述子集成分类器权重学习 active expression recognition multi-visual descriptors ensemble model weight learning

分类号 TP391.41 [自动化与计算机技术—计算机应用技术] TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献6

1吴奇,申寻兵,傅小兰.微表情研究及其应用[J].心理科学进展,2010,18(9):1359-1368. 被引量：102
2吴冉,任衍具.微表情的启动效应研究[J].应用心理学,2011,17(3):241-248. 被引量：10
3梁静,颜文靖,吴奇,申寻兵,王甦菁,傅小兰.微表情研究的进展与展望[J].中国科学基金,2013,27(2):75-78. 被引量：40
4胡振兴.一种基于PCA类内平均脸法和支持向量机模型的人脸识别算法[J].软件导刊,2012,11(6):33-34. 被引量：2
5刘志华,李改燕,刘晓爽.基于最小二乘法的蒙特卡洛移动节点定位算法[J].传感技术学报,2012,25(4):541-544. 被引量：20
6贲晛烨,杨明强,张鹏,李娟.微表情自动识别综述[J].计算机辅助设计与图形学学报,2014,26(9):1385-1395. 被引量：45

二级参考文献100

1何国辉,甘俊英.PCA类内平均脸法在人脸识别中的应用研究[J].计算机应用研究,2006,23(3):165-166. 被引量：29
2Cohn, J. F., Kruez, T. S., Matthews, I., Yang Y., Nguyen, M. H., Padilla M. T Torre, De la. F. (2009). Detecting depression from facial actions and vocal prosody. In: Proceedings of International Conference. Affective Computing and Intelligent Interaction. Retrieved December 28, 2009, from http://www.andrew.cmu.edu/ usor/minhhoan/papers/acii-paper_final.pdf.
3Darwin, C. (1998). The Expression of the Emotions in Man and Animals, 3rd edit. Introduction, afterwords, and commentaries by Paul Ekman. London, UK: HarperCollins New York, US: Oxford University Press.
4Depaulo, B. M., & Bond, C. F. (2006). Accuracy of deception judgments. Personality and Social P~ychology Review, 10, 214-234.
5Ekman, P. (1992). Facial expressions of emotion: An old controversy and new findings. Philosophical Transactions of the Royal Society of London, Series B: Biological Science, B355, 63-69.
6Ekman, P. (2002). MicroExpression Training Tool (METT). Retrieved April 15, 2009, from http://www.paulekman. com.
7Ekman, P. (2003). Darwin, deception, and facial expression. Annals of the New York Academy of Sciences, 1000 (Emotions Inside Out: 130 Years after Darwin's The Expression of the Emotions in Man and Animals): 205-221.
8Ekman, P. (2009). Lie catching and microexpressions. In C. Martin (Ed.): The Philosophy of Deception (pp. 118-133). Oxford: Oxford University Press.
9Ekman, P., & Friesen, W. V. (1969). Nonverbal leakage and clues to deception. Psychiatry, 32, 88-97.
10Ekman, E, & W. Fricsen.(1974). Nonverbal behavior and psychopathology. In R. J. Friedman & M. M. Katz (Eds.): The Psychology of Depression: Contemporary Theory and Research (pp. 203-224). Washington D. C.: Winston &Sons.

共引文献175

1刘洋,吴佩,万芷涵,石佳玉,朱立芳.用户微表情信息表征研究综述[J].知识管理论坛,2023(3):215-227. 被引量：2
2Bottom Up与Top Down[J].管理学家（学术版）,2013(12):34-34.
3时畅.从“微表情”看访谈节目中的人际传播[J].电影评介,2011(18):71-72.
4姚沂婕,安宏玉.网络表情符号分析[J].校园心理,2011,9(5):336-337. 被引量：13
5齐尚晓.简论“微表情”在高校思想政治工作中的效用[J].天水师范学院学报,2011,31(4):131-134. 被引量：2
6吴冉,任衍具.微表情的启动效应研究[J].应用心理学,2011,17(3):241-248. 被引量：10
7任建华.可燃气体检测报警器检定探讨[J].计量与测试技术,2000,27(3):35-36. 被引量：2
8赵海艳.非言语交际中体态语在美剧《不要对我说谎》中的体现形式[J].前沿,2012(10):137-138. 被引量：1
9叶晓菡,陈岭,姜贤塔,陈根才.基于生理信号的观众情感状态识别模型[J].浙江大学学报（工学版）,2012,46(6):995-1003. 被引量：1
10凤四海.欺骗识别及其在公共安全领域的应用[J].社会科学研究,2012(5):134-137. 被引量：1

同被引文献91

1丁名都,李琳.基于CNN和HOG双路特征融合的人脸表情识别[J].信息与控制,2020,49(1):47-54. 被引量：17
2张会云.语音情感识别研究综述[J].信息通信,2019,0(11):58-60. 被引量：2
3周正.城市视频监控应用系统中监控中心的设计与分析[J].电子世界,2020,0(5):150-151. 被引量：4
4杜艳明,刘齐跃.基于多姿态脸和小波变换的动态人脸识别[J].计算机应用,2007,27(B12):83-84. 被引量：2
5李代立,陈榕.WebSocket在Web实时通信领域的研究[J].电脑知识与技术,2010,6(10):7923-7925. 被引量：62
6屠彬彬,于凤芹.基于样本熵与MFCC融合的语音情感识别[J].计算机工程,2012,38(7):142-144. 被引量：7
7李勇帆,李里程.情感计算在网络远程教育系统中的应用：功能、研究现状及关键问题[J].现代远程教育研究,2013,25(2):100-106. 被引量：33
8张石清,李乐民,赵知劲.人机交互中的语音情感识别研究进展[J].电路与系统学报,2013,18(2):440-451. 被引量：30
9薛陇彬,刘钊远.基于WebSocket的网络实时通信[J].计算机与数字工程,2014,42(3):478-481. 被引量：31
10林记明.体态语言的功能及其应用[J].西安外国语学院学报,2001,9(4):47-51. 被引量：35

引证文献10

1陈斌,朱晋宁,东一舟.基于残差整流增强卷积神经网络的表情识别[J].液晶与显示,2020,35(12):1299-1308. 被引量：8
2耿涛.基于位移特征与个性化学习的动态序列人脸表情识别方法[J].兰州文理学院学报（自然科学版）,2021,35(6):51-55. 被引量：2
3杜杏菁,孙炳刚.涉险岗位人员异常情绪识别与应急预警研究[J].华北科技学院学报,2021,18(5):74-79.
4任瑞.基于音频特征的音乐音符智能切分识别方法[J].信息技术,2021,45(12):31-36. 被引量：3
5龙英潮,丁美荣,林桂锦,刘鸿业,曾碧卿.基于视听觉感知系统的多模态情感识别[J].计算机系统应用,2021,30(12):218-225. 被引量：3
6CHEN Beijing,TAN Weijin,WANG Yiting,ZHAO Guoying.Distinguishing Between Natural and GAN-Generated Face Images by Combining Global and Local Features[J].Chinese Journal of Electronics,2022,31(1):59-67. 被引量：2
7韩笑,韩剑.基于融合分层视觉感知的人脸局部特征识别[J].计算机仿真,2022,39(7):184-188.
8张海荣,王正玉,齐梅,刘则芬.基于WebSocket的动态人脸识别系统构建[J].安徽开放大学学报,2022(3):87-91.
9周程宁,王青山,王琦,沈德伟.WiDriver:一种基于WiFi的驾驶员情绪波动识别框架[J].小型微型计算机系统,2022,43(10):2137-2142. 被引量：1
10师硕,覃嘉俊,于洋,郝小可.基于改进ConvMixer和动态焦点损失的视听情感识别[J].电子学报,2024,52(8):2824-2835.

二级引证文献19

1奚琰.基于对比学习的细粒度遮挡人脸表情识别[J].计算机系统应用,2022,31(11):175-183. 被引量：4
2陈清江,胡倩楠,李金阳.多尺度交替连接残差网络用于图像去模糊[J].光学精密工程,2021,29(7):1686-1694. 被引量：9
3易三莉,王天伟,杨雪莲,佘芙蓉.ARS-CNN算法在新冠肺炎识别中的研究[J].液晶与显示,2021,36(11):1565-1572. 被引量：4
4吴家辉,周涛,罗明新,肉扎吉·依马穆.基于C3D CNN的人脸表情识别系统设计与开发[J].信息与电脑,2022,34(14):104-107.
5曹馨予.基于虚拟现实的三角钢琴键盘模拟系统设计[J].自动化与仪器仪表,2022(11):151-155. 被引量：1
6陈斌,朱晋宁.双流增强融合网络微表情识别[J].智能系统学报,2023,18(2):360-371. 被引量：3
7陈北京,王鹏,喻乐延,舒华忠.注意力融合双流特征的局部GAN生成人脸检测算法[J].东南大学学报（自然科学版）,2023,53(3):543-551. 被引量：4
8陈万泽,黄丽清,陈家祯,叶锋,黄添强,罗海峰.融合小波快捷连接生成对抗网络的面部性别伪造[J].网络与信息安全学报,2023,9(3):150-160.
9陈斌,樊飞燕,张睿.年龄算子深度稀疏融合扩展表情识别[J].南京师范大学学报（工程技术版）,2023,23(3):43-52.
10杨雪珂,蒙金超,冯悦恒,林婷婷,王兆君,刘辉.基于残差卷积神经网络模型的勺嘴鹬动作识别[J].热带生物学报,2023,14(5):481-489.

1朱林林,王国中,滕国伟,杨郑龙.基于图像增强处理的CDVS匹配算法[J].电子测量技术,2019,42(4):123-128. 被引量：6
2谢冰,段哲民.基于SAE与底层视觉特征融合的无人机目标识别算法(英文)[J].红外与激光工程,2018,47(S1):205-213. 被引量：1
3张鲁楠.大国品牌开始向世界发声[J].浙商,2019,0(15):41-45.
4姜明星,胡敏,王晓华,任福继,王浩文.视频序列中表情和姿态的双模态情感识别[J].激光与光电子学进展,2018,55(7):161-168. 被引量：11
5何景琳,梁正友,孙宇.基于三维卷积神经网络与支持向量机的微表情自动识别[J].现代计算机,2019,25(13):43-48. 被引量：3
6董晓晨,赵志刚,吕慧显,刘成士.基于改进的局部二值模式的微表情识别方法[J].青岛大学学报（自然科学版）,2018,31(3):32-36. 被引量：2
7鲍晓宇.叙事性动态表情包的建构[J].艺海,2019,0(8):91-94.
8徐高扬,郑海涛,黄国庆,吴凤波.基于门控单元循环神经网络的台风路径预测[J].计算机应用与软件,2019,36(5):119-125. 被引量：1
9刘书朋,陈志强,陈娜,陈振宜,李太豪.一组基于Tensorflow的CNN-RNN的融合架构实验[J].工业控制计算机,2019,32(8):66-68. 被引量：2
10刘振,王甦菁,李擎.基于多任务中级特征个性化学习的微表情识别[J].计算机工程与应用,2019,55(18):151-154. 被引量：4

电子学报

2019年第8期

浏览历史

内容加载中请稍等...

基于多视觉描述子及音频特征的动态序列人脸表情识别被引量：10

参考文献6

二级参考文献100

共引文献175

同被引文献91

引证文献10

二级引证文献19

相关作者

相关机构

相关主题

浏览历史

基于多视觉描述子及音频特征的动态序列人脸表情识别 被引量：10

参考文献6

二级参考文献100

共引文献175

同被引文献91

引证文献10

二级引证文献19

相关作者

相关机构

相关主题

浏览历史

基于多视觉描述子及音频特征的动态序列人脸表情识别被引量：10