基于改进CycleGan模型和区域分割的表情动画合成被引量：4

Expression Animation Synthesis Based on Improved CycleGan Model and Region Segmentation

下载PDF

导出

摘要针对现有人脸表情合成大多依赖于数据源驱动,且存在生成效率低、真实感差的问题,提出一种基于改进CycleGan模型和区域分割的表情动画合成新方法。新方法可实时地合成新表情动画,且具有较好的稳定性和鲁棒性。所提方法在传统CycleGan模型的循环一致损失函数中构造新的协方差约束条件,可有效避免新表情图像生成时出现的色彩异常和模糊不清等现象;提出分区域训练的思想,用Dlib人脸识别数据库对人脸图像进行关键点检测,通过检测到的关键特征点将源域和目标域的人脸分割成左眼、右眼、嘴部和剩余人脸部分共4个区域块,并利用改进的CycleGan模型对每块区域单独进行训练;最后将训练结果加权融合成最终的新表情图像。分区域训练进一步增强了表情合成的真实感。实验数据来自英国萨里大学的语音视觉情感(SAVEE)数据库,在Tensorflow框架下,用python 3.4软件进行实验结果的展示。实验表明,新方法无需数据源驱动,可直接在源人脸动画序列上实时地生成真实、自然的新表情序列,且对于语音视频可保证新面部表情序列与源音频同步。 Aiming at the problems of mostly relying on data source driver,low generation efficiency and poor authenticity of the existing facial expression synthesis methods,this paper proposes a new method for expression animation synthesis based on the improved CycleGan model and region segmentation.This new method can synthesize new expression in real time and has good stability and robustness.The proposed method constructs a new covariance constraint in the cycle consistent loss function of the traditional CycleGan model,which can effectively avoid color anomalies and image blurring in generation of new expression images.The idea of zonal training is put forward.The Dlib face recognition database is used to detect the key points of the face images.The detected key feature points are used to segment the face in domain source and target domain into four zones:left eye,right eye,mouth and the rest of the face.The improved CycleGan model is used to train each region separately,and finally the training results are weighted and fused into the final new expression image.The zonal training further enhances the authenticity of expression synthesis.The experimental data comes from the SAVEE database,and the experimental results are presented with python 3.4 software under the Tensorflow framework.Experiments show that the new method can directly generate real and natu-ral new expression sequences in real time on the original facial expression sequence without data source driver.Furthermore,for the voice video,it can effectively ensure the synchronization between the generated facial expression sequence and the source audio.

作者叶亚男迟静于志平战玉丽张彩明 YE Ya-nan;CHI Jing;YU Zhi-ping;ZHAN Yu-li;ZHANG Cai-ming(School of Computer Science and Technology,Shandong University of Finance and Economics,Jinan 250014,China;Shandong Provincial Key Laboratory of Digital Media Technology,Jinan 250014,China;School of Software,Shandong University,Jinan 250101,China;Future Intelligent Computing Collaborative Innovation Center,Yantai,Shandong 264003,China)

机构地区山东财经大学计算机科学与技术学院山东省数字媒体技术重点实验室山东大学软件学院未来智能计算协同创新中心

出处《计算机科学》 CSCD 北大核心 2020年第9期142-149,共8页 Computer Science

基金山东省省属优青项目(ZR2018JL022) 国家自然科学基金(61772309,61602273) 山东省重点研发计划(2019GSF109112) 山东省教育厅科技计划项目(J18RA272) 山东省高等学校优势学科人才团队培育计划。

关键词表情合成区域分割 CycleGan 协方差约束深度学习 Facial expression synthesis Region segmentation CycleGan Covariance constraint Deep learning

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1吕培,徐明亮,谢蕾,周兵.表情数据库无关的人脸表情转移[J].计算机辅助设计与图形学学报,2016,28(1):68-74. 被引量：4

二级参考文献1

1万贤美,金小刚.真实感3D人脸表情合成技术研究进展[J].计算机辅助设计与图形学学报,2014,26(2):167-178. 被引量：10

共引文献3

1秦添,赵晖.维吾尔语可视语音合成的唇部动画系统[J].计算机工程,2016,42(12):282-289.
2黄炎辉,樊养余,苏旭辉.基于多尺度分析的自动人脸照片移植[J].计算机应用研究,2017,34(11):3510-3513.
3高翔,黄法秀,刘春平,陈虎.3DMM与GAN结合的实时人脸表情迁移方法[J].计算机应用与软件,2020,37(4):119-126. 被引量：1

同被引文献43

1于重重,萨良兵,马先钦,陈秀新,赵霞.基于度量学习的小样本零器件表面缺陷检测[J].仪器仪表学报,2020,41(7):214-223. 被引量：11
2何永强,秦勤,王俊鹏.改进深度学习块卷积神经网络的人脸表情识别[J].计算机工程与设计,2019,40(3):850-855. 被引量：11
3王华,李绅绅,何晓宇,朱付保,姚妮,徐明亮.基于个性化定制的交互式蒙版擦除动画设计与实现[J].图学学报,2019,40(3):473-480. 被引量：5
4谭宇彤,周旭峰,孔令芝,王醒策,武仲科,税午阳,付艳,周明全,Vladimir KORKHOV,Luciano Paschoal GASPARY.面向肌电信号的虚拟现实提线木偶动画研究[J].软件学报,2019,30(10):2964-2985. 被引量：6
5王奇胜,高博青,吴慧.基于引导线偏移的建筑网格生成方法[J].上海交通大学学报,2019,53(9):1040-1044. 被引量：2
6邓辉,王长龙,胡永江,张玉华.脉冲耦合神经网络在图像融合中的应用研究[J].电光与控制,2019,26(11):19-24. 被引量：8
7闫衍芙,吕科,薛健,王聪,甘玮.基于深度学习和表情AU参数的人脸动画方法[J].计算机辅助设计与图形学学报,2019,31(11):1973-1980. 被引量：13
8陈俊周,王娟,龚勋.基于级联生成对抗网络的人脸图像修复[J].电子科技大学学报,2019,48(6):910-917. 被引量：16
9孙晓,丁小龙.基于生成对抗网络的人脸表情数据增强方法[J].计算机工程与应用,2020,56(4):115-121. 被引量：24
10叶继华,祝锦泰,江爱文,李汉曦,左家莉.人脸表情识别综述[J].数据采集与处理,2020,35(1):21-34. 被引量：27

引证文献4

1崔婷婷,于海霞.基于改进深度学习的动画人物面部表情生成方法的研究[J].九江学院学报（自然科学版）,2021,36(4):68-72. 被引量：1
2左毅子.基于Morphing算法的定格场景动画生成方法研究[J].安徽职业技术学院学报,2022,21(4):22-27.
3高海洋,张明川,葛泉波,刘华平.基于点集匹配的缺陷样本图像生成方法[J].智能系统学报,2023,18(5):1030-1038. 被引量：1
4范蕴睿.基于PCNN的角色表情动画去毛刺生成方法[J].常州工学院学报,2024,37(1):27-33.

二级引证文献2

1郭松笛.基于美学风格的当代影视剧人物造型研究[J].戏剧之家,2023(27):175-177. 被引量：1
2张付祥,徐兆洋,李俊慧,黄风山,李文忠.改进CycleGAN的钢材表面缺陷图像生成方法[J].河北科技大学学报,2023,44(6):571-579.

1付可欣.当代古筝演奏技法的传承与发展研究[J].鸭绿江,2020,0(6):82-82.
2单科,王锐浩,田林,王晓丽.基于SAVEE方法的海岛地下水开采适宜性评价[J].海洋技术学报,2020,39(2):78-83. 被引量：2
3依沙·吾阿提别克,阿里甫·库尔班,郝子煜,周雷,吕情深.聋哑学校语文辅助教学系统研究[J].计算机工程与应用,2020,56(11):225-229. 被引量：1
4张婷.视频通信中的图像处理技术探讨[J].信息通信,2020(5):76-77. 被引量：2
5刘晨昱.关于高清视频会议系统技术分析[J].电子测试,2020,31(9):135-136. 被引量：4
6吕诲,童倩倩,袁志勇.基于人脸分割的复杂环境下表情识别实时框架[J].计算机工程与应用,2020,56(12):134-140. 被引量：16
7高文梅,李彬,张武霞,郭冬冬.钯催化咔唑的乙酰氧化合成新方法[J].合成化学,2020,28(7):594-599.
8李佳佳.谈动画与纪实文本的共存现场[J].美术教育研究,2020(16):104-107.
9李进京,吴义班,张召来,李林博,刘玉肖,姬金岭,魏洪福,张杰.N-PMI的合成新方法及中试放大研究[J].山东化工,2020,49(15):27-28.
10黄姗.首创基于GISC原理的高速超分辨荧光纳米成像方法——中国科学院上海高等研究院研究员王中阳[J].科技成果管理与研究,2020(7):12-13.

计算机科学

2020年第9期

浏览历史

内容加载中请稍等...

基于改进CycleGan模型和区域分割的表情动画合成被引量：4

参考文献1

二级参考文献1

共引文献3

同被引文献43

引证文献4

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于改进CycleGan模型和区域分割的表情动画合成 被引量：4

参考文献1

二级参考文献1

共引文献3

同被引文献43

引证文献4

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于改进CycleGan模型和区域分割的表情动画合成被引量：4