基于音频驱动的遮挡下人脸表情重建技术

Technology of Audio-Driven Masked Facial Expression Reconstruction

下载PDF

导出

摘要网络舆情对政治生活秩序和社会稳定的影响与日俱增,还原网络视频中刻意遮挡的人脸,有助于网络舆情管控以及掌握网络舆情攻防战的主动权。结合生成对抗网络,提出了一种基于音频驱动的遮挡下人脸表情重建方法。首先,通过音频解耦器实现音频内容与情绪分离;然后,基于双阶段遮挡下人眼关键点检测网络对头部姿态进行估计,得到头部3维姿态编码;最后,基于生成对抗网络,对生成人脸的说话口型、面部表情和头部姿态进行综合控制,实现对说话人脸的生动还原。试验结果表明,该方法可准确有效地还原人脸表情和头部姿态。 The influence of online public opinion on political life order and social stability is increasing day by day. Restoring the faces deliberately blocked in online videos is helpful to control online public opinion and seize the initiative in the battle against online public opinion. Combined with generative adversarial network, a method of audio-driven masked facial expression reconstruction is proposed. Firstly, the audio content and emotion are separated through audio decoupling device. Then, based on the two-stage masked human eye key-points detection network, the head pose is estimated to obtain the 3D head pose code. Finally, based on the generative adversarial network, the mouth shape, facial expression and head posture of the generated face are comprehensively controlled to achieve a vivid restoration of the speaker′s face. The experimental result shows that the method can effectively restore facial expressions and head poses.

作者王航宇李晓冬李新德 WANG Hangyu;LI Xiaodong;LI Xinde(School of Cyber Science and Engineering,Southeast University,Nanjing 211189,China;Science and Technology on Information Systems Engineering Laboratory,Nanjing 210023,China;School of Automation,Southeast University,Nanjing 210096,China)

机构地区东南大学网络空间安全学院信息系统工程重点实验室东南大学自动化学院

出处《指挥信息系统与技术》 2022年第6期89-94,共6页 Command Information System and Technology

基金信息系统工程重点实验室开放基金(05202003)资助项目。

关键词网络舆情人脸生成深度学习生成对抗网络 network public opinion human face generating deep learning generative adversarial network(GAN)

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1水浩.社交媒体时代网络舆情引导策略研究[J].网络安全技术与应用,2022(4):161-162. 被引量：2
2孙毅,王志浩,邓佳,李犇,杨彬,唐胜.人脸深度伪造检测综述[J].信息安全研究,2022,8(3):241-257. 被引量：5
3郑方,张国亮,宋战江.Comparison of Different Implementations of MFCC[J].Journal of Computer Science & Technology,2001,16(6):582-589. 被引量：19
4周文柏,张卫明,俞能海,赵汉卿,刘泓谷,韦天一.人脸视频深度伪造与防御技术综述[J].信号处理,2021,37(12):2338-2355. 被引量：13

二级参考文献12

1刘正荣.从非理性网络舆论看网民群体心理[J].现代传播（中国传媒大学学报）,2007,29(3):167-168. 被引量：72
2Chen X X，Int Conference on Spoken Language Processing（ICSLP'2000），2000年
3Li A J，Int Conference on Spoken Language Processing（ICSLP'2000），2000年
4Zheng F，Int Symposium on Chinese Spoken Language Processing（ISCSLP'98），1998年，ASRA349页
5Huang X D，Automatic Speech and Speaker Recognition:Advanced Topics，1996年，481页
6Zheng F，学位论文，1992年
7吴绍忠,李淑华.互联网络舆情预警机制研究[J].中国人民公安大学学报（自然科学版）,2008,14(3):38-42. 被引量：176
8丁柏铨.论网络舆情[J].新闻记者,2010(3):4-8. 被引量：39
9周静.论新媒体诚信的制度逻辑[J].广西社会科学,2018,0(9):185-189. 被引量：1
10白国柱,王蓓蓓.Deepfake技术监管政策现状和面临的挑战及建议[J].信息安全研究,2020,6(5):454-457. 被引量：4

共引文献35

1尚海涛.“深度伪造”法律规制的新范式与新体系[J].河北法学,2023,41(1):23-42. 被引量：16
2胡峰,马春侠,崔毅安,史广顺.基于分布式干涉光纤传感网络的通信线路防护系统[J].南京理工大学学报,2014,38(6):757-762. 被引量：4
3宋青松,田正鑫,孙文磊,吴小杰,安毅生.用于孤立数字语音识别的一种组合降维方法[J].西安交通大学学报,2016,50(6):42-46. 被引量：9
4罗贵舟,熊晓东.基于LD3320的智能LED照明系统研究[J].电子世界,2017,0(2):182-183. 被引量：4
5赵鑫,陈晓冬,常昕,齐麟,汪毅,郁道银.基于Multi-Fisher准则的语音混合特征提取和特征增强方法[J].纳米技术与精密工程,2017,15(4):317-322. 被引量：3
6徐保民,李文婧.一种自适应的异常声音端点检测方法[J].软件导刊,2017,16(8):1-4. 被引量：3
7徐宏伟,严迪群,阳帆,王让定,金超,向立.基于卷积神经网络的电子变调语音检测算法[J].电信科学,2018,34(2):46-57. 被引量：4
8李应,印佳丽.基于多随机森林的低信噪比声音事件检测[J].电子学报,2018,46(11):2705-2713. 被引量：5
9杨正哲,任玉玲,杜省,柳瑞波.分区域方言客服语音识别系统研究[J].网络新媒体技术,2019,8(1):37-42. 被引量：3
10林艺明,李应.利用能量压缩后的MBPD检测低信噪比声音事件[J].计算机应用与软件,2021,38(6):126-133.

1宋雪静.高中班主任班级管理工作的现状及对策[J].前卫,2020(19):148-150.
2习近平同俄罗斯总统普京通电话[J].伙伴（俄文版）,2020(3):8-9.
3李剑森,陈旭光,邓爱萍,杨芬,杨宇威,郝爱华.广东省新冠肺炎疫情早期防控政策文本量化分析[J].中国公共卫生管理,2022,38(4):449-454. 被引量：2
4石青.自媒体时代下网红正能量传播的路径探析[J].广告大观,2022(23):0154-0156.
5陈宁.基于深度学习的图像超分辨率重建技术分析[J].造纸装备及材料,2022,51(11):139-141. 被引量：1
6佟立金.新年寄语[J].砖瓦,2023(1):5-5.
7邢玲,何双美.让人大代表的声音更响亮[J].人民之友,2022(12):34-35.
8熊成.高温对蜜蜂的影响及蜂群管理措施[J].蜜蜂杂志,2023,43(1):15-17. 被引量：2
9孙明娟,刘四斌,胡玖益.80 kV结合前后置全模型实时迭代重建技术在腹部CT增强检查中的运用[J].重庆医科大学学报,2022,47(10):1236-1241. 被引量：3
10宋學立.金元全真教傳戒論略[J].全真道研究,2021(1):37-52.

指挥信息系统与技术

2022年第6期

浏览历史

内容加载中请稍等...

基于音频驱动的遮挡下人脸表情重建技术

参考文献4

二级参考文献12

共引文献35

相关作者

相关机构

相关主题

浏览历史