基于辅助学习的改进端到端合成语音检测方法

Improved End-to-end Synthetic Speech Detection Method Based on Auxiliary Learning

下载PDF

导出

摘要随着深度伪造技术的发展,合成语音检测面临越来越多的挑战。本文提出一种将辅助学习融入端到端模型的合成语音检测方法。将音频数据进行数据对齐后在不加提取任何手工特征的情况下直接输入到改进端到端模型,主任务进行真实语音与合成语音的二分类,同时选用不同合成语音类型判别作为辅助任务,为主任务的合成语音检测提供先验假设,并且对主辅任务的权重叠加进行了优化。通过在公开数据集ASVspoof2019及ASVspoof2015上进行的实验结果表明,本文改进的模型与使用手工特征的模型相比能有效降低等错率,且优于改进前的端到端模型,并且在面对未知攻击类型时拥有更好的泛化能力。 With the development of deep forgery technology,synthetic speech detection faces more and more challenges,a syn⁃thetic speech detection method is proposed,which integrates auxiliary learning into end-to-end model.After data alignment,the audio data is directly input to the improved end-to-end model without extracting any manual features.The main task is to classify real speech and synthetic speech.At the same time,different synthetic speech types are selected as auxiliary tasks to provide a priori hypothesis for the combined speech detection of the main task,and the weight superposition of the main and auxiliary tasks is optimized.The experimental results on the open datasets ASVspoof2019 and ASVspoof2015 show that the improved model in this paper can effectively reduce the equal error rate compared with the model using manual features,and is better than the endto-end model before the improvement,and has better generalization ability in the face of unknown attack types.

作者袁甜甜李志华邱阳 YUAN Tian-tian;LI Zhi-hua;QIU Yang(College of Energy and Electrical Engineering,Hohai University,Nanjing 211100,China)

机构地区河海大学能源与电气学院

出处《计算机与现代化》 2023年第5期52-57,67,共7页 Computer and Modernization

基金江苏省自然科学基金资助项目(BK20151500)。

关键词深度伪造合成语音检测辅助学习权重优化端到端系统 deep forgery synthetic speech detection auxiliary learning weight optimization end-to-end system

分类号 TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献3

1张鹏,王丽红,毛琳.语音合成系统中波形拼接过渡算法的研究[J].黑龙江大学自然科学学报,2011,28(6):867-870. 被引量：1
2王锦阳,华光,黄双.基于注意力机制的端到端合成语音检测[J].信号处理,2022,38(9):1975-1987. 被引量：2
3张钰,刘建伟,左信.多任务学习[J].计算机学报,2020,43(7):1340-1378. 被引量：33

二级参考文献7

1倪昕,蔡莲红.基于混合基元模型的非定长基元选取算法[J].小型微型计算机系统,2005,26(6):1079-1082. 被引量：1
2张鹏,王琳,刘胜.基于韵律匹配代价和韵律拼接代价的汉语语音合成[J].哈尔滨工业大学学报,2006,38(11):2006-2008. 被引量：1
3梁瑞刚,吕培卓,赵月,陈鹏,邢豪,张颖君,韩冀中,赫然,赵险峰,李明,陈恺.视听觉深度伪造检测技术研究综述[J].信息安全学报,2020,5(2):1-17. 被引量：28
4陶建华,傅睿博,易江燕,王成龙,汪涛.语音伪造与鉴伪的发展与挑战[J].信息安全学报,2020,5(2):28-38. 被引量：16
5任延珍,刘晨雨,刘武洋,王丽娜.语音伪造及检测技术研究综述[J].信号处理,2021,37(12):2412-2439. 被引量：16
6张钦,李辉,戴蓓倩.基于协同发音现象的一种汉语语音合成方法[J].小型微型计算机系统,2003,24(6):1091-1094. 被引量：1
7周迅溢,王蓓,杨玉芳,李晓庆.语句中协同发音对音节知觉的影响[J].心理学报,2003,35(3):340-344. 被引量：10

共引文献33

1赵海英,周伟,侯小刚,张小利.基于多任务学习的传统服饰图像双层标注[J].吉林大学学报（工学版）,2021,51(1):293-302. 被引量：7
2杨佳明,姜静.基于联合训练的强化学习方法[J].信息技术与信息化,2021(3):126-127.
3陈亮,褚燕华,王丽颖,张晓琳,刘海佳.基于CoBERT-BiGRU的对话式机器阅读理解[J].计算机应用研究,2021,38(7):1983-1987.
4颜志鹏.基于多任务协同的粒子群聚类优化算法[J].现代计算机,2021,27(19):32-40. 被引量：1
5郭辉,郭静纯,张甜.基于梯度优化的多任务混合学习方法[J].计算机技术与发展,2021,31(10):7-12. 被引量：2
6吴锴,王晓放,边超,刘海涛.面向变精度仿真数据建模分析的多任务学习方法比较研究[J].风机技术,2021,63(5):71-80.
7马雨,解庆,唐伶俐,刘永坚.一种基于多任务学习的方面级情感分析方法[J].计算机应用与软件,2022,39(2):245-252. 被引量：1
8李红光,王菲,丁文锐.面向目标分类识别的多任务学习算法综述[J].航空学报,2022,43(1):197-212. 被引量：8
9谭慧欣,赖杰伟,王祚,季磊,张一行,王进亮,宋育章,阳维.可穿戴式心电信号R峰检测的心拍感知卷积网络[J].南方医科大学学报,2022,42(3):375-383. 被引量：3
10王鑫,赵清杰,于重重,张长春,陈涌泉.多节点探测器软着陆的路径规划方法[J].宇航学报,2022,43(3):366-373. 被引量：2

1王萍,靳勇,肖娟,周嘉琦,崔洁,梁昌晶.管道不同内检测数据对齐算法研究及完整性评价[J].石油管材与仪器,2023,9(3):52-57. 被引量：1
2毛跃辉.方言语音识别关键技术研究及其在空调上的应用[J].家电科技,2022(S01):167-171. 被引量：1
3邓立霞,张肖轶群,陈奂宇,刘海英.基于改进麻雀搜索算法及动态窗口法的路径规划[J].科学技术与工程,2023,23(14):6096-6104. 被引量：3
4王保周,李莹.基于AHP的水利工程项目管理课程考核评价权重优化[J].科技资讯,2023,21(9):145-148.
5朱理清,李祥.改进YOLOv5算法的遥感图像车辆检测[J].计算机与现代化,2023(5):117-121. 被引量：2
6万宇宾,刘红文,杜京润,李佳怡,周瑞睿.结温导向的两电平逆变器寿命优化控制[J].电工技术,2023(8):147-151. 被引量：2
7王栋,聂皓,袁越锦,谢永康,赵哲,卢禹铭.果蔬蒸汽烫漂与热风真空干燥设备的结构优化[J].真空科学与技术学报,2023,43(5):450-459. 被引量：2
8李彬,明雨,祁兵,孙毅,赵建立,侯战胜.基于改进长短期记忆网络的需求响应分布式拒绝服务攻击识别方法[J].现代电力,2023,40(3):372-380.
9陈潇潇,曹雪松,吴楠,李喜梅,王丽艳,荆瑞勇.两株聚球藻伴生细菌分离纯化与促生功能鉴定[J].微生物学通报,2023,50(5):1826-1839.
10吴晟懿.基于KNN算法的网络入侵检测技术开发[J].信息与电脑,2023,35(5):67-69. 被引量：1

计算机与现代化

2023年第5期

浏览历史

内容加载中请稍等...

基于辅助学习的改进端到端合成语音检测方法

参考文献3

二级参考文献7

共引文献33

相关作者

相关机构

相关主题

浏览历史