基于改进胶囊网络的音调篡改检测算法

Voice Pitch Tamper Detection Algorithm Based on Improved Capsule Network

下载PDF

导出

摘要音调篡改技术是语音伪造常用的一种技术手段,可能对说话人验证系统造成威胁。对噪声和压缩场景下的伪造语音检测问题进行了研究,提出了基于改进胶囊网络的音调篡改检测算法。为增强鲁棒性,将相对频谱感知线性预测(RelAtive SpecTrAl-Perceptual Linear Predictive,RASTAPLP)和梅尔倒谱系数(Mel-scale Frequency Cepstral Coefficients,MFCC)融合为新特征,并输入优化的胶囊网络,对经加噪和压缩处理的音频进行检测。实验结果表明,该算法在已知噪声、未知噪声和压缩场景下的检测准确率均在98%以上,和现有的一些算法相比,具有较高的检测准确率和鲁棒性。 Pitch tampering technique is a common technical means of speech forgery, which can pose great threat to speaker verification systems. For the problems of detecting forged speech in noisy and compressed scenarios, a pitch tampered detection algorithm based on improved capsule network is proposed. To enhance the robustness, RASTA-PLP(RelAtive SpecTrAl-Perceptual Linear Predictive) and MFCC(Mel-scale Frequency Cepstral Coefficients) are fused into new features and fed into an optimized capsule network for detection on the noise-added and compressed processed audio. Experimental results indicate that the accuracy of the algorithm reached over 98% in known noise, unknown noise and compression scenarios.Therefore, compared with some existing algorithms, the algorithm proposed in this paper has higher detection accuracy and robustness.

作者杜海云王宏霞 DU Haiyun;WANG Hongxia(Sichuan University,Chengdu Sichuan 610207,China)

机构地区四川大学

出处《通信技术》 2022年第8期984-989,共6页 Communications Technology

基金四川省科技计划资助项目(2022YFG0320)。

关键词胶囊网络音调篡改检测鲁棒性相对频谱感知线性预测梅尔倒谱系数 capsule network pitch tampered detection robustness RASTA-PLP MFCC

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1杨青林,高勇.在变换域中实现的能量自适应音频隐藏算法[J].通信技术,2022,55(2):223-228. 被引量：2
2Veton Z.Kepuska,Hussien A.Elharati.Robust Speech Recognition System Using Conventional and Hybrid Features of MFCC,LPCC,PLP,RASTA-PLP and Hidden Markov Model Classifier in Noisy Conditions[J].Journal of Computer and Communications,2015,3(6):1-9. 被引量：7

二级参考文献10

1全笑梅,张鸿宾.用于篡改检测及认证的脆弱音频水印算法[J].电子与信息学报,2005,27(8):1187-1192. 被引量：14
2刘勍,张步达,温志贤,何向阳.信息隐藏技术及其应用[J].现代物理知识,2005,17(6):38-40. 被引量：2
3马翼平,韩纪庆.DCT域音频水印:嵌入对策和算法[J].电子学报,2006,34(7):1260-1264. 被引量：33
4孙素静,赵翠俭,李英辉.关于音频水印算法透明性评估的讨论[J].计算机安全,2008(2):39-41. 被引量：3
5冯涛.一种基于能量集中的数字水印嵌入方法[J].上海第二工业大学学报,2010,27(2):136-140. 被引量：1
6赵春雨,宫娜娜,武海艳.数字水印的容量分析与计算[J].福建电脑,2011,27(4):5-6. 被引量：1
7蔡咏梅.基于RDWT-DCT-SVD的鲁棒性音频盲水印算法[J].计算机工程与设计,2014,35(2):457-461. 被引量：5
8石杰,丁海洋,李子臣,陈世斌.基于DES和DFT的数字水印算法[J].北京印刷学院学报,2017,25(7):16-18. 被引量：1
9姚明明,杜庆治.基于范数的DWT域鲁棒音频水印算法[J].电视技术,2021,45(4):101-107. 被引量：2
10谢宸琪,张保稳,易平.人工智能模型水印研究综述[J].计算机科学,2021,48(7):9-16. 被引量：5

共引文献7

1成利江,景新幸,杨海燕.基于SOC FPGA的车载语音识别系统设计[J].桂林电子科技大学学报,2016,36(6):454-460. 被引量：1
2张策,韦鹏程,陆晓燕,石熙.重庆方言语音识别系统的设计与实现[J].计算机测量与控制,2018,26(1):256-259. 被引量：6
3陈盛,胡维平,张佑贤,覃以威.基于嵌入式的语音控制系统的设计与实现[J].电子设计工程,2018,26(19):57-61. 被引量：10
4张策,韦鹏程,石熙.小语料库重庆话语音识别的研究[J].计算机测量与控制,2018,26(11):252-255. 被引量：3
5郭佳敏,李鸿燕.一种改进LSTM训练的语音分离技术[J].电子设计工程,2021,29(11):140-145.
6徐志伟,高勇.基于LSB的低复杂度时域音频隐写算法[J].通信技术,2023,56(7):835-840. 被引量：2
7Hussien A.Elharati,Mohamed Alshaari,Veton Z.Kepuska.Arabic Speech Recognition System Based on MFCC and HMMs[J].Journal of Computer and Communications,2020,8(3):28-34. 被引量：2

1潘泽波.基于改进MFCC与短时能量特征的异常音频检测方法[J].电子世界,2020(23):139-141. 被引量：4
2王健,申炜涛,耿皓松,张艳.基于频繁序列挖掘的声纹特征提取关键技术研究[J].北华航天工业学院学报,2022,32(1):10-12.
3梁小林,沈湘菲,梁曌,邱海琳.基于CTC-GRU模型的长沙方言识别[J].吉首大学学报（自然科学版）,2022,43(2):45-52.
4吴情,胡维平,陈丹丹,肖婷.基于深度学习的语声抑郁识别[J].应用声学,2022,41(5):837-842.
5万苗,任杰,马苗,曹瑞.多任务学习在中国方言分类中的应用研究[J].计算机技术与发展,2022,32(4):109-115. 被引量：1
6聂晨淅.基于MFCC均值特征的电台语言类节目相似度比对算法研究[J].电声技术,2022,46(4):50-53.
7吴培涛,罗良梅,陶雪,肖梅,魏立,施明毅.基于区块链的中药材溯源质量安全信息平台的构建[J].电脑知识与技术,2022,18(24):107-109. 被引量：3
8梁超,高勇.一种利用SE-Res2Net的合成语音检测系统[J].无线电工程,2022,52(9):1560-1565. 被引量：3
9Fengping Dou,Long Xu,Zhixiang Ren,Dong Zhao,Xinze Zhang.Super-resolution of Solar Magnetograms Using Deep Learning[J].Research in Astronomy and Astrophysics,2022,22(8):218-229. 被引量：1
10WU Qiang,ZHONG Shaojun,TONG Xingwei.Genetic Pleiotropy Test by Quasi p-Value with Application to Typhoon Data in China[J].Journal of Systems Science & Complexity,2022,35(4):1557-1572.

通信技术

2022年第8期

浏览历史

内容加载中请稍等...

基于改进胶囊网络的音调篡改检测算法

参考文献2

二级参考文献10

共引文献7

相关作者

相关机构

相关主题

浏览历史