融合CNN和Transformer编码器的变声语音鉴别与还原被引量：1

Identification and restoration of transformed voice by fusing CNN and Transformer encoder

下载PDF

导出

摘要语音变声伪装会导致人耳感知和声纹识别出现错误,从而达到隐匿说话人真实身份的目的。为削弱变声语音的影响,提出一种融合卷积神经网络(Convolutional Neural Networks,CNN)和Transformer编码器的模型,提取变声语音的局部特征和全局特征用于判别变声因子,并根据变声因子的数值实施变声语音还原。在中英文真实场景录音数据集上验证了所提方法的有效性,对变声因子判别实现了95%以上的准确率。利用所提出的方法,在黑箱条件下对某型商用硬件变声器输出的语音进行鉴别与还原,取得了较好的效果。 Voice transformation will lead to errors in auditory perception and speaker recognition so as to conceal the speaker′s real identity.In order to reduce the negative impact of transformed voice,a model fusing Convolutional Neural Networks(CNN)and Transformer encoder was proposed in this paper,which extracted local and global features of transformed voice to predict the disguise factor,and restored the original voice according to the value of the disguise factor.The validity of the proposed method was verified on datasets of both Chinese and English recorded in real-world scenes,where the accuracy was higher than 95%.Under the condition of black box,the proposed method had good performance when identifying and restoring the output voice of a commercial hardware of voice changer.

作者魏春雨孙蒙刘伟张星昱 Wei Chunyu;Sun Meng;Liu Wei;Zhang Xingyu(College of Command and Control Engineering,Army Engineering University of PLA,Nanjing 210007,China)

机构地区陆军工程大学指挥控制工程学院

出处《信息技术与网络安全》 2022年第1期47-54,共8页 Information Technology and Network Security

基金江苏省优秀青年基金(BK20180080)。

关键词基频变声语音鉴伪变声还原时频特征 pitch scaling voice anti-disguise voice restoration time-frequency features

分类号 TP391.9 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1孙哲南,赫然,王亮,阚美娜,冯建江,郑方,郑伟诗,左旺孟,康文雄,邓伟洪,张杰,韩琥,山世光,王云龙,茹一伟,朱宇豪,刘云帆,何勇.生物特征识别学科发展报告[J].中国图象图形学报,2021,26(6):1254-1329. 被引量：29
2王永全,施正昱,张晓.基于DC-CNN的电子伪装语音还原研究[J].计算机科学,2019,46(8):183-188. 被引量：5

二级参考文献12

1张翠玲,谭铁军,刘昇.伪装语音的自动话者识别研究[J].刑事技术,2007,32(2):18-21. 被引量：4
2王科俊,袁智.基于小波矩融合PCA变换的手指静脉识别[J].模式识别与人工智能,2007,20(5):692-697. 被引量：32
3Hyeon Chang LEE,Byung Jun KANG,Eui Chul LEE,Kang Ryoung PARK.Finger vein recognition using weighted local binary pattern code based on a support vector machine[J].Journal of Zhejiang University-Science C(Computers and Electronics),2010,11(7):514-524. 被引量：14
4张桂清,金怡珠,刘红伟,崔效义.电子伪装语音的变声规律研究[J].证据科学,2010,18(4):503-509. 被引量：9
5毋立芳,马玉琨,周鹏,郑伟诗.生物特征模板保护综述[J].仪器仪表学报,2016,37(11):2407-2420. 被引量：15
6李燕萍,陶定元,林乐.基于DTW模型补偿的伪装语音说话人识别研究[J].计算机技术与发展,2017,27(1):93-96. 被引量：7
7刘罡,徐超,陈思义,吴聪.结合深度置信网络与混合神经网络的图像分类方法[J].小型微型计算机系统,2017,38(9):2146-2151. 被引量：3
8付文博,孙涛,梁藉,闫宝伟,范福新.深度学习原理及应用综述[J].计算机科学,2018,45(B06):11-15. 被引量：67
9宋平,黄玲,王云龙,刘菲,孙哲南.基于计算光场成像的虹膜活体检测方法[J].自动化学报,2019,45(9):1701-1712. 被引量：5
10王财勇,孙哲南.虹膜分割算法评价基准[J].计算机研究与发展,2020,57(2):395-412. 被引量：7

共引文献32

1郑琳琳,孙蒙,张雄伟,潘志欣.语音伪装方法及其防御对策综述[J].信息技术与网络安全,2020,39(8):33-42.
2郑琳琳,张雄伟,孙蒙,李嘉康,张星昱.基于i⁃vector的电子伪装语音鲁棒还原方法研究[J].数据采集与处理,2020,35(5):880-891. 被引量：1
3李建桥,贾晓芬,赵佰亭.多特征融合的胶囊网络用于图像分类[J].哈尔滨商业大学学报（自然科学版）,2020,36(6):695-700. 被引量：2
4邬明汉,黄永祯,郭柏冬,王东,张曼.基于步态识别的视频侦查技术与应用[J].中国人民公安大学学报（自然科学版）,2021,27(3):22-28. 被引量：3
5仲亮.一种基于大数据的政务专业人员系统的数据治理研究[J].新一代信息技术,2021,4(15):29-34.
6周宝昌,林梓宏,苏培杰,谢智阳.一种基于双光谱切换技术的掌纹掌脉智能门禁系统[J].软件,2021,42(10):38-40. 被引量：2
7林凌,程思凡.识别数字化风险及多维治理路径[J].编辑学刊,2021(6):19-24.
8杨军.基于生物特征识别技术的高校课外体育活动监管系统研究[J].当代体育科技,2021,11(35):207-211.
9刘宪权,陆一敏.生物识别信息刑法保护的构建与完善[J].苏州大学学报（哲学社会科学版）,2022,43(1):60-71. 被引量：22
10谢晓华,卞锦堂,赖剑煌.人脸活体检测综述[J].中国图象图形学报,2022,27(1):63-87. 被引量：6

同被引文献2

1陈文实,刘心惠,鲁明羽.基于编码解码器与深度主题特征抽取的多标签文本分类[J].南京师大学报（自然科学版）,2019,42(4):61-68. 被引量：6
2张宸逍,潘庆,王效灵.深度连接的超轻量化子空间注意模块[J].计算机与现代化,2021(12):79-84. 被引量：1

引证文献1

1陈华超,李刚领,廖承就,张惠荣,张磊.基于单目深度估计的输电线路防外破监测方法[J].科学与信息化,2023(22):73-75.

1郭朝阳,汪波,王新安,张国新.一种改进的适用于数字助听器的基于非线性频率压缩的多通道响度补偿方法（英文）[J].北京大学学报（自然科学版）,2018,54(1):25-34. 被引量：1
2袁爱平,陶志勇,邓河,陈为满.云计算环境中HDFS数据块存储策略研究[J].电脑知识与技术,2020,16(26):33-35. 被引量：5
3包桂秋,林喜荣,苏晓生,周兆英.基于人体生物特征的身份鉴别技术发展概况[J].清华大学学报（自然科学版）,2001,41(4):72-76. 被引量：2
4技嘉拓展AORUS电竞产品线推出H1电竞耳机[J].电脑爱好者,2021(2):65-65.
5刘敏,陈曙晖.基于关联融合的volte流量分析研究[J].信息网络安全,2020(4):81-86.
6蔡建国(译),Fei Dai,Abbas Rashidi,loannis Brilakis.基于图像和飞行时间的基础设施三维重建技术比较[J].四川建材,2021,47(2):39-45. 被引量：2
7郑琳琳,张雄伟,孙蒙,李嘉康,张星昱.基于i⁃vector的电子伪装语音鲁棒还原方法研究[J].数据采集与处理,2020,35(5):880-891. 被引量：1
8李政,肖冰冰,李笑若,祝丙南,金晨光.Roundabout:一种基于燃烧证明的比特币隐私保护方法[J].计算机与数字工程,2021,49(12):2538-2543.
9潘德阔,贾尚帅,孙艳红,代文强,郑旭.高速列车车内声品质优化仿真研究[J].噪声与振动控制,2021,41(1):108-112. 被引量：1
10郝巍东,乔红.山西临汾碧岩寺观音阁殿外彩塑探析[J].天工,2021(12):64-67.

信息技术与网络安全

2022年第1期

浏览历史

内容加载中请稍等...

融合CNN和Transformer编码器的变声语音鉴别与还原被引量：1

参考文献2

二级参考文献12

共引文献32

同被引文献2

引证文献1

相关作者

相关机构

相关主题

浏览历史

融合CNN和Transformer编码器的变声语音鉴别与还原 被引量：1

参考文献2

二级参考文献12

共引文献32

同被引文献2

引证文献1

相关作者

相关机构

相关主题

浏览历史

融合CNN和Transformer编码器的变声语音鉴别与还原被引量：1