音色变换音频信号的篡改检测技术研究被引量：3

Study on tamper detection technology for voice transformation

下载PDF

导出

摘要针对音色变换软件带来的社会安全问题,提出一种音频信号篡改检测方法。首先根据语音信号的混沌特性和人耳的听觉特性,利用美尔频率倒谱系数(Mel frequency cepstral coefficients,MFCC)特征提取原理,提取待测音频的杜芬频率倒谱系数(Duffing frequency cepstral coefficients,DFCC),然后将特征参数的幅度进行提升,利用支持向量机(SVM)将特征参数与语料库里的特征进行分类。分类成功的情况下,根据幅度提升的大小判断待测音频信号是否经过篡改;同时根据幅度提升的大小和待测音频的性别判断说话人的真实性别。大量的实验结果表明,该方法在音频信号的篡改检测和音频信号说话人的真实性别判断方面均具有较高的准确率,并且性能稳定。 To address the social security issue brought up by voice transformation software, a method for sound signal tamper detection is proposed. Firstly, with the extraction method of Mel frequency cepstral coefficients (MFCC),Duffing frequency cepstral coefficients(DFCC) characteristic parameters of audio signals are extracted based on the human hearing characteristics and chaos characteristics of speech signal. Then, the amplitude of characteristic parameters is enhanced and support vector machine (SVM) is used to classify the characteristic parameters and characteristics in corpus. In case of successful classification, the audio signal will be judged whether it is tampered as per the size of the amplitude enhanced. Meanwhile, the speaker gender will be judged according to the size of the amplitude enhanced and the gender of the audio. Through a large number of experiments, it shows that the method has stable performance and high accuracy both in the audio signal tampering detection and audio speaker real gender judgement.

作者何朝霞潘平罗辉 HE Zhaoxia;PAN Ping;LUO Hui(College of Technology & Engineering,Yangtze University,Jingzhou 434023,China;Computer Science and Information Institute,Guizhou University,Guiyang 550025,China;School of Computer Science and Technology,Harbin Institute of Technology,Harbin 150001,China)

机构地区长江大学工程技术学院贵州大学计算机科学与信息学院哈尔滨工业大学计算机科学与技术学院

出处《中国测试》 CAS 北大核心 2017年第2期98-103,共6页 China Measurement & Test

基金贵州省科学技术基金项目(黔科合J字[2012]2132) 贵阳市科技计划项目(筑科合同[2011101]1-2) 长江大学工程技术学院科学研究发展基金(15j0401)

关键词篡改检测特征提取杜芬频率倒谱系数支持向量机 tamper detection feature extraction DFCC SVM

分类号 TP311.12 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献6

1丁琦,平西建.针对语音变换的语音篡改检测[J].数据采集与处理,2012,27(1):57-62. 被引量：6
2晁浩,宋成,彭维平.基于发音特征的声效相关鲁棒语音识别算法[J].计算机应用,2015,35(1):257-261. 被引量：8
3陆成刚.语音性别变换的实时实现[J].电声技术,2009,33(12):50-53. 被引量：1
4孙颖,姚慧,张雪英,张奇萍.基于混沌特性的情感语音特征提取[J].天津大学学报（自然科学与工程技术版）,2015,48(8):681-685. 被引量：12
5何朝霞,潘平,罗辉.基于非线性共振的说话人特征提取研究与仿真[J].科学技术与工程,2012,20(25):6507-6510. 被引量：4
6志扬.一位科学家对音乐的贡献[J].乐器,1990(2):36-36. 被引量：1

二级参考文献53

1栗学丽,丁慧,徐柏龄.基于熵函数的耳语音声韵分割法[J].声学学报,2005,30(1):69-75. 被引量：34
2杨莉莉,林玮,徐柏龄.汉语耳语音孤立字识别研究[J].应用声学,2006,25(3):187-192. 被引量：8
3蒋明哲,廖建新,朱晓民,杨波.基于智能网的变声彩话业务的设计与实现[J].电信工程技术与标准化,2006,19(5):84-87. 被引量：1
4孙卓,岳振军.一种汉语语音变换技术[J].电声技术,2007,31(6):37-40. 被引量：1
5LIEBERMAN P, BLUMSTEIN S E. Speech physiology, speech perception, and acoustic phonetics (Cambridge studies in speech science and communication) [M]. London : Cambridge University Press, 1988 : 356-363.
6YAIR M Y, CHAZAN E. Super resolution pitch deterruination of speech signals [J]. IEEE Trans. on Signal Processing, 1991.39 ( 1 ): 40-48.
7MOUI.INES E,CHARPENTIER F. Pitch-synchronous waveform processing techniques for text-to-speech synthesis using diphones[J]. Speech Communication, 1990,9 (5/6) : 453-467.
8Stylianou Y. Voice transformation: a survey[C]// IEEE International Conference on Acoustics, Speech and Signal Processing. Taipei, Taiwan: IEEE Press, 2009 : 3585-3588.
9Atal B S, Hanauer S L. Speech analysis and synthesis by linear prediction of the speech wave[J]. The Journal of the Acoustical Society of America, 1971,50(2):637-655.
10Desai S, Raghavendra E V, Yegnanarayana B, et al. Voice conversion using artificial neural networks [C]//IEEE International Conference on Acoustics, Speech and Signal Processing. Taipei, Taiwan: IEEE Press, 2009 : 3893-3896.

共引文献25

1马学明.50%苯·苄可湿性粉剂的研究[J].湖南化工,2000,30(1):22-23.
2何朝霞,刘凯.基于Duffing随机共振的图像去噪技术研究[J].科学技术与工程,2013,21(26):7683-7687. 被引量：2
3钟巍,孔祥维,尤新刚,王波.基于分数倒谱变换的取证语音拼接特征提取与分析[J].数据采集与处理,2014,29(2):248-253. 被引量：6
4赵祎,张盛,林孝康.一种改进的基音周期提取算法[J].数据采集与处理,2014,29(2):304-308. 被引量：6
5王洋,潘平,田庚.一种基于量子势阱组的说话人特征提取方法[J].科学技术与工程,2015,35(1):267-272.
6贺前华,潘伟锵,胡永健,朱铮宇,李艳雄,奉小慧.说话人认证录音回放检测方法综述[J].数据采集与处理,2015,30(2):266-274. 被引量：1
7包永强,梁瑞宇,丛韫,高冲红,王青云.音频取证若干关键技术研究进展[J].数据采集与处理,2016,31(2):252-259. 被引量：8
8吴为胜,张良,李磊.虚拟场景中篡改语音检测方法的研究[J].计算机仿真,2016,33(7):418-422. 被引量：2
9畅江,张雪英,张奇萍,陈宏涛,孙颖,胡凤云.不同语种及非言语情感声音的ERP研究[J].清华大学学报（自然科学版）,2016,56(10):1131-1136. 被引量：3
10杨臻.语音信号准确性识别仿真研究[J].计算机仿真,2017,34(2):285-288. 被引量：5

同被引文献25

1杜建清.云计算技术在综合电子信息系统中的应用研究[J].自动化与仪器仪表,2016(5):181-182. 被引量：3
2杨跃武,赵瑞丽.基于电话交换机电子计时计费系统校准结果的研究[J].自动化与仪器仪表,2016(5):226-227. 被引量：3
3吴真,钟哲强,杨磊,张彬.基于多层介质膜光栅的谱合成系统光束特性分析[J].物理学报,2016,65(5):124-133. 被引量：7
4方鹏,李贤,汪增福.运用核聚类和偏最小二乘回归的歌唱声音转换[J].智能系统学报,2016,11(1):55-60. 被引量：2
5林静,杨继臣,张雪源,李新超.基于稀疏表示权重张量的音频特征提取算法[J].计算机应用,2016,36(5):1426-1429. 被引量：5
6张毅,谢延义,罗元,席兵.一种语音特征提取中Mel倒谱系数的后处理算法[J].智能系统学报,2016,11(2):208-215. 被引量：12
7温翠红,章兢,程凡永.基于DAG-LDM的手写音乐符号分类[J].电子测量与仪器学报,2016,30(5):764-771. 被引量：7
8张毅,汪培培,罗元.基于MUSIC/MNM谱估计的鲁棒语音特征提取[J].信息与控制,2016,45(3):355-360. 被引量：1
9李晗,陈克安,田旭华.基于平板冲击声的声源特性表征及自动识别[J].应用声学,2016,35(4):294-301. 被引量：3
10刘磊,段俊奇,刘轶铭,翁丽娜.基于听觉特征的舰船辐射噪声分类研究[J].中国电子科学研究院学报,2016,11(4):401-406. 被引量：5

引证文献3

1张琳,吴建明.基于计算机技术的钢琴音色识别与电子合成系统设计[J].自动化与仪器仪表,2018,0(10):79-82. 被引量：6
2张红兵.Mel频率下语音信号深度频谱特征提取方法仿真[J].计算机仿真,2020,37(5):197-200. 被引量：6
3何朝霞,朱嵘涛,罗辉.基于F-DFCC融合特征的语音情感识别方法[J].现代电子技术,2024,47(6):131-136. 被引量：1

二级引证文献13

1汪园园.计算机语言的逻辑开发与软件开放设计应用[J].信息与电脑,2018,30(22):60-61. 被引量：1
2仝智倍.基于人工智能的钢琴编曲音色识别系统设计[J].现代电子技术,2020,43(4):183-186. 被引量：4
3邢洁.立式击弦机半自动组装结构复奏性能研究[J].自动化与仪器仪表,2020(10):97-100.
4左张弛.基于傅里叶分析方法的钢琴音色识别与电子合成系统研究[J].自动化技术与应用,2021,40(2):137-140. 被引量：3
5高渝蓉,娄屹萍.高密度电子电路多通道频谱误差自动识别研究[J].通信电源技术,2020,37(22):34-35.
6唐琴.电子通信信号循环频率特征自提取方法研究[J].通信电源技术,2021,38(17):60-62.
7胡丽敏,桂浩,杜佶峻,汤健雄,陈开一.基于卷积神经网络的音符级钢琴音乐转录方法研究[J].计算机应用与软件,2022,39(5):179-185. 被引量：2
8陈琳.面向语音特征提取的英语机器人识别方法构建[J].自动化与仪器仪表,2022(8):234-239.
9肖林,肖倩宏,魏莉莉,周艳云,汪适.基于大数据和深度学习的电网调度语音识别声学模型研究[J].电力大数据,2022,25(9):30-36. 被引量：2
10张锦豪,赵月爱.基于声学特征与自编码器的机械故障检测方法[J].计算机与数字工程,2024,52(2):512-520.

1张永亮,张先庭,鲁宇明.基于FMFCC和HMM的说话人识别[J].计算机仿真,2010,27(5):352-354. 被引量：8
2高振斌,张晨,李景春.混沌算法和子空间算法应用在微弱信号检测中的比较[J].科学技术与工程,2014,22(1):235-238. 被引量：5
3刘京诚,高海英,廖志勇.基于DSP和FPGA的机器人声控系统设计与实现[J].现代电子技术,2006,29(14):109-112. 被引量：7
4王瑞,王康晏,冯玉田,张海燕,金彦亮,张有正.复杂场景下声频传感器网络核稀疏表示车辆识别[J].西安电子科技大学学报,2015,42(4):114-120. 被引量：7
5李战明,王贞.基于小波包分析特征参数的说话人识别系统[J].电声技术,2005,29(6):46-49. 被引量：5
6袁霞,赵向阳.基于MEL频率倒谱系数技术的音控汽车天窗的研究设计[J].河南机电高等专科学校学报,2015,23(2):13-14.
7寇占奎,徐江峰.基于音频特征的半脆弱水印方案[J].计算机工程与设计,2012,33(9):3323-3326. 被引量：8
8彭秋芳,刘洋.基于SVM的电子商务行为的性别判断[J].山东大学学报（理学版）,2016,51(7):74-80. 被引量：2
9无线技术在安防系统中的应用[J].电子技术应用,2009,35(12):20-21.
10韩卫华,宁佐贵.时间序列预测的动态神经网络方法[J].微机发展,2004,14(9):40-41. 被引量：3

中国测试

2017年第2期

浏览历史

内容加载中请稍等...

音色变换音频信号的篡改检测技术研究被引量：3

参考文献6

二级参考文献53

共引文献25

同被引文献25

引证文献3

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

音色变换音频信号的篡改检测技术研究 被引量：3

参考文献6

二级参考文献53

共引文献25

同被引文献25

引证文献3

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

音色变换音频信号的篡改检测技术研究被引量：3