采用联合字典优化的噪声鲁棒性语音转换算法被引量：1

A noise robust voice conversion algorithm based on joint dictionary optimization

下载PDF

导出

摘要针对含噪语音难以实现有效的语音转换,本文提出了一种采用联合字典优化的噪声鲁棒性语音转换算法。在联合字典的构成中,语音字典采用后向剔除算法(Backward Elimination algorithm,BE)进行优化,同时引入噪声字典,使得含噪语音与联合字典相匹配。实验结果表明,在保证转换效果的前提下,后向剔除算法能够减少字典帧数,降低计算量。在低信噪比和多种噪声环境下,本文算法与传统NMF算法和基于谱减法消噪的NMF转换算法相比具有更好的转换效果,噪声字典的引入提升了语音转换系统的噪声鲁棒性。 A noise robust voice conversion algorithm based on joint dictionary optimization is proposed in this paper to solve the problem that it is difficult to effectively convert noisy source speech into the target one.In the composition of the joint dictionary,the speech dictionary is optimized using a backward elimination algorithm.At the same time,a noise dictionary is introduced to match the noisy speech with the joint dictionary.The experimental results show that the backward elimination algorithm can decrease the number of dictionary frames and reduce the amount of calculation while ensuring the conversion effect.In low SNR and multiple noise environments,the algorithm has better conversion effect than the traditional NMF algorithm and the NMF conversion algorithm plus spectral subtraction de-noising.The proposed algorithm improves the robustness of the voice conversion system.

作者张石磊简志华孙闽红钟华刘二小 ZHANG Shilei;JIAN Zhihua;SUN Minhong;ZHONG Hua;LIU Erxiao(School of Communication Engineering,Hangzhou Dianzi University,Hangzhou 310018)

机构地区杭州电子科技大学通信工程学院

出处《声学学报》 EI CSCD 北大核心 2019年第6期1074-1082,共9页 Acta Acustica

基金国家自然科学基金项目(61201301,61271214,61301248,41704154,61772166) 浙江省科技计划项目(LGG18F010009)资助

关键词字典优化转换算法联合字典语音转换噪声鲁棒性谱减法转换效果帧数

分类号 TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献4

1JIAN Zhihua,WANG Xiangwen.A modified voice conversion algorithm using compressed sensing[J].Chinese Journal of Acoustics,2014,33(3):323-333. 被引量：8
2李阳春,俞一彪.倒谱本征空间结构化高斯混合模型语音转换方法[J].声学学报,2015,40(1):12-19. 被引量：9
3ZHANG Tianqi,XU Xin,WU Wangjun,LIU Yu.Music/voice separation based on the multi-repeating structure of Mel cepstrum coefficient[J].Chinese Journal of Acoustics,2015,34(4):424-435. 被引量：4
4李贤,於俊,汪增福.面向情感语音转换的韵律转换方法[J].声学学报,2014,39(4):509-516. 被引量：9

二级参考文献21

1左国玉,刘文举,阮晓钢.声音转换技术的研究与进展[J].电子学报,2004,32(7):1165-1172. 被引量：32
2康永国,双志伟,陶建华,张维.基于混合映射模型的语音转换算法研究[J].声学学报,2006,31(6):555-562. 被引量：13
3苏庄銮,汪增福.基于统计方法的普通话情感语调模型[J].自动化学报,2007,33(7):673-677. 被引量：2
4Stylianou Y,Toda T,Wu C H,Kain A,Rosec O.Introduction to the special section on voice transformation.IEEE Audio,Speech,and Language Processing,2010;18(5):909
5Abe M,Nakamura S,Shikano K,Kuwabara H.Voice Conversion through vector quantization.In:Proc.ICASSP,1988:655—658
6Krendranath M,Murthy H,Barnwelt T,Nielsen A.Perceptual relevance of objectively measured descriptors for speaker characterization.In:Proc.ICASSP,1998:869—872
7Valbret H,Moulines E,Tubach J.Voice Transformation Using PSOLSA Technique.In:Proc.ICASSP,1992:145-148
8Kain A,Macon M.Spectral voice conversion for text-tospeech synthesis.In:Proc.ICASSP,1998:285—288
9Elina Helander,Hanna Silen,Tuomas Virtanen,Moncef Gabbouj.Voice conversion using dynamic kernel partial least squares regression.IEEE Audio,Speech,and Language Processing,2012;20(3):806—817
10Athanasios Mouchtaris,Jan Van der Spiegel,Paul Mueller.Nonparallel training for voice conversion based on a parameter adaptation approach.IEEE Transactions on Audio,Speech,and Language Processing,2006;14:952—963

共引文献17

1王彪,朱志慧,戴跃伟.一种快速稀疏贝叶斯学习的水声目标方位估计方法研究[J].声学学报,2016,41(1):81-86. 被引量：9
2董胡.基于先验信噪比和能零熵的语音端点检测算法[J].计算机技术与发展,2017,27(7):72-75. 被引量：4
3高悦,臧明相,郭馥英.基于小波变换和压缩感知的语音信号压缩研究[J].计算机应用研究,2017,34(12):3672-3674. 被引量：9
4邓叶勋,赵晖.基于非负矩阵分解的情感语音基频转换研究[J].计算机工程,2018,44(5):256-261. 被引量：1
5GU Dong,JIAN Zhihua.An algorithm for voice conversion with limited corpus[J].Chinese Journal of Acoustics,2018,37(3):371-384.
6周健,窦云峰,刘荣敏,王华彬,陶亮.采用低维特征映射的耳语音向正常音转换[J].声学学报,2018,43(5):855-863. 被引量：2
7谷东,简志华.面向少量语料的语音转换算法[J].声学学报,2018,43(5):864-872. 被引量：3
8杜楠楠,赵晖.维吾尔语情感语音韵律转换研究[J].计算机工程与应用,2016,52(19):154-160. 被引量：2
9智鹏鹏,杨鸿武,宋南.利用说话人自适应实现基于DNN的情感语音合成[J].重庆邮电大学学报（自然科学版）,2018,30(5):673-679. 被引量：4
10张雄伟,苗晓孔,曾歆,孙蒙,曹铁勇.语音转换技术研究现状及展望[J].数据采集与处理,2019,34(5):753-770. 被引量：9

同被引文献6

1连海伦,周健,胡雨婷,郑文明.利用深度卷积神经网络将耳语转换为正常语音[J].声学学报,2020,45(1):137-144. 被引量：8
2王旭勇.基于语音分析的智能质检关键词提取方法设计[J].电子世界,2018,0(19):174-175. 被引量：2
3叶枫,胡程,黄倩,陈勇.基于云服务的AI玩偶的研究及在教育教学中的应用[J].计算机工程与科学,2018,40(A01):72-80. 被引量：3
4张雄伟,苗晓孔,曾歆,孙蒙,曹铁勇.语音转换技术研究现状及展望[J].数据采集与处理,2019,34(5):753-770. 被引量：9
5王文浩,张筱,万永菁.改进深度信念网络在语音转换中的应用[J].浙江大学学报（工学版）,2019,53(12):2372-2380. 被引量：1
6何若云,杨熤天,杨琦,阮国蓓,张玲.语音识别技术在智能审计中的运用初探[J].中国内部审计,2020,0(1):34-40. 被引量：5

引证文献1

1李智诚,张云翔.面向电力行业的智能会议录音回溯系统[J].现代计算机,2020,26(21):37-39. 被引量：1

二级引证文献1

1林鑫,佟芳,马国雷,张容福,杨承,李心.电力语音精准识别系统构建模型研究[J].电力设备管理,2024(6):137-139.

1孟欠欠,沈龙凤,李晓,李梦雯.基于字典优化的迁移稀疏编码方法[J].黑龙江工业学院学报（综合版）,2019,19(12):73-78.
2黎曾建.和head有关的英语表达[J].语数外学习（初中版）,2019,0(9):39-41.
3陈佳欣,王大东,孙明辰,王晓宇.基于云平台的NAO机器人语音处理[J].佳木斯大学学报（自然科学版）,2019,37(6):912-916. 被引量：3
4吴斌.基于智能网联车辆模型的驾驶员酒后驾驶检测系统研究[J].机械与电子,2020,38(2):67-70. 被引量：2
5王美能.基于L2稀疏约束和图正则化的非负矩阵分解算法[J].宜春学院学报,2019,41(12):28-30.
6严国萍,陈禹,李雨冲,闫昭帆.基于一维堆叠卷积自编码器的分布式应变裂缝检测[J].计算机系统应用,2020,29(1):144-150. 被引量：3
7王益艳.基于多方向的各向异性边缘检测算法[J].计算机与数字工程,2020,48(1):167-169. 被引量：4
8蔡宁,黄腾,钱龙,夏玉国.三维坐标转换算法的粗差探测比较研究[J].甘肃科学学报,2020,32(1):18-21. 被引量：1
9董胡,徐雨明,马振中,李列文,任可.基于小波包与自适应维纳滤波的语音增强算法[J].计算机技术与发展,2020,30(1):50-53. 被引量：9
10杨保俊,洪荣晶,潘裕斌.基于CEEMDAN- EFICA去噪的风电齿轮箱故障诊断[J].组合机床与自动化加工技术,2020(2):115-118. 被引量：4

声学学报

2019年第6期

浏览历史

内容加载中请稍等...

采用联合字典优化的噪声鲁棒性语音转换算法被引量：1

参考文献4

二级参考文献21

共引文献17

同被引文献6

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

采用联合字典优化的噪声鲁棒性语音转换算法 被引量：1

参考文献4

二级参考文献21

共引文献17

同被引文献6

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

采用联合字典优化的噪声鲁棒性语音转换算法被引量：1