基于修正Mel域掩蔽模型和无语音概率的耳语音增强被引量：2

Speech enhancement based on modified Mel masking model and speech absence probability in whispers

下载PDF

导出

摘要提出了一种基于修正Mel域听觉掩蔽模型和无语音概率的耳语音增强方法。该方法根据耳语音的发音特点对Mel频率进行修正,对每一帧耳语音信号进行Mel域频带滤波,同时通过无语音概率(SAP)动态地确定每个频带的听觉掩蔽阈值,对不同的听觉掩蔽阈值自适应地调整谱减系数来进行耳语音增强。对增强后的耳语音进行客观和主观测试,结果表明,该方法与其它谱减法相比,能将残留噪声和背景噪声控制在人耳掩蔽阈值下,取得更小的语音失真,主观听觉也得到了很大的改善。 A method of whispered speech enhancement using auditory masking model in modified Mel-domain and Speech Absence Probability （SAP） is proposed. In light of the phonation characteristic of whispered speech, we modify the Mel Frequency Scaling model. Whispered speech is filtered by the proposed model. Meanwhile, the value of masking threshold for each frequency band is dynamically determined by speech absence probability. Then whisper speech enhancement is conducted by adaptively rectifying the spectrum subtraction coefficients using different masking threshold values. Results of objective and subjective tests on the enhanced whispered speech signal show that compared with other methods, the proposed method can enhance whispered speech signal with better subjective auditory quality and less distortion by reducing the music noise and background noise under the masking threshold value.

作者陶智赵鹤鸣吴迪陈大庆张晓俊

机构地区苏州大学物理科学与技术学院苏州大学电子信息学院

出处《声学学报》 EI CSCD 北大核心 2009年第4期370-377,共8页 Acta Acustica

基金国家自然科学基金(60572076) 江苏省高校自然科学基金(05KJB510113)资助项目

关键词语音增强听觉掩蔽 Mel 概率模型掩蔽阈值噪声控制耳语音 Distillation Frequency bands Probability Speech recognition

分类号 TB52 [理学—声学]

引文网络
相关文献

参考文献4

1赵晓群,黄小珊.改进的基于人耳掩蔽效应谱减语音增强算法[J].通信学报,2008,29(9):73-80. 被引量：8
2LIN Wei YANG Lili XU Boling.A new frequency scale of Chinese whispered speech in the application of speaker identification[J].Progress in Natural Science:Materials International,2006,16(10):1072-1078. 被引量：5
3陶智,赵鹤鸣,龚呈卉.基于听觉掩蔽效应和Bark子波变换的语音增强[J].声学学报,2005,30(4):367-372. 被引量：39
4栗学丽,丁慧,徐柏龄.基于熵函数的耳语音声韵分割法[J].声学学报,2005,30(1):69-75. 被引量：34

二级参考文献65

1陈韬,李昌立,莫福源.汉语孤立字全音节实时识别系统[J].声学学报,1993,18(3):161-171. 被引量：4
2LIXueli,XUBoling.Tone features in whispered Chinese[J].Progress in Natural Science:Materials International,2005,15(3):285-288. 被引量：5
3卜凡亮,王为民,戴启军,陈砚圃.基于噪声被掩蔽概率的优化语音增强方法[J].电子与信息学报,2005,27(5):753-756. 被引量：16
4潘凌云,孙达传,吴美朝.语音识别中基于语谱图的语音音素分割方法[J].杭州大学学报（自然科学版）,1995,22(1):42-46. 被引量：7
5齐士钤张家禄.汉语普通话辅音音长分析[J].声学学报,1982,(1):8-13.
6曹剑芬.现代语音基础知识[M].北京:人民教育出版社,1990..
7Taisuke Itoh, Kazuya Takeda and Fumitada Itakura.Acoustic analysis and recognition of whispered speech. In:Proc. ICASSP, Orlando, Florida, USA, 2002:389-392.
8Robert W. Morris, Mark A. Clements. Reconstruction of speech from whispers. Medical Engineering ~ Physics,2002; 24(8): 515-520.
9Higashikawa M, Nakai K, Sakakura A, Takahashi H. Perceived pitch of whispered vowels-relationship with formant frequencies: a preliminary study. Journal of Voice,1996; 10(2): 155-158.
10Izmirli O. Using a spectral flatness based feature for audio segmentation and retrieval. In: Proc. International Symposium on Music Information Retrieval, Plymouth, USA,2000:100-101.

共引文献77

1茹婷婷,谢湘.耳语音数据库的设计与采集[J].清华大学学报（自然科学版）,2008,48(S1):725-729. 被引量：2
2LIXueli,XUBoling.Tone features in whispered Chinese[J].Progress in Natural Science:Materials International,2005,15(3):285-288. 被引量：5
3杨莉莉,李燕,徐柏龄.汉语耳语音库的建立与听觉实验研究[J].南京大学学报（自然科学版）,2005,41(3):311-317. 被引量：13
4林玮,杨莉莉,徐柏龄.基于修正MFCC参数汉语耳语音的话者识别[J].南京大学学报（自然科学版）,2006,42(1):54-62. 被引量：23
5樊星,卢晶,徐柏龄.汉语耳语音转换为正常音的研究[J].电声技术,2005,29(12):44-47. 被引量：11
6杨莉莉,林玮,徐柏龄.汉语耳语音孤立字识别研究[J].应用声学,2006,25(3):187-192. 被引量：8
7姜占才,袁海良.基于时域与小波域相结合的语音增强技术[J].青海师范大学学报（自然科学版）,2006,22(3):20-22.
8国雁萌,付强,颜永红.复杂噪声环境中的语音端点检测[J].声学学报,2006,31(6):549-554. 被引量：17
9施晓敏,顾济华,陶智,赵鹤鸣,张晓俊.基于听觉感知小波变换的电子耳蜗CIS语音信号处理[J].微电子学与计算机,2006,23(12):41-43. 被引量：3
10王欢良,韩纪庆,李海峰.基于特征似然度加权和维数缩减的Robust语音端点检测[J].声学学报,2007,32(1):62-68. 被引量：7

同被引文献16

1茹婷婷,谢湘.耳语音数据库的设计与采集[J].清华大学学报（自然科学版）,2008,48(S1):725-729. 被引量：2
2张翠玲,谭铁军,刘昇.伪装语音的自动话者识别研究[J].刑事技术,2007,32(2):18-21. 被引量：5
3戴朝华,朱云芳,陈维荣,林建辉.云遗传算法及其应用[J].电子学报,2007,35(7):1419-1424. 被引量：84
4Alireza R V, Ali H M. Solving a bi-criteria permutation flow-shop problem using shuffled frog-leaping algorithm [J]. Soft Computing, 2008, 12(5) : 435 -452.
5Eusuff M M, Lansey K E. Shuffled frog-leaping algo- rithm: a mimetic meta-heuristic for discrete optimization [J]. Engineering Optimization, 2006, 38 (2) : 129 - 154.
6Alireza R V, Ali H M. A hybrid multi-objective shuf- fled frog-leaping algorithm for a mixed-model assembly line sequencing problem [ J ]. Computers & Industrial Engineering, 2007, 53 (4) 642 - 666.
7Swope W C, Andersen H C, Berens P H, et al. A computer simulation method for the calculation of equi- librium constants for the formation of physical clusters of molecules: application to small water clusters [ J ]. Journal of Chemical Physics, 1982, 76( 1 ) : 637 -649.
8徐星,李元香,姜大志,汤铭端,方慎林.一种基于分子动理论的改进粒子群优化算法[J].系统仿真学报,2009,21(7):1904-1907. 被引量：10
9陈雪勤,赵鹤鸣.基于听觉模型的汉语耳语音声调检测[J].电子学报,2009,37(4):864-867. 被引量：5
10赵迎春,张劲松,韩晶晶,任芳,蔡汝刚.中国儿童情感评价图片库(7～14岁,上海版)的建立[J].中国儿童保健杂志,2009,17(3):290-292. 被引量：6

引证文献2

1张潇丹,包永强,奚吉,赵力,邹采荣.基于MD-CM-SFLA神经网络的耳语音情感识别[J].东南大学学报（自然科学版）,2012,42(5):848-853. 被引量：2
2龚呈卉,赵鹤鸣,陶智,张庆芳.全局谱参数下的耳语说话人状态因子分析[J].声学学报,2014,39(2):281-288. 被引量：1

二级引证文献3

1李佳芮,洪缨.喘鸣音的声谱图熵特征分析及检测[J].声学学报,2020,45(1):131-136. 被引量：3
2张前进,王华东.基于核典型相关分析和支持向量机的语音情感识别模型[J].南京理工大学学报,2017,41(2):191-197. 被引量：4
3晁萍瑶,王小敏.基于SFLA优化的RBF神经网络入侵检测算法[J].软件导刊,2017,16(8):50-52. 被引量：1

1蔡汉添,袁波涛.一种基于听觉掩蔽模型的语音增强算法[J].通信学报,2002,23(8):93-98. 被引量：16
2桑鹤平.基于听觉掩蔽模型和量化的音频水印算法[J].计算机与现代化,2008(7):72-74.
3彭浩辉,谢志文.掩蔽模型对语音增强效果影响的研究[J].电声技术,2008,32(9):56-60.
4桑鹤平,赵鹤鸣.基于听觉频率掩蔽效应的音频数字水印算法[J].计算机工程与应用,2008,44(9):101-103. 被引量：1
5马义德,邱秀清,陈昱莅,刘映杰,朱敬锋.改进的基于听觉掩蔽特性的语音增强[J].电子科技大学学报,2008,37(2):255-257. 被引量：8
6施化吉,唐慧,郑洪源,李星毅,丁秋林.一种自适应的同步音频水印算法[J].华南理工大学学报（自然科学版）,2008,36(9):59-63. 被引量：5
7吴俊,顾济华,陶智,赵鹤鸣,黄传霞.一种基于人耳掩蔽效应的DCT域音频水印[J].通信技术,2008,41(4):73-75. 被引量：3
8阔永红,陈健,杨昌方.基于听觉掩蔽效应的MMSE语音增强算法[J].计算机工程与应用,2007,43(27):140-141. 被引量：5
9孙静,陶智,顾济华,赵鹤鸣.基于AD神经网络的耳语音增强的研究[J].计算机工程与应用,2007,43(29):242-244. 被引量：2
10叶婷.小波变换在EEG噪声滤除中的应用[J].信息通信,2011,24(3):15-16. 被引量：1

声学学报

2009年第4期

浏览历史

内容加载中请稍等...

基于修正Mel域掩蔽模型和无语音概率的耳语音增强被引量：2

参考文献4

二级参考文献65

共引文献77

同被引文献16

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于修正Mel域掩蔽模型和无语音概率的耳语音增强 被引量：2

参考文献4

二级参考文献65

共引文献77

同被引文献16

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于修正Mel域掩蔽模型和无语音概率的耳语音增强被引量：2