基于ERB尺度划分的多子带语声信号抗噪谱减算法被引量：1

A multi-band anti-noise spectral subtraction algorithm using ERB scale

下载PDF

导出

摘要为了研究心理声学在语声增强方面的应用,本文提出了一种基于等效矩阵带宽(ERB)尺度划分的多子带语声信号抗噪谱减算法。此算法根据ERB尺度将带噪信号的频谱划分成多个子带,然后再根据每个子带的分段信噪比以及心理声学掩蔽原则分别计算每个子带的谱减参数,最后在每个子带中分别进行谱减算法处理。实验结果表明,应用新算法所获得的语声增强结果在信噪比、IS失真以及PESQ方面均优于之前提出的多子带语声信号抗噪谱减算法。 This paper addresses a multi-band spectral subtraction algorithm based on equivalent rectangular bandwidth(ERB)scale for applying psychoacoustics to speech enhancement.In the proposed algorithm,the whole spectrum of noisy speech is divided into multiple bands based on ERB scale.The subtraction parameters are then calculated according to the segment SNR of each band and psychoacoustics criteria.Finally,spectral subtraction with different subtraction parameters is executed in each band.The measurements of SNR improvement,IS distortion and PESQ show that the proposed algorithm outperforms the previous speech enhancement algorithms.

作者周挺挺曾毓敏王蓉蓉卞乐 ZHOU Tingting;ZENG Yumin;WANG Rongrong;BIAN Le(School of Physics and Technology, Nanjing Normal University, Nanjing 210000, China)

机构地区南京师范大学物理科学与技术学院

出处《应用声学》 CSCD 北大核心 2017年第3期212-219,共8页 Journal of Applied Acoustics

基金江苏省科技项目(BE2014139)

关键词 ERB尺度心理声学掩蔽多子带谱减 ERB scale Psychoacoustic masking Multi-band spectral subtra

分类号 TN912.35 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献2

1Navneet Upadhyay,Abhijit Karmakar.Single-Channel Speech Enhancement Using Critical-Band Rate Scale Based Improved Multi-Band Spectral Subtraction[J].Journal of Signal and Information Processing,2013,4(3):314-326. 被引量：1
2刘敏,曾毓敏,张铭,李晨.基于二次相关的语音信号时延估计改进算法[J].应用声学,2016,35(3):255-264. 被引量：16

二级参考文献13

1唐娟,行鸿彦.基于二次相关的时延估计方法[J].计算机工程,2007,33(21):265-267. 被引量：48
2RYAN J G, GOUBRAN R A. Application of near-field optimum microphone arrays to hands-free mobile tele- phone[J]. IEEE Transactions on Vehic-ular Technology, 2003, 52(2): 390-400.
3KNAPP C H, CARTER G C. The generalized correla- tion method for estimation of time delay[J]. IEEE Trans. Acoust, Speech, Signal Processing, 1976, 24(8): 320-327.
4WIDROW B, STEARNS D. Adaptive signal process- ing[M]. Englewood Cliffs: Prentice-Hall. Inc., 1993.
5LU B, FENG C, LONG G. A new varible step-size LMS adaptive based on marr function[C]//IEEE, International Conference on. Information Technology and Applications (ITA), 2013: 214-217.
6POURMOHAMMAD A, AHADI S M. N-dimensional N- microphone sound source localization[J]. EURASIP Jour- nal on Audio, Speech, and Music Processing, 2013, 201a(1): 27.
7HUANG N E, SHEN Z, LONG S R. The empirical mode decomposition and the Hilbert spectrum for nonlinear and nonstationary time series analysis[J]. Proceedings of the Royal Society of London series A, 1998, 454(1971): 903-995.
8TAMIM N S M, GHANI F. Hilbert transform of FFT pruned cross correlation function for optimization in time delay estimation[C]//IEEE 9th Malaysia International Conference on Communications (MICC), IEEE, 2009: 811-812.
9ALLEN J B, BERKELY D A. Image method for efficiently simulating small room acoustics[J]. Journal of Acoustical Society of America, 1979, 65(4): 943-950.
10International Audio Laboratories Erlangen. Rir generator [EB/OL]. [2015-07-21]. https://www.audiolabs-erlangen. de/fau/professor/habets/software/rir-generator.

共引文献15

1朱超,屈晓旭,娄景艺.一种新的广义二次相关时延估计算法[J].舰船电子对抗,2018,41(5):53-58. 被引量：4
2张宇,严天峰.基于SCOT双加权二次相关的时延估计算法[J].全球定位系统,2018,43(5):53-57. 被引量：3
3李均浩,刘文红.一种改进的非整数自适应时延估计方法[J].应用声学,2019,38(2):253-260. 被引量：1
4张亚斌,赵哲,颜康,白嵩,李胜全,朱建军.基于三阶累积量的水声信号时延估计研究[J].黑龙江大学自然科学学报,2019,36(2):227-233. 被引量：5
5钱隆彦,陈卫松,肖梦迪.基于广义二次互相关的低信噪比信号时延估计[J].无线电通信技术,2020,46(1):93-97. 被引量：11
6郭培培,李建良.音频无人机定位的时延估计模拟分析[J].声学技术,2020,39(5):650-654. 被引量：2
7李登峰,张修靖,蒋杨杨,李思琦.基于三阶累积一维分量的广义二次互相关时延估计[J].电子设计工程,2021,29(22):1-5. 被引量：1
8屈顺彪,俞华,芦竹茂,申冲,韩钰,王晨光.面向声源定位的改进广义互相关时延估计方法[J].导航定位与授时,2021,8(6):118-124. 被引量：6
9王雪峰,张自豪,陈兴稣,王元庆.基于二次相关法的非视域物体定位研究[J].激光与红外,2022,52(4):530-536. 被引量：2
10罗乐,于玲.石油管道盗取定位中的时延估计算法[J].电脑知识与技术,2022,18(13):109-112. 被引量：1

同被引文献6

1栾少文,龚卫国.公共场所典型异常声音的特征提取[J].计算机工程,2010,36(7):208-210. 被引量：16
2张伟豪,许枫.基于ERB尺度的心理声学模型及其数值计算[J].声学技术,2011,30(2):161-166. 被引量：6
3尹辉,谢湘,匡镜明.基于听觉模型与自适应分数阶Fourier变换的声学特征在语音识别中的应用[J].声学学报,2012,37(1):97-103. 被引量：14
4周强,张晓俊,顾济华,赵鹤鸣,朱俊杰,陶智.嗓音多频带非线性分析的声带病变识别[J].声学学报,2014,39(1):111-118. 被引量：11
5李伟红,田真真,龚卫国,王伟冰.改进的ESMD用于公共场所异常声音特征提取[J].仪器仪表学报,2016,37(11):2429-2437. 被引量：18
6樊晓鹤,赵鹤鸣,陈雪勤,周燕.倒谱参数稀疏分解下的汉语音谎言检测[J].声学学报,2018,43(1):121-128. 被引量：4

引证文献1

1李伟红,王伟冰,龚卫国.低信噪比下公共场所异常声音声学特征提取[J].声学学报,2019,44(5):934-944. 被引量：4

二级引证文献4

1孙袖山,李剑,贺斌,庞润嘉,马翊翔,郭锦铭.基于ZYNQ的枪声识别系统设计[J].电子测量技术,2023,46(2):1-6. 被引量：2
2李林桦,王学渊,李小霞.融合多维时频特征的环境声识别[J].制造业自动化,2021,43(6):49-52.
3张永梅,孙捷.基于动静态特征双输入神经网络的咳嗽声诊断COVID-19算法[J].电子学报,2023,51(1):202-212. 被引量：2
4王彦麟,孙静,杨宏波,郭涛,潘家华,王威廉.基于时频融合特征的肺动脉高压心音分类模型[J].计算机科学,2024,51(S01):375-381.

1李洋,李双田.稀疏重构的压缩感知语声增强模型与算法[J].信号处理,2013,29(9):1120-1126. 被引量：2
2胡奎,梁维谦.基于听觉场景分析的近讲语音增强算法[J].清华大学学报（自然科学版）,2011,51(9):1176-1179. 被引量：1
3曾学文,侯自强.MPEG音频编码的高效算法研究及单片DSP实现[J].应用声学,2000,19(1):8-15. 被引量：2
4连兵,黄杰,王宏禹.自适应噪声抵消语声增强的实时后处理算法[J].大连理工大学学报,1996,36(1):94-99.
5王仁华.语声身份确认系统[J].高技术通讯,1991,1(6):12-15.
6IS China 2004于5月12日至14日在上海开展[J].音响世界,2004(5):61-61.
7蒋毅,刘润生,冯振明.基于听感知特性的双麦克风近讲语音增强算法[J].清华大学学报（自然科学版）,2014,54(9):1179-1183. 被引量：1
8罗小布.三网融合、观念、NGB和电视商业模式＆迎合百姓心理，应对“三网融合”[J].世界广播电视,2010,24(9):87-87.
9吴峰燕,李志华.基于小波包分解和噪声分析的抗噪说话人识别特征参数[J].计算机与现代化,2009(1):113-115.
10雷建军,杨震,刘刚,郭军.基于短时谱估计的语音增强研究[J].计算机工程与应用,2008,44(32):6-9. 被引量：11

应用声学

2017年第3期

浏览历史

内容加载中请稍等...

基于ERB尺度划分的多子带语声信号抗噪谱减算法被引量：1

参考文献2

二级参考文献13

共引文献15

同被引文献6

引证文献1

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于ERB尺度划分的多子带语声信号抗噪谱减算法 被引量：1

参考文献2

二级参考文献13

共引文献15

同被引文献6

引证文献1

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于ERB尺度划分的多子带语声信号抗噪谱减算法被引量：1