一种基于加权Mel倒谱的语音信号共振峰提取算法被引量：6

A formant extraction algorithm of speech signal based on weighted Mel-cepstrum

下载PDF

导出

摘要提出了一种利用加权Mel倒谱提取语音信号共振峰的算法.首先对短时语音信号进行加权Mel倒谱分析,获得包含频谱主要成分的加权Mel倒谱系数;然后利用离散余弦平滑算法,从加权Mel倒谱系数获得谱包络,并从谱包络的峰值位置获得候选共振峰;最后根据共振峰的连续性约束条件和频率范围,从候选共振峰筛选得到共振峰的估计值.实验结果表明,本算法比倒谱法提取的共振峰误差更小,在噪声环境下具有较好的鲁棒性. This paper presents a method to realize formants extraction from speech signal.The weighted Mel-cepstrum coefficients（WMCC）,which contain main components of spectrum,are obtained from speech signal by using weighted Mel-cepstrum analysis.The discrete cosine transform （DCT） based smooth algorithm is then applied to the WMCCs to obtain the smooth contour of spectrum in which the peaks of contour are candidate formants.The formant frequencies are selected from candidate formants according to the continuity constrain and the frequency range of formants.Tests show that the errors of this method outperform the cepstrum based method.The method is also robust on noisy speech signal.

作者杨鸿武赵涛涛

机构地区西北师范大学物理与电子工程学院

出处《西北师范大学学报（自然科学版）》 CAS 北大核心 2014年第1期53-57,共5页 Journal of Northwest Normal University(Natural Science)

基金国家自然科学基金资助项目(61263036) 甘肃省杰出青年基金资助项目(1210RJDA007)

关键词加权Mel倒谱共振峰 DCT变换鲁棒性 weighted Mel-cepstrum formant DCT robustness

分类号 TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献9

1LU G,ZHAO H. Developments of the research ofthe formant tracking algrithm [ J ]. Computer andInformation Science, 2010,3(1) : 68-71.
2CODELLO I,KUNISZYK-JOZKOWIAK W.Formant paths tracking using linear prediction basedmethods [ J ]. Annales UMCS Informatica Al*2010, 10(2): 7-12.
3赵毅,尹雪飞,陈克安.一种新的基于倒谱的共振峰频率检测算法[J].应用声学,2010,29(6):416-424. 被引量：9
4KOISHIDA K, TOKUDA K, KOBAYASHI T, etal. CELP speech coding based on mel-generalizedcepstral analyses [ J ]. Electronics andCommunications in Japan , 2000, 83(5) : 32-41.
5HONGWU Y,HUANG D,LIANHONG C A I.Perceptually weighted melcepstrum analysis of speechbased on psychoacoustic model [ J ]. IEICEtransactions on information and systems, 2006,89(12): 2998-3001.
6黄德智,杨鸿武,蔡莲红.语音信号的加权mel倒谱分析[J].信号处理,2006,22(6):840-843. 被引量：4
7赵铭,崔慧娟,唐昆,杜文.谱包络参数的平滑算法[J].清华大学学报（自然科学版）,2005,45(4):448-451. 被引量：5
8陈宁,万茂文.语音信号共振峰频率估计的分段线性预测算法[J].计算机工程与应用,2009,45(28):156-159. 被引量：1
9DUCKWORTH M, MCDOUGALL K,DE JONGG,et al. Improving the consistency of formant mea-surement [J]. International Journal of SpeechLanguage and the Lazv , 2011, 18(1) : 35-51.

二级参考文献31

1黄海,陈祥献.基于Hilbert-Huang变换的语音信号共振峰频率估计[J].浙江大学学报（工学版）,2006,40(11):1926-1930. 被引量：12
2Heller P N,Karp T, Nguyen T Q.A general formulation of modulated filter banks [J].IEEE Transactions on Speech and Audio Processing, 1999,47 (4) : 986-1002.
3Johnston J D.A filter family designed for use in quadrature mirror filter banks [C]//Proe Int Conf Aeeoust Speech, Signal Proeessing, 1980: 291-294.
4Karp T,Fliege N J.Modified DFT filter banks with perfect reconstruction[J].IEEE T-CS:Analog and Digital Signal Processing, 1996,46( 11 ) : 1404-1414.
5Tran T D,De Queririoz R L.Linear-phase perfect reconstruction filter bank : Lattice structure, design, and application in image coding[J].IEEE T-SP, 2000,48( 1 ) : 133-147.
6何峰,陈晓清,李国锁,林嘉宇.一种新的语音信号共振峰提取的算法[J].信号处理,2007,23(4):618-621. 被引量：6
7徐长发李国宽.实用小波方法[M].武汉:华中科技大学出版社,2004..
8LeBlanc W P, Bhattacharya B, Mahmoud S A, et al.Efficient search and design procedures for robust multi-stage VQ of LPC parameters for 4 kb/s speech coding [J]. IEEE Transactions on Speech Audio Processing, 1993, 1(4): 373-385.
9Tsao C, Gray R M. Matrix quantizer design for LPC speech using the generalized Lloyd algorithm [J]. IEEE Transactions on Acoust, Speech, Signal Processing, 1985,33(3): 537-545.
10Xydeas C S, Papanastasiou C. Efficient coding of LSP parameters using split matrix quantization [A]. Proceedings of IEEE Inter Conf Acoustics, Speech and Signal Processing,Proceedings of ICASSP-1995 [C]. Detroit, MI, USA: IEEE Press, 1995. 740- 743.

共引文献14

1向波,唐昆,崔慧娟,魏旋,党晓妍.基于DCT变换的LSF参数降维算法[J].通信技术,2008,41(8):204-206. 被引量：4
2林睿,樊养余.人脸语音动画中语音特征参数提取算法研究[J].现代电子技术,2011,34(6):74-77. 被引量：1
3赵毅,尹雪飞,陈克安.一种基于共振峰提取的多通道响度补偿算法[J].信号处理,2012,28(3):352-360. 被引量：7
4周群群,马泳,王盛青,王宏远.最佳相位设计的MBE声码器语音合成[J].计算机与数字工程,2012,40(9):21-23.
5魏政,尹雪飞,陈克安.可实现听觉场景匹配的智能数字助听器算法[J].声学技术,2012,31(5):511-516. 被引量：1
6常亮,徐敬德,崔慧娟,唐昆.基于SELP的150b／s语音压缩编码算法[J].清华大学学报（自然科学版）,2013,53(7):967-971. 被引量：2
7高婉贞,张玲华,曹旭来,李云天.基于GSC结构的多通道语音补偿算法研究[J].南京邮电大学学报（自然科学版）,2014,34(4):51-56. 被引量：1
8赵涛涛,杨鸿武.结合EMD和加权Mel倒谱的语音共振峰提取算法[J].计算机工程与应用,2015,51(9):207-212. 被引量：7
9刘强,陈福兰.基于倒谱与BP网络的船舶生活垃圾分类方法研究[J].南通航运职业技术学院学报,2016,15(1):34-38. 被引量：2
10杨鸿武,张帅,丁朋程.基于FPGA的Mel倒谱系数提取方法设计与实现[J].仪表技术与传感器,2017(3):82-85.

同被引文献42

1王坤赤,蒋华.一种基于语音频谱的基频和共振峰提取算法[J].信息技术,2007,31(10):20-22. 被引量：2
2肖宪波,王宁宇,胡广书.数字助听器中若干主要算法的发展和现状[J].生物医学工程学杂志,2004,21(4):694-698. 被引量：20
3赵铭,崔慧娟,唐昆,杜文.谱包络参数的平滑算法[J].清华大学学报（自然科学版）,2005,45(4):448-451. 被引量：5
4陶智,赵鹤鸣,龚呈卉.基于听觉掩蔽效应和Bark子波变换的语音增强[J].声学学报,2005,30(4):367-372. 被引量：39
5赵毅,尹雪飞,陈克安.一种新的基于倒谱的共振峰频率检测算法[J].应用声学,2010,29(6):416-424. 被引量：9
6陈广飞,应俊.数字助听器宽动态压缩算法研究[J].北京生物医学工程,2006,25(5):454-456. 被引量：9
7黄德智,杨鸿武,蔡莲红.语音信号的加权mel倒谱分析[J].信号处理,2006,22(6):840-843. 被引量：4
8何峰,陈晓清,李国锁,林嘉宇.一种新的语音信号共振峰提取的算法[J].信号处理,2007,23(4):618-621. 被引量：6
9Smit T,Türckheim F,Mores R.Fast and robust formant detection from LP data[J].Speech Communication,2012,54(7):893-902.
10Codello I,Kuniszyk-Jozkowiak W.Formant paths tracking using linear prediction based methods[J].Annales UMCS Informatica AI,2010,10(2):7-12.

引证文献6

1赵涛涛,杨鸿武.结合EMD和加权Mel倒谱的语音共振峰提取算法[J].计算机工程与应用,2015,51(9):207-212. 被引量：7
2杨臻.语音信号准确性识别仿真研究[J].计算机仿真,2017,34(2):285-288. 被引量：5
3韩芳,郑晶晶.基于LPC的共振峰检测改进算法[J].电子设计工程,2017,25(17):85-89. 被引量：2
4姚旺,张凤翔,骆天宇.基于人听觉机理的宽动态压缩算法的仿真实验[J].电子制作,2016,24(3X):26-28.
5杨建香,佘玉梅,傅美君,和丽华,解雪琴,潘文林.基于自适应变分模态分解的佤语孤立词共振峰估计[J].云南民族大学学报（自然科学版）,2019,28(3):297-305. 被引量：1
6李如玮,代凯璇,刘尚枫.基于人耳听觉特性的非线性频率压缩方法[J].北京工业大学学报,2021,47(10):1122-1128.

二级引证文献14

1杨臻.语音信号准确性识别仿真研究[J].计算机仿真,2017,34(2):285-288. 被引量：5
2韩芳,郑晶晶.基于LPC的共振峰检测改进算法[J].电子设计工程,2017,25(17):85-89. 被引量：2
3黄春燕,景妮洁,祝红梅.语音信号的MATLAB分析与处理[J].计算机科学,2018,45(B06):555-558. 被引量：2
4李云红,梁思程,贾凯莉,张秋铭,宋鹏,何琛,王刚毅,李禹萱.一种改进的DNN-HMM的语音识别方法[J].应用声学,2019,38(3):371-377. 被引量：17
5杨建香,佘玉梅,傅美君,和丽华,解雪琴,潘文林.基于自适应变分模态分解的佤语孤立词共振峰估计[J].云南民族大学学报（自然科学版）,2019,28(3):297-305. 被引量：1
6潘涛,王胜利.基于不同算法的语音信号共振峰提取研究与实现[J].甘肃科技,2019,35(22):23-26.
7曾霞,李霜.语音信号声纹识别的研究和仿真[J].新一代信息技术,2019,2(16):61-65. 被引量：1
8王晓岩.机电一体化系统振动信号自适应分解方法研究[J].自动化应用,2020(4):28-29. 被引量：1
9田维维,周悦,尹旺,何凌,邓丽华,李元媛.结合EHHT和CI的精神分裂症语音自动检测算法[J].计算机科学,2020,47(S01):187-195.
10姜囡.伪装语音GFCC与共振峰混合特征的提取与识别[J].中国刑警学院学报,2020(5):122-128. 被引量：1

1刘亚丽,杨鸿武,黄德智.基于加权Mel倒谱系数的说话人识别[J].计算机应用与软件,2009,26(9):24-27. 被引量：3
2赵丽华,王鹏宇.基于Matlab的非时域端点检测算法的实现与分析[J].科学技术与工程,2010,10(35):8822-8825.
3张震,王化清.语音信号特征提取中Mel倒谱系MFCC的改进算法[J].计算机工程与应用,2008,44(22):54-55. 被引量：29
4庞陟儒,张雪英,刘晓峰.基于PCA-MFCC支持向量机快速语音识别[J].科学技术与工程,2013,21(4):1034-1036. 被引量：1
5孙林慧,李平安.基于倒谱加权的说话人识别技术[J].西安邮电学院学报,2006,11(3):9-12.
6伟利国,张小超,吴文彪.鸟鸣叫声特征提取方法的研究[J].辽宁师范大学学报（自然科学版）,2010,33(1):108-111. 被引量：3
7柯晶晶,周萍,景新幸,杨青.差分和加权Mel倒谱混合参数应用于说话人识别[J].微电子学与计算机,2014,31(9):88-91. 被引量：14
8熊伟,罗云贵.语音识别的MFCC算法研究[J].现代商贸工业,2010,22(3):291-292. 被引量：2
9鄢田云,云霞,靳蕃,朱庆军.RBF神经网络及其在基于输出的客观音质评价中的应用[J].电子学报,2004,32(8):1282-1285. 被引量：7
10李玉鼎.语音信号特征提取中Mel倒谱系MFCC算法的讨论[J].高等函授学报（自然科学版）,2012,25(4):78-80. 被引量：2

西北师范大学学报（自然科学版）

2014年第1期

浏览历史

内容加载中请稍等...

一种基于加权Mel倒谱的语音信号共振峰提取算法被引量：6

参考文献9

二级参考文献31

共引文献14

同被引文献42

引证文献6

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

一种基于加权Mel倒谱的语音信号共振峰提取算法 被引量：6

参考文献9

二级参考文献31

共引文献14

同被引文献42

引证文献6

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

一种基于加权Mel倒谱的语音信号共振峰提取算法被引量：6