基于一种新特征参数的说话人识别被引量：4

Speaker recognition based on a new feature parameter

下载PDF

导出

摘要针对传统的特征参数Mel频域倒谱系数MFCC难以满足语音信号的非平稳性问题,提出一种基于小波分析的新特征参数FPBW的提取方法.为了提高训练速度,采用正交高斯混和模型,将正交变换改到最大期望EM算法之前进行,从而减少训练时间.实验结果表明,新的特征参数FPBW优于特征参数MFCC,并且采用正交高斯混合模型进一步提高了识别性能和训练速度. Aimed at the problem that the traditional feature parameters MFCC （reel-frequency ceptrum coefficients） was hard to satisfy the non-stationary characteristic of speech signal, a method was proposed for extraction of a new feature parameter FPBW based on wavelet analysis. In order to improve training speed, an orthogonal Guass mixture model （OGMM） was employed in order that the orthogonal transform was to be performed before the use of expectation maximization algorithm, so that the training time was reduced. The experiment results showed that a new feature vector FPBW was better than MFCC, and the OGMM could further improve the recognition performance and training speed.

作者陈若珠曾番李战明

机构地区兰州理工大学电气工程与信息工程学院

出处《兰州理工大学学报》 CAS 北大核心 2008年第1期68-71,共4页 Journal of Lanzhou University of Technology

基金甘肃省信息化专项基金

关键词说话人识别 MFCC FPBW正交高斯混合模型 speaker recognition MFCC FPBW orthogonal Gauss mixture model

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献10

1LIU L, HE J. On the use of orthogonal GMM in speaker recognition [C/OL], 1999-02 [2007-05]3. http://ieeexplore. ieee. org/xpl/RecentCon.jsp? punumber=6110.
2邱政权,尹俊勋,薛丽萍.基于DWT-TEO的说话人识别[J].自动化学报,2006,32(5):753-759. 被引量：5
3汪峥,连翰,王建军.说话人识别中特征参数提取的一种新方法[J].复旦学报（自然科学版）,2005,44(1):197-200. 被引量：16
4刘雅琴,裘雪红.应用小波包变换提取说话人识别的特征参数[J].计算机工程与应用,2006,42(9):67-69. 被引量：15
5GOWDY J N,TUFEKCI Z. Mel-Sealed Discrete Wavelet Coefficients for Speech Recognition [C/OL]. 2000-03 [2007-05]. http://ieeexplore. ieee. org/xpl/ReeentCon. jsp? punumber= 6939.
6BADRI N, BENLAHOUAR A, TADY C, et al. on the use of wavelet and fourier transforms for speaker verification [C/ OL]. 2002-03 [2007-05]. http://ieeexplore. ieee. org/xpl/RecentCon. jsp? punumber=8452.
7李战明,陈迪.一种基于小波神经网络混合模型的说话人识别方法[J].兰州理工大学学报,2007,33(2):77-80. 被引量：3
8FAROOQ O, DATTA S. Mel filter-like admissible wavelet packet structure for speech recognition [J]. IEEE Signal Processing Letters, 2001,8 (7): 196-198.
9ANTONINI M, BARI.AUD M, MATHIEU P, et al. Image ceding using wavelet transform [J]. Image Processing, IEEE Transactions on Valbonne, 1992,1 (2) : 205-220.
10陈若珠,李战明,王贞.基于组合神经网络的与文本无关的说话人识别[J].兰州理工大学学报,2006,32(3):78-81. 被引量：2

二级参考文献28

1楼红伟,胡光锐.基于Teager能量算子和小波变换的语音识别特征参数[J].上海交通大学学报,2003,37(z1):83-85. 被引量：2
2李苇营,易克初,胡征.神经网络与HMM构成的混合网络在语音识别中应用的研究[J].电子学报,1994,22(10):73-80. 被引量：8
3林遂芳,潘永湘,孙旭霞.基于HMM和小波网络模型的抗噪语音识别方法[J].系统仿真学报,2005,17(7):1720-1723. 被引量：13
4边肇祺.模式识别[M].清华大学出版社,1999..
5Gowdy J N, Tufekci Z. Mel-Scaled discrete wavelet coefficients for speech recognition [EB/OL]. http:∥ieeexplore.ieee.org/ie15/6939/18687/00861829.pdf, 2000-06-01/2004-02-06.
6Torres H M, Rufiner H L. Automatic speaker identification by means of Mel cepstrum, wavelets and wavelet packets [EB/OL]. http:∥ieeexplore.ieee.org/ie15/7218/19434/00897886.pdf, 2000-07-01/2004-02-08.
7Farooq O, Datta S. Mel filter-Like admissible wavelet packet structure for speech recognition [J]. IEEE Signal Processing Letters, 2001, 8(7): 196-198.
8Reynodls D, Rose R. Robust text-independent speaker identification using Gaussian mixture speaker models [J]. IEEE Trans on Speech and Audio processing, 1995, 3(1): 72-83.
9HaykinS.神经网络的综合基础[M].北京:清华大学出版社,培生教育集团,2001..
10刘贵忠,邸双亮.小波分析及应用[M].第一版,西安:西安电子科技大学出版社,1992

共引文献33

1陈杰,张玲华.说话人识别中语音特征参数的研究[J].信息技术,2006,30(11):88-89. 被引量：6
2胡文吉,王让定.基于小波包分析的特征参数提取[J].宁波大学学报（理工版）,2007,20(1):51-54. 被引量：3
3朱浩冰,郭东辉.声纹识别系统原理及其关键技术[J].计算机安全,2007(9):14-17. 被引量：15
4陈杰,张玲华,吴玺宏.基于小波包-LPCC的说话人识别特征参数[J].南京邮电大学学报（自然科学版）,2007,27(6):54-56. 被引量：5
5陈静,张飞云.基于小波包变换和MFCC的说话人识别特征参数[J].电声技术,2009,33(2):49-51. 被引量：3
6张广兰.声纹识别的关键技术及发展趋势[J].中国新技术新产品,2009(8):10-10. 被引量：3
7范小春,邱政权.基于KLT算法和MMCE的说话人识别[J].计算机工程与应用,2009,45(15):194-195.
8杨建华,于小宁.说话人识别中语音特征参数研究[J].大理学院学报（综合版）,2009,8(8):32-35. 被引量：5
9刘雅琴,智爱娟.几种语音识别特征参数的研究[J].计算机技术与发展,2009,19(12):67-70. 被引量：19
10李战明,林娟,陈若珠.基于改进的小波阈值去噪和二级判断模型的说话人识别[J].兰州理工大学学报,2010,36(1):78-81. 被引量：2

同被引文献35

1龙艳花,郭武,戴礼荣.用于SVM说话者确认系统的序列核[J].清华大学学报（自然科学版）,2008,48(S1):688-692. 被引量：1
2郭武,戴礼荣,王仁华.采用UBM更新量作为支持向量机特征的说话人确认[J].清华大学学报（自然科学版）,2008,48(S1):704-707. 被引量：4
3陈虎虎,钟方平,许学忠,董明荣.基于支持向量机的低空飞行目标声识别[J].系统工程与电子技术,2005,27(1):46-48. 被引量：11
4林坤辉,息晓静,周昌乐.基于HMM与神经网络的声学模型研究[J].厦门大学学报（自然科学版）,2006,45(1):44-46. 被引量：13
5陈功,张雄伟,邓玉良.基于HMM与K-均值聚类的声目标识别[J].弹箭与制导学报,2006,26(2):144-147. 被引量：5
6朱志松.战场声目标特征提取研究[J].探测与控制学报,2006,28(3):9-11. 被引量：12
7李玉,于凤芹,杨慧中,李从宏.基于新的阈值函数的小波阈值去噪方法[J].江南大学学报（自然科学版）,2006,5(4):476-479. 被引量：7
8郝征科,魏明果.基于小波包变换的说话人语音特征参数的提取[J].三峡大学学报（自然科学版）,2006,28(4):374-376. 被引量：2
9Farooq O,Datta S.Mel filter-like admissible wavelet packet structure for speech recognition[J].IEEE Signal Processing Letters,2001,8(7):196-198.
10Farooq O,Datta S.Mel Filter-Like Admissible Wavelet Packet Structure For Speech Recognition[J|.IEEE Signal Processing Letters,2001,8(7):196-198.

引证文献4

1曾番,鹿光,李国宏.基于小波包分析的战场被动声目标特征提取[J].弹箭与制导学报,2010,30(2):240-242. 被引量：1
2张昊慧.基于小波包分解的抗噪说话人识别特征参数[J].通信技术,2010,43(12):144-146. 被引量：1
3曾番.小波包分析与能量算子结合的声目标特征参数[J].探测与控制学报,2010,32(6):54-58. 被引量：9
4谭萍,邢玉娟.基于GMM超向量和Fisher-稀疏表示分类的说话人确认[J].青海大学学报（自然科学版）,2016,34(1):51-57. 被引量：2

二级引证文献13

1陈金燕,邹俊忠,张见.基于小波变换和Teager能量算子的癫痫脑电自动分类[J].生物医学工程学进展,2012,33(3):147-151. 被引量：2
2祝鹏,王成儒.小波包变换与Teager能量算子结合的说话人识别[J].计算机工程与应用,2013,49(9):187-189. 被引量：2
3童强,李辉,方昕.基于韵律特征的说话人确认系统融合研究[J].通信技术,2013,46(11):90-94.
4李国,韩学良,段钢.飞机噪声识别方法研究及FPGA固化实现[J].计算机工程与设计,2014,35(3):835-840.
5王少锋,王戈,王建国,高琳.基于小波包熵与EMD的能量算子解调机械故障诊断[J].机械设计与制造,2015(10):217-220. 被引量：3
6王建国,王戈,王少锋,张玉皓,刘永亮,仲济祥.基于小波包自相关的能量算子旋转机械故障诊断[J].河南理工大学学报（自然科学版）,2016,35(1):90-94. 被引量：2
7王少锋,王戈,王建国,仲济祥.基于EMD与自相关的能量算子解调机械故障诊断[J].机械设计与制造,2016(6):174-178. 被引量：6
8周鹏,郑日荣.提升小波变换与Teager能量算子结合在睡眠分期的研究[J].电子世界,2016,0(14):90-91.
9王建国,王戈,王少锋,高琳,仲济祥.基于一种EEMD的能量算子解调机械故障诊断[J].兰州理工大学学报,2016,42(6):43-47.
10曾番,黄文龙,夏伟鹏,冯卉.小波包特征能量算子与多核函数组合KPCA的声目标识别[J].电光与控制,2017,24(4):5-7. 被引量：3

1姚磊.基于图像块的EM自适应图像去噪算法[J].科技广场,2017(2):14-17.
2董兰芳,余家奎.基于图像分离的视频烟雾检测方法[J].计算机工程,2015,41(9):251-254. 被引量：4
3陈菲,王刚.一种用于独立分量分析的准最大期望算法研究[J].四川大学学报（自然科学版）,2008,45(6):1347-1351.
4张瑜慧,吴江梅,孙莹,刘海朦.基于高斯混和模型与Blob分析的人手定位[J].科学技术与工程,2013,21(31):9371-9374. 被引量：4
5黎佳.CAT选题策略研究[J].重庆科技学院学报（自然科学版）,2014,16(3):115-117.
6孙广玲,沈宙彪.基于多组耦合字典及交替学习的图像超分辨率重建[J].应用科学学报,2012,30(6):642-648. 被引量：2
7王梦灵,李柠,李少远.带有测量噪声的Ⅱ型T-S模糊建模[J].系统工程与电子技术,2008,30(10):1957-1961. 被引量：4
8李蓉.一种改进的基于正交GMM的说话人辨识方法[J].华东交通大学学报,2007,24(5):77-80.
9毛少武,张焕国,黄崇超,吴万青.改进的K最短路径算法在通信网络中的应用[J].武汉大学学报（理学版）,2013,59(6):534-538. 被引量：11
10胡海波,傅鹂,向宏,周元,刘晓艳.基于贝叶斯算法与高斯混和模型的语者确认研究[J].计算机工程与应用,2007,43(29):225-227.

兰州理工大学学报

2008年第1期

浏览历史

内容加载中请稍等...

基于一种新特征参数的说话人识别被引量：4

参考文献10

二级参考文献28

共引文献33

同被引文献35

引证文献4

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

基于一种新特征参数的说话人识别 被引量：4

参考文献10

二级参考文献28

共引文献33

同被引文献35

引证文献4

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

基于一种新特征参数的说话人识别被引量：4