基于矢量量化方法的说话人识别技术

Speaker Recognition Technology Based on VQ

下载PDF

导出

摘要说话人识别是一项通过语音来识别说话人身份的技术,它在保安、司法、军事、财经和信息服务等领域都具有广泛的应用前景。该文采用线性预测倒谱系数和美尔倒谱系数特征相结合,基于矢量量化聚类方法建立了一个与文本无关的、连续语音发音的说话人识别系统。只要矢量量化聚类法码本大小选择合适,该说话人识别系统就可以获得较好的识别效果。当阈值恰当选取时,该系统具备拒绝识别集外人的功能。 Speaker recognition is a kind of technology to judge the speaker＇s identify according to his voice. It has good prospect in many areas such as security, judicatory, and military. One speaker identification system by extracting MFCC as feature vector and using VQ in match phase is constructed. The results of the experiment indicate that, the speaker recognition model based on VQ is effective; the advantage is correct classifying, small memory need and rapid judging.

作者张一清李轶

机构地区杭州电子科技大学自动化学院

出处《杭州电子科技大学学报（自然科学版）》 2005年第4期58-61,共4页 Journal of Hangzhou Dianzi University：Natural Sciences

关键词矢量量化说话人识别线性预测倒谱系数美尔倒谱系数 vector quantization（VQ） speaker identification LPCC cepstrum MFCC cepstrum

分类号 TP914.32 [自动化与计算机技术]

引文网络
相关文献

参考文献4

1Campbell J P. Speaker Recognition: A Tutorial[J]. Proceedings of IEEE, 1997, 85(9): 1437 - 1462.
2王让定,柴佩琪.语音倒谱特征的研究[J].计算机工程,2003,29(13):31-33. 被引量：50
3韩雁,陈利华.说话人计算机识别系统的设计与实现[J].浙江大学学报（工学版）,2001,35(2):165-169. 被引量：3
4陆哲明,潘正祥,孙圣和.一种矢量量化码书搜索的快速算法[J].电子学报,2000,28(2):133-135. 被引量：9

二级参考文献12

1周汀,闵昊,章倩苓.一种矢量量化编码的加速算法[J].电子学报,1997,25(4):95-98. 被引量：6
2Huang Xuedong, Acero A, Hon H W. Spoken Language Processing.Prentice Hall,2001.
3Young S, Kershaw D, Odell J, et al. The HTK Book.Microsoft Corporation &CUED,2000.
4Duda R O, Hart P E, Stork D G. Pattern Classification (Second Edition). A Wiley-interscience Publication, 2001.
5Wendt S, Fink G A, Kummert F. Forward Masking for Increased Robustness in Automatic Speech Recognition. in: Proc. of European Conf. on Speech Communication and Technology, Aalborg,Danemark, 2001,1:615-618.
6Hermansky H. Perceptual Linear Predictive(PLP) Analysis for Speech.J Acoust Soc Am ,1990,87:1738-1752.
7Chang Hsinglee，Signal Processing，1995年，43卷，323页
8Chang Dabei，IEEE Trans Commun，1985年，33卷，10期，1132页
9Rabiner L Juang Biing-Hwang.Fundamentals of Speech Recognition[M].北京：清华大学出版社（影印版）,1999..
10杨行峻迟惠生等.语音数字信号处理[M].北京:电子工业出版社,1995..

共引文献57

1孙圣和,陆哲明,刘春和.快速最近邻矢量量化码字搜索算法[J].电子学报,2001,29(z1):1772-1777. 被引量：3
2张超琼,苗夺谦,岳晓冬.基于高斯混合模型的语音性别识别[J].计算机应用,2008,28(S2):360-362. 被引量：1
3李战明,王贞.基于小波包分析特征参数的说话人识别系统[J].电声技术,2005,29(6):46-49. 被引量：5
4木春梅,蒋建国,齐美彬.一种矢量量化的快速码字搜索算法[J].合肥工业大学学报（自然科学版）,2006,29(3):288-291. 被引量：4
5林琳,王树勋,王秀丽.基于DSP开集说话人识别系统的实时实现[J].吉林大学学报（信息科学版）,2006,24(3):252-258. 被引量：2
6左洪.用户的需求是创新的源泉[J].软件世界,2006(11):38-38.
7陈若珠,李战明,王贞.基于组合神经网络的与文本无关的说话人识别[J].兰州理工大学学报,2006,32(3):78-81. 被引量：2
8钟建,戴卫国.基于隐马尔可夫模型的舰船辐射噪声目标识别[J].青岛大学学报（自然科学版）,2006,19(2):34-37. 被引量：2
9侯雪梅,张雪英,赵高峰.一种改进的基于LP倒谱特征的孤立词语音识别方法[J].太原理工大学学报,2006,37(5):508-510. 被引量：2
10陈伯胜,廖海洋.一种在单片机上提取语音特征参数MFCC的快速算法[J].现代电子技术,2007,30(2):47-48. 被引量：1

1魏星,周萍.语音识别系统及其特征参数的提取研究[J].计算机与现代化,2009(9):167-168. 被引量：5
2王倩.语音特征的神经网络识别[J].武汉工程职业技术学院学报,2006,18(1):65-69.
3黄亚娟,郑林.一种新的抗噪语音特征的提取[J].微电子学与计算机,2011,28(10):215-216.
4安玲玲,于雷.基于高斯混合模型的心音信号识别[J].吉林大学学报（理学版）,2016,54(5):1096-1102. 被引量：5
5张学锋,王芳,夏萍.融合LPC与MFCC的特征参数[J].计算机工程,2011,37(4):216-217. 被引量：8
6于明,袁玉倩,董浩,王哲.一种基于MFCC和LPCC的文本相关说话人识别方法[J].计算机应用,2006,26(4):883-885. 被引量：14
7胡文吉,王让定.基于小波包分析的特征参数提取[J].宁波大学学报（理工版）,2007,20(1):51-54. 被引量：3
8刘晋胜,周靖.基于并行遗传算法的说话人识别系统设计[J].信息技术,2009,33(8):68-70. 被引量：1
9孟祥斌,尹常永,包妍.语音识别系统中的特征参数提取过程研究[J].沈阳工程学院学报（自然科学版）,2009,5(4):370-372. 被引量：3
10刘宏,刘立群.改进的美尔倒谱系数用于说话人识别研究[J].计算机工程与应用,2012,48(8):155-157. 被引量：3

杭州电子科技大学学报（自然科学版）

2005年第4期

浏览历史

内容加载中请稍等...

基于矢量量化方法的说话人识别技术

参考文献4

二级参考文献12

共引文献57

相关作者

相关机构

相关主题

浏览历史