GMM文本无关的说话人识别系统研究被引量：27

Research on GMM text-independent speaker recognition

下载PDF

导出

摘要在高斯混合模型(Gaussian Mixture Model,GMM)训练时,对传统的模型参数初始化方法(随机法、K均值聚类法)进行改进,提出分裂法与K均值聚类相结合的新方法。实验表明,采用改进的方法与传统方法相比,系统平均识别率有15.47%和7.5%的提高。研究了GMM的阶数、协方差阈值、预加重系数对系统识别率的影响。对实验结果进行详细分析,并根据实验数据,取它们各自表现最好的值,从而使构建的说话人识别系统获得一个较高的识别率。实验表明,在规定的实验条件下,系统可达到90%以上的识别率。 This paper improves the traditional method of Gaussian Mixture Mode（lGMM） parameters initialization at the time of GMM training.A new approach which combines division and K-means clustering is presented.The experiment shows that the proposed method can achieve the average recognition rate increase by 15.47% and 7.5% compared with the randomization and Kmeans clustering.At the same time,the impact of the order of GMM,covariance threshold and pre-emphasis coefficient on system recognition rate are studied.Meanwhile,the experiment results are analyzed in detail.In order to make the speaker recognition system get a higher recognition rate,their optimal values are chosen from the experiment data.The experiment shows that the system can achieve the recognition rate with above 90% under the provided experimental condition.

作者蒋晔唐振民

机构地区南京理工大学计算机科学与技术学院

出处《计算机工程与应用》 CSCD 北大核心 2010年第11期179-182,195,共5页 Computer Engineering and Applications

关键词说话人识别高斯混合模型美尔频率倒谱系数(MFCC) 分裂法与K均值聚类结合法 speaker recognition Gaussian Mixture Moda（lGMM） Mel Frequency Cepstrum Coefficien（tMFCC） combination division and K-means clustering

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献7

1Reynolds D A,Rose R C.Robust text-independent speaker identification using Gaussian mixture speaker models[J].IEEE Transactions on Speech and Audio Processing,1995,3(1):72-83.
2Reynolds D A.Speaker identification and verification using Gaussian mixture speaker model[J].Speech Communication,1995,17:91-108.
3You K H.Wang H C.Joint estimation of feature transformation parameters and Gaussian mixture model for speaker identification[J].Speech Communication,1999,28:227-241.
4Jim Z C.Improvement of the K-means clustering filtering algorithm[J].Pattern Recognition,2008,41 (12):3677-3681.
5岳喜才,叶大田.文本无关的说话人识别:综述[J].模式识别与人工智能,2001,14(2):194-200. 被引量：8
6吴尊敬,曹志刚.Improved MFCC-Based Feature for Robust Speaker Identification[J].Tsinghua Science and Technology,2005,10(2):158-161. 被引量：7
7Reynolds D A,Thomas F.Speaker verification using adapted Gaus-sian mixture models[J].Digital Signal Processing,2000,10 (1-3):19-41.

二级参考文献10

1郭铭,陈云凤.自动发音人识别中测试文本选择的研究[J].声学学报,1993,18(2):148-153. 被引量：3
2韦岗,陆以勤,欧阳景正.混沌、分形理论与语音信号处理[J].电子学报,1996,24(1):34-39. 被引量：33
3牟晓隆,胡起秀,吴文虎.与文本无关的复合策略说话人辨识系统[J].清华大学学报（自然科学版）,1997,37(3):16-19. 被引量：6
4包威权,陈珂,迟惠生.基于HMM/MLFNN混合结构的说话人辨认研究[J].北京大学学报（自然科学版）,1997,33(3):359-367. 被引量：5
5袁中选,徐柏龄,余崇智.基于模糊神经网络的话者辩认研究[J].声学学报,1997,22(4):329-337. 被引量：4
6陶伟忠,岳喜才,郑崇勋.离散时间域的 Gabor 谱分析及其在语音处理中的应用[J].西安交通大学学报,1997,31(6):27-31. 被引量：1
7林宝成,陈永彬.基于ARMA模型的汉语讲话者识别[J].声学学报,1998,23(3):229-234. 被引量：6
8马继涌,高文,姚鸿勋.基于多码本矢量量化的非限定文本的联机话者辨认方法[J].计算机研究与发展,1999,36(6):712-716. 被引量：1
9岳喜才,伍晓宇,郑崇勋,叶大田.一种大类别数分类的神经网络方法[J].计算机研究与发展,2000,37(3):278-283. 被引量：7
10岳喜才,伍晓宇,郑崇勋.用神经阵列网络进行文本无关的说话人识别[J].声学学报,2000,25(3):230-234. 被引量：14

共引文献13

1艾佳琪,左毅,刘君霞,贺培超,李铁山,陈俊龙.基于余弦相似度的动态语音特征提取算法[J].计算机应用研究,2020,37(S02):147-149. 被引量：10
2毛大伟,曹华,木拉提.哈米提,童勤业.基于美尔倒谱系数和复杂性的说话人识别[J].生物医学工程学杂志,2006,23(4):882-886. 被引量：2
3唐建,何劲松.模糊相关性文本无关矢量量化说话人辨认研究[J].系统仿真学报,2009,21(14):4351-4355.
4张喜宁.说话人识别技术——语音特征参数提取及组合[J].科技资讯,2009,7(34):231-232. 被引量：2
5方凡泉,李心广,王桂珍,林江豪.语音质量客观评价方法研究及实现[J].广州大学学报（自然科学版）,2011,10(1):65-69. 被引量：4
6胡峰松,王磊.一种基于小波包分析的说话人识别算法[J].小型微型计算机系统,2014,35(7):1610-1614. 被引量：1
7陈建涛,陈维娜.基于文本无关的话者识别技术综述[J].电脑知识与技术,2016,0(1):189-191. 被引量：1
8梁宏宇,李通旭.基于最大团的防骗贷算法研究[J].信息安全研究,2017,3(11):1017-1019.
9毛锦,李林聪,刘凯,杜进辅,崔亚辉.无人驾驶汽车行车环境下鲁棒性声学特征提取算法[J].中国公路学报,2019,32(6):169-175. 被引量：4
10林浩文,张正道,张明馨,高超宏.一种婴儿哭声识别优化算法的研究[J].测控技术,2019,38(12):46-51. 被引量：2

同被引文献200

1冷自强,王金明,林大会.一种GMM-SVM混合说话人辨认模型[J].军事通信技术,2009,30(1):86-89. 被引量：1
2杜志然,周萍,景新幸,李杰.基于谱熵的耳语音增强研究[J].传感器与微系统,2012,31(6):69-72. 被引量：3
3侯珏,刘轶,郑方,蒋丹宁,秦勇,黄石磊,刘勇.基于VP树结构的多层匹配算法在哼唱识别中的应用[J].清华大学学报（自然科学版）,2009(S1):1419-1424. 被引量：4
4刘敬伟,徐美芝,郑忠国,程乾生.基于DTW的语音识别和说话人识别的特征选择[J].模式识别与人工智能,2005,18(1):50-54. 被引量：13
5宋秀霞 ,纪立农 .国际糖尿病联盟代谢综合征全球共识定义[J].中华糖尿病杂志（1006-6187）,2005,13(3):178-180. 被引量：611
6周曦,戴蓓蒨,陈雁翔,李辉.基于纯度和BBN算法的无监督的话者聚类[J].模式识别与人工智能,2005,18(4):486-490. 被引量：2
7李晔,张仁智,崔慧娟,唐昆.低信噪比下基于谱熵的语音端点检测算法[J].清华大学学报（自然科学版）,2005,45(10):1397-1400. 被引量：37
8杨彦,赵力.一种改进的模糊C-均值聚类算法在说话人识别中的应用[J].电声技术,2006,30(1):40-43. 被引量：4
9于明,袁玉倩,董浩,王哲.一种基于MFCC和LPCC的文本相关说话人识别方法[J].计算机应用,2006,26(4):883-885. 被引量：14
10张庆芳,赵鹤鸣.基于改进VQ算法的文本无关的说话人识别[J].计算机工程与应用,2006,42(10):65-68. 被引量：7

引证文献27

1曹洁,潘鹏.基于GMM的说话人识别技术研究[J].计算机工程与应用,2011,47(11):114-117. 被引量：6
2景新幸,杨艺敏,刘涛.改进PSO-SVM在说话人确认中的应用[J].计算机工程与应用,2011,47(33):106-108.
3霍春宝,张彩娟,赵红敏.基于GMM-UBM的说话人确认系统的研究[J].辽宁工业大学学报（自然科学版）,2012,32(2):98-101.
4王再欢,唐云建,韩鹏.一种利用声音识别的森林盗伐检测方法[J].计算机工程与应用,2012,48(30):216-219. 被引量：3
5郭敏,张明真.基于GMM和聚类方法的储粮害虫声信号识别研究[J].南京农业大学学报,2012,35(6):44-48. 被引量：6
6马振,张雄伟,杨吉斌.一种基于K-SVD的说话人识别方法[J].计算机工程与应用,2012,48(34):112-115. 被引量：2
7祝鹏,王成儒.小波包变换与Teager能量算子结合的说话人识别[J].计算机工程与应用,2013,49(9):187-189. 被引量：2
8成培.移动式智能化广播影视视听节目监管平台解决方案[J].科技创新与应用,2013,3(17):23-23. 被引量：2
9赵玉晓,顾秀秀,张二华.与文本无关说话人识别[J].计算机与数字工程,2014,42(2):243-247. 被引量：2
10赵立辉,毛竹,霍春宝,杨红喆.基于GMM-SVM的说话人识别系统研究[J].工矿自动化,2014,40(5):49-53. 被引量：7

二级引证文献75

1洪晓兰,杨飒,叶泳仪,李金林,陈育均,杨豪杰.基于HT66F2390的新型智能门锁系统设计[J].电子测量技术,2020(10):18-23. 被引量：5
2江楠,陈洁,肖潘,唐文强,林志泉.基于声纹识别的电力会议多角色语音的分离和识别研究[J].高电压技术,2023,49(S01):40-46. 被引量：1
3马学明.50%苯·苄可湿性粉剂的研究[J].湖南化工,2000,30(1):22-23.
4李强,彭益武.基于FPGA的GMM说话人辨认系统[J].广东交通职业技术学院学报,2014,13(2):42-46.
5冉国敬,夏秀渝,张凤仪.信道失配环境下鲁棒说话人识别[J].计算机系统应用,2015,24(3):235-240. 被引量：2
6张凤仪,夏秀渝,冉国敬,何礼,叶于林.多声源环境下的鲁棒说话人识别[J].计算机系统应用,2015,24(4):32-37. 被引量：1
7包晓敏,吕文杰,夏海霞.农业虫害自动测报终端的设计[J].浙江理工大学学报（自然科学版）,2015,33(6):872-876. 被引量：2
8王波,钟映春,陈俊彬.融合AP和GMM的说话人识别方法研究[J].广东工业大学学报,2015,32(4):145-149. 被引量：1
9于云,周伟栋.基于稀疏表示的鲁棒性说话人识别系统[J].计算机技术与发展,2015,25(12):41-46.
10高华,甄彤,祝玉华.仓储害虫检测的研究现状及其展望[J].粮食储藏,2015,44(6):10-14. 被引量：3

1孔维功,张国杰,张效军.MFCC中DCT结构的设计与实现[J].计算机工程,2009,35(5):265-267. 被引量：3
2田玉敏,梅丽霞.基于综合特征的图像分割[J].计算机工程与应用,2004,40(20):92-94. 被引量：5
3胥飞燕,陈涛,孙旭,房宗良,李丽蓉.基于TMS320C6713的语音识别系统设计[J].物联网技术,2012,2(9):14-15.
4周宴宇,杨胜跃,何正明,龙慧.基于MFCC与LPCC的滚动轴承故障音频诊断法[J].微计算机信息,2009(31):123-124. 被引量：8
5肖佳林,赵聿晴,王英.基于HMM与SVM的语音活动检测[J].计算机工程,2014,40(1):203-208. 被引量：10
6马勇,李娟,吕彬.脑电信号驱动的个性化情绪音乐播放系统算法研究及初步实现[J].生物医学工程学杂志,2016,33(1):38-41. 被引量：3
7高会贤,马全福,郑晓势.短语音噪声环境下说话人识别特征提取[J].计算机应用,2010,30(10):2712-2714. 被引量：2
8祝亚斌,陈林,陈培.PCI Express3．0技术分析[J].高性能计算技术,2012,0(2):36-39. 被引量：1
9蒋琳琼,贺建飚.一种声纹美尔频率倒谱系数干扰消除算法研究[J].计算机仿真,2013,30(4):382-385. 被引量：2
10刘京诚,高海英,廖志勇.基于DSP和FPGA的机器人声控系统设计与实现[J].现代电子技术,2006,29(14):109-112. 被引量：7

计算机工程与应用

2010年第11期

浏览历史

内容加载中请稍等...

GMM文本无关的说话人识别系统研究被引量：27

参考文献7

二级参考文献10

共引文献13

同被引文献200

引证文献27

二级引证文献75

相关作者

相关机构

相关主题

浏览历史

GMM文本无关的说话人识别系统研究 被引量：27

参考文献7

二级参考文献10

共引文献13

同被引文献200

引证文献27

二级引证文献75

相关作者

相关机构

相关主题

浏览历史

GMM文本无关的说话人识别系统研究被引量：27