一种新型的与文本相关的说话人识别方法研究

A new study on text-related speaker recognition

下载PDF

导出

摘要在与文本相关的说话人识别研究中,既要包含说话人身份的识别,又要包含语音文本内容的识别.提出一种基于语音识别的与文本相关的说话人识别方法,从而建立说话人的声纹模型和语音文本模型,与传统的仅建立一种模型的方法相比,该方法能更精确地描述说话人身份信息和语音的文本信息,较好地解决了短时语音样本识别效果不佳的问题.测试实验表明,和传统与文本相关的说话人识别方法(如基于动态时间规整、高斯混合-通用背景模型)相比,由本方法建立的系统虚警概率降低了8.9%,识别性能得到了提高. In the study of text-related speaker recognition, it is to include the identity recognition as well as the speech text recog-nition. This paper proposes a new kind of text-related speaker recognition method based on the speech recognition. The model built by this method can describe both the identity information and the speech text information more accurately. Besides, it can also solve the problem that the short-term speech samples have poor recognition effect. The experiments show that compared with the traditional text-related speaker recognition system such as dynamic time warping （ DTW） and Gaussian mixture model-universal background model（ GMM-UBM） ,the false alarm probability of the system established by the present method is reduced by 8.9% and the recognition performance is improved.

作者周雷龙艳花魏浩然

机构地区上海师范大学信息与机电工程学院

出处《上海师范大学学报（自然科学版）》 2017年第2期224-230,共7页 Journal of Shanghai Normal University(Natural Sciences)

基金上海高校青年教师培养计划(zzshsfl14026)

关键词文本相关说话人识别语音识别 text-related speaker recognition speech recognition

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1赵玉晓,顾秀秀,张二华.与文本无关说话人识别[J].计算机与数字工程,2014,42(2):243-247. 被引量：2
2胡政权,曾毓敏,宗原,李梦超.说话人识别中MFCC参数提取的改进[J].计算机工程与应用,2014,50(7):217-220. 被引量：29
3王韵琪,俞一彪.自适应高斯混合模型及说话人识别应用[J].通信技术,2014,47(7):738-743. 被引量：8
4姜洪臣,郑榕,张树武,徐波.基于SDC特征和GMM-UBM模型的自动语种识别[J].中文信息学报,2007,21(1):49-53. 被引量：14
5蒋晔,唐振民.GMM文本无关的说话人识别系统研究[J].计算机工程与应用,2010,46(11):179-182. 被引量：27

二级参考文献39

1吴尊敬,曹志刚.Improved MFCC-Based Feature for Robust Speaker Identification[J].Tsinghua Science and Technology,2005,10(2):158-161. 被引量：7
2Reynolds D A,Rose R C.Robust text-independent speaker identification using Gaussian mixture speaker models[J].IEEE Transactions on Speech and Audio Processing,1995,3(1):72-83.
3Reynolds D A.Speaker identification and verification using Gaussian mixture speaker model[J].Speech Communication,1995,17:91-108.
4You K H.Wang H C.Joint estimation of feature transformation parameters and Gaussian mixture model for speaker identification[J].Speech Communication,1999,28:227-241.
5Jim Z C.Improvement of the K-means clustering filtering algorithm[J].Pattern Recognition,2008,41 (12):3677-3681.
6Reynolds D A,Thomas F.Speaker verification using adapted Gaus-sian mixture models[J].Digital Signal Processing,2000,10 (1-3):19-41.
7Alvin F.Martin and Mark A.Przybockl.NIST 2003 Language Recognition Evaluation[A].In:Proceedings of Eurospeech[C].Geneva,Switzerland:Sept.2003,161-164.
8P.A.Torres-Carrasquillo et al.Approaches to Language Identification Using Gaussian Mixture Model and Shifted Delta Cepstral Features[A].In:Proceedings of ICSLP[C].Colorado USA:Sept.2002,89-92.
9D.A.Reynolds,T.F.Quatieri,and R.B.Dunn.Speaker Verification Using Adapted Gaussian Mixture Models[J].Digital Signal Processing,2000,Vol.10:19-41.
10Y.K.Muthusamy,R.A.Cole,and B.T.Qshika.The OGI Multilanguage Telephone Speech Corpus[A].In:Proceedings of ICSLP[C],Oct.1992,895-898.

共引文献72

1王士进,孟猛,梁家恩,徐波.基于Multilingual的音素识别及其在语种识别中的应用[J].清华大学学报（自然科学版）,2008,48(S1):678-682. 被引量：2
2雷文辉,宋彦,戴礼荣.一种基于层次化支持向量机的语种识别方法[J].小型微型计算机系统,2009,30(4):721-725. 被引量：2
3陈业仙,张歆奕,毛杰.基于GMM-UBM的语言辨识算法研究[J].五邑大学学报（自然科学版）,2010,24(3):56-60.
4曹洁,潘鹏.基于GMM的说话人识别技术研究[J].计算机工程与应用,2011,47(11):114-117. 被引量：6
5景新幸,杨艺敏,刘涛.改进PSO-SVM在说话人确认中的应用[J].计算机工程与应用,2011,47(33):106-108.
6刘波霞,陈建峰.基于特征分析的环境声音事件识别算法[J].计算机工程,2011,37(22):261-263. 被引量：15
7张丽,杨镇西,吉立新.语种识别算法中GSV计算的定点仿真与实现[J].计算机工程与设计,2012,33(2):679-683. 被引量：1
8霍春宝,张彩娟,赵红敏.基于GMM-UBM的说话人确认系统的研究[J].辽宁工业大学学报（自然科学版）,2012,32(2):98-101.
9王再欢,唐云建,韩鹏.一种利用声音识别的森林盗伐检测方法[J].计算机工程与应用,2012,48(30):216-219. 被引量：3
10郭敏,张明真.基于GMM和聚类方法的储粮害虫声信号识别研究[J].南京农业大学学报,2012,35(6):44-48. 被引量：6

1徐惠红,林晓庆.基于优化的Baum-Welch算法的说话人识别研究[J].辽东学院学报（自然科学版）,2009,16(4):321-324.
2李为,游寒旭,朱杰,陈宁.一种应用于文本相关说话人确认的L-向量表示和改进的余弦距离核函数（英文）[J].上海师范大学学报（自然科学版）,2016,45(2):243-247. 被引量：2
3徐惠红.优化的HMM算法在文本相关的说话人识别中的研究[J].微型机与应用,2010,29(2):69-70. 被引量：2
4刘云冰,祝彦成,彭静,肖俊,吴传菊.HMM在说话人识别系统中的实现[J].软件导刊,2006,5(12):15-16. 被引量：2
5宫乃斌.你听,地球滚动的声音[J].知识就是力量,2009(5):54-56.
6蒋烈辉,王淑英,程自强.一个文本相关的说话人验证系统的实现[J].信息工程学院学报,1994,13(4):21-24.
7高洁,吉根林.文本分类技术研究[J].计算机应用研究,2004,21(7):28-30. 被引量：36
8隗兵,戴文战.基于克隆选择算法的Hopfield网络容量提升方法[J].浙江理工大学学报（自然科学版）,2015,33(3):390-393. 被引量：2
9成新民,张迎,蒋云良.基于FVQMM的说话人识别[J].辽宁工程技术大学学报（自然科学版）,2007,26(5):719-722.
10龚伟.说话人识别在智能家居中的应用[J].低压电器,2005(9):22-24. 被引量：1

上海师范大学学报（自然科学版）

2017年第2期

浏览历史

内容加载中请稍等...

一种新型的与文本相关的说话人识别方法研究

参考文献5

二级参考文献39

共引文献72

相关作者

相关机构

相关主题

浏览历史