一个快速说话人识别系统的设计和实现被引量：1

The Application of a Fast Multi-language Recognition System

下载PDF

导出

摘要基于美国国家科学技术标准局的说话人识别评测任务,提出了快速说话人识别技术框架。在此框架下,低层的声学特征向量首先经过高斯混合建模和非线性映射,转变为高层的高维特征向量(超向量);接着利用区分性分类器支持向量机,对超向量进行分类;最后依据假设检验理论,进行最终判决。相比较传统的说话人识别系统,以超向量作为特征进行分类,比直接采用声学特征更为稳健。实现了一个快速说话人识别系统,并在电话数据集上进行测试,取得了不错的效果。 We proposed a fast language recognition framework based on National Institute of Standards and Technology Speaker Recognition Evaluation （NIST SRE）. In the framework, low-level acoustic feature vector is firstly converted to high -level feature vector （Super Vector） through Gaussian Mixture Modeling and nonlinear mapping methods. Then, the super vector is classified by backend classifier. Finally, decision is given out based on hypothesis test theory. The proposed system is much more robust compared with traditional speaker recognition system. Besides, a fast speaker recognition system is built and achieved a good result based on telephone dataset.

作者安茂波刘建

机构地区国家计算机网络应急技术处理协调中心中国科学院语言声学与内容理解重点实验室

出处《网络新媒体技术》 2012年第3期37-41,共5页 Network New Media Technology

关键词说话人识别高斯混合建模支持向量机超向量 Speaker Recognition, Gaussian Mixture Modeling, Support Vector Machine, Super Vector

分类号 TN912.34 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献1

1杨行峻;迟惠生.语音信号数字处理[M]北京:电子工业出版社,1995.

同被引文献3

1王欢良,韩纪庆,郑贵滨.基于K-L散度模型聚类的快速说话人辨识方法[J].模式识别与人工智能,2010,23(6):856-861. 被引量：5
2熊华乔,郑建彬,詹恩奇,汪阳,华剑.基于说话人模型聚类的说话人识别[J].计算机工程与应用,2014,50(2):133-136. 被引量：2
3余艳.融合KL散度和移地距离的高斯混合模型相似性度量方法[J].计算机应用,2014,34(3):828-832. 被引量：4

引证文献1

1茅正冲,涂文辉.基于分层识别的快速说话人识别研究[J].计算机工程与科学,2018,40(7):1244-1249. 被引量：3

二级引证文献3

1杨勇.VC++中位图的几种显示特技[J].电脑编程技巧与维护,2000(5):77-84.
2王刚,肖黎,屈文忠.Lamb波高斯混合模型螺栓松动损伤检测[J].机械科学与技术,2020,39(4):493-500. 被引量：6
3王丽萍,王光明.基于ARM的多通道大功率脉冲声发射器的设计[J].自动化与仪器仪表,2021(3):115-118. 被引量：2

1梁春燕,安茂波,刘振业,索宏彬,汪俊杰.高斯超向量-支持向量机鉴别性语种识别系统[J].计算机工程与应用,2013,49(2):174-176.
2芮挺,曹鹏,张金林,马光彦,孙仁武.基于高斯混合建模的多尺度HOG行人头肩特征检测[J].山东科技大学学报（自然科学版）,2013,32(2):90-93. 被引量：3
3张超,吴小培,周建英,戚培庆,王营冠,吕钊.基于改进高斯混合建模和短时稳定度的运动目标检测算法[J].电子与信息学报,2012,34(10):2402-2408. 被引量：9
4李彦,沈旭昆.基于高斯模型的遥感影像目标识别方法的初探[J].系统仿真学报,2009,21(S1):57-60. 被引量：2
5吴建军,高济.基于指令统计分布的软件水印方案[J].浙江大学学报（工学版）,2005,39(2):225-228. 被引量：8
6罗欢,吴怀宇,陈洋,周致富.光照突变环境下运动目标检测方法研究[J].计算机应用与软件,2015,32(9):201-205.
7魏宇,史正伟,李鉴.序列核支持向量机系统的广义性分析[J].南阳理工学院学报,2012,4(4):14-17.
8段志刚,屈靓琼,田建东,唐延东.基于正交分解的室外光照阴影检测[J].光学学报,2016,36(8):201-209. 被引量：9
9吕英,罗森林,高晓芳,谢尔曼,潘丽敏.采用2D-Haar声学特征超向量的快速特定音频识别方法[J].声学学报,2015,40(5):739-750. 被引量：2
10李荣,王华君,徐燕华,孟德建.基于监督超向量编码和自适应GMM的人脸表情识别方法[J].计算机与现代化,2016,0(2):15-20.

网络新媒体技术

2012年第3期

浏览历史

内容加载中请稍等...

一个快速说话人识别系统的设计和实现被引量：1

参考文献1

同被引文献3

引证文献1

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

一个快速说话人识别系统的设计和实现 被引量：1

参考文献1

同被引文献3

引证文献1

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

一个快速说话人识别系统的设计和实现被引量：1