两级决策的开集说话人辨认方法被引量：12

Method of open-set speaker identification with two-level decision strategy

导出

摘要为了减少语音数据量 ,提高处理速度和识别的准确性 ,提出了一种采用公共码本、个人隐 Markov模型 (HMM)和个人拒识阈值进行两级决策来实现开集说话人辨认的新方法。在系统实现时 ,采用了一种改进的语音切分算法来提高输入数据的有效性 ,并将说话人识别和人脸识别融合在一起进行身份验证。实验证明这种融合方法能够有效地降低识别的相等错误率至 1%。 To reduce required speech data and improve the processing speed and the recognition precision, this paper presents a novel speaker identification method using the public codebook, the individual hidden Markov model (HMM) and the individual threshold of rejection to make a two level decision strategy. The system used an improved algorithm of speech segmentation to extract the available speech data from utterances. An approach of integrating the speaker recognition with the face recognition to verify a person's identity could further reduce the equal error rate to 1%.

作者何致远胡起秀徐光祐

机构地区清华大学计算机科学与技术系

出处《清华大学学报（自然科学版）》 EI CAS CSCD 北大核心 2003年第4期516-520,共5页 Journal of Tsinghua University(Science and Technology)

基金国家"八六三"高技术项目 ( 863 -3 0 6-ZT0 3 -0 1-1) 国家教育振兴计划

关键词说话人识别说话人辨认语音切分隐MARKOV模型两级决策语音识别 speaker recognition speaker identification speech segmentation hidden Markov model 

分类号 TN912.34 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献9

1牟晓隆,胡起秀,吴文虎.与文本无关的复合策略说话人辨识系统[J].清华大学学报（自然科学版）,1997,37(3):16-19. 被引量：6
2何致远.说话人确认和辨认的研究与实现[D].北京:清华大学,2002.
3何致远胡起秀姚志宏.基于HMM的数字串提示文本的说话人确认[A]..第九届全国多媒体技术学术会议论文集[C].北京,2000.215—219.
4JIN Qin, SI Luo, HU Qixiu. A high-performance text-independent speaker identification system based on BCDM [A]. Proc of the Fifth Inter Conf on Spoken Language Processing[C]. Sydney, Australia. 1998.
5SI Luo, HU Qixiu. Two-stage speaker identification system based on VQ and NBDGMM [A]. Proc of the Sixth Inter Conf on Spoken Language Processing [C]. Beijing, 2000.
6Fakotakis N, Sirigos J. A high performance text independent speaker recognition system based on vowel spotting and neural nets [A]. Proc Inter Conf on Acoustics, Speech and Signal Processing[C]. Atlanta, USA. 1996. 661-664.
7Furui S. Recent advances in speaker recognition [J]. Lecture Notes in Computer Science, 1997, 1206:237-252.
8Li Qi, Juang Biinghwang, Lee Chinhui, et al. Recent advancements in automatic speaker authentication [J]. IEEE Robotics and Automation Magazine, 1999, 3:24 - 34.
9Furui S. Cepstral analysis technique for automatic speaker verification [J]. IEEE Trans on Acoustics, Speech and Signal Processing, 1981, 29(2) : 254 - 272.

共引文献5

1陆小珊,王俊法,田岚.音高特征在说话人识别中的可分性及应用研究[J].山东大学学报（工学版）,2005,35(4):56-58.
2张晓洲,黄德智,蔡莲红.考虑帧间动态特征的音色变换算法[J].清华大学学报（自然科学版）,2006,46(10):1767-1770. 被引量：1
3杨澄宇,赵文,杨鉴.基于高斯混合模型的说话人确认系统[J].计算机应用,2001,21(4):7-8. 被引量：5
4岳喜才,叶大田.文本无关的说话人识别:综述[J].模式识别与人工智能,2001,14(2):194-200. 被引量：8
5刘杰,张玉茹.机器人灵巧手抓持分类器的设计与实现[J].机器人,2003,25(3):259-263. 被引量：3

同被引文献113

1王秀芳,张光华,陈雪松.消除数字滤波器中Gibbs现象的研究[J].信号处理,2003,19(z1):13-16. 被引量：4
2于哲舟,周春光,李佳慧,杨佳东.一种简单有效的说话人身份认证方法[J].吉林大学学报（信息科学版）,2003,21(S1):29-33. 被引量：1
3万亚红,黄樟钦,陈旭辉,霍囝囝.基于主动推理的情境感知系统框架[J].计算机工程,2004,30(12):8-9. 被引量：19
4闫友彪,陈元琰.机器学习的主要策略综述[J].计算机应用研究,2004,21(7):4-10. 被引量：55
5叶俊,刘贤德,韩露.基于多主体的楼宇智能控制体系结构[J].计算机工程与应用,2004,40(19):203-205. 被引量：3
6伍忠东,高新波,谢维信.基于核方法的模糊聚类算法[J].西安电子科技大学学报,2004,31(4):533-537. 被引量：75
7田光明,陈光(?).基于熵调整模糊c-均值聚类的时频能量混合模型[J].信号处理,2005,21(1):1-6. 被引量：3
8汪峥,连翰,王建军.说话人识别中特征参数提取的一种新方法[J].复旦学报（自然科学版）,2005,44(1):197-200. 被引量：16
9韩江洪,江波,杜诗研,张利.一种基于多Agent系统的智能家庭网络研究[J].电子科技大学学报,2005,34(2):233-235. 被引量：6
10邱慧敏,杨义先,胡正名.一种改进的基于智能卡的身份鉴别方案设计[J].北京邮电大学学报,2005,28(2):39-41. 被引量：3

引证文献12

1于哲舟,杨佳东,蒲东兵,周春光,王纲巧.多门限声纹识别方法[J].吉林大学学报（信息科学版）,2005,23(2):216-220. 被引量：1
2林琳,王树勋,王秀丽.基于DSP开集说话人识别系统的实时实现[J].吉林大学学报（信息科学版）,2006,24(3):252-258. 被引量：2
3林琳,王树勋.基于遗传-模糊聚类的说话人识别方法及其仿真研究[J].系统仿真学报,2006,18(8):2338-2341. 被引量：13
4李晓华,赵现纲.一种基于多Agent的智能家居系统研究与设计[J].计算机工程,2006,32(21):233-234. 被引量：4
5林琳,王树勋,郭纲.短语音说话人识别新方法的研究[J].系统仿真学报,2007,19(10):2272-2275. 被引量：10
6朱浩冰,郭东辉.声纹识别系统原理及其关键技术[J].计算机安全,2007(9):14-17. 被引量：15
7林琳,王树勋,陈建.基于模糊核熵的短语音说话人识别[J].系统仿真学报,2008,20(16):4368-4372. 被引量：1
8洪英,韩周安.偏亚高斯语音信号有效分离ICA方法研究[J].电子科技大学学报,2008,37(5):693-697. 被引量：3
9茅剑,林奇.基于声纹识别的嵌入式防盗系统[J].计算机与现代化,2009(11):163-165. 被引量：5
10张汝霞,李苏梅.小规模人员语音辨识系统的研究[J].现代计算机（中旬刊）,2013(1):12-16.

二级引证文献65

1江楠,陈洁,肖潘,唐文强,林志泉.基于声纹识别的电力会议多角色语音的分离和识别研究[J].高电压技术,2023,49(S01):40-46. 被引量：1
2李炜恒,王林生.声纹识别技术在金刚石压机顶锤防护中的应用[J].金刚石与磨料磨具工程,2013,33(3):71-74. 被引量：3
3张吉稳,何汉武,胡兆勇.基于虚拟环境的汽车驾驶安全预警方法[J].系统仿真学报,2009,21(S1):234-237. 被引量：1
4周顺先,林亚平,王耀南,易叶青.基于聚簇隐马尔可夫模型的文本信息抽取[J].系统仿真学报,2007,19(21):4926-4931. 被引量：2
5许允喜,俞一彪.说话人识别中采用混合免疫算法的VQ码本设计[J].计算机应用,2008,28(2):339-341.
6林琳,王树勋,陈建.基于可区分性加权的模糊核说话人识别[J].电子学报,2008,36(7):1446-1450. 被引量：2
7邵晨曦,范金锋,王子才,杨明.时间序列重构相空间中系统定性行为建模与仿真[J].系统仿真学报,2008,20(15):4149-4154. 被引量：2
8林琳,王树勋,陈建.基于模糊核熵的短语音说话人识别[J].系统仿真学报,2008,20(16):4368-4372. 被引量：1
9李金,于虹,周璐璐,梁洪.基于量子遗传和无迹粒子滤波的人体运动跟踪[J].系统仿真学报,2008,20(18):4867-4871. 被引量：7
10李燕萍,唐振民,钱博,张燕.基于PLAR特征补偿的鲁棒性说话人识别仿真研究[J].系统仿真学报,2009,21(2):409-412. 被引量：2

1李欢欢,王金明,尹海明,徐志军,孔磊,张开礼.一种改进的基于Viterbi的语音切分算法[J].通信技术,2015,48(9):1027-1031. 被引量：3
2林帆,徐明星.一种改进的基于时域参数的语音切分算法[J].计算机科学,2006,33(4):164-167. 被引量：3
3王成儒,王金甲,李静,胡正平.基于神经网络的说话人辨认方法[J].微机发展,2003,13(5):26-27.
4林琳,王树勋,王秀丽.基于DSP开集说话人识别系统的实时实现[J].吉林大学学报（信息科学版）,2006,24(3):252-258. 被引量：2
5张文军,谢剑英,李聪.基于贝叶斯方法的鲁棒语音切分[J].数据采集与处理,2002,17(3):260-264. 被引量：2
6张宝奇,张连海,屈丹.基于听觉事件检测的汉语语音声韵切分[J].声学学报,2010,35(6):701-707. 被引量：7
7何致远,胡起秀,徐光.说话人识别中语音切分算法的研究[J].计算机工程与应用,2003,39(6):55-58. 被引量：4
8李凌,曾以成,雷雄国.EMD在说话人辨认中的应用[J].湘潭大学自然科学学报,2006,28(3):108-111. 被引量：6
9胡国元,段春丽,宋智军,段铸红,温富刚.高速双通道光电耦合器OC-5631的研制[J].微电子学与计算机,1998,15(1):10-14.
10湖南首只集成电路创投基金成立首期规模2．5亿元[J].中国集成电路,2016,0(4):1-2.

清华大学学报（自然科学版）

2003年第4期

浏览历史

内容加载中请稍等...

两级决策的开集说话人辨认方法被引量：12

参考文献9

共引文献5

同被引文献113

引证文献12

二级引证文献65

相关作者

相关机构

相关主题

浏览历史

两级决策的开集说话人辨认方法 被引量：12

参考文献9

共引文献5

同被引文献113

引证文献12

二级引证文献65

相关作者

相关机构

相关主题

浏览历史

两级决策的开集说话人辨认方法被引量：12