一种任务域无关的语音关键词检测系统被引量：2

Task domain independent speech keyword detection system

下载PDF

导出

摘要提出了面向语音关键词检测的多尺度声学模型建模框架,基于判决树的自动音素聚类生成了大尺度音素集,利用HMM声学模型训练技术生成了大尺度音素声学上下文相关的背景模型,提高了废料语音的建模精度,还给出了此框架下共享HMM状态的高效搜索空间构造方法,关键词识别准确率平均提高了绝对6.9%;提出了近邻声学上下文准则以及候选关键词在多尺度声学模型上的似然比计算方法并采用FLDA融合,显著提高了声学置信度计算的有效性,系统等错率绝对下降了3.0%。 A multiple scale acoustic modeling framework for task-domain independent keyword spotting was proposed, A large-scale phoneme set was obtained automatically through decision-tree based phoneme clustering, and a large-scale phoneme acoustic context dependent background model was trained accordingly through using standard HMM training framework. The modeling accuracy for filler speech is improved. Under the framework, an efficient searching space construction through using shared HMM state was also described. Experimental results showed that in average absolute 6.9% improvement of keyword recognition accuracy could be obtained. Furthermore an acoustic context neighbor algorithm to measure acoustic confidence and a method of computing candidate keyword likelihood based on proposed multiple-scale acoustic model were proposed and a fusing method based on FLDA was adopted. The effectiveness of acoustic confidence measure is improved significantly, Experimental results showed that absolute 3.0% reduction ,of equal error rate could be obtained.

作者韩疆刘晓星颜永红张鹏远

机构地区中国科学院声学研究所中科信利语音实验室

出处《通信学报》 EI CSCD 北大核心 2006年第2期137-141,共5页 Journal on Communications

关键词声学置信度多尺度声学建模搜索空间 acoustic confidence measure multiple scale acoustic modeling searching space

分类号 TP391.42 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献8

1WILLIAMS G,RENALS S.Confidence measures for hybrid HMM/ANN speech recognition[A].Proceedings of Eurospeech-97[C].1997.1955-1958.
2ABDOU S,SCORDILIS M.Beam search pruning in speech recognition using a posterior probability-based confidence measure[A].Speech Communication[C].2004.409-428.
3ROSE R C,PAUL D B.A hidden markov model based keyword recognition system[A].Proceedings of IEEE ICASSP-1990[C].1990.129-132.
4BENAYED Y,FOHR D,HATON J P.Confidence measure for keyword spotting using support vector machines[A].Proceedings of IEEE ICASSP-2003[C].2003.588-591.
5DUDA R O,HART P E.Pattern Classification and Scene Analysis[M].John Wiley & Sons,1973.
6KAMPPARI S O,HAZEN T J.Word and phone level acoustic confidence scoring[A].Proceedings of IEEE ICASSP-2000[C].2000.1799-1802.
7RIVLIN Z,COHEN M,ABRASH V,et al.A phone dependent confidence measure for utterance rejection[A].Proceedings IEEE ICASSP[C].1996.515-517.
8SANKAR A,WU S L.Utterance verification based on statistics of phone-level confidence scores[A].Proceedings of IEEE ICASSP-2003[C].2003.584-587.

同被引文献9

1WANG Zuo-ying, GAO Hong-ge. An Inhomogeneous HMM Speech Recognition Algorithm [J]. Chinese Journal of Electr- onics, January, 1998,7( 1 ):73-77.
2]哈力克·尼亚孜.基础维吾尔语[M].新疆:新疆大学出版社,1997:69-214.
3那斯尔江.吐尔逊,吾守尔.斯拉木.麦麦提艾力.维吾尔语.大词汇量连续语音识别研究-语音语料库的建立[C].北京:第十一届全国民族语言文字信息学术研讨会论文集,2007,2:379-385.
4梁家恩.语音识别中置信度研究与应用.博士学位论文.北京:中科院自动化所,2007.
5王安娜,王勤万,刘俊芳,袁文静.改进的语音特征提取方法及其应用[J].计算机工程,2008,34(5):196-197. 被引量：8
6刘加,潘胜昔,江金涛,胡凯军,王作英.用 TMS320C31 实时实现电话语音识别系统[J].清华大学学报（自然科学版）,1998,38(9):51-54. 被引量：4
7刘镜,刘加.置信度的原理及其在语音识别中的应用[J].计算机研究与发展,2000,37(7):882-890. 被引量：13
8李春,王作英.基于语音学分类的汉语三音子识别单元的算法[J].清华大学学报（自然科学版）,2003,43(1):16-19. 被引量：4
9王作英,肖熙.基于段长分布的HMM语音识别模型[J].电子学报,2004,32(1):46-49. 被引量：42

引证文献2

1丁玉忠,吾守尔·斯拉木,那斯尔江·吐尔逊.基于垃圾模型的维吾尔语关键词识别[J].现代计算机,2011,17(12):20-23.
2张震,赵庆卫,颜永红.基于语音识别与特征的无监督语音模式提取[J].计算机工程,2014,40(5):262-265. 被引量：4

二级引证文献4

1赵彩光,张树群,雷兆宜.基于改进对比散度的GRBM语音识别[J].计算机工程,2015,41(5):213-218. 被引量：4
2乔玲玲,郭秀婷.人体语音特征提取身份优化验证仿真研究[J].计算机仿真,2017,34(2):342-345. 被引量：3
3尤鑫,陈雪梅.基于声学模型的语音识别专利技术综述[J].科学与信息化,2018,0(34):39-39.
4刁彤.一种广播电视音频语种识别方法[J].电声技术,2021,45(5):18-20.

1刘鑫,陆林生.关键词检测系统中声学置信度的应用[J].计算机工程,2004,30(8):28-30. 被引量：2
2孟猛,梁家恩,徐波.基于音素聚类的多语言声学建模方法[J].模式识别与人工智能,2009,22(1):86-90. 被引量：1
3朱珠,李寿山,戴敏,周国栋.结合主动学习和自动标注的评价对象抽取方法[J].山东大学学报（理学版）,2015,50(7):38-44. 被引量：3
4许爱琴,王梦洁,刘永坚,王卫华.一种新的生成候选关键词集的方法[J].武汉理工大学学报（信息与管理工程版）,2013,35(6):816-819.
5张鹏远,韩疆,颜永红.关键词检测系统中基于音素网格的置信度计算[J].电子与信息学报,2007,29(9):2063-2066. 被引量：3
6马龙,万康康,韩小纯.FLDA在单样本人脸识别中的应用研究[J].计算机应用与软件,2014,31(4):175-177. 被引量：1
7张鹏远,邵健,赵庆卫,颜永红.广播新闻语音的关键词检测系统[J].通信学报,2007,28(12):131-135. 被引量：1
8娄玉娟,徐慧.中文文本关键词抽取方法的研究[J].企业技术开发（下半月）,2011(4):106-107. 被引量：1
9郑永军,张连海.融合查询扩展和动态匹配的集外词检测[J].数据采集与处理,2014,29(2):280-285.
10杨鹏,谢磊,张艳宁.低资源语言的无监督语音关键词检测技术综述[J].中国图象图形学报,2015,20(2):211-218. 被引量：3

通信学报

2006年第2期

浏览历史

内容加载中请稍等...

一种任务域无关的语音关键词检测系统被引量：2

参考文献8

同被引文献9

引证文献2

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

一种任务域无关的语音关键词检测系统 被引量：2

参考文献8

同被引文献9

引证文献2

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

一种任务域无关的语音关键词检测系统被引量：2