汉语连续语音中HMM模型状态数优化方法研究被引量：7

The Optimal Selecting for HMM State-number in Mandarin Continuous Speech

下载PDF

导出

摘要为了优化汉语连续语音中HMM模型系统以提高识别性能,提出了分别为每个声母和韵母半音节声学模型选择最优的状态数的方法。通过综合考虑每个声母和韵母半音节声学模型在不同状态数下的段长均值、方差以及各自识别率这三者信息,作为进行最优模型状态数的选择准则。优化后的声学模型系统由状态数各不相同的声母半音节声学模型组成,同未优化前状态数统一的模型系统相比,音节识别性能提高了5.07个百分点。研究表明,每个声母和韵母半音节志学模型应根据情况选择不同的状态数,优化后的模型系统识别性能得到了提高。 In order to optimize the penformance of HMM-based Mandarin Continuous Speech recognition, the method of optimal selecting for each initial and final semi-syllable acoustic Hidden Markov Model state-number is proposed. It is proposed that to synthetically calculate three kinds of information, which are the duration mean, duration variance and correctness of each initial and final semi-syllable acoustic Hidden Markov Model, as the principle to select the optimal each semi-syllable acoustic Hidden Markov Model with different state-number and it shows the better performance of semi-syllable recognition by 5.07%, compared with the Hidden Markov Model system with the same statenumber. The research demonstrated that each initial and final semi-syllable acoustic Hidden Markov Model should be set up according to practicality and the recognition performance can be increased after the optimal selecting.

作者何珏刘加

机构地区清华大学电子工程系

出处《中文信息学报》 CSCD 北大核心 2006年第6期83-88,共6页 Journal of Chinese Information Processing

基金国家自然科学基金资助项目(NSFC)(60572083) 信息产业部信息安全计划项目资助

关键词计算机应用中文信息处理声学模型隐型Markov模型语音识别 computer application Chinese information processing acoustic model hidden Markov model speech recognition

分类号 TN912.34 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献6

1黄顺珍,方棣棠.基于拼音模型的声学层识别的研究[J].中文信息学报,2002,16(3):46-51. 被引量：1
2刘刚,张洪刚,郭军.基于变帧率训练的HMM汉语人名识别[J].中文信息学报,2001,15(1):40-45. 被引量：2
3Lawrence Rabiner,Biing-Hwang Juang.Fundamentals of Speech Recognition[M](影印版).北京:清华大学出版社,1999.142-149.
4刘亚斌,李爱军.朗读语料与自然口语的差异分析[J].中文信息学报,2002,16(1):13-18. 被引量：16
5Fraley C.and Raftery A.How many clusters? Which clustering method? Answers via model-based cluster analysis[M].Tech.Rep.329.Sattle.WA.Department of statistics.University of Washington.1998.
6Roberts.S.Husmeier D.Rezek I.et al.Bayesian approaches to Gaussian mixture modeling[J].IEEE Transactions on Pattern Analysis and Machine Intelligence.1998,2.1133-1142.

二级参考文献11

1吴平.汉语会话中的反馈信号[J].当代语言学,2001,3(2):119-126. 被引量：32
2詹津明牟晓隆等.一个大字表语音识别系统中的语言模型.第五届全国人机语音通讯学术会议论文集[M].哈尔滨,1998.214-217.
3牟晓隆詹津明等.基于修正退化频度估计算法的n-gram语言模型.第五届全国人机语音通讯学术会议论文集[M].哈尔滨,1998.206-209.
4方棣棠李树青.汉语语音输入的研究现状与发展前景.第六届全国人机语音通讯学术会议论文集[M].深圳,2001.219-222.
5孙甲松王作英等.一个新的汉语连续语音识别系统THEESP.第五届全国人机语音通讯学术会议论文集[M].哈尔滨,1998.122-125.
6李爱军徐波.口语对话语音语料库CADCC和其语音标注.第五届全国现代语音学会议[M].-,2001..
7-.现代汉语频率词典[M].北京语言学院出版社,1986..
8孙国华.连续话语中的减音研究.第五届全国现代语音学会议资料[M].-,2001..
9孙放,胡光锐,虞晓.变帧率技术在语音识别中的应用[J].上海交通大学学报,1998,32(8):42-44. 被引量：3
10郑方,牟晓隆,徐明星,武健,宋战江.汉语语音听写机技术的研究与实现[J].软件学报,1999,10(4):436-444. 被引量：6

共引文献17

1苏杭,傅忆馨.汉语学术口语语料库的研制与应用[J].语料库语言学,2021,8(2):106-117.
2李爱军.普通话对话中韵律特征的声学表现[J].中国语文,2002(6):525-535. 被引量：47
3李朝虹,陆建湖.现代汉语自动分析研究现状综述[J].广西教育学院学报,2003(1):112-116. 被引量：1
4陈滟,施蕴中.中医留学生临床带教翻译模式[J].江西中医学院学报,2006,18(1):54-55. 被引量：1
5侯周国,钱盛友,姚畅.短时域语音端点检测中谱熵算法的改进[J].计算机工程与应用,2006,42(21):55-56. 被引量：3
6袁咏.英语专业学生朗读中话语标记语的韵律模式——一项基于语料库的纵深研究[J].解放军外国语学院学报,2008,31(1):43-47. 被引量：21
7陶红印,刘娅琼.从语体差异到语法差异(下)--以自然会话与影视对白中的把字句、被动结构、光杆动词句、否定反问句为例[J].当代修辞学,2010(2):22-27. 被引量：24
8达哇彭措,李永宏,张金爽.语音库的韵律标注及参数自动提取实现[J].西北民族大学学报（自然科学版）,2011,32(2):43-48. 被引量：1
9郭中子.普通话自然独白话语两音节韵律词的重音分析[J].宁波大学学报（人文科学版）,2014,27(6):39-45. 被引量：1
10郭中子.结构因素与汉语普通话自然话语两音节韵律词音高特征的交互性[J].当代外语研究,2015(10):10-18.

同被引文献59

1陈思宝,姚志强,胡郁,王仁华.基于树的相关系数补偿满方差建模技术[J].清华大学学报（自然科学版）,2008,48(S1):668-672. 被引量：1
2张文忠,郭晶晶.模糊评分:外语口语测试评分新思路[J].现代外语,2002,25(1):98-102. 被引量：29
3吴尊敬,曹志刚.Improved MFCC-Based Feature for Robust Speaker Identification[J].Tsinghua Science and Technology,2005,10(2):158-161. 被引量：6
4陈继光,祝令德.基于神经网络的马尔可夫预测模型[J].计算机工程与应用,2006,42(6):225-226. 被引量：16
5孙景涛.介音在音节中的地位[J].语言科学,2006,5(2):44-52. 被引量：13
6刘庆升,魏思,胡郁,郭武,王仁华.基于语言学知识的发音质量评价算法改进[J].中文信息学报,2007,21(4):92-96. 被引量：14
7李净,徐明星.汉语连续语音识别中声学模型基元比较:音节、音素、声韵母[C].第六届全国人机语音通信会议,20014:267-280.
8Yang Fengqin,Zhang Changhai.An effective hybrid optimization algorithm for HMM[C]//proceedings of the 4th International Conference on Natural Computation,Jinan,China,2008:80-84.
9Yang Fengqin,Zhang Changhai,Sun Tieli.Comparisun of particle swarm optimization and genetic algorithm for HMM training[C]//Proceedings of the 19th International Conference on Pattern Recognition,Tampa,USA,2008.
10邱天爽,刘文红,郭莹,等.现代数字信号处理与噪声降低[M].北京:电子工业出版社,2007:99-107.

引证文献7

1鄢志杰,胡郁,王仁华.一种基于区分性准则的模型结构优化方法[J].中文信息学报,2008,22(2):99-105. 被引量：1
2杨笔锋,张英杰.单状态基因克隆HMM语音训练算法[J].计算机工程与应用,2011,47(3):113-116. 被引量：1
3方凡泉,李心广,王桂珍,林江豪.语音质量客观评价方法研究及实现[J].广州大学学报（自然科学版）,2011,10(1):65-69. 被引量：4
4史国良,梁鹏,刘明宇.多重ANN/HMM混合模型在时序模式识别中的应用[J].哈尔滨师范大学自然科学学报,2011,27(6):53-55. 被引量：1
5齐欣,肖云鹏,叶卫平.普通话发音评估性能改进[J].中文信息学报,2013,27(3):48-55. 被引量：2
6董丽娜,何怡,叶卫平.基于小波分析的梅尔频率倒谱参数[J].北京师范大学学报（自然科学版）,2015,51(5):469-474. 被引量：2
7王勇和,飞龙,高光来.基于TDNN-FSMN的蒙古语语音识别技术研究[J].中文信息学报,2018,32(9):28-34. 被引量：5

二级引证文献16

1杨笔锋,张英杰.单状态基因克隆HMM语音训练算法[J].计算机工程与应用,2011,47(3):113-116. 被引量：1
2陆汝华,段盛.状态加权合成的CGHMM训练算法[J].应用科技,2012,39(4):6-10.
3张忠慧,方元.语音编码方案客观评价[J].计算机应用,2014,34(A01):265-267. 被引量：2
4任娟.高师《英语语音》课程建设探索与实践──以陇南师范高等专科学校《英语语音》课程建设为例[J].湖南大众传媒职业技术学院学报,2015,15(2):109-111. 被引量：1
5陈瑶瑶,郝建华,张子博.基于DCT变换的端到端语音加密算法[J].电子测量技术,2015,38(8):140-143. 被引量：4
6董丽娜,何怡,叶卫平.基于小波分析的梅尔频率倒谱参数[J].北京师范大学学报（自然科学版）,2015,51(5):469-474. 被引量：2
7陈锦.基于LPCMCC特征的英语音素发音质量客观评价方法[J].黑龙江科技信息,2016(15):166-166.
8邓勇,于晨松,文浩.基于倒谱和决策树的模拟电路故障诊断[J].电子测量与仪器学报,2017,31(3):430-435. 被引量：10
9寻惟德,陈征,陈焕新,郭亚宾,袁玥,刘桢.数据挖掘技术在冷链物流行业的应用[J].制冷与空调,2018,18(3):78-85. 被引量：1
10南措吉,才让卓玛,都格草.基于BLSTM和CTC的藏语语音识别[J].青海师范大学学报（自然科学版）,2019,35(4):26-33. 被引量：2

1张文国.连续汉语语音识别技术[J].自动化博览,1997(6):21-22.
2赵力,邹采荣,吴镇扬.基于连续分布型HMM的汉语连续语音的声调识别方法[J].信号处理,2000,16(1):20-23. 被引量：6
3赵庆卫,王作英,陆大紟.基于音节间相关识别单元的汉语连续语音识别算法[J].清华大学学报（自然科学版）,1999,39(9):65-68. 被引量：2
4赵鹤鸣,周旭东.基于知识的汉语连续语音识别研究[J].计算机研究与发展,1993,30(6):44-48. 被引量：2
5吴霁,侯伯亨.一种新的汉语连续语音音节分割方法[J].西部电子,1993,4(4):8-17.
6沈达阳.Java在中文信息处理中的应用[J].广东通信技术,2004,24(A01):87-90.
7王立建,陈壮,王欣,代红.中文信息处理标准化[J].信息技术与标准化,2004(11):21-24. 被引量：3
8王劲松,陈哲,冯静兰,顾明亮.半监督学习对十个口述数字的识别[J].电声技术,2010,34(4):50-52.
9钟金宏,杨善林,蒋俊杰.汉语连续语音中声调识别的特殊性研究[J].小型微型计算机系统,2002,23(4):470-473. 被引量：2
10薛宝.中国专利信息中心-北京师范大学机器翻译联合实验室揭牌[J].北京师范大学学报（自然科学版）,2011,47(2):137-137. 被引量：1

中文信息学报

2006年第6期

浏览历史

内容加载中请稍等...

汉语连续语音中HMM模型状态数优化方法研究被引量：7

参考文献6

二级参考文献11

共引文献17

同被引文献59

引证文献7

二级引证文献16

相关作者

相关机构

相关主题

浏览历史

汉语连续语音中HMM模型状态数优化方法研究 被引量：7

参考文献6

二级参考文献11

共引文献17

同被引文献59

引证文献7

二级引证文献16

相关作者

相关机构

相关主题

浏览历史

汉语连续语音中HMM模型状态数优化方法研究被引量：7