期刊文献+

一种改进Viterbi算法的应用研究 被引量:7

Application study of improved viterbi algorithm
下载PDF
导出
摘要 为降低现代汉语句法分析的难度,以北大和哈工大语料为基础,利用改进的Viterbi算法对汉语真实文本进行了短语识别研究。提出了在隐马尔可夫模型(HMM)框架下,训练阶段依据统计概率信息,以极大似然法获取HMM参数,识别阶段用一种改进的Viterbi算法进行动态规划,识别同层短语;在此基础上,运用逐层扫描算法和改进Viterbi算法相结合的方法来识别汉语嵌套短语。实验结果表明,识别正确率在封闭测试中可达93.52%,在开放测试中达到77.529%,证明该算法对短语识别问题具有良好的适应性和实用性。 To decrease the difficulty of syntax parsing, an improved Viterbi algorithm to recognize phrases in Chinese texts based on the corpus from Peking university and Harbin institute of technology is adopted. An efficient scheme for Chinese phrase recognition is pro- posed in the framework ofhidden Markov model, In the tagging system, statistics probability information and maximum likelihood estimation are used to get HMM parameters for training phase. An improved Viterbi algorithm for dynamic programming is presented to identify the same hierarchy phrase for identifying phase. Then the combination method of hierarchical syntax parsing and Viterbi algorithm is brought forward to identify those recursive phrases. The experimental results show that the precision rates of the phrase recognition in the closed test and the open test are 93.52 % and 77.529 % respectively, which proves that the algorithm has a better adaptability and practicability for phrase identification.
作者 李荣 郑家恒
出处 《计算机工程与设计》 CSCD 北大核心 2007年第3期530-531,571,共3页 Computer Engineering and Design
基金 山西省忻州师范学院科研基金项目(200623)
关键词 隐马尔可夫模型 VITERBI算法 层次分析 短语识别 句法分析 hidden markov model viterbi algorithm hierarchical analysis phrase recognition syntax parsing
  • 相关文献

参考文献9

二级参考文献13

  • 1赵明.手写印刷体汉字识别方法综述[J].计算机研究与发展,1993,30(4):59-64. 被引量:14
  • 2路浩如,杨源远.手写体汉字识别问题综论[J].计算机应用与软件,1994,11(2):1-8. 被引量:5
  • 3周强.规则和统计相结合的汉语词类标注方法[J].中文信息学报,1995,9(3):1-10. 被引量:43
  • 4周强.基于语料库和面向统计学的自然语言处理技术[J].计算机科学,1995,22(4):36-40. 被引量:25
  • 5周强.汉语语料库的短语自动划分和标注研究.北京大学博士研究生学位论文[M].-,1996..
  • 6赵军.汉语基本名词短语识别及结构分析研究.清华大学工学博士学位论文[M].-,1998..
  • 7孙宏林.现代汉语非受限文本的实语块分析.北京大学博士研究生学位论文[M].-,2001..
  • 8[1]Bernard Merialdo.Tagging English Text with a Probabilistic Model[J].Computational Linguistics,1995,20:155-171.
  • 9[2]Weischedel, Ralph; Meteer, Marie; Schwartz, Richard;Ramshaw, Lance;and Palmucci,Jeff(1993). Coping with ambiguity and unknown words through probabilistic models[J].Computational Linguistics,1996,19(2):359-382.
  • 10L R Rabiner.A turtorial on Hidden Markov Models and selected applications in speech recognition[C],In:Prec IEEE,1989;77(2):257-286.

共引文献95

同被引文献72

引证文献7

二级引证文献38

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部