一种改进Viterbi算法的应用研究被引量：7

Application study of improved viterbi algorithm

下载PDF

导出

摘要为降低现代汉语句法分析的难度,以北大和哈工大语料为基础,利用改进的Viterbi算法对汉语真实文本进行了短语识别研究。提出了在隐马尔可夫模型(HMM)框架下,训练阶段依据统计概率信息,以极大似然法获取HMM参数,识别阶段用一种改进的Viterbi算法进行动态规划,识别同层短语;在此基础上,运用逐层扫描算法和改进Viterbi算法相结合的方法来识别汉语嵌套短语。实验结果表明,识别正确率在封闭测试中可达93.52%,在开放测试中达到77.529%,证明该算法对短语识别问题具有良好的适应性和实用性。 To decrease the difficulty of syntax parsing, an improved Viterbi algorithm to recognize phrases in Chinese texts based on the corpus from Peking university and Harbin institute of technology is adopted. An efficient scheme for Chinese phrase recognition is pro- posed in the framework ofhidden Markov model, In the tagging system, statistics probability information and maximum likelihood estimation are used to get HMM parameters for training phase. An improved Viterbi algorithm for dynamic programming is presented to identify the same hierarchy phrase for identifying phase. Then the combination method of hierarchical syntax parsing and Viterbi algorithm is brought forward to identify those recursive phrases. The experimental results show that the precision rates of the phrase recognition in the closed test and the open test are 93.52 % and 77.529 % respectively, which proves that the algorithm has a better adaptability and practicability for phrase identification.

作者李荣郑家恒

机构地区忻州师范学院计算机系山西大学计算机与信息技术学院

出处《计算机工程与设计》 CSCD 北大核心 2007年第3期530-531,571,共3页 Computer Engineering and Design

基金山西省忻州师范学院科研基金项目(200623)

关键词隐马尔可夫模型 VITERBI算法层次分析短语识别句法分析 hidden markov model viterbi algorithm hierarchical analysis phrase recognition syntax parsing

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献9

1魏欧,吴健,孙玉芳,sonata.iscas.ac.cn.基于统计的汉语词性标注方法的分析与改进[J].软件学报,2000,11(4):473-480. 被引量：31
2Mak B,Bocchieri E.Direct training of subspace distribution clustering hidden Markov model[J].IEEE Transactions on Speech and Audio Processing,2001,9 (4):378-387.
3刘颖.用隐马尔柯夫模型对汉语进行切分和标注排歧[J].计算机工程与设计,2001,22(4):58-62. 被引量：11
4徐健,郑家恒.基于隐马尔克夫模型的现代汉语句法分析[J].计算机工程与应用,2003,39(27):109-112. 被引量：4
5童学锋,邓刚,柴佩琪.隐马尔可夫模型在脱机手写体汉字识别中的应用[J].计算机应用,2002,22(10):1-3. 被引量：8
6魏欧,孙玉芳.基于非监督训练的汉语词性标注的实验与分析[J].计算机研究与发展,2000,37(4):477-482. 被引量：6
7屈刚,陆汝占.基于特征的汉语词性标注模型[J].计算机研究与发展,2003,40(4):556-561. 被引量：6
8张昱琪,周强.汉语基本短语的自动识别[J].中文信息学报,2002,16(6):1-8. 被引量：41
9李荣.汉语名词短语自动识别方法研究[D].太原:山西大学硕士学位论文,2004.

二级参考文献13

1赵明.手写印刷体汉字识别方法综述[J].计算机研究与发展,1993,30(4):59-64. 被引量：14
2路浩如,杨源远.手写体汉字识别问题综论[J].计算机应用与软件,1994,11(2):1-8. 被引量：5
3周强.规则和统计相结合的汉语词类标注方法[J].中文信息学报,1995,9(3):1-10. 被引量：43
4周强.基于语料库和面向统计学的自然语言处理技术[J].计算机科学,1995,22(4):36-40. 被引量：25
5周强.汉语语料库的短语自动划分和标注研究.北京大学博士研究生学位论文[M].-,1996..
6赵军.汉语基本名词短语识别及结构分析研究.清华大学工学博士学位论文[M].-,1998..
7孙宏林.现代汉语非受限文本的实语块分析.北京大学博士研究生学位论文[M].-,2001..
8[1]Bernard Merialdo.Tagging English Text with a Probabilistic Model[J].Computational Linguistics,1995,20:155-171.
9[2]Weischedel, Ralph; Meteer, Marie; Schwartz, Richard;Ramshaw, Lance;and Palmucci,Jeff(1993). Coping with ambiguity and unknown words through probabilistic models[J].Computational Linguistics,1996,19(2):359-382.
10L R Rabiner.A turtorial on Hidden Markov Models and selected applications in speech recognition[C],In:Prec IEEE,1989;77(2):257-286.

共引文献95

1陈文亮,朱靖波,吕学强.词性标注规则的获取和优化[J].术语标准化与信息技术,2004(2):23-26. 被引量：5
2谭咏梅,姚天顺,陈晴,李珩,朱靖波.基于SVM+Sigmoid的汉语组块识别[J].计算机科学,2004,31(8):142-146. 被引量：3
3陈晓明,周渝.汉语部分句法分析的研究和发展趋势[J].贵州大学学报（自然科学版）,2004,21(4):384-386. 被引量：2
4张虎,郑家恒,刘江.汉语语料库词性标注自动校对方法研究[J].计算机应用,2005,25(1):17-19. 被引量：1
5方华,陆汝占,刘绍明.一个实现多种切分标注算法的系统[J].计算机工程,2004,30(24):122-124. 被引量：2
6李盼池,许少华.正规化模糊神经网络及在手写体汉字识别中的应用[J].计算机工程与设计,2005,26(3):816-817. 被引量：1
7曹建芳,郑家恒.基于SVM的汉语动词短语识别[J].咸阳师范学院学报,2004,19(6):32-34. 被引量：3
8梁以敏,黄德根.基于完全二阶隐马尔可夫模型的汉语词性标注[J].计算机工程,2005,31(10):177-179. 被引量：25
9干俊伟,黄德根.汉语介词短语的自动识别[J].中文信息学报,2005,19(4):17-23. 被引量：14
10陈笑蓉,秦进.基于最大熵原理的汉语词义消歧[J].计算机科学,2005,32(5):174-176. 被引量：7

同被引文献72

1钟祥财.中国近代研究经济思想史的方法论特点:以梁启超为例[J].财经研究,2010,36(8):36-45. 被引量：3
2刘传霞.爱情的解构与重建——两个“庐山恋”文本的比较[J].山东师范大学学报（人文社会科学版）,1999,44(2):87-89. 被引量：1
3黄仕忠.元明戏曲观念之变迁——以《琵琶记》的评论与版本比较为线索[J].艺术百家,1996,12(4):17-27. 被引量：3
4尹斌庸,方世增.词频统计的新概念和新方法[J].语言文字应用,1994(2):69-75. 被引量：33
5耿传明.严复的《天演论》与赫胥黎的《进化论与伦理学》[J].文艺理论研究,1997(6):69-74. 被引量：6
6李霞.本世纪以来《管子》研究简介[J].哲学动态,1994(3):40-43. 被引量：5
7崔尚森,冯博琴.最长前缀匹配查找的索引分离trie树结构及其算法[J].计算机工程与应用,2005,41(20):131-134. 被引量：5
8曹勇刚,曹羽中,金茂忠,刘超.面向信息检索的自适应中文分词系统[J].软件学报,2006,17(3):356-363. 被引量：48
9陈曜.《红楼梦》及英译本在中国的研究现状[J].理论月刊,2007(11):128-130. 被引量：4
10IBourland H,Wellekens C J.links between MarkoV models and multilay er PerdePtrons [J].IEEE Trans on PAMI ,1990,12(12): 1167-1178.

引证文献7

1陈免慧,沈炜.嵌入式语音系统信息采集算法研究[J].工业控制计算机,2015,28(12):64-65. 被引量：2
2刘婉婉,苏依拉,乌尼尔,仁庆道尔吉.基于门控循环神经网络词性标注的蒙汉机器翻译研究[J].中文信息学报,2018,32(8):68-74. 被引量：3
3姜安印,冯龙飞.基于Python的长文本比较研究——以《管子》与《国富论》经济思想比较为例[J].图书与情报,2018(2):67-73. 被引量：7
4蒋卫丽,陈振华,邵党国,马磊,相艳,郑娜,余正涛.基于领域词典的动态规划分词算法[J].南京理工大学学报,2019,43(1):63-71. 被引量：16
5李英,钱建国,方响,杨翾,董航,杨兴超.基于大数据背景的集中监控辅助决策系统研究[J].浙江电力,2019,38(10):34-39. 被引量：8
6Hang Zhang,Bin Wen.Construction of Word Segmentation Model Based on HMM+BI-LSTM[J].国际计算机前沿大会会议论文集,2020(2):47-61.
7张航,文斌.基于HMM+CRF词性标注的实体抽取方法[J].计算机与数字工程,2023,51(12):2929-2933. 被引量：2

二级引证文献38

1蒋旭东,杨莉,舒启江,刘红杏,张美娜,赵林波.中医药院校“互联网+”创新创业项目培育策略分析[J].创新创业理论研究与实践,2022(5):194-198.
2王俊力,冯锡炜,孟菲.石油石化设备巡检小车语音识别与控制系统设计与实现[J].电子设计工程,2017,25(22):74-77. 被引量：4
3王建仁,马鑫,段刚龙.改进的K-means聚类k值选择算法[J].计算机工程与应用,2019,55(8):27-33. 被引量：111
4常思亮,罗小丹,卢堃.“差评”研究生学位论文主要特点鉴别[J].黑龙江高教研究,2019,37(5):107-112. 被引量：22
5朱咸军,洪宇,黄雅琳,张馨予,肖芳雄.基于HMM的算法优化在中文分词中的应用[J].金陵科技学院学报,2019,35(3):1-7. 被引量：6
6高营.基于WOS API辅助准确检索学者论文程序的设计与实现[J].河北科技图苑,2020,33(1):83-87. 被引量：1
7张亚娜,高子婷,胡溢,杨成.融媒体新闻生产中的中文评论关键词提取[J].人工智能,2020(2):57-66. 被引量：4
8唐艺明.电子信息工程现代化技术的应用研究[J].浙江水利水电学院学报,2020,32(3):81-84. 被引量：6
9段翔兮,邹琬,高剑,李熠,杨紫苓,宋永娟.基于Unity3d的监控告警信息展示系统的设计与实现[J].四川电力技术,2020,43(3):78-84. 被引量：3
10陈美,李顿伟,高洪美,吴小丽.基于深度学习的《辞海》分词方法[J].现代计算机,2020,26(16):60-64. 被引量：2

1李荣,郑家恒,郭梅英.基于遗传算法的隐马尔可夫模型在名词短语识别中的应用研究[J].计算机科学,2009,36(10):244-246. 被引量：4
2徐丽,康瑞华.基于遗传算法的HMM参数估计[J].湖北工业大学学报,2006,21(4):68-71. 被引量：3
3孙永强,徐昕,黄遵国.基于HMM的分布式拒绝服务攻击检测方法[J].微电子学与计算机,2006,23(10):176-177. 被引量：4
4彭利民.基于HMM的足球视频语义分析研究[J].计算机工程与设计,2008,29(19):5002-5005. 被引量：2
5许满英,张永奎.基于HMM的中文BaseNp的识别[J].电脑开发与应用,2008,21(12):39-41.
6范长青,华宇宁.语音识别中改进viterbi算法的研究实现[J].科技资讯,2007,5(32):212-213. 被引量：1
7黄菊,张立志,赵志杰,孙华东,金雪松.基于GMM-HMM的静态手势识别[J].哈尔滨商业大学学报（自然科学版）,2015,31(3):345-349.
8张立志,黄菊,孙华东,赵志杰,陈丽,邢宗新.局部特征与全局特征结合的HMM静态手势识别[J].计算机科学,2016,43(S2):247-251. 被引量：7
9杨国亮,于仲安.基于改进光流算法和HMM的面部表情识别[J].微计算机信息,2008,24(1):284-285. 被引量：4
10陈魁,冯寅.一种基于隐马尔可夫模型的第一类对位生成方法[J].福建电脑,2008,24(9):63-64.

计算机工程与设计

2007年第3期

浏览历史

内容加载中请稍等...

一种改进Viterbi算法的应用研究被引量：7

参考文献9

二级参考文献13

共引文献95

同被引文献72

引证文献7

二级引证文献38

相关作者

相关机构

相关主题

浏览历史

一种改进Viterbi算法的应用研究 被引量：7

参考文献9

二级参考文献13

共引文献95

同被引文献72

引证文献7

二级引证文献38

相关作者

相关机构

相关主题

浏览历史

一种改进Viterbi算法的应用研究被引量：7