期刊文献+

一种改进的统计与后串最大匹配的中文分词算法研究 被引量:7

Research of Chinese Word Segmentation Algorithms Based on Statistics and Reverse Maximum Match
下载PDF
导出
摘要 在比较各种传统分词方法优缺点的基础上,本文提出了一种新的分词算法。它采用改进的双向Markov链统计方法对词库进行更新,再利用基于词典的有穷自动机后串最大匹配算法以及博弈树搜索算法进行分词。实验结果表明,该分词算法在分词准确性、效率以及生词辨识上取得了良好的效果。 This paper analyzes several traditional methods for the Chinese word segmentation, compares the advantages and disadvantages of these methods, and presents a new segmentation algorithm. The method adopts the improved bidirectional Markov chain statistical method to update the word library, and then uses the Reverse Maximum Match method based on the word library and the GameTree search algorithm to cut the Chinese word strings. The experimental results show this algorithm has got better effect on veracity, efficiency and new word distinguishment.
出处 《计算机工程与科学》 CSCD 2008年第8期79-82,共4页 Computer Engineering & Science
基金 国家863计划资助项目(2006AA04Z131)
关键词 正向最大前串匹配 逆向最大前串匹配 统计法 有穷自动机 forward maximum match reverse maximum match statistical method definite finite automation
  • 相关文献

参考文献8

二级参考文献30

  • 1孙茂松,黄昌宁,邹嘉彦,陆方,沈达阳.利用汉字二元语法关系解决汉语自动分词中的交集型歧义[J].计算机研究与发展,1997,34(5):332-339. 被引量:66
  • 2张潮生,中文信息处理国际会议论文集,1987年
  • 3梁南元,中文信息,1986年,1期
  • 4姚天顺,计算机的汉字信息处理,1985年
  • 5管纪文,中文信息处理国际研讨论文集,1983年
  • 6芍大举,中文信息,1991年,1期,33页
  • 71991年
  • 8新华字典,1991年
  • 9李慧勤,1990年
  • 10黄昌宁,中国计算机用户,1990年,11期

共引文献146

同被引文献78

引证文献7

二级引证文献30

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部