期刊文献+

一种基于双哈希二叉树的中文分词词典机制 被引量:4

A DICTIONARY MECHANISM FOR CHINESE WORD SEGMENTATION BASED ON DOUBLE HASH BINARY TREE
下载PDF
导出
摘要 汉语自动分词是汉语信息处理的前提,词典是汉语自动分词的基础,分词词典机制的优劣直接影响到中文分词的速度和效率。详细介绍汉语自动分词的三种方法及五种词典机制,提出一种简洁而有效的中文分词词典机制,并通过理论分析和实验对比说明几种词典机制的效率差异来证明所提出分词词典机制的有效性。 Automatic Chinese word segmentation is the prerequisite for Chinese information processing,and dictionary is the basis of automatic Chinese word segmentation.Whether a dictionary mechanism of word segmentation is good or bad directly affects the speed and efficiency of Chinese word segmentation.In this paper,three kinds of Chinese word segmentation means and five kinds of dictionary mechanisms are introduced in detail.In the end,a simple and effective dictionary mechanism for Chinese word segmentation is proposed.Furthermore,through theoretical analysis and experiment,we compare and illustrate the differences in efficiency of a couple of dictionary mechanisms,and use the conclusion to prove the effectiveness of our dictionary mechanism for word segmentation.
作者 罗洋
出处 《计算机应用与软件》 CSCD 北大核心 2013年第5期251-253,306,共4页 Computer Applications and Software
关键词 中文信息处理 自动分词 词典 哈希 二叉树 索引 Chinese information processing Automatic word segmentation Dictionary Hash Binary tree Index
  • 相关文献

参考文献4

二级参考文献21

  • 1孙茂松,邹嘉彦.汉语自动分词研究中的苦干理论问题[J].语言文字应用,1995(4):40-46. 被引量:45
  • 2黄祥喜.书面汉语自动分词的现状和问题[J].情报学报,1989,8(2):125-133. 被引量:11
  • 3吴胜远.一种汉语分词方法[J].计算机研究与发展,1996,33(4):306-311. 被引量:49
  • 4马晏.基于评价的汉语自动分词系统的研究与实现[A]..语言信息处理专论[C].北京:清华大学出版社,1996..
  • 5[7]黄青松.中文全文信息检索系统中索引项技术及分词系统的实现[C].昆明:云南省计算机学会通讯,2000.
  • 6Choi A, Cheng C H, Ko Y L. Word extraction from Chinese documents by occurrence counts [ A].1988 International Conference on Computer Processing of Chinese and Oriental Languages, Toronto,Canada: 488 - 491.
  • 7Fan C K, Tsai W H. Automatic word identification in Chinese sentences by the relaxation technique[J]. Computer Processing of Chinese and Oriental Languages, 1988, 4(1):33-56.
  • 8黄昌宁.中文信息处理的主流技术是什么[N].计算机世界报,2002(44).
  • 9孙茂松.自动分词与中文搜索引擎[N].计算机世界报,2002,(44).
  • 10梁南元.书面汉语自动分词系统—CDWS[J].中文信息学报,1987,(2):44-52.

共引文献156

同被引文献27

引证文献4

二级引证文献3

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部