期刊文献+

汉语自动分词词典机制的实验研究 被引量:118

An Experimental Study on Dictionary Mechanism for Chinese Word Segmentation
下载PDF
导出
摘要 分词词典是汉语自动分词系统的一个基本组成部分。其查询速度直接影响到分词系统的处理速度。本文设计并通过实验考察了三种典型的分词词典机制:整词二分、TRIE 索引树及逐字二分,着重比较了它们的时间、空间效率。实验显示:基于逐字二分的分词词典机制简洁、高效,较好地满足了实用型汉语自动分词系统的需要。 The dictionary mechanism serves as one of the basic components in Chinese word segmentation systems.Its performance influences the segmentation speed significantly.In this paper,we design and implement three typical dictionary mechanisms,i.e.binary seek by word,TRIE indexing tree and binary seek by characters,from word segmentation point of view,and compare their space and time complexity experimentally.It can be seen that the binary seek by characters model is the most appropriate one being capable of fulfilling the need for speed of practical Chinese word segmenters to the maximum extent.
出处 《中文信息学报》 CSCD 北大核心 2000年第1期1-6,共6页 Journal of Chinese Information Processing
基金 国家自然科学基金资助!(合同号:69433010)
关键词 中文信息处理 汉语自动分词 分词词典机制 Chinese information processing Chinese word segmentation Dictionary mechanism for Chinese word segmentation
  • 相关文献

参考文献2

共引文献82

同被引文献570

引证文献118

二级引证文献804

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部