期刊文献+

全二分快速自动分词算法构建 被引量:6

A Design of Algorithm for Chinese Phrase Segmentation
下载PDF
导出
摘要 分析现有分词算法存在的不足,在此基础上提出一种新的分词词典,通过为分词词典建立首字Hash表和词索引表两级索引,使得该分词词典支持全二分最大匹配分词算法,利用该分词算法进行自动分词,其时间复杂度实现了大的改善。 This paper analyses the shortcoming of segmentation algorithm, designs a new algorithm for Chinese phrase segmentation. By building two levels index for Chinese thesaurus, we attain a highly efficient Chinese phrase segmentation thesaurus which supports hashing operation by means of the first Chinese character in a string and full binary search. Based on this thesaurus, we design a new algorithm for Chinese phrase segmentation.
作者 张海营
出处 《现代图书情报技术》 CSSCI 北大核心 2007年第4期52-55,共4页 New Technology of Library and Information Service
关键词 分词算法 汉语分词 Segmentation algorithm Chinese segmentation
  • 相关文献

参考文献8

二级参考文献53

共引文献163

同被引文献78

引证文献6

二级引证文献112

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部