期刊文献+

面向中文自动分词的可扩展式电子词典研究 被引量:2

Extendable digital dictionary for automatic Chinese word segmentation
下载PDF
导出
摘要 在中文自动分词及词性标注系统中,电子词典是系统的重要组成部分,也是影响系统性能的重要因素之一。介绍了电子词典应该具备的查询功能及常用的组织结构,给出了一种结构为系统词典+用户词典的可扩展式电子词典机制。其系统词典是基于首字Hash散列的逐字二分词典结构,用户词典采用基于首字Hash散列的链接表词典结构,具有很强的扩展性和实用性。 Digital dictionary is an important part in automatic Chinese word segmentation and part of speech tagging,which is also a vital factor aftecting system performance.This thesis introduces the necessary searching thnetions and common components for a digital dictionary and proposes an extendable mechanism which consists of system dictionary and user dictionary.The system dictionary is indexed with initial character hash table characterized with character-based binary tree structure.The user's dictionary is also indexed with initial character hash table but augmented with linking structure.Experiment shows that the system is extendable in practice.
出处 《计算机工程与应用》 CSCD 北大核心 2008年第21期199-201,共3页 Computer Engineering and Applications
基金 国家自然科学基金( the National Natural Science Foundation of China under Grant No.60773173) 江苏省自然科学基金( the Natural Science Foundation of Jiangsu Province of China under Grant No.07YYB003)
关键词 电子词典 词典结构 自动分词 HASH digital dictionary dictionary structure automatic word segmentation hash
  • 相关文献

参考文献8

二级参考文献25

  • 1孙茂松,邹嘉彦.汉语自动分词研究中的苦干理论问题[J].语言文字应用,1995(4):40-46. 被引量:45
  • 2[5]刘源.信息处理用现代汉语分词规范及自动分词方法[M].北京:清华大学出版社,1992.
  • 3刘开瑛,自然语言处理,1990年
  • 4管纪文,计算机程序设计技巧.3,1984年
  • 5俞士汶,现代汉语语法信息词典详解,1998年
  • 6Chang Y I,IEEE Trans Knowledge Data Engineering,1997年,9卷,1期,179页
  • 7Chen C Y,IEEETranson Know ledge and Data Engineering,1997年,9卷,1期,148页
  • 8Chen I R,Computer J,1995年,38卷,3期,245页
  • 9Chen M S,IEEE Trans Knowledge Data Engineering,1995年,7卷,4期,656页
  • 10周国栋,学位论文,1992年

共引文献155

同被引文献7

引证文献2

二级引证文献6

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部