期刊文献+

规则和统计相结合的汉语词类标注方法 被引量:43

Chinese Corpus Tagging Using Rule Techniques and Statistics Techniques
下载PDF
导出
摘要 本文分析了汉语的多类词现象与汉语词类标注的困难,介绍了汉语词类标注中的规则排歧和统计排歧的处理策略以及规则和统计相结合的处理思路。按此思路设计的软件系统,对封闭语料和开放语料的标注正确率分别达到了96.06%和95.82%。 Abstract In this paper,we analyze category ambiguities of Chinese words,and introduce the schemes of rulebased disambiguation and statistics-based disambiguation in Chinese corpus tagging.We also propose a method blending rule-based processing with statistics-based processing.Using this method to tag Chinese corpus,we get the tagging accuracy of 96.06%(close testing) and 95.82% (open testing).
作者 周强
出处 《中文信息学报》 CSCD 1995年第3期1-10,共10页 Journal of Chinese Information Processing
基金 国家自然科学基金
  • 相关文献

参考文献8

  • 1俞士汶,1994年
  • 2周强,计算机研究与运用,1993年
  • 3白栓虎,1992年
  • 4刘开瑛,1992年
  • 5俞士汶,1991年
  • 6减怀德,形容词用法词典,1991年
  • 7孟琮,动词用法词典,1985年
  • 8朱德熙,语法答问,1985年

同被引文献346

引证文献43

二级引证文献353

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部