期刊文献+

一种基于规则优先级的词性标注方法 被引量:4

A Method of POS Tagging Based on Priority of Rules
下载PDF
导出
摘要 词性标注作为汉语自动分词以至中文信息处理领域比较关键的问题之一,是该领域的研究难点也是研究重点,对兼类词词性标注的正确率严重影响着词性标注的质量。在基于规则的词性标注的基础上,提出了一种基于规则优先级的词性标注方法,即对每条词性标注规则加上优先级,并在标注算法中通过对优先级进行控制来完成兼类词的词性标注。并用大规模语料对该方法做了试验,结果表明其词性标注正确率可达到96.4%。 As one of the important problem in the field of Chinese automatic word segmentation and Chinese information process, part of speech tagging is the research difficulty and emphases in the filed. The precision of POS tagging to syntactic category has influenced badly the quality of POS tagging. On the basis of POS tagging based on rules, proposed a method of POS tagging based on PRI of rules, that is adding PRI to each rule.Through controlling the PRI in the tagging algorithm,POS tagging to syntactic categories can be completed. Lots of examples are used to test the method, The result shows that the precision of POS tagging is 96.4%.
出处 《安徽工业大学学报(自然科学版)》 CAS 2008年第4期426-429,共4页 Journal of Anhui University of Technology(Natural Science)
关键词 汉语自动分词 词性标注 兼类词 规则优先级 Chinese automatic word segmentation POS tagging syntactic category priority of rules
  • 相关文献

参考文献6

二级参考文献24

  • 1周强.规则和统计相结合的汉语词类标注方法[J].中文信息学报,1995,9(3):1-10. 被引量:43
  • 2周强.基于语料库和面向统计学的自然语言处理技术[J].计算机科学,1995,22(4):36-40. 被引量:25
  • 3刘开瑛 陈肇雄.语料库词类自动标注算法研究.机器翻译研究进展[M].北京:电子工业出版社,1992.378-386.
  • 4白栓虎 陈肇雄.汉语语料库词性标注方法研究.机器翻译研究进展[M].电子工业出版社,1991,12.401-402.
  • 5王素格 张永奎.汉语词性标注中兼类词排歧算法探讨.计算语言学文集[M].北京:清华大学出版社,1999,11.162-166.
  • 6王素格.汉语词性标注知识获取方法研究:硕士论文[M].山西大学,2000,6..
  • 7俞士汶,1994年
  • 8周强,计算机研究与运用,1993年
  • 9白栓虎,1992年
  • 10刘开瑛,1992年

共引文献79

同被引文献26

引证文献4

二级引证文献66

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部