期刊文献+

一个改进的基于最大熵原理的汉语词性标注系统

An Improved Based on the Principle of Maxinum Entrogy of Speech Tagging System
下载PDF
导出
摘要 本文研究了基于最大熵原理的汉语词性标注。文章采用了准确率增量驱动的上下文特征选取策略,而后采用EM算法量化了特征之间的相依程度,并将其作为概率特征引入到统一的特征表示框架;建模过程充分利用了语法词典中的知识,针对外部词汇构造了伪事件,并将词的候选词性限制在一个特定的子集内,有效缩减了词性标记的搜索范围。文章以北京大学人民日报标记语料作为试验数据,验证了该方法的有效性。
出处 《光盘技术》 2007年第6期17-18,共2页 CD TECHNOLOGY
关键词 最大熵 特征选取 词典知识 汉语词性标注 maxinum entropy feature selection knowledge dictionary Chinese POS tagging
  • 相关文献

参考文献2

二级参考文献7

  • 1清华大学计算机科学与技术系.汉语词性自动标注系统技术报告[R].,1992..
  • 2Zhou Qiang,Chin Inf J,1996年,9卷,3期,1页
  • 3Zhang Chi,1996年
  • 4Zhou Ming,Proceedings of the NLPRS’95,1995年
  • 5赵铁军,Chin Inf J,1994年,7卷,4期,52页
  • 6Bai Shuanhu,硕士学位论文,1992年
  • 7郭玲,周献中.基于模糊最大熵原则的地图图像分割[J].计算机应用,2002,22(11):18-19. 被引量:4

共引文献21

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部