期刊文献+

基于最大熵的蒙古文人名识别系统的设计与实现

下载PDF
导出
摘要 最大熵模型能充分利用上下文,灵活取用多个特征。使用最大熵模型进行蒙古文人名识别,分析蒙古文人名结构及上下文环境,根据语言特点设计特征模板,建立粗选特征集;建立人名知识库,提取精选特征集,训练最大熵模型;实验结果证明,本系统能有效识别蒙古文人名,开放测试的正确率达到94.56%,召回率达到85.15%,F值达到89.61%,识别效果较为理想。
出处 《图书馆理论与实践》 CSSCI 北大核心 2015年第5期96-98,共3页 Library Theory and Practice
基金 国家自然科学基金重点项目"跨语言社会舆情分析基础理论与关键技术"(项目编号:61331013)的研究成果之一
  • 相关文献

参考文献7

二级参考文献32

  • 1刘群,张华平,俞鸿魁,程学旗.基于层叠隐马模型的汉语词法分析[J].计算机研究与发展,2004,41(8):1421-1429. 被引量:198
  • 2周强.规则和统计相结合的汉语词类标注方法[J].中文信息学报,1995,9(3):1-10. 被引量:43
  • 3罗智勇,宋柔.现代汉语自动分词中专名的一体化、快速识别方法[C]//Ji Dong-Hong.国际中文电脑学术会议,新加坡,2001:323-328.
  • 4买合木提·买买提.基于统计的维吾尔语词性标注研究与实现[D].乌鲁木齐:新疆大学,2009.
  • 5宋柔,朱宏.基于语料库和规则库的人名识别法[C]//陈力为.计算语言研究与应用.北京:北京语言学院出版社,1993.
  • 6Zhang Huaping, Liu Qun, Yu Hongkui, et al. Chinese named entity recognition using role model[J]. The International Journal of Computational Linguistics and Chinese Language Processing, 2003, 8(2) : 29-60.
  • 7Wu Youzheng, Zhao Jun, Xu Bo, et al. Chinese named entity recognition based on multiple feature [C]//Proceedings of Human Language Technology Conference and Conference on Empirical Methods in Natural Language Processing(HLT/EMNLP), Vancouver, 2005: 427-434.
  • 8Ratnaparkhi A.A maximum entropy model for part-of-speech tagging[C]//Proceedings of the Conference on Empirical Methods in Natural Language Processing, 1996 : 133-141.
  • 9Zhao Yan, Wang Xiaolong.Applying class triggers in Chi- nese POS tagging based on maximum entropy model[C]// The 3rd International Conference on Machine Learning and Cybernetics,Shanghai,2004: 1641-1645.
  • 10Darroch J N, Ratcliff D.Generalized iterative scaling for log2 linear models[J].Analysis of Mathematical Statistics, 1999,43(5) : 1470-1480.

共引文献52

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部