期刊文献+

基于最大熵模型的中国人名自动识别 被引量:7

Automatic recognition of Chinese name based on maximum entropy
下载PDF
导出
摘要 用最大熵模型自动识别中国人名。首先对语料库的词性进行角色替换,然后用特征模板从角色替换后的语料库中提取出特征集,接着用IIS算法训练特征集的最大熵参数,最后用viterbi算法对初分词文本进行角色标注,并在角色序列的基础上进行模式最大匹配,从而实现中国人名的自动识别。在封闭测试实验中,识别准确率、召回率、F-值分别达到了85.4%、91.2%、88.2%。 Authors use the maximum entropy model to recognize the Chinese name automatically.Firstly,authors replace the corpus's poses with roles,then,use feature template to extract feature set from the corpus which poses have been replaced with roles,thirdly,train the parameters of the feature set using IIS algorithm,finally,use the viterbi algorithm to tag the text which has been roughly segmented.The possible names are recognized after maximum pattern matching on the roles sequence.The closed test shows that the precision,the recall and the F-measure reach 75.6%,91.4%,82.8%.
出处 《计算机工程与应用》 CSCD 北大核心 2009年第4期227-228,234,共3页 Computer Engineering and Applications
基金 国家自然科学基金No.60564001~~
关键词 中国人名识别 最大熵模型 VITERBI算法 Chinese name recognition maximum entropy model viterbi algorithm
  • 相关文献

参考文献5

二级参考文献32

  • 1刘群,张华平,俞鸿魁,程学旗.基于层叠隐马模型的汉语词法分析[J].计算机研究与发展,2004,41(8):1421-1429. 被引量:197
  • 2李荣陆,王建会,陈晓云,陶晓鹏,胡运发.使用最大熵模型进行中文文本分类[J].计算机研究与发展,2005,42(1):94-101. 被引量:95
  • 3孙茂松,黄昌宁,高海燕,方捷.中文姓名的自动辨识[J].中文信息学报,1995,9(2):16-27. 被引量:87
  • 4罗智勇,宋柔.现代汉语自动分词中专名的一体化、快速识别方法[C]//Ji Dong-Hong.国际中文电脑学术会议,新加坡,2001:323-328.
  • 5[2]Darroch J N,Ratcliff D.Generalized iterative scaling for log-linear models[J].The Annals of Mathematical Statistics, 1972;43(5): 1470-1480
  • 6[3]Au R Rosenfeld. Adaptive language modeling using the maximum entropy principle[C].ln:Proceedings of the Human Language Technology Workshop ,ARPA: 1993: 108-113
  • 7[4]Rosenfeld R.A maximum entropy approach to adaptive statistical language modeling[J].Computer, Speech, and Language, 1996; 10
  • 8[5]Jaynes E T.Notes on present status and future prospects[C].ln:Grandy W T,Schick L Heds. Maximum Entropy and Bayesian Methods,Kluwer: 1990:1-13
  • 9罗智勇 宋柔.现代汉语自动分词中专名的一体化、快速识别方法[A]..ICCC,Singapore[C].,2001.11..
  • 10Ji Heng, Luo Zhen-Shen. Inverse name frequency model and rules based on Chinese name identifying. In: Huang ChangNing, Zhang Pu ed.. Natural Language Understanding and Machine Translation. Beijing: Tsinghua University Press,2001, 123 - 128( in Chinese)(季姮,罗振声.基于反比概率模型和规则的中文姓名自动辨识系统.见:黄昌宁,张普编.自然语言理解与机器翻译.北京:清华大学出版社,2001,123-128)

共引文献259

同被引文献53

引证文献7

二级引证文献32

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部