期刊文献+

最大熵模型在最长地点实体识别中的应用 被引量:1

Application of Maximum Entropy Model in the LLE Identification
下载PDF
导出
摘要 实体识别是自然语言处理领域中一个十分重要的问题,是信息提取的基础,其识别程度直接影响了后续的句法分析、篇章理解等工作的精确程度。"熵"最初是热力学的一个概念,用来表示不确定度,熵越大,不确定性越大。"最大熵"模型是一种融合多种特征于一体,并综合这些特征进行建模,在满足约束的模型中选择熵最大的模型。"最大熵"模型可以综合观察到各种相关或不相关的概率知识,对许多问题的处理都可以达到较好的效果。通过实验分析了在新闻报道领域最长地点实体的特征,并应用了最大熵模型进行了识别研究。 Entity identification is an important field in Natural Language Processing (NLP). It's foundation of intbrmation extracuon and its accuracy has a direct effect on many NLP tasks such as Syntactic analysis, reading comprehension and so on. "Entropy" was a concept of thermodynamics originally, used to represent uncertainty, and it decreases with increasing of uncertainty. A Maximum Entropy Model combines variety of features to model and fits the right model from all satisfied constraint model. It can observe a variety of related or not related to the probability, and can better problem solving. This paper statistically analyse characteristics of the LLE and identify using the maximum entropy model.
出处 《广东石油化工学院学报》 2012年第4期40-42,45,共4页 Journal of Guangdong University of Petrochemical Technology
基金 湛江师范学院校级项目"突发事件中地点性实体提及的提取及研究"(QL1110)
关键词 最长地点实体 实体识别 最大熵模型 Longest Location Entity (LLE) Entity Recognition Maximum Entropy
  • 相关文献

参考文献5

二级参考文献25

  • 1王昀,苑春法.基于转换的时间-事件关系映射[J].中文信息学报,2004,18(4):23-30. 被引量:19
  • 2孙宏林,俞士汶.浅层句法分析方法概述[J].当代语言学,2000,2(2):74-83. 被引量:38
  • 3孙茂松,黄昌宁,高海燕,方捷.中文姓名的自动辨识[J].中文信息学报,1995,9(2):16-27. 被引量:87
  • 4沈达阳 孙茂松 黄昌宁.中文地名的自动识别[A]..计算语言学进展与应用[C].北京:清华大学出版社,1995..
  • 5Lu Jian-ming. Special nesting phenomena of Chinese constituents[C]//The Optional Paper Of Lu Jian-ming ZhengZhou, He'nan Education Press, 1993 : 174-192.
  • 6黄昌宁,林娟,孙承杰.何谓金本位[C]//自然语言理解与大规模内容计算-全国第八届计算语言学联合学术会议(JSCL-2005)论文集,北京:清华大学出版社,2005:ll-20.
  • 7赵军.基于转换的汉语基本名词短语识别模型[D].清华大学博士论文,1998.
  • 8LiWen-jie, Zhou Ming, Pan Hai-hua, et al. Corpus-based maximal-length Chinese noun phrase extraction [C]//Chen Li-wei, Yuan Qi eds Advances and Appli-cations on Computational Linguistics Beijing: Tsinghua University Press, 1995 : 119-124.
  • 9ACE. ACE Chinese Annotation Guidelines {or Entities (Version 5.5)[EB/OL]. http://www, ldc. upenru edu/ proj ects/ACE/docs/Chinese-Entities-Guidelines_v5. 5. pdf. 2005a.
  • 10ACE. ACE Chinese Annotation Guidelines for Events [EB/OL].

共引文献95

同被引文献21

  • 1李丽双,黄德根,陈春荣,杨元生.用支持向量机进行中文地名识别的研究[J].小型微型计算机系统,2005,26(8):1416-1419. 被引量:10
  • 2蔡华利,刘鲁,李红.基于规则推理的突发事件发生地点识别研究[J].情报学报,2011,30(2):219-224. 被引量:8
  • 3钱晶,张杰,张涛.基于最大熵的汉语人名地名识别方法研究[J].小型微型计算机系统,2006,27(9):1761-1765. 被引量:26
  • 4李丽双,黄德根,陈春荣,杨元生.SVM与规则相结合的中文地名自动识别[J].中文信息学报,2006,20(5):51-57. 被引量:32
  • 5NLPIR 汉语分词系统[EB/OL]. [2013-07-10]. http://ictclas.nlpir.org/downloads.
  • 6Li X W, Lv X Q, Liu K H. Automatic Recognition of Chinese Location Entity [A]. // Natural Language Processing and Chinese Computing [M]. Springer Berlin Heidelberg, 2014: 379-391.
  • 7Egenhofer M J. Toward the Semantic Geospatial Web[C]. In: Proceedings of the 10th ACM International Symposium on Advances in Geographic Information System. 2002.
  • 8杜薄.基于本体的中国行政区划地名识别与抽取研究[D].兰州:兰州大学,2011.
  • 9McCurley K S. Geospatial Mapping and Navigation of the Web [C]. In: Proceedings of "the I0th International Conference on World Wide Web, Hong Kong, China. 2001: 221-229.
  • 10Amitay E, Har'El N, Sivan R, et al. Web-a-Where: Geotagging Web Content [C]. In: Proceedings of the 27th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval,2004: 273-280.

引证文献1

二级引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部