-
题名简约语法规则和最大熵模型相结合的混合实体识别
被引量:12
- 1
-
-
作者
陆铭
康雨洁
俞能海
-
机构
中国科学技术大学多媒体计算与通信教育部微软重点实验室
-
出处
《小型微型计算机系统》
CSCD
北大核心
2012年第3期537-541,共5页
-
基金
国家″八六三″高技术研究发展计划项目(2008AA01Z117)资助
国家自然科学基金重点项目(60933013)资助
+1 种基金
国家重大科技专项项目(2010ZX03004-003)资助
博士学科点专项科研基金项目(20070358040)资助
-
文摘
现有的命名实体识别算法多半采用统计与规则相结合的办法,但是这些方法有的没有考虑全局信息,有的没有解决好统计模型的时间复杂性问题.提出一个简约语法规则和最大熵模型相结合的混合命名实体识别方法,该方法采用简约语法规则与最大熵模型级联,首先使用简约语法规则模型进行识别,降低了使用复杂语法规则的时间复杂度,并把它的输出进行部分匹配,很好的弥补了由于简约语法规则带来的召回率偏低的问题,然后将得到的中间结果作为输入传递给最大熵模型,再由最大熵模型进行识别,得到最终的识别结果.实验结果表明,在MUC-7的命名实体识别评测中,系统的准确率、召回率和F值分别达到了94%,91%和92.48%,与已有的系统相比在性能上有很大的提升.
-
关键词
命名实体识别
简约语法规则
最大熵模型
部分匹配
-
Keywords
named entity recognition
basic grammar rule
maximum entropy model
partial matching
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-