摘要
实体关系抽取的核心问题是实体关系特征的选择。以往的研究通常都以词法特征、实体原始特征等来刻画实体关系,其抽取效果已难再提高。在传统方法的基础上,该文提出一种基于句法特征、语义特征的实体关系抽取方法,融入了依存句法关系、核心谓词、语义角色标注等特征,选择SVM作为机器学习的实现途径,以真实新闻文本作为语料进行实验。实验结果表明该方法的F1值有明显提升。
Identifying the relation features between named entities is the key aspect in named entity relation extrac- tion. Traditional methods usually chose the lexical features and other surface features, which are well addressed al- ready. This paper proposes a novel Chinese named entity relation extraction method, adding such syntactic and se- mantic features as dependency parsing, core predicate verb and semantic role labeling etc. Experimented by SVM o- ver a true news text corpus, the results indicate that this method could improve the F1 value significantly.
出处
《中文信息学报》
CSCD
北大核心
2014年第6期183-189,共7页
Journal of Chinese Information Processing
基金
国家社会科学基金重大项目(12&2D223)
国家"十二五"科技支撑计划课题(2012BAK24B01)
国家自然科学基金(61300144)
国家语委"十二五"重点项目(ZDI125-1)
教育部/国家外国专家局高等学校学科创新引智计划项目(B07042)
湖北省自然科学基金重点项目(2011CDA034)
华中师范大学中央高校基本科研业务费项目(CCNU13A05014
No.CCNU13C01001
CCNU13F010)
关键词
句法特征
语义特征
实体关系抽取
SVM
syntactic features
semantic features
named entity relation extraction
SVM