-
题名基于维基百科和模式聚类的实体关系抽取方法
被引量:23
- 1
-
-
作者
张苇如
孙乐
韩先培
-
机构
中国科学院软件研究所
中国科学院研究生院
-
出处
《中文信息学报》
CSCD
北大核心
2012年第2期75-81,127,共8页
-
基金
国家自然科学基金重大研究计划培育项目(90920010)
国家863计划重点项目(2008AA01Z145)
-
文摘
该文提出了一种基于维基百科和模式聚类的方法,旨在从开放文本中抽取高准确率的中文关系实体对。首次使用从人工标注知识体系知网到维基百科实体映射的方式获取关系实例,并且充分利用了维基百科的结构化特性,该方法很好地解决了实体识别的问题,生成了准确而显著的句子实例;进一步,提出了显著性假设和关键词假设,在此基础上构建基于关键词的分类及层次聚类算法,显著提升了模式的可信度。实验结果表明该方法有效提升了句子实例及模式的质量,获得了良好的抽取性能。
-
关键词
关系抽取
维基百科
模式聚类
-
Keywords
relation extraction
Wikipedia
pattern clustering
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-