-
题名基于网络语义标签的多源知识库实体对齐算法
被引量:27
- 1
-
-
作者
王雪鹏
刘康
何世柱
刘树林
张元哲
赵军
-
机构
中国科学院自动化研究所模式识别国家重点实验室
-
出处
《计算机学报》
EI
CSCD
北大核心
2017年第3期701-711,共11页
-
基金
国家自然科学基金项目(61533018)
国家"九七三"重点基础研究发展规划(2014CB340503)
"CCF-腾讯"犀牛鸟基金资助~~
-
文摘
知识库是多种自然语言处理任务的重要数据资源,但单一知识库覆盖度低,不同知识库异构性强,不利于数据的共享和集成.因此,多源知识库融合技术的研究有着十分重要的意义.其中,多源知识库实体对齐是多源知识库融合技术中的重要组成部分.在语义万维网发展的推动下,国外开展了很多相关工作,大多适用于英文知识库,对于中文知识库的研究较少.出于对中文知识库融合的研究目的,该文提出了一种基于网络语义标签的多源知识库实体对齐算法.该算法综合利用属性标签、类别标签和非结构化文本关键词,对齐中文百科实体.经实验测试,该算法能够较好地解决多源知识库实体对齐问题,算法在近95%的准确率下,仍能保持近55%的较好的召回率,应用于实际系统中,满足了实际的多源知识库实体对齐应用需求.
-
关键词
语义标签
多源知识库
实体对齐
异构
实体歧义
-
Keywords
semantic tags
multi-source knowledge bases
entity alignment
heterogeneous
entity ambiguity
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-