-
题名基于重排序的迭代式实体对齐
被引量:9
- 1
-
-
作者
曾维新
赵翔
唐九阳
谭真
王炜
-
机构
国防科技大学信息系统工程重点实验室
地球空间信息技术协同创新中心(武汉大学)
新南威尔士大学计算机科学与工程学院
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2020年第7期1460-1471,共12页
-
基金
国家自然科学基金项目(61872446,61902417,71690233,71971212)
湖南省自然科学基金项目(2019JJ20024)
湖南省研究生科研创新项目(CX20190033)。
-
文摘
现有的知识图谱无法避免地存在不完整这一问题.缓解此问题的可行方法是引入外部知识图谱中的知识.在此过程中,实体对齐是最关键的步骤.当前最先进的实体对齐解决方案主要依靠知识图谱的结构信息来判断实体的等价性,但在真实世界知识图谱上,大部分实体只具有较低的节点度数以及微少的结构信息.此外,标注数据的缺乏也大大限制了实体对齐模型的效果.为解决上述问题,提出将不受节点度数影响的实体名信息与结构信息相结合,从更全面的角度实现实体对齐.在此基本框架上,利用基于课程学习的迭代训练方法从易至难地选择高置信度结果加入到训练数据中,扩增标注数据的规模.最后使用词移距离模型进一步改进实体名信息的利用方式,并对前序对齐结果重排序,提升实体对齐准确率.在跨语言以及单语言实体对齐任务上的实验结果表明,提出的实体对齐方法性能远好于当前最好的方法.
-
关键词
实体对齐
课程学习
迭代训练
重排序
知识图谱对齐
-
Keywords
entity alignment
curriculum learning
iterative training
re-ranking
knowledge graph alignment
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-