-
题名面向行业电商知识图谱应用的实体对齐算法
被引量:1
- 1
-
-
作者
陈富强
肖明明
韩凯南
任毅
王文文
李克
-
机构
北京联合大学智慧城市学院
中铁物贸集团有限公司
鲁班(北京)电子商务科技有限公司
-
出处
《高技术通讯》
CAS
2022年第12期1302-1311,共10页
-
基金
国家自然科学基金(61972040)
中铁物贸集团鲁班公司科技研究开发计划课题,北京市教育委员会科研计划(KM201911417010)
北京联合大学校内科研专项课题(ZB10202004)资助项目。
-
文摘
针对多源异构知识图谱数据融合中的实体对齐问题,本文面向行业电商领域电商平台真实数据,提出了一种基于领域知识的集合相似度实体对齐算法。首先,基于领域知识针对性设计数据预处理技术,如实体属性值原子化、统一术语和去除冗余等,以规范化电商底层多源异构数据、提升数据处理效率和准确性;然后,以行业电商知识图谱应用为导向,筛选实体对生成高质量候选集,优化集合相似度测量和实体对排序方法,实现实体对的高效匹配。实验结果表明,本文算法可有效提高多源异构数据融合的准确率,大幅减少人工干预,可为行业电商发展提供新思路。
-
关键词
多源异构数据
知识图谱
实体对齐
集合相似度
电子商务
-
Keywords
multi-source heterogeneous data
knowledge graph
entity alignment
set similarity
e-commerce
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
F724.6
[经济管理—产业经济]
-