异构网络中实体匹配算法综述被引量：2

A survey of entity matching algorithms in heterogeneous networks

下载PDF

导出

摘要互联网、物联网和云计算技术的不断融合,使得各行各业信息化程度越来越高,但同时也带来了数据碎片化的问题.数据碎片化的海量性、异构性、隐私性、相依性和低质性等特征,导致了数据可用性较差,利用这些数据难以挖掘出准确而完整的信息.为了更有效地利用数据,实体匹配、融合和消歧变得尤为重要.主要对异构网络中实体匹配算法进行了综述,对实体相似度度量和数据预处理技术进行了梳理;特别针对海量数据,概述了可扩展实体匹配方法的研究进展,综述了运用监督学习和非监督学习两类技术的实体匹配算法. The continuous integration of Internet, Internet of Things, and cloud comput ing technologies has been improving digitization across different industries, but it has also introduced increased data fragmentation. Data fragmentation is characterized by mass, heterogeneity, privacy, dependence, and low quality, resulting in poor data availability. As a esult, it is often difficult to obtain accurate and complete information for many r ＇ analytical tasks. To make effective use of data, entity matching, fusion, and disambiguation are of particular significance. In this paper, we summarize data preprocessing, similarity measurements, and entity matching algorithms of heterogeneous networks. In addition, particularly for large datasets, we investigate scalable entity matching algorithms. Existing entity matching algorithms can be categorized into two groups, supervised and unsupervised learning-based algorithms. We conclude the study with research progress on entity matching and topics for future research.

作者李娜金冈增周晓旭郑建兵高明 LI Na;JIN Gang-zeng;ZHOU Xiao-xu;ZHENG Jian-bing;GAO Ming(School of Data Science and Engineering,East China Normal University,Shanghai 200062,China)

机构地区华东师范大学数据科学与工程学院

出处《华东师范大学学报（自然科学版）》 CAS CSCD 北大核心 2018年第5期41-55,共15页 Journal of East China Normal University(Natural Science)

基金国家重点研发计划项目(2016YFB1000905) 国家自然科学基金广东省联合重点项目(U1401256) 国家自然科学基金(61672234 61502236 61472321) 上海市科技兴农推广项目(T20170303)

关键词数据融合实体匹配记录链接实体解析 data fusion entity matching record linkage entity resolution

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

同被引文献9

1谢红.基于词频比的改进Jaccard系数文本相似度计算[J].内江科技,2021,42(8):27-28. 被引量：9
2吴建华,万洋洋.利用泰森多边形的点实体匹配算法[J].测绘科学,2015,40(4):97-100. 被引量：8
3庄严,李国良,冯建华.知识库实体对齐技术综述[J].计算机研究与发展,2016,53(1):165-192. 被引量：86
4焦洋洋,武芳,翟仁健,陈艺文.利用灰色关联分析的居民地几何匹配方法[J].测绘科学技术学报,2017,34(1):96-101. 被引量：1
5崔铁军.基于全息论构建的全息地理空间数据模型框架[J].天津师范大学学报（自然科学版）,2017,37(5):36-43. 被引量：12
6孙群.多源矢量空间数据融合处理技术研究进展[J].测绘学报,2017,46(10):1627-1636. 被引量：67
7黄宝群,盛业华,郭宁宁,吕海洋,张思阳.同名边界点的面状居民地要素匹配[J].测绘科学,2018,43(2):108-113. 被引量：7
8朱继召,乔建忠,林树宽.表示学习知识图谱的实体对齐算法[J].东北大学学报（自然科学版）,2018,39(11):1535-1539. 被引量：9
9王凌阳,陈钦况,寿黎但,陈珂.多源异构数据的实体匹配方法研究[J].计算机工程与应用,2019,55(19):87-95. 被引量：7

引证文献2

1姜晶莉,郭黎,李豪,王云阁.面向空间关联的多源矢量数据空间实体匹配方法[J].测绘科学,2020,45(4):183-191. 被引量：9
2陈富强,肖明明,韩凯南,任毅,王文文,李克.面向行业电商知识图谱应用的实体对齐算法[J].高技术通讯,2022,32(12):1302-1311. 被引量：1

二级引证文献10

1王乃生,李祥武,白穆,庞晓峰,勾会杰.地理要素数据变化信息关联传递技术研究[J].测绘科学,2022,47(7):188-193.
2郭黎,姜晶莉,李豪,王云阁.多源地理空间矢量数据关联模型设计[J].测绘通报,2020(7):97-102. 被引量：7
3姜松言,宋国民,贾奋励,陈令羽,张蓝天.结合地名知识和位置信息的中文地名匹配方法[J].测绘通报,2022(5):120-125. 被引量：6
4黄元怀.多源矢量数据融合分析研究[J].工程技术研究,2022,7(12):222-224. 被引量：1
5刘贺,郭黎,李豪,张婉晨,白翔天.面实体匹配的集成学习CatBoost方法[J].地球信息科学学报,2022,24(11):2198-2211. 被引量：2
6王辉,邢伟,曹帅,阴鹏飞,史梦瑶.工业企业数据挖掘和知识图谱系统建设研究[J].中国标准化,2023(20):75-80.
7林烨婷,范炜琳,陈功伯,张良嵩,方晓明.异构网络通信平台数据智能可视化系统设计[J].信息技术,2023,47(12):81-86. 被引量：1
8刘丽丽.基于并行小波算法的多模态数据近似匹配模型构建[J].吉林大学学报（信息科学版）,2024,42(1):124-130.
9孙茜茜,代国标,李新芝,任延旭,王炎川.基于边缘控制的矢量数据空间校正方法研究[J].测绘标准化,2024,40(1):16-21.
10王朝,吴晓鹏,张方锐.基于ArcGIS的河道行洪排涝问题分析及优化[J].北京测绘,2024,38(8):1186-1192.

1韩姝敏,申德荣,聂铁铮,寇月,于戈.一种基于隐私保护下的多方记录链接方法[J].软件学报,2017,28(9):2281-2292. 被引量：4
2Yaoli XU,Zhanhuai LI,Qun CHEN,Fengfeng FAN.GL-RF： a reconciliation framework for label-free entity resolution[J].Frontiers of Computer Science,2018,12(5):1035-1037. 被引量：2
3刘宏,申德荣,寇月,聂铁铮,于戈.基于实体演化的记录链接算法[J].南京大学学报（自然科学版）,2017,53(6):991-1003. 被引量：1
4李东贤.Brandless做对了什么[J].商周刊,2018,0(17):42-43.
5苗金萍.激光网络光栅坏点数据检测[J].激光杂志,2018,39(5):116-119.
6马友忠,张智辉,林春杰.大数据相似性连接查询技术研究进展[J].计算机应用,2018,38(4):978-986. 被引量：15
7姚诚伟,陈根才.一种深度生成模型的超参数自适应优化法[J].实验室研究与探索,2018,37(2):48-53. 被引量：5
8宋美娜,赵雪君,鄂海红.基于分类的多属性实体推荐[J].系统仿真学报,2018,30(2):405-413. 被引量：1
9李家辉,周忠眉.关联分类及其改进算法综述[J].科技通报,2018,0(8):140-144. 被引量：6
10白悦岐.构建更接近大脑的多种可塑性共存的SNN[J].电子世界,2018,0(16):68-69.

华东师范大学学报（自然科学版）

2018年第5期

浏览历史

内容加载中请稍等...

异构网络中实体匹配算法综述被引量：2

同被引文献9

引证文献2

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

异构网络中实体匹配算法综述 被引量：2

同被引文献9

引证文献2

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

异构网络中实体匹配算法综述被引量：2