-
题名基于因子图的不一致记录对消歧方法
被引量:2
- 1
-
-
作者
徐耀丽
李战怀
陈群
王艳艳
樊峰峰
-
机构
西北工业大学计算机学院
大数据存储与管理工业和信息化部重点实验室(西北工业大学)
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2020年第1期175-187,共13页
-
基金
国家重点研发计划项目(2018YFB1003403)
国家自然科学基金项目(61732014,61672432)
陕西省自然科学基础研究计划项目(2018JM6086)~~
-
文摘
实体解析(entity resolution,ER)是数据集成和清洗系统的关键基础问题.尽管有大量实体解析方法提出,但这些方法依赖隐式或显式的假设或采用不同的解析策略.对相同的实体解析任务进行处理后,它们的结论存在冲突,产生了大量的不一致记录对.在没有给定标记数据的情况下,进行这类记录对的消歧处理具有很大的挑战:一方面当标签数据缺失时,评估现存方法的解析效果并选出最优的不可行,另一方面尽管可选的方法是协调这些冲突结果以得到一致的标记方案,但有效且融合所有提示信息的消歧策略还有待研究.为此,提出了一种基于因子图的不一致记录对消歧方法.该方法首先对某给定的实体解析任务使用现存的实体解析技术进行实体解析,得到一致或不一致的记录对;接着,用核密度估计、匹配信息传递等方法输出与不一致记录对是否匹配相关的特征,并把这些建模为因子图的因子函数,该因子图是一个带因子权重的联合概率分布;最后基于最大似然估计方法估计出各因子的权重,并基于该分布对不一致记录对进行消歧处理.实验结果表明:在真实的数据集合,该方法有效且优于现存最好的方法.
-
关键词
数据集成
实体解析
最大似然估计
不一致记录对
核密度估计
因子图
-
Keywords
data integration
entity resolution
maximum likelihood estimation
inconsistent pair
kernel density estimation (KDE)
factor graph
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名GPS参考站观测与记录时间不一致问题的解决方法
被引量:1
- 2
-
-
作者
张勇
朱丽强
王建
-
机构
苏州工业园区格网信息科技有限公司
江苏CORS苏州分中心
四川省第一测绘工程院
-
出处
《大地测量与地球动力学》
CSCD
北大核心
2014年第1期148-152,共5页
-
基金
精密工程与工业测量国家测绘地理信息局重点实验室开放基金(PF2011-2)
-
文摘
在对GPS参考站数据的周跳探测中,发现Rinex文件中的记录时刻与观测时间不一致,记录时间的不一致导致利用不同方法探测周跳的结果出现矛盾。针对该问题,提出了采用组合周跳探测与观测历元修复等两种解决方法,并验证了两种方法的可行性与有效性。
-
关键词
GPS参考站
周跳探测
观测与记录时刻不一致
电离层无关组合
WM组合观测值
-
Keywords
GPS reference station
cycle slip detection
inconsistency between observation and recording time
ion-osphere-independent combination
WM combination observation
-
分类号
P207
[天文地球—测绘科学与技术]
-