-
题名基于统计推理的不一致数据清洗方法
- 1
-
-
作者
张安珍
胡生吉
夏秀峰
-
机构
中国科学院沈阳计算技术研究所
沈阳航空航天大学计算机学院
-
出处
《计算机应用研究》
CSCD
北大核心
2024年第10期2987-2992,共6页
-
基金
国家自然科学基金青年基金资助项目(6210071734)。
-
文摘
不一致数据修复是数据清洗领域的一个重要研究方向,现有方法大多是基于完整性约束规则的,采用最小代价原则进行修复,然而,代价最小的修复方案通常是不正确的,导致现有修复方法的准确率较低。针对现有方法准确率较低的问题,提出了一种基于统计推理的不一致数据清洗方法BayesOUR,兼顾修复的代价与质量,提高修复准确性。BayesOUR主要分为三个阶段:首先根据完整性约束规则进行错误检测;然后利用贝叶斯网络推理所有可能的一致性修复方案概率;最后选择概率最大的修复方案进行数据清洗。真实数据上的实验结果表明,该方法与目前领先的方法相比,能够显著提高不一致数据修复的准确性。
-
关键词
不一致数据
贝叶斯网络
统计推理
-
Keywords
inconsistent data
Bayesian network
probabilistic inference
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-