-
题名面向脏数据的贝叶斯统计建模研究
被引量:1
- 1
-
-
作者
程炜东
王洪亚
郭开彦
-
机构
东华大学计算机科学与技术学院
-
出处
《智能计算机与应用》
2019年第2期104-107,111,共5页
-
文摘
为了处理贝叶斯建模中的脏数据,通常会有2种解决方法。一种是对整个数据集进行清洗,但这种方法的代价很高,且对中型或大型的数据集可行性较低。另一种是使用点估计,这种点估计的方法虽然能有效减少清洗的代价,但是对训练出来贝叶斯模型的可信程度没有保证。针对上述清洗方法中存在的问题,本文提出了一种基于区间的贝叶斯统计建模方法,简称区间贝叶斯建模。区间贝叶斯建模结合中心极限定理,使用区间估计的方法,保证了真实的后验概率会以一定的概率落在后验概率区间内。实验结果表明,区间贝叶斯建模通过清洗少量的样本,便能够训练出良好的贝叶斯模型,有效改善了清洗成本,并在精度和召回率上比不清洗任何数据的情况有显著的提升。
-
关键词
贝叶斯分类器
数据清洗
概率区间
区间比较策略
-
Keywords
Bayesian classifier
data cleaning
probability interval
interval comparison strategies
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-