摘要
论文在基于粗糙集理论的基础上提出一个大数据系统的数据清洗模型,以利于信息不完备决策问题的实施。模型从给定的初始数据出发,在假定属性的重要性量度σ0的前提下,经过一系列的计算,比较属性实际重要性量度σCD(x)与σ0的大小,由此确定属性x的清洗,然后根据清洗后的数据得出相应的决策规则。并给出一个简单的例子来验证数据清洗模型。
This paper presents a data cleaning model of massive data based on rough set theory for executing decision system when information in hand is not perfect.Form the given initial data with provided essentiality measurement σ 0 ,a series of count is executed,hence comparing big betweenσ CD (x)andσ 0 ,meanwhile deciding to accept or give up the x.A simple example on validating the model is given.
出处
《计算机工程与应用》
CSCD
北大核心
2004年第31期164-165,182,共3页
Computer Engineering and Applications
关键词
粗糙集
数据清洗
重要性量度
决策系统
rough set,data cleaning model,essentiality measurement ,decision system