期刊文献+

基于信息增益的数据库缺失值填充算法 被引量:4

Information Gain based Algorithm for Filling Missing Data
下载PDF
导出
摘要 在数据挖掘以及机器学习等领域,都需要涉及一个数据预处理过程。其中,缺失值的填充是一个非常具有挑战性的任务,因为填充效果的好坏会极大的影响学习算法及挖掘算法的后续处理过程.目前已有的一些填充算法在一定程度上能够处理缺失值问题.与已有的方法不同,提出了一种扩展的基于信息增益的缺失值填充算法,它充分利用数据集中各属性之间隐含的关系对缺失的数据进行填充。大量的实验表明,提出的扩展的基于信息增益的缺失值填充算法是有效的. In the data mining or machine learning field, a data preproeessing procedure is often neededoWhile the missing data filling is a very challenging task, because the filling results could greatly affect the following procedures of the learning or mining algorithms. While some existing filling algorithms can deal with the missing data problem to some extent. Different from existing methods, an extended information gain (IG) based algorithm is proposed in this paper for dealing with missing data, which fully utilizes the underlying relationships between attributes of the dataset. Extensive experiments show that the proposed algorithm is efficient.
作者 覃泽
出处 《微计算机信息》 北大核心 2007年第04X期180-181,186,共3页 Control & Automation
关键词 数据挖掘 缺失值填充 信息增益 分类准确率 Data Mining, Missing Data Filling, Information Gain, Classification Accuracy
  • 相关文献

参考文献6

  • 1韩家炜,坎伯.数据挖掘:概念与技术[M].北京:机械工业出版社,2000.
  • 2王清毅,蔡智,邹翔,蔡庆生.部分数据缺失环境下的知识发现方法[J].软件学报,2001,12(10):1516-1524. 被引量:18
  • 3王功明,关永,赵春江.面向对象数据库的关键技术和实现[J].微计算机信息,2006,22(02X):169-171. 被引量:6
  • 4Brown,M.L.,and Kros,J.F.,Data mining and the impact of missing data,Industrial Management & Data Systems,103/8[2003].611-621.
  • 5Zhang,C.,Yang,Q.and Liu,B.Intelligent Data Preparation.IEEE Transactions on Knowledge and Data Engineering 17(9):1163-1165,2005
  • 6Shichao Zhang,Yongsong Qin,Xiaofeng Zhu,Jilian Zhang and Chengqi Zhang.Optimized parameters for missing data imputation.In:Proceedings of the 9th Pacific Rim International Conference on Artificial Intelligence,PRICAI 2006.

二级参考文献5

共引文献26

同被引文献28

引证文献4

二级引证文献6

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部