期刊文献+

基于遗传算法的组合数据预处理技术 被引量:2

Data Preprocessing Combination Algorithm Based on Genetic Algorithm
下载PDF
导出
摘要 针对现实世界中数据的杂乱性、冗余性和不完整性而提出了一种基于遗传算法的组合数据清理方法。利用这种方法,使得数据在挖掘之前具有更好的完整性和一致性,可以提高数据挖掘模式的总体质量和减少实际挖掘所需要时间。以学生成绩作为试验对象进行了分析和研究,有效地去除了数据中的噪声,试验结果证明了此方法的可行性和有效性。 A data preprocessing combination algorithm was put forward to avoid imperfection and inconsistency of data in real world.This algorithm made data more cleaning and integrated before data mining,which improved data mining quality and reduces data mining time.A test applies in students grade research was set up and gets valid results.
出处 《沈阳农业大学学报》 CAS CSCD 北大核心 2008年第1期121-123,共3页 Journal of Shenyang Agricultural University
基金 国家自然科学基金项目(70572070)
关键词 数据挖掘 数据预处理 噪声数据 遗传算法 组合算法 data mining data preprocessing noisy data genetic algorithm combination algorithm
  • 相关文献

参考文献6

  • 1罗斌.数据挖掘研究进展.中国水运:学术版,2007,(7):56-58.
  • 2HAN J W,KAMBERM. Data Mining:Concep ts and Techniques[M]. San Francisco,CA. Morgan Kaufmann,2001:2-7.
  • 3HanJiawei MichelineKambe.数据挖掘概念与技术[M].北京:机械工业出版社,2001..
  • 4朱明.数据挖掘[M].北京:中国科学技术出版社,2001:81-85.
  • 5符静.数据挖掘:情报学的发展[J].大学图书情报学刊,2005,23(4):44-45. 被引量:7
  • 6陈莉,焦李成.基于自适应聚类的数据预处理算法I[J].计算机应用与软件,2005,22(3):28-29. 被引量:9

二级参考文献16

  • 1石冰,郑燕峰.信息检索中的数据挖掘技术[J].情报学报,1999,18(S1):108-111. 被引量:26
  • 2郭际元,江宝得,江雯倩,李洋.空间数据挖掘技术与发展趋势[J].国土资源导刊,2004,1(3):49-50. 被引量:3
  • 3Matthew P.,Rafael A.C.,Fast Dimensionality Reduction and Simple PCA.Intelligent Data Analysis.1998,2.203~214.
  • 4Davies S.,Moore A.,Bayesian Networks for Lossless Dataset Compression.In Proceedings KDD'99.San Diego CA USA.1999.
  • 5Slowinski R.,Stafanowski J.,Rough Classification in Incomplete Information System.Mathematical and Computer Modelling.1989,12.1347~1357.
  • 6Liang J.,Xu Z.,Uncertainty Measures of Roughness of Knowledge and Rough Sets.In Incomplete Information System.The Third World Congress on Intelligent Control and Automation.2000.2526~2529.
  • 7Hong T.P.,Wang T.T.,Wang S.L.,Knowledge Acquistion from Quantitative Data Using the Rough Set Theory.Intelligent Data Analysis.2000,4.289~304.
  • 8Xu X.,Ester M.,Kriegel H.P.et al.A Distribution-Based Clustering Algorithm for Mining in Large Spatial Databases.Proceedings of the 14^th International Conference on Data engineering.1998.324~331.
  • 9Zhang T.,Ramakrishnan R.,Livny M.,BIRCH:An Efficient Data Clustering Method for Very Large Databases.Proceedings of the ACM SIGMOD International Conference on Management of Data.Montreal,Canada.1996.
  • 10Agrawal R.,Gehrke J.,Gunopolos D.et al.Automatic Subspace Clustering of High Dimension Data for Data Mining Applications.Proceedings of the ACM SIGMOD International Conference on Management of Data.1998.

共引文献163

同被引文献12

引证文献2

二级引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部