期刊文献+

聚类剪枝算法在离群点检测中的应用

下载PDF
导出
摘要 数据源中的离群点是由于系统受外部干扰而形成,它会直接影响模型的拟合精度,甚至会得到一些虚假的结论。在模型构建前期的数据预处理阶段,为有效检测样本中的离群点,采用聚类算法,按稠密度抽取非最稀疏的那些类进行剪枝后,利用箱线图进行离群点检测。经过实验验证该离群点检测算法具有较好的泛化性,检测结果符合预期。
作者 张青
出处 《广东通信技术》 2018年第12期58-61,75,共5页 Guangdong Communication Technology
  • 相关文献

参考文献4

二级参考文献32

  • 1王美华.数据挖掘领域中的聚类方法[J].南华大学学报(理工版),2004,18(1):58-62. 被引量:11
  • 2王鑫,王洪国,王珺,王金枝.数据挖掘中聚类方法比较研究[J].计算机技术与发展,2006,16(10):20-22. 被引量:22
  • 3胡庆林,叶念渝,朱明富.数据挖掘中聚类算法的综述[J].计算机与数字工程,2007,35(2):17-20. 被引量:36
  • 4梁志荣.数据挖掘中聚类分析的技术方法[J].电脑开发与应用,2007,20(6):37-39. 被引量:15
  • 5左嵩.基于数据挖掘的会员制图书连锁零售企业客户关系管理的研究及应用[D].上海:复旦大学,2010.
  • 6Zhang T, Ramakrishnan R, Livny M. BIRCH: An effi- cient data clustering method for very large databases [ C ]// Proceedings of the 1996 ACM SIGMOD International Con- ference on Management of Data. 1996:103-114.
  • 7Xu R, Wunsehll D. Survey of clustering algorithms[ J]. IEEE Transactions on Neural Networks, 2(305,16(3) :645-678.
  • 8Hu Hui-rong, Wang Zhou-jing. Two-level Hierarchical Cluste-ring Analysis and Application[ C]//第十届国际制造工程与管理会议论文摘要集.2002:283-284.
  • 9薛薇,陈欢歌.Clementine数据挖掘方法及应用[M].北京:电子工业出版,2012:279-286.
  • 10Han Jiawei, Micheline Kamber. Data Mining: Concepts and Techniques[ M]. USA: Morgan Kaufmann Publishers, :001 : 70-95.

共引文献8

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部