期刊文献+

采用机器学习的聚类模型特征选择方法比较 被引量:3

Comparison of Feature Selection Method of Clustering Model Using Machine Learning
下载PDF
导出
摘要 针对机器学习聚类模型在特征选择时存在的问题,首先,对特征选择在聚类模型中的适用性进行分析并对其进行调整和改进.然后,基于R语言中的递归特征消除(RFE)特征选择方法和Boruta特征选择方法进行特征选择算法设计.最后,应用聚类内部有效性指标,对在线品牌忠诚度聚类模型优化结果进行分析,进而对特征选择方法进行比较研究.结果表明:Boruta特征选择方法更具优势. Targeting at problems during the feature selection process of machine learning clustering model, at first,it makes analysis on the applicability of the feature selection for clustering model and makes adjustment and improvement. Then makes feature selection algorithm design based on R language recursive feature elimi-nation (RFE) feature selection method and Boruta feature selection method. At last, applying cluster interior validity indexes to analyze the optimization result of online brand loyalty clustering model, a further compara-tive study is made on the feature selection method. The results show that the Boruta feature selection method has more advantages.
作者 赵玮
出处 《华侨大学学报(自然科学版)》 CAS 北大核心 2017年第1期105-108,共4页 Journal of Huaqiao University(Natural Science)
基金 北京市教委科研计划项目(KM201511417010)
关键词 特征选择 聚类模型 机器学习 递归特征消除算法 Boruta方法 feature selection clustering model machine learning recursive feature elimination algorithm Boruta method
  • 相关文献

参考文献4

二级参考文献152

  • 1江小平,李成华,向文,张新访,颜海涛.k-means聚类算法的MapReduce并行化实现[J].华中科技大学学报(自然科学版),2011,39(S1):120-124. 被引量:79
  • 2王咏梅,陈家琪,耿玉良.一种可交互的数据清洗系统[J].计算机工程与设计,2005,26(4):955-957. 被引量:7
  • 3杨善林,李永森,胡笑旋,潘若愚.K-MEANS算法中的K值优化问题研究[J].系统工程理论与实践,2006,26(2):97-101. 被引量:190
  • 4刘奕群,张敏,马少平.面向信息检索需要的网络数据清理研究[J].中文信息学报,2006,20(3):70-77. 被引量:5
  • 5Han Jiawei,Kamber M.Data Mining Concepts and Techniques[M],USA,Boston:Morgan Kaufmann Publishers,2001.
  • 6EfremC.Mallach.决策支持与数据仓库系统[M].北京:电子工业出版社,2001..
  • 7Datta A.Thomas H.The Cube Data Model:a Conceptual Model and Algebra for On-line Analytical Processing in Data Warehouses[J],Decision Support Systems,1999,27(3):289 ~301.
  • 8刘蓉."利用数据仓库技术完善综合电信管理决策系统"[J].湖南省通信学会年会优秀获奖论文,1999,11(11):142-148.
  • 9Lin T.Y.Cerone N.Rough Sets and Data Mining Analysis[M],USA Boston:Kluwer Academic Pubishers,1997.
  • 10Rahm E, Do H. H. Data Cleaning: Problems and Current Approaches[J]. IEEE Data Engineering Bulletin, 2000, 23(4): 3- 13.

共引文献207

同被引文献28

引证文献3

二级引证文献8

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部