期刊文献+

基于粗糙集的海量数据挖掘算法研究 被引量:8

Research on massive data mining algorithm based on rough set
下载PDF
导出
摘要 针对传统数据挖掘算法在数据量级方面的局限性,提出在粗糙集理论的基础上,采用类分布链表结构改进传统的基于属性重要性的数据离散化算法、属性约简算法以及基于启发式的值约简算法;讨论了基于动态聚类的两步离散化算法,当算法适应大数据处理之后,采用并行计算的方法提高算法的执行效率。算法测试结果表明改进的算法能有效地处理大数据量,同时并行计算解决了大数据量处理带来的效率问题。 Since traditional data mining algorithms have the limitation of data magnitude,and on the basis of rough set theory,the class distribution list structure is used to improve the traditional data discretization algorithm based on attribute im-portance,attribute reduction algorithm and heuristic-based value reduction algorithm. A two-step discrete algorithm based on dynamic clustering is discussed. When the algorithm is suited for the big data processing,the parallel computing method is used to improve the execution efficiency of the algorithm. The test results of this algorithm show that the improved algorithm can process the massive data effectively,and the parallel computing can solve the efficiency problem caused by massive data processing.
出处 《现代电子技术》 北大核心 2016年第17期116-119,123,共5页 Modern Electronics Technique
基金 2015年四川省教育厅项目:基于主题爬虫技术的网络舆情监督及热点发现研究(15ZB0258) 2015年四川省教育厅旅游研究中心项目:数据挖掘算法在智慧服务中的应用(LYC15-16)
关键词 数据挖掘 粗糙集 大数据处理 并行计算 data mining rough set big data processing parallel computing
  • 相关文献

参考文献5

二级参考文献25

共引文献42

同被引文献98

引证文献8

二级引证文献45

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部