期刊文献+

MRClose:一种基于MapReduce的并行闭频繁项集挖掘算法

下载PDF
导出
摘要 频繁项集挖掘是最重要的数据挖掘任务之一,闭频繁模式项集是频繁项集的一种无损压缩形式,具有挖掘效率高、无冗余信息等优点。在大数据时代,基于单机的闭频繁项集挖掘算法不能适应海量数据的挖掘需求,需要并行的算法来解决。本文分析了并行闭频繁项集挖掘中搜索空间划分、剪枝策略的策略选择,设计了一种并行的全局闭项集筛选方法,提出一种基于Map Reduce计算模型的并行闭频繁项集挖掘算法MRClose。实验表明提出的算法实现了较好的均衡负载和低I/O量,在执行效率和结果压缩两方面较并行频繁项集挖掘算法具有更好的效果。
作者 胡娟 肖文
出处 《电子技术与软件工程》 2017年第22期169-171,共3页 ELECTRONIC TECHNOLOGY & SOFTWARE ENGINEERING
  • 相关文献

参考文献1

二级参考文献10

  • 1Aouad L M,Le-Khac N A,Kechadi T M. Performance Study of Distributed Apriori-Like Frequent Itemsets Mining[J].Knowledge and Information Systems,2010,(01):55-72.
  • 2Yu Kunming,Zhou Jiayi,Hong T P. A Load-Balanced Distributed Parallel Mining Algorithm[J].Expert Systems with Applications,2010,(03):2459-2464.
  • 3Shankar S,Purusothaman T. Utility Sentient Frequent Itemset Mining and Association Rule Mining:A Literature Survey and Comparative Study[J].International Journal of Soft Computing Applications,2009.81-95.
  • 4Hen Jiawei,Kamber M. Data Mining:Concepts and Techniques[M].London,UK:Morgan Kaufmann,2006.
  • 5Pei Jian,Han Jiawei,Mao Runying. CLOSET:An Efficient Algorithm for Mining Frequent Closed Itemsets[A].Dallas,USA,2000.21-30.
  • 6Wang Jianyong,Han Jiawei,Pei Jian. CLOSET +:Searching for the Best Strategies for Mining Frequent Closed Itemsets[A].Washington DC USA,2003.236-245.
  • 7Liu Guimei,Lu Hongjun,Yu J X. AFOPT:An Efficient Implementation of Pattern Growth Approach[EB/OL].http://ftp.informatik.rwth-aachen.de/Publications/CEURWS/Vol-90/liu.pdf,2003.
  • 8Liu Guimei,Lu Hongjun,Xu Yabo. Ascending Frequency Ordered Prefixtree:Efficient Mining of Frequent Patterns[A].Kyoto,Japan,2003.65-72.
  • 9Li Haoyuan,Wang Yi,Zhang Dong. PFP:Parallel FPGrowth for Query Recommendation[A].Lausanne,Switzerland,2008.107-111.
  • 10陶利民,黄林鹏.Cherry:一种无须子集检查的闭合频繁集挖掘算法[J].软件学报,2008,19(2):379-388. 被引量:6

共引文献17

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部