基于自适应哈希链的分布式频繁模式挖掘算法被引量：2

Distributed algorithm for mining frequent pattern based on adaptive hash chain structure

下载PDF

导出

摘要针对分布式系统,提出了自适应哈希链结构的频繁模式挖掘算法。该算法首先在每个站点产生局部频繁1-项集,再产生全局频繁1-项集,根据全局频繁1-项集产生各站点的投影数据库,在各个站点分别扫描投影数据库中的交易,并根据站点可用内存情况形成相应大小的哈希链结构。通过挖掘各站点的哈希链结构得到全局频繁项集。给出了基本步骤和挖掘算法。研究表明该算法不但效率高,而且适应性强。 An algorithm for mining frequent pattern is put forward based on adaptive hash chain structures for a distributed system. In this algorithm, first the frequent 1-itemsets are generated at every site, then global frequent 1-itemsets are generated and the projection database of the global frequent 1-itemsets is formed at every site. After the transaction of the projection database is scanned at every site respectively, corresponding hash chain structures that are fit for the available memory are constructed at every site and mined to gain the global frequent itemsets. The basic process and the mining algorithm are presented. The study shows that the algorithm has higher efficiency and adaptability than the exiting approaches.

作者叶飞跃

机构地区南京航空航天大学信息科学与技术学院

出处《系统工程与电子技术》 EI CSCD 北大核心 2005年第3期560-564,共5页 Systems Engineering and Electronics

基金江苏省高校自然科学研究计划基金资助课题(04KJB46003)

关键词数据挖掘频繁模式分布式自适应哈希链 data mining frequent pattern distributed adaptive hash chain

分类号 TP311.133 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献7

1Agrawal R, Srikant R. Fast algorithms for mining association rules[A].VLDB[C], 1994. 487-499.
2Han J, Pei J, Yin Y. Mining frequent patterns without candidate generation[A]. SIGMOD[C], 2000. 1- 12.
3Pei J, Han J, Lu H, et al. H-Mine: hyper-structure mining of frequent in large database[A]. Proc. Int. Conf. on Data Mining[C], 2001. 38.
4Park J S, Chen M S, Yu P S. Efficient parallel mining for association rules [ A ]. Proc. 4th Int. Conf. on information and Knowledge Management[C]. Baltimore, Maryland, 1995. 31-36.
5Agrawal R, Shafer J C. Parallel mining of association rules: design,implementation, and experience[ J]. IEEE Trans. Knowledge and Data Engineering, 1996. 962 - 969.
6Cheung David W, Han Jiawei, Ng Vincent T, et al. A fast distributed algorithm for mining association rules[A]. Proc. of 4th Int. Conf. on Parallel and Distributed Information Systems[ C], Miami Beach, Florida,December, 1996.31 - 43.
7叶飞跃,王建东,陈慧萍,张有东.基于哈希链结构的频繁模式挖掘[J].计算机工程与应用,2004,40(11):174-176. 被引量：4

二级参考文献1

1严蔚敏.数据结构[M].清华大学出版社,2001..

共引文献3

1彭勇.一种基于超级哈希树的关联规则挖掘算法[J].株洲工学院学报,2005,19(4):32-34.
2叶飞跃,吴访升,王建东.分布式系统中的元挖掘研究[J].系统工程与电子技术,2006,28(2):301-305. 被引量：1
3冯洁,陶宏才.典型关联规则挖掘算法的分析与比较[J].计算机技术与发展,2007,17(3):121-124. 被引量：12

同被引文献23

1陈慧萍,王建东,叶飞跃,王煜.基于FP-tree和支持度数组的最大频繁项集挖掘算法[J].系统工程与电子技术,2005,27(9):1631-1635. 被引量：2
2Dong G, Pei J. Sequence data mining[M]. NewYork : Springer, 2007.
3Han J, Cheng H, Xin D, et al. Frequent pattern mining: current status and future directions[J]. Data Mining and Knowledge Discovery, 2007, 15(1): 55- 86.
4Agrawal R, Srikant R. Mining sequential patterns[C]//Proc. of the llth International Conference on Data Engineering, 1995: 3-14.
5Pei J, Han J, Mortazavi-Asl B, et al. Mining sequential patterns by pattern growth : the PrefixSpan approach [J]. IEEE Trans. on Knowledge and Data Engineering, 2004, 16(11):1424 - 1440.
6Zaki M J. SPADE: an efficient algorithm for mining frequent se quences[J]. Machine Learning, 2001, 42 (1/2) : 31 - 60.
7Yah X, Han J, Afshar R. CloSpan: mining closed sequential patterns in large databases[C]//Proc, of the 3rd SIAM International Conference on Data Mining, 2003 : 166 - 177.
8Wang J, Han J, Li C. Frequent closed sequence mining without candidate maintenance[J]. IEEE Trans. on Knowledge and Data Engineering, 2007, 19(8) :1042-1056.
9Yang G. Computational aspects of mining maximal frequent patterns[J]. Theoretical Computer Science, 2006, 362 (1 - 3) : 63 - 85.
10Arimura H. Efficient algorithms for mining frequent and closed patterns from semi-structured data[C]// Proc. of the 12th Pacific-Asia Conference on Advances in Knowledge Discovery and Data Mining, 2008: 2- 13.

引证文献2

1叶飞跃,吴访升,王建东.分布式系统中的元挖掘研究[J].系统工程与电子技术,2006,28(2):301-305. 被引量：1
2李晋宏,杨炳儒,宋威,侯伟.基于包含索引的频繁闭序列模式挖掘的新算法[J].系统工程与电子技术,2009,31(10):2485-2488. 被引量：1

二级引证文献2

1钟晓桢.基于Apriori和IUA的改进算法[J].江汉大学学报（自然科学版）,2007,35(3):59-63. 被引量：4
2宋威,刘文博,李晋宏.基于动态裁剪频繁模式树的频繁项集并发挖掘算法[J].山东大学学报（工学版）,2011,41(4):49-55. 被引量：3

1公伟,刘培玉,贾娴.基于改进PrefixSpan的序列模式挖掘算法[J].计算机应用,2011,31(9):2405-2407. 被引量：12
2刘群,贾泂.一种分布式全局频繁项集挖掘方法[J].计算机工程与应用,2011,47(29):134-136.
3谢清森,杨天奇.改进的PrefixSpan算法在Web挖掘中的应用[J].科学技术与工程,2009,9(23):7176-7179. 被引量：2
4张艺雪,黄毅杰.一种基于MapReduce的Apriori改进算法研究[J].兰州工业学院学报,2014,21(6):13-16. 被引量：2
5郭进伟,皮建勇.基于MapReduce的SON算法实现[J].计算机应用,2014,34(A01):100-102. 被引量：7
6陈一心,杨磊,杨颖.基于分布式全局频繁项集挖掘算法的研究[J].计算机光盘软件与应用,2012,15(24):156-156.
7洪月华.传感器网络分布式数据流的频繁项集挖掘算法[J].计算机科学,2013,40(2):58-60. 被引量：4
8何波.基于频繁模式树的分布式关联规则挖掘算法[J].控制与决策,2012,27(4):618-622. 被引量：11
9曾庆森,黄贤英.基于FP-tree的快速数据挖掘算法[J].重庆工学院学报（自然科学版）,2009,23(10):72-76. 被引量：3
10宋宝莉,覃征.分布式环境下关联规则的安全挖掘算法[J].计算机工程,2006,32(21):35-37. 被引量：6

系统工程与电子技术

2005年第3期

浏览历史

内容加载中请稍等...

基于自适应哈希链的分布式频繁模式挖掘算法被引量：2

参考文献7

二级参考文献1

共引文献3

同被引文献23

引证文献2

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于自适应哈希链的分布式频繁模式挖掘算法 被引量：2

参考文献7

二级参考文献1

共引文献3

同被引文献23

引证文献2

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于自适应哈希链的分布式频繁模式挖掘算法被引量：2