一种改进的最大频繁项目集挖掘算法被引量：2

An Improved Maximal Frequent Itemsets Mining Algorithm

下载PDF

导出

摘要本文提出了一种基于布尔矩阵FP-array的最大频繁项目集挖掘的并行算法。该算法利用基于前缀的划分方法将事务数据集划分为较小的子空间,并将具有完全包含关系的项目集分配到同一处理机,然后各处理机站点Si分别进行局部最大频繁项目集的挖掘,再将挖掘结果传送到主站点S,最后得到全局最大频繁项目集。 An improved parallel algorithm for mining maximal frequent itemsets based on FP-array is proposed in this paper. The algorithm divides the transaction data sets into smaller one based on the prefix, and distributes the itemsets which have the complete include relationship to the same site. Then each site Si mines local maximal frequent itemsets reapectively, and delivers the mining results to the main site S. Finally, the global maximal frequent itemsets are obtained.

作者潘益婷张红娟严建军

机构地区杭州电子科技大学计算机学院嘉兴学院

出处《计算机工程与科学》 CSCD 北大核心 2009年第8期63-65,共3页 Computer Engineering & Science

关键词最大频繁项目集并行算法布尔矩阵 maximal frequent itemsets parallel algorithmm FP-array

分类号 TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献7

1Bayado R J. Efficiently Mining Long Patterns from Databases [C]//Proc of the 1998 ACM SIGMOD Int'l Conf on Management of Data, 1998 : 85-93.
2Lin D, Kedem Z M. Pineer-Seareh:A New Algorithm for Discovering the Maximum Frequent Set[C]//Proc of EDBT' 98, 1998:105-119.
3Agarwal R C, Aggarwal C C, Prasad V V V. Depth First Generation of Long Pattems[C]//Proc of the 6th ACM SIGMOD Int'l Knowledeg Discovery and Data Mining, 2000 :108-118.
4Agrawal R, Shafer J C. Parallel Mining of Association Rules [J].IEEE Trans on Knowledge and Data Engineering, 1996,8(6): 962-969.
5Schuster A, Wolff R. Communication Efficient Distributed Mining of Association Rules[J].Data Mining and Knowledeg Discovery, 2004,8 (2) : 473-484.
6宋宝莉,覃征.分布式全局频繁项目集的快速挖掘方法[J].西安交通大学学报,2006,40(8):923-927. 被引量：11
7朱玉全,宋余庆,陈耿.关联规则挖掘中增量式更新算法的研究[J].计算机工程与应用,2005,41(15):186-187. 被引量：8

二级参考文献16

1Han J,Kamber M.Data Mining:Concepts and Techniques[M].Beijing: High Education Press,2001.
2Fan Ming,Meng Xiao-feng et al.Data Mining:Concepts and Teehniques[M].Beijing:Mechanical Industrial Press,2001.
3Agrawal R,Srikant R.Fast algorithm for mining association rules[C]. In:Proceedings of the 20th International Conference on VLDB,Santiago,Chile,1994: 487-499.
4Han J,Jian P,Yiwen Y.Mining Frequent Patterns without Candidate Generation[C].In:Proceedings of 2000 ACM SIGMOD International Conference Management of Data,Dallas ,TX ,2000:1-12.
5Cheung D W,Han J,Ng V T et al.Maintenance of discovered association rules in large databases:an incremental updating technique[C]. In:Proe of the 12^th Int Conf on Data Engineering,New Orleans,Louisiana,1996:106-114.
6Agrawal R,Imielinski T,Swami A.Mining association rules between sets of items in large databases[C].In:Proceedings ACM SIGMOD International Conference Management of Date,Washington DC,1993:207-216.
7Agrawal R,Imielinski T,Swami A.Mining association rules between sets of items in large database[J].SIGMOD Record,1993,22(2):207-216.
8Agrawal R,Srikant R.Fast algorithms for mining association rules in large databases[C]∥Proceedings of the 20th International Conference on Very Large Data Bases.San Mateo,USA:Morgan Kaufmann Publicationg Inc.,1994:487.
9Agrawal R,Srikant R.Parallel mining of association rules[J].IEEE Trans on Knowledge and Data Engineering,1996,8(6):962-969.
10Cheung D W,Han Jiawei,Ng V T,et al.A fast distributed algorithm for mining association rules[C]∥Proceedings of the 1996 4th International Conference on Parallel and Distributed Information Systems.Los Alamitos,USA:IEEE Computer Society,1996:31-42.

共引文献16

1何宏,肖建华,肖伟平.关联规则增量式更新算法的研究[J].湘潭大学自然科学学报,2006,28(3):36-39. 被引量：1
2宋宝莉,覃征.分布式数据库的全局频繁项目集高效更新算法[J].计算机工程与应用,2006,42(31):157-160. 被引量：1
3宋宝莉,覃征.分布式环境下关联规则的安全挖掘算法[J].计算机工程,2006,32(21):35-37. 被引量：6
4胡斌,蒋外文,黄天强,陈生萍,施渊.一种最大频繁项集快速更新算法[J].计算机应用研究,2006,23(12):81-83.
5宋宝莉,覃征.分布式数据库关联规则的安全挖掘算法研究[J].计算机工程与应用,2007,43(6):181-183. 被引量：4
6宋宝莉,覃征.分布式数据库关联规则更新算法[J].西安交通大学学报,2007,41(4):416-420.
7胡斌,蒋外文,蔡国民,黄天强,卓月明.基于位阵的更新最大频繁项集算法[J].计算机工程,2007,33(3):59-61. 被引量：4
8郭有强.一种高效的关联规则维护算法研究与实现[J].计算机技术与发展,2007,17(10):123-126. 被引量：6
9孙士潮,刘寒冰,吉立新.一种高效的关联规则增量式更新算法[J].计算机应用与软件,2007,24(10):169-170. 被引量：1
10邹长忠,傅清祥.分布式数据库的关联规则更新算法[J].福州大学学报（自然科学版）,2008,36(5):655-659. 被引量：1

同被引文献17

1施亮,钱雪忠.基于Hadoop的并行FP-Growth算法的研究与实现[J].微电子学与计算机,2015,32(4):150-154. 被引量：15
2邱长春.基于项目约束的关联规则挖掘方法的研究[J].湖北教育学院学报,2006,23(8):21-23. 被引量：2
3唐瑜,王勇,杨辉华.挖掘最大频繁项集的优化方法[J].计算机工程与应用,2006,42(31):171-173. 被引量：5
4李芸,李青山.基于约束的最大频繁项集挖掘算法[J].计算机工程与应用,2007,43(17):160-163. 被引量：12
5David Aha.UCI Machine learning repository:Center for ma-chine learning and intelligent systems[DB].http://ar-chive.ics.uci.edu/ml/datasets.html,2010.
6冯凤.快速更新挖掘最大频繁项集[J].合肥学院学报（自然科学版）,2007,17(4):46-49. 被引量：3
7王华,胡学钢,田卫东.特定数据最大频繁集挖掘算法[J].计算机工程,2008,34(14):63-65. 被引量：3
8朱烨,叶高英.关联规则挖掘Apriori算法的改进[J].现代电子技术,2008,31(18):78-80. 被引量：8
9马丽生.快速挖掘频繁项目集算法[J].计算机工程与设计,2009,30(8):1903-1906. 被引量：6
10段仰广,韦玉科.基于循环十字链表的频繁模式挖掘算法[J].计算机技术与发展,2009,19(10):73-76. 被引量：5

引证文献2

1尹士闪,马增强,毛晚堆.基于频繁项目集链式存储方法的关联规则算法[J].计算机工程与设计,2012,33(3):1002-1007. 被引量：4
2焦润海,张谦,陈超.基于Spark改进的最大频繁项集挖掘算法[J].计算机工程与设计,2017,38(7):1839-1843. 被引量：8

二级引证文献12

1钟雁,马海漫,张春,赵怀昕.改进的FP-tree算法在动车组故障诊断中的应用研究[J].交通运输系统工程与信息,2013,13(6):105-111. 被引量：3
2王华,刘萍.改进的关联规则算法在学生成绩预警中的应用[J].计算机工程与设计,2015,36(3):679-682. 被引量：30
3张凯斐,刘继华,张菊芳.大规模高维数据集中局部异常数据挖掘算法[J].微电子学与计算机,2018,35(3):116-119. 被引量：13
4顾军华,高星,王守彬,武君艳,张素琪.基于大数据的IPTV视频评估模型[J].计算机应用与软件,2018,35(8):231-237. 被引量：1
5张春,郭玉霞.一种基于改进FP-Growth算法的动车组故障预测研究[J].铁路计算机应用,2017,26(12):1-4. 被引量：3
6刘莉萍,章新友,牛晓录,郭永坤,丁亮.基于Spark的并行关联规则挖掘算法研究综述[J].计算机工程与应用,2019,55(9):1-9. 被引量：30
7居保华,陈皇宇.基于改进关联搜索的海量病案信息挖掘算法设计[J].中国数字医学,2019,14(4):91-93. 被引量：2
8刘建.基于频繁项集挖掘的数据库超文本查询算法研究[J].数字技术与应用,2019,37(4):119-120. 被引量：2
9苏卉,李玉辉,张先荣.基于射频识别的物流频繁路径数据挖掘仿真[J].计算机仿真,2019,36(9):357-360. 被引量：2
10张铁宝,李桂娥.能力约束下多产品物流频繁路径挖掘算法仿真[J].计算机仿真,2019,36(12):249-252. 被引量：1

1钱进.最大频繁项目集挖掘技术研究与展望[J].微计算机应用,2005,26(6):652-654. 被引量：7
2钱进.最大频繁项目集挖掘技术研究[J].江苏技术师范学院学报,2004,10(4):61-64.
3马丽生,邓辉文,齐逸.一种新的最大频繁项目集挖掘算法[J].计算机应用,2006,26(11):2670-2673. 被引量：6
4宋余庆,朱玉全,孙志挥,杨鹤标.一种基于频繁模式树的约束最大频繁项目集挖掘及其更新算法[J].计算机研究与发展,2005,42(5):777-783. 被引量：21
5赵鹏.海量高维数据下的频繁项目集挖掘算法研究[J].计算机应用与软件,2012,29(7):150-153. 被引量：2
6张京京.搜索99 搜索全球[J].电脑爱好者,1999,0(13):26-26.
7刘超慧,安建成,刘敏.一种分布式数据库查询优化算法[J].许昌学院学报,2008,27(2):63-66.
8李小武,邵剑飞,廖秀玲.一种基于K-means的分布式聚类算法[J].桂林电子科技大学学报,2011,31(6):460-463. 被引量：7
9李忠哗,吴聪聪,何丕廉.一种约束最大频繁项目集挖掘算法[J].微电子学与计算机,2007,24(11):70-72. 被引量：2
10吴聪聪,李忠哗,何丕廉.基于矩阵的最大频繁模式挖掘及其更新算法[J].微电子学与计算机,2007,24(12):29-31. 被引量：4

计算机工程与科学

2009年第8期

浏览历史

内容加载中请稍等...

一种改进的最大频繁项目集挖掘算法被引量：2

参考文献7

二级参考文献16

共引文献16

同被引文献17

引证文献2

二级引证文献12

相关作者

相关机构

相关主题

浏览历史

一种改进的最大频繁项目集挖掘算法 被引量：2

参考文献7

二级参考文献16

共引文献16

同被引文献17

引证文献2

二级引证文献12

相关作者

相关机构

相关主题

浏览历史

一种改进的最大频繁项目集挖掘算法被引量：2