基于索引数组的频繁项集挖掘算法被引量：2

Frequent itemsets mining algorithm based on index array

下载PDF

导出

摘要基于现有的关联规则挖掘算法,提出了一种通过循环迭代增加项为项集后缀的方式产生所有项集的新方法,构造了一种新的数据结构—索引数组,存储所发现的频繁1-项集及其相关信息,以便快速发现项集与事务之间的关系;并提出了一种基于索引数组的频繁项集挖掘新算法。该算法只需扫描数据库两次就能发现所有频繁项集。实验结果表明,该算法可以有效提高频繁项集的挖掘效率。 The paper presented a new approach of increasing item to suffix of itemset reeursively according to the classical association rule mining algorithms. And used a new data structure--index array to store frequent 1-itemset and its correlative information. So the relations of itemsets and transactions were found quickly. Presented a frequent itemsets mining algorithm based on index array and could mine all frequent itemsets through scanning database only twice. The experimental results show that the proposed algorithm outperforms similar state-of-the-art algorithms.

作者张忠平李岩林志杰王爱杰

机构地区燕山大学信息科学与工程学院计算机应用技术

出处《计算机应用研究》 CSCD 北大核心 2009年第1期44-46,共3页 Application Research of Computers

基金国家自然科学基金资助项目(60773100) 国家教育部科学技术研究重点资助项目(205014) 河北省教育厅科研计划资助项目(2006143)

关键词数据挖掘关联规则频繁项集索引数组 data mining association rule frequent itemsets index array

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献13

1AGRAWAL R, IMIELINSKI T, SWAMI A. Mining association rules between sets of items in large databases [ C ]//Proc of ACM SIGMOP Conference on Management of Data. New York: ACM Press, 1993: 207-216.
2HAN Jia-wei, PEI Jian, YIN Yi-wen. Mining frequent patterns without candidate generation [ J ]. ACM SIGMOD Record, 2000,29 (2) :1-12.
3ZAKI M J. Scalable algorithms for association mining[ J]. IEEE Trans on Knowledge Data Engineering, 2000,12(3) :372-390.
4焦学磊,王新庄.基于矩阵的频繁项集发现算法[J].江汉大学学报（自然科学版）,2007,35(1):43-46. 被引量：6
5孟祥萍,钱进,刘大有.基于数组的关联规则挖掘算法[J].计算机工程,2003,29(15):98-99. 被引量：20
6王柏盛,刘寒冰,靳书和,马丽艳.基于矩阵的关联规则挖掘算法[J].微计算机信息,2007,23(05X):144-145. 被引量：18
7高宏宾,潘谷,黄义明.基于频繁项集特性的Apriori算法的改进[J].计算机工程与设计,2007,28(10):2273-2275. 被引量：25
8宋威,杨炳儒,徐章艳,侯伟.基于索引数组与集合枚举树的最大频繁项集挖掘算法[J].计算机科学,2007,34(7):146-149. 被引量：4
9XIN Dong, HAN Jia-wei, YAN Xi-feng, et al. On compressing frequent patterns[J]. Data & Knowledge Engineering ,2007,60(1) : 5-29.
10ORLANDO S, LUCCHESE C, PALMERINI P,et al. KDCI:a multistrategy algorithm for mining frequent sets [ C ]//Proc of ICDM Workshop on Frequent Itemset Mining Implementations. Plorida: [ s. n. ], 2003.

二级参考文献28

1张倩,王治和,杨俊.一种Apriori的改进算法[J].沈阳理工大学学报,2006,25(1):40-42. 被引量：3
2李庆华,王卉,蒋盛益.挖掘最大频繁项集的并行算法[J].计算机科学,2004,31(12):132-134. 被引量：5
3冯中毅,董海棠.一种新的频集发现算法P&FP[J].兰州交通大学学报,2004,23(6):81-84. 被引量：2
4何小东,刘卫国.数据挖掘中关联规则挖掘算法比较研究[J].计算机工程与设计,2005,26(5):1265-1268. 被引量：36
5黄建设.一种改进的关联规则算法探讨[J].计算机仿真,2005,22(12):72-75. 被引量：6
6刘翠娟,王保义,秦艳凯.基于项集特性的关联规则挖掘中Apriori算法的改进[J].山西电子技术,2005(6):20-22. 被引量：1
7何宏,肖建华,肖伟平.基于数组的频繁项目集的挖掘算法[J].邵阳学院学报（自然科学版）,2005,2(4):52-54. 被引量：4
8陈刚,李秀,刘文煌.基于“新颖度”的关联挖掘算法[J].微计算机信息,2006,22(08X):1-3. 被引量：4
9Han J,Kambr M. Data Mining:Concepts and Techniques[M]. Beijing: Higher Education Press,2001.
10Agrawal R, Srikant R. Fast Algorithms for Mining Association Rules Santiago, Chile: Proc. of the 20th Int'l Conference on Very Large Databases, 1994 : 487-499.

共引文献64

1杜跃,王治和,景永霞.基于数组的关联规则挖掘算法[J].甘肃联合大学学报（自然科学版）,2007,21(3):56-57. 被引量：1
2吴磊,何嘉.基于项目集矩阵的AprioriHybral算法研究[J].成都信息工程学院学报,2009(1):43-47.
3高晓红.档案信息网络管理风险及安全防范措施[J].黑龙江档案,2006(2):8-8. 被引量：3
4朱嘉贤.一个基于散列技术的关联规则挖掘算法[J].肇庆学院学报,2004,25(5):67-70.
5彭勇.一种基于超级哈希树的关联规则挖掘算法[J].株洲工学院学报,2005,19(4):32-34.
6陈文庆,许棠.关联规则挖掘Apriori算法的改进与实现[J].微机发展,2005,15(8):155-157. 被引量：21
7刘翠娟,王保义,秦艳凯.基于项集特性的关联规则挖掘中Apriori算法的改进[J].山西电子技术,2005(6):20-22. 被引量：1
8刘莹,郭福亮.基于数组的关联规则挖掘算法[J].计算机与数字工程,2006,34(1):38-40. 被引量：8
9钱少华,蔡勇,钱雪忠.基于数组的Apriori算法的改进[J].计算机应用与软件,2006,23(2):111-113. 被引量：16
10卢雪燕,王勇,周永权.一种基于位矩阵的负关联规则挖掘新算法[J].广西民族大学学报（自然科学版）,2007,13(4):57-60. 被引量：3

同被引文献16

1JiaweiH MichlineK.数据挖掘概念与技术[M].北京:机械工业出版社,2001..
2TAN P-N,STEINBACH M,KUMAR V.数据挖掘导论[M].范明,范宏建,译.北京:人民邮电出版社,2006.
3毛国君.数据挖掘原理与算法[M].北京:清华大学出版社,2007.
4Agrawal R, Imieliski T. Mining Association Rules Between Sets of Items in Large Database[C]//Proc of the ACM SIG- MOD Intl Conf on Management of Data, 1993:207 216.
5Wang P J, Shi L, Bai J N, et al. Mining Association Rules Based on Apriori Algorithm and Application[ C]//Proc of the 2009 Intl Forum on Computer Science-Technology and Applications. 2009 : 141-143.
6Agrawal R, Imielinski T, Swami A. Mining association rules between sets of items in large databases [ C //Proc of ACM SIGMOP Conference on Management of Data. New York: ACM Press, 1993: 207-216.
7Wu F, Chiang S W, Lin J R. A new approach to mine frequent patterns using item-transformation methods [ J ]. Information Systems, 2007, 32 (7) : 1056-1072.
8刘星沙,谭利球,熊拥军.关联规则挖掘算法及其应用研究[J].计算机工程与科学,2007,29(1):83-85. 被引量：36
9李新良,陈湘涛.数据挖掘中关联规则算法的研究[J].计算机工程与科学,2007,29(12):111-113. 被引量：16
10王强.基于事务标识列表的关联规则挖掘算法[J].现代图书情报技术,2008(8):63-69. 被引量：4

引证文献2

1张素琪,梁志刚,胡利娟,董永峰.改进的多维关联规则算法研究及应用[J].计算机工程与科学,2012,34(9):174-179. 被引量：10
2张林,王宏海.一种改进的频繁项目集挖掘算法[J].阜阳师范学院学报（自然科学版）,2013,30(1):54-57. 被引量：1

二级引证文献11

1陈一心,杨磊,杨颖.基于分布式全局频繁项集挖掘算法的研究[J].计算机光盘软件与应用,2012,15(24):156-156.
2陈伟珂,张铮燕.地铁施工灾害关键警兆监测指标研究[J].中国安全科学学报,2013,23(1):148-154. 被引量：6
3向程冠,熊世桓,王东.基于关联规则的社交网络好友推荐算法[J].中国科技论文,2014,9(1):87-91. 被引量：9
4林长方,吴扬扬.关联规则挖掘技术在冠心病诊断中的应用[J].江南大学学报（自然科学版）,2014,13(1):60-66. 被引量：3
5宋威,吉红蕾,李晋宏.一种高效用项集并行挖掘算法[J].计算机工程与科学,2015,37(3):422-428. 被引量：3
6汪峰坤,张婷婷.一种基于矩阵直接生成二阶频繁项集的多值属性关联规则算法[J].新乡学院学报,2016,33(6):38-42.
7蔡榆榕.统一数据交换平台下高校实验教学设备决策支持和预警平台的研究[J].福建电脑,2017,33(1):128-130.
8顾军华,武君艳,许馨匀,谢志坚,张素琪.基于Spark的并行FP-Growth算法优化及实现[J].计算机应用,2018,38(11):3069-3074. 被引量：9
9王萝萍,唐兴宏,钱颖颖,马永凯,于春霞,秦玉华.基于矩阵的多维关联规则算法在烟叶复烤配方的应用研究[J].计算机与数字工程,2019,47(1):253-257. 被引量：4
10张素琪,孙云飞,武君艳,顾军华.基于Spark的并行频繁项集挖掘算法[J].计算机应用与软件,2019,36(2):24-28. 被引量：6

1毛建景.基于索引数组的改进关联规则算法[J].洛阳师范学院学报,2015,34(8):65-67.
2严菲,杨科华.基于索引数组的频繁项集增量更新算法[J].微计算机信息,2010,26(33):150-151. 被引量：1
3董改芳,许道云.游戏中寻找路径的改进算法[J].计算机工程与应用,2009,45(23):38-39. 被引量：3
4宋威,杨炳儒,徐章艳,高静.一种改进的频繁闭项集挖掘算法[J].计算机研究与发展,2008,45(2):278-286. 被引量：11
5宋威,杨炳儒,徐章艳,韩彦岭.一种基于索引数组的频繁项集高效挖掘算法[J].高技术通讯,2008,18(3):259-264. 被引量：1
6宋威,杨炳儒,徐章艳,侯伟.基于索引数组与集合枚举树的最大频繁项集挖掘算法[J].计算机科学,2007,34(7):146-149. 被引量：4
7宋威,杨炳儒,徐章艳,张桃红.基于索引数组和复合频繁模式树的频繁闭项集挖掘算法[J].计算机科学,2007,34(8):165-167. 被引量：1
8陈密密.基于顶点索引的三维建模与可视化方法研究[J].影像技术,2011,23(2):7-10. 被引量：2
9孙名松,周三山,刘杰.分布式后缀树在P2P搜索中的应用[J].计算机技术与发展,2011,21(3):31-35. 被引量：1
10董洪伟.求k邻域的体素栅格算法研究[J].计算机工程与应用,2007,43(21):52-56. 被引量：4

计算机应用研究

2009年第1期

浏览历史

内容加载中请稍等...

基于索引数组的频繁项集挖掘算法被引量：2

参考文献13

二级参考文献28

共引文献64

同被引文献16

引证文献2

二级引证文献11

相关作者

相关机构

相关主题

浏览历史

基于索引数组的频繁项集挖掘算法 被引量：2

参考文献13

二级参考文献28

共引文献64

同被引文献16

引证文献2

二级引证文献11

相关作者

相关机构

相关主题

浏览历史

基于索引数组的频繁项集挖掘算法被引量：2