基于分解事务矩阵的关联规则挖掘算法被引量：11

Improved Apriori algorithm based on decomposed transaction matrix

下载PDF

导出

摘要 Apriori算法是数据挖掘领域挖掘关联规则频繁项目集的经典算法,但该算法存在产生大量的候选项目集及需要多次扫描数据库的缺陷。为此提出一种新的挖掘关联规则频繁项目集算法(CApriori算法):利用分解事务矩阵来压缩存放数据库的相关信息,进而对分解事务矩阵进行关联规则挖掘;优化了由频繁k-1项目集生成频繁k项目集的连接过程;提出了一种不需要扫描数据库,利用行集"与运算"快速计算支持数的方法,改进算法挖掘所有的频繁项目集只需扫描数据库两次。实验结果表明,改进算法在最小支持度较小时效率高于Apriori算法。 Apriori algorithm is a classical algorithm that detects frequent item sets of association rules in data mining field, but it has defects in generating a huge number of candidate item sets and scanning the database many times. Therefore,this paper proposed a new algorithm named CApriori. It used the decomposed transaction matrix to compress information of database, then mined association rules in decomposed transaction matrix. It also optimized the process of connection when generating frequent k item sets from frequent k- 1 item sets. It put forward a kind of method using the ＂and operation＂to calculate the supports of all candidate item sets without scanning the database. The new algorithm only needs to scan database two times. The experimental results prove that the improved algorithm is more effective than Apriori algorithm when the minimum support is low.

作者胡维华冯伟

机构地区杭州电子科技大学计算机学院

出处《计算机应用》 CSCD 北大核心 2014年第A02期113-116,共4页 journal of Computer Applications

关键词数据挖掘关联规则频繁项目集 APRIORI算法分解事务矩阵 data mining association rule frequent item sets Apriori algorithm decomposed transaction matrix

分类号 TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献15

1罗森林,马俊,潘丽敏编著.数据挖掘理论与技术[M].北京:电子工业出版社,2013.
2曾波.一种基于单事务项集组合的频繁项集挖掘算法[J].计算机科学,2008,35(1):196-197. 被引量：4
3王江伟,郭民.关联规则在电子商务推荐系统中的应用[J].现代电子技术,2011,34(19):179-182. 被引量：6
4AGRAWAL R, IMIELINSKI T, SWAMI A. Mining association rules between sets of items in large databases [ C] // Proceedings of the 1993 ACM SIGMOD International Conference on Management of Data. New York: ACM Press, 1993:207-216.
5熊忠阳耿晓斐张玉芳.一种新的频繁项集挖掘算法.计算机科学,2009,36(4):42-44.
6ZAKI M J. Scalable algorithms for association mining [ J]. IEEE Transactions on Knowledge and Data Engineering, 2000, 12(3) : 372 - 390.
7路松峰,卢正鼎.快速开采最大频繁项目集[J].软件学报,2001,12(2):293-297. 被引量：113
8崔贯勋,李梁,王柯柯,苟光磊,邹航.关联规则挖掘中Apriori算法的研究与改进[J].计算机应用,2010,30(11):2952-2955. 被引量：95
9付沙,宋丹.基于矩阵的Apriori改进算法研究[J].微电子学与计算机,2012,29(5):156-160. 被引量：11
10毛国君.数据挖掘原理与算法[M].北京:清华大学出版社,2007.

二级参考文献53

1张锋,常会友,衣杨.基于规则的电子商务推荐系统模型和实现[J].计算机集成制造系统,2004,10(8):898-902. 被引量：11
2马盈仓.挖掘关联规则中Apriori算法的改进[J].计算机应用与软件,2004,21(11):82-84. 被引量：24
3徐章艳,刘美玲,张师超,卢景丽,区玉明.Apriori算法的三种优化方法[J].计算机工程与应用,2004,40(36):190-192. 被引量：71
4曾万聃,周绪波,戴勃,常桂然,李春平.关联规则挖掘的矩阵算法[J].计算机工程,2006,32(2):45-47. 被引量：33
5朱意霞,姚力文,黄水源,黄龙军.基于排序矩阵和树的关联规则挖掘算法[J].计算机科学,2006,33(7):196-198. 被引量：7
6李超,余昭平.基于矩阵的Apriori算法改进[J].计算机工程,2006,32(23):68-69. 被引量：43
7李晓虹,尚晋.一种改进的新Apriori算法[J].计算机科学,2007,34(4):196-198. 被引量：26
8AGRWAL R, SRIKAN R. Fast algorithms for mining association rules in large databases [ C]//Proceedings of the 20th International Conference on Very Large Data Bases. San Francisco: Morgan Kaufmann Publishers, 1994:487 - 499.
9PARK J S, CHEN M S, YU P S. An effective Hash based algorithm for mining association rules [ C]//Proceedings of International Conference on the Special Interest Group on Management of Data. New York: ACM, 1995:175 - 186.
10HAN J, FU Y. Discovery of multiple-level association rules from large databases [ C]//Proceedings of the 20th International Conference on Very Large Database. Zuich, Switzerland: [ s. n. ], 1995: 420 - 431.

共引文献383

1吴雨桐,吴思佳,杨建卫,何依娜,李洪凯,黄琳,刘云霞.基于Apriori算法分析2021年山东省医疗器械不良事件的关联性[J].山东大学学报（医学版）,2022,60(12):111-118. 被引量：8
2王平,张清,黎元元,支英杰,高明慧.基于复杂网络分析真实世界中鹿瓜多肽注射液治疗骨折的联合药物[J].辽宁中医杂志,2021,48(7):23-28. 被引量：2
3胡世昌,李劲华,王常颖.基于二进制编码的Apriori改进算法[J].计算机应用研究,2020,37(2):398-400. 被引量：16
4夏秀峰,张雅茜,丛丽晖,于戈.基于关联规则挖掘的一种改进Apriori算法[J].沈阳航空工业学院学报,2006,23(4):51-54. 被引量：1
5伊卫国,卫金茂,王名扬,王兴通.基于数据库划分的高效关联规则挖掘算法研究[J].东北师大学报（自然科学版）,2004,36(4):45-50. 被引量：7
6谢志强,朱孟杰,杨静.基于改进FP-树的最大项目集挖掘算法[J].计算机应用研究,2009,26(2):502-505. 被引量：1
7高正红,沈学利.Apriori算法在超市决策中的应用[J].长春工程学院学报（自然科学版）,2007,8(1):63-66. 被引量：1
8姜晗,贾泂.基于标记域FP-Tree快速挖掘最大频繁项集[J].计算机研究与发展,2007,44(z2):334-349. 被引量：4
9刘辛,杨素锦.基于数组的Apriori算法在体质测试数据分析中的应用[J].山东理工大学学报（自然科学版）,2011,25(5):55-58. 被引量：7
10陈晴光,李际军.汽车ERP中关联规则挖掘与动态更新的实现策略[J].机械制造,2004,42(6):69-72. 被引量：2

同被引文献99

1崔树娜,胡雪琴,温先荣.基于关联规则挖掘的白细胞减少症方药规律分析[J].中国中医药图书情报杂志,2014,38(1):23-26. 被引量：9
2万琳,范秋灵.面向软件缺陷数据的负关联规则挖掘方法[J].微电子学与计算机,2015,32(4):50-55. 被引量：1
3张素兰.一种基于事务压缩的关联规则优化算法[J].计算机工程与设计,2006,27(18):3450-3453. 被引量：16
4黄龙军,段隆振,章志明.一种基于上三角项集矩阵的频繁项集挖掘算法[J].计算机应用研究,2006,23(11):25-26. 被引量：11
5Han Jiawei，Kamber M.数据挖掘:概念与技术[M]．北京:机械工业出版社，2001．
6罗森林,马俊,潘丽敏编著.数据挖掘理论与技术[M].北京:电子工业出版社,2013.
7KRAJCA P,OUTRATA J,VYCHODIL V.Using frequent closed itemsets for data dimensionality reduction[C]// 11th IEEE International Conference on Data Mining,In- stitute of Electrical and Electronics Engineers Inc,Van- couver,2011:1128-1133.
8YANG X Y,ZHEN L,FU Y.MapReduce as a program- ming model for association rules algorithm on Hadoop [C]//3rd International Conference on Information Sci- ences and Interaction Sciences,IEEE Computer Society. Chengdu:IEEE,2010:99-102.
9SIHUI SHU.A New Association Rule Mining Algorithm Based on Compression Matrix[J].Computer Engineering and Networking Lecture Notes in Electrical Engineering, 2014,277:281-289.
10TAOSHEN LI,DAN LUO-A New Improved Apriori Algo- rithm Based on Compression Matrix[J].Advanced Data Mining and Applications Lecture Notes,2014,8933:1-15.

引证文献11

1任伟建,于博文.基于矩阵约简的Apriori算法改进[J].计算机与现代化,2015(9):1-5. 被引量：7
2安建瑞,王海鹏,张龙波,金超,怀浩.一种基于MapReduce的压缩矩阵关联规则挖掘算法[J].重庆理工大学学报（自然科学）,2016,30(2):95-100. 被引量：5
3张伟科.一种改进的AprioriTid算法[J].沈阳工业大学学报,2016,38(3):314-318. 被引量：6
4张永梅,许静,郭莎.基于堆排序的重要关联规则挖掘算法研究[J].计算机技术与发展,2016,26(12):45-48. 被引量：2
5崔双弥,张德生.一种改进的Inter-Apriori算法[J].计算机系统应用,2017,26(1):157-162. 被引量：2
6张春生,图雅,李艳.基于精简二元矩阵的蒙医方剂关联规则挖掘[J].世界科学技术-中医药现代化,2017,19(2):365-369. 被引量：3
7杨瀚涛,王向阳.基于垂直事务关系的快速Apriori算法[J].西安邮电大学学报,2017,22(2):98-102. 被引量：1
8温荣坤.基于偏微积分分类数学模型的关联挖掘改进技术[J].现代电子技术,2018,41(13):95-99. 被引量：1
9陈喜华,黄海宁,黄沛杰.基于Apriori算法的学生成绩分析在课程关联性的应用研究[J].北京城市学院学报,2018(4):60-65. 被引量：7
10胡敏,陈元会,黄宏程.基于用户隐式行为特征的最大熵推荐算法[J].计算机工程与设计,2019,40(2):405-411. 被引量：3

二级引证文献38

1刘芳,吴广潮.一种基于压缩矩阵的改进Apriori算法[J].山东大学学报（工学版）,2018,48(6):82-88. 被引量：9
2朱楠.Apriori算法在网络教学系统中的研究与应用[J].内江科技,2016,37(7):43-44.
3黄剑,李明奇,郭文强.基于Hadoop的Apriori改进算法研究[J].计算机科学,2017,44(7):262-266. 被引量：23
4李国玉,周广禄,张兆心.基于分布式PageRank算法的可疑目标挖掘[J].高技术通讯,2017,27(5):410-415.
5郑建华,徐龙琴,刘双印,张世龙.基于双压缩的Apriori算法优化设计[J].仲恺农业工程学院学报,2017,30(4):26-31.
6李融,杨淙钧,高泽,李常宝,刘忠麟,艾中良.基于Spark的精准关联规则挖掘算法实现[J].信息技术,2018,42(2):153-158. 被引量：4
7于庆年.上证指数与股票收盘价相关性实证研究[J].数理统计与管理,2018,37(2):362-370. 被引量：1
8刘海林,龚书能,雷虹云,潘炫霖,张依辰.基于关联规则算法的配电网联络有效性[J].农村电气化,2018(2):5-8. 被引量：1
9杨秋翔,孙涵.基于权值向量矩阵约简的Apriori算法[J].计算机工程与设计,2018,39(3):690-693. 被引量：15
10陈喜华,黄海宁,黄沛杰.基于Apriori算法的学生成绩分析在课程关联性的应用研究[J].北京城市学院学报,2018(4):60-65. 被引量：7

1冯贺,陶宏才.基于事务矩阵的关联规则挖掘算法[J].电脑学习,2008(5):46-47.
2边根庆,王月.一种基于矩阵和权重改进的Apriori算法[J].微电子学与计算机,2017,34(1):136-140. 被引量：23
3毕永成.Web日志处理中Apriori算法及其改进[J].电脑知识与技术（过刊）,2010,0(14):3573-3574. 被引量：2
4卢博礼,张小平,王翰虎.基于矩阵算法的序列模式挖掘研究[J].计算机技术与发展,2011,21(1):120-124. 被引量：1
5刘旭明,康慕宁,王绪鑫.基于矩阵算法的关联规则挖掘[J].科学技术与工程,2009,9(6):1604-1606.
6苗苗苗,王玉英.基于矩阵压缩的Apriori算法改进的研究[J].计算机工程与应用,2013,49(1):159-162. 被引量：29
7杨志刚,何月顺.基于压缩事务矩阵相乘的Apriori改进算法[J].中国新技术新产品,2010(6):57-58. 被引量：7
8朱玉全,宋余庆,陈耿.约束最大频繁项目集的增量式更新算法[J].计算机工程,2004,30(18):31-32.
9孟祥萍,钱进,张维俊.基于候选最大频繁项目集的关联规则挖掘算法[J].长春工程学院学报（自然科学版）,2003,4(1):1-4. 被引量：3
10曹风华.改进的基于两个矩阵的关联规则挖掘算法[J].电子科技,2012,25(5):126-128. 被引量：3

计算机应用

2014年第A02期

浏览历史

内容加载中请稍等...

基于分解事务矩阵的关联规则挖掘算法被引量：11

参考文献15

二级参考文献53

共引文献383

同被引文献99

引证文献11

二级引证文献38

相关作者

相关机构

相关主题

浏览历史

基于分解事务矩阵的关联规则挖掘算法 被引量：11

参考文献15

二级参考文献53

共引文献383

同被引文献99

引证文献11

二级引证文献38

相关作者

相关机构

相关主题

浏览历史

基于分解事务矩阵的关联规则挖掘算法被引量：11