一种基于M-Bisearch的最大频繁项集挖掘算法研究

Research on Mining Algorithm of Maximal Frequent Itemsets based on M-blsearch

下载PDF

导出

摘要大数据分析的理论核心就是数据挖掘,关联规则挖掘算法是数据挖掘的重要分支,其包含频繁项集的生成和关联规则的产生两个步骤,频繁项集的生成过程中算法开销占据很大成本。从最大频繁项集的性质入手,在改变数据存储结构的基础上采用M-Bisearch的思想,通过对存储空间进行压缩来减少扫描次数和降低支持度计算开销,从而达到提升算法执行效率的目的。实验表明,改进算法在处理中长模式的频繁项集挖掘问题时具有明显的优越性。 Data mining is the core of big data analysis, and association rule mining algorithm is an important branch of data miningwhich contains two steps： the generation of frequent itemsets and the generation of association rules. The process of generating frequent itemsets in overhead occupies a large cost. This paper starts with the nature of the maximal frequent itemsets, adopts the idea of M-bisearch on the basis of hanging data storage structure, reduces computation cost of the scanning times and the support degree though compressing storage space, so as to achieve the goal of improving the efficiency of the algorithm.

作者李宝林周坤李仕伟 LI Bao-lin ZHOU Kun LI Shi-wei(College of Computer Science, China West Normal University, Nanchong 637000, China)

机构地区西华师范大学计算机学院

出处《成都信息工程大学学报》 2016年第5期463-468,共6页 Journal of Chengdu University of Information Technology

基金四川省科技厅支撑资助项目(2013SZ0056)

关键词机器学习数据挖掘关联规则频繁项集最大频繁项集 M-Bisearch machine learning data mining association rules frequent itemsets maximum frequent itemsets Mbisearch

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献13

1黄建明,赵文静,王星星.基于十字链表的Apriori改进算法[J].计算机工程,2009,35(2):37-38. 被引量：25
2刘华婷,郭仁祥,姜浩.关联规则挖掘Apriori算法的研究与改进[J].计算机应用与软件,2009,26(1):146-149. 被引量：119
3栗晓聪,滕少华.频繁项集挖掘的Apriori改进算法研究[J].江西师范大学学报（自然科学版）,2011,35(5):498-502. 被引量：9
4刘玉文.基于十字链表的Apriori算法的研究与改进[J].计算机应用与软件,2012,29(5):267-269. 被引量：11
5郑麟.一种直接生成频繁项集的分治Apriori算法[J].计算机应用与软件,2014,31(4):297-301. 被引量：14
6陈方健,张明新,杨昆.一种具有跳跃式前进的Apriori算法[J].计算机应用与软件,2015,32(3):34-36. 被引量：10
7宋余庆,朱玉全,孙志挥,杨鹤标.一种基于频繁模式树的约束最大频繁项目集挖掘及其更新算法[J].计算机研究与发展,2005,42(5):777-783. 被引量：21
8颜跃进,李舟军,陈火旺.基于FP-Tree有效挖掘最大频繁项集[J].软件学报,2005,16(2):215-222. 被引量：68
9林佳雄,黄战.基于数组向量的Apriori算法改进[J].计算机应用与软件,2011,28(5):268-271. 被引量：14
10付沙,宋丹.基于矩阵的Apriori改进算法研究[J].微电子学与计算机,2012,29(5):156-160. 被引量：11

二级参考文献137

1徐健辉.生成频繁项集的逻辑“与”运算算法[J].计算机应用,2004,24(11):88-90. 被引量：5
2吉根林,杨明,宋余庆,孙志挥.最大频繁项目集的快速更新[J].计算机学报,2005,28(1):128-135. 被引量：47
3徐章艳,刘美玲,张师超,卢景丽,区玉明.Apriori算法的三种优化方法[J].计算机工程与应用,2004,40(36):190-192. 被引量：71
4颜跃进,李舟军,陈火旺.基于FP-Tree有效挖掘最大频繁项集[J].软件学报,2005,16(2):215-222. 被引量：68
5秦亮曦,史忠植.SFPMax——基于排序FP树的最大频繁模式挖掘算法[J].计算机研究与发展,2005,42(2):217-223. 被引量：26
6王政伟,施润身.一种基于图的关联规则挖掘改进算法[J].计算机工程与科学,2005,27(5):48-51. 被引量：3
7陈慧萍,王建东,叶飞跃.MAXFP-Miner:利用FP-tree快速挖掘最大频繁项集[J].控制与决策,2005,20(8):887-891. 被引量：4
8陈耿,朱玉全,杨鹤标,陆介平,宋余庆,孙志挥.关联规则挖掘中若干关键技术的研究[J].计算机研究与发展,2005,42(10):1785-1789. 被引量：62
9钱进.最大频繁项目集挖掘技术研究与展望[J].微计算机应用,2005,26(6):652-654. 被引量：7
10钱少华,蔡勇,钱雪忠.基于数组的Apriori算法的改进[J].计算机应用与软件,2006,23(2):111-113. 被引量：16

共引文献290

1吴雨桐,吴思佳,杨建卫,何依娜,李洪凯,黄琳,刘云霞.基于Apriori算法分析2021年山东省医疗器械不良事件的关联性[J].山东大学学报（医学版）,2022,60(12):111-118. 被引量：6
2胡世昌,李劲华,王常颖.基于二进制编码的Apriori改进算法[J].计算机应用研究,2020,37(2):398-400. 被引量：16
3张丽.关联规则挖掘算法的研究[J].赤峰学院学报（自然科学版）,2013,29(2):22-23.
4孙赵平,李龙澍.基于关联规则的Web日志挖掘算法研究[J].电子技术（上海）,2010(8):11-13. 被引量：2
5刘美琦,唐常杰,徐开阔,刘胤田.基于补充频繁模式的P2P搜索优化[J].四川大学学报（自然科学版）,2009,46(6):1638-1644.
6黄澍庄.频繁项集挖掘算法分析与比较[J].德州学院学报,2005,21(6):65-71.
7陈鹏,吕卫锋.一种基于有效修剪的最大频繁项集挖掘算法[J].北京航空航天大学学报,2006,32(2):218-223. 被引量：2
8唐德权,王绪峰,朱林立,谢文君.一种快速挖掘频繁项集算法的研究[J].湖南科技学院学报,2006,27(5):117-120. 被引量：3
9马丽生,邓辉文,齐逸.一种新的最大频繁项目集挖掘算法[J].计算机应用,2006,26(11):2670-2673. 被引量：6
10丁卫平,施诠,管致锦.一种基于事务规则树的高效关联规则挖掘算法[J].计算机应用研究,2007,24(5):83-86. 被引量：3

1张慧,肖卫东,刘健,胡艳丽.Isearch机制分析[J].计算机应用研究,2006,23(12):129-131.
2陈晨.最大频繁项集挖掘算法综述[J].电脑知识与技术,2008,0(11Z):1030-1031.
3黄松英.基于最大频繁项集挖掘的入侵检测研究[J].绍兴文理学院学报,2007,27(10):32-36. 被引量：1
4邓忠军,宋威,郑雪峰,王少杰.P2P网络中最大频繁项集挖掘算法研究[J].计算机应用研究,2010,27(9):3490-3492. 被引量：1
5谭义红,陈治平,林亚平.基于兴趣挖掘的非结构化P2P搜索机制研究与实现[J].计算机应用,2006,26(5):1164-1166. 被引量：11
6彭慧伶,舒云星,武新.基于FP-tree的最大频繁项集挖掘新算法[J].计算技术与自动化,2009,28(2):62-65.
7陈凤娟.基于FP树的最大频繁项集挖掘[J].电子世界,2014(17):119-119.
8陈慧萍,王建东,王煜.频繁项集挖掘的研究与进展[J].计算机仿真,2006,23(4):68-73. 被引量：10
9马志新,陈晓云,王雪,李龙杰.最大频繁项集挖掘中搜索空间的剪枝策略[J].清华大学学报（自然科学版）,2005,45(S1):1748-1752. 被引量：5
10徐芳,李晓霞,温浩.基于Web的搜索引擎及其在化学信息资源导航中的应用[J].计算机与应用化学,1999,16(1):19-23. 被引量：8

成都信息工程大学学报

2016年第5期

浏览历史

内容加载中请稍等...

一种基于M-Bisearch的最大频繁项集挖掘算法研究

参考文献13

二级参考文献137

共引文献290

相关作者

相关机构

相关主题

浏览历史