改进的频繁和高效用项集挖掘算法被引量：1

Improved Mining Algorithm for Frequent and High Utility Itemsets

下载PDF

导出

摘要提出一种基于局部效用质量值的上界剪枝新方法,引入伪投影技术避免真实地构造物理投影,基于二者提出改进的FHIMA-P算法.在提出的FHIMA-P算法中引入事务合并和投影事务合并技术,提出最终的FHIMA-MP算法,并在mushroom和accident数据集上进行实验.结果表明:FHIMA-P算法的运行时间相比FHIMA-ALL算法缩短,而FHIMA-MP算法则较前两者效率有非常大的提高;在不同参数下,mushroom和accident数据集中大量可合并事务(投影事务)数目也很好地证明了事务(投影事务)合并的有效性. A new method that uses the upper bound of quality to prune the search space based on local utility quality is proposed,meanwhile,pseudo projection technique is introduced to avoid actually construct the physical projection,then based on these two points,an improved FHIMAP algorithm is proposed.By adding the transaction merging and projected transaction merging technique in FHIMAP algorithm,the final FHIMAMP algorithm is proposed.An experiment is conducted on mushroom and accident dataset,the result shows that the running time of FHIMAP algorithm is shorter than that of FHIMAALL algorithm,while the FHIMAMP algorithm improves significantly compared with the previous two algorithms′efficiency.Moreover,the huge number of transactions(projected transaction)that can be merged on mushroom and accident dataset in different papameters also prove the effectiveness of transaction(projected transaction)merging technique.

作者张健刘韶涛 ZHANG Jian;LIU Shaotao(College of Computer Science and Technology, Huaqiao University, Xiamen 361021, China)

机构地区华侨大学计算机科学与技术学院

出处《华侨大学学报（自然科学版）》北大核心 2017年第6期880-885,共6页 Journal of Huaqiao University(Natural Science)

基金福建省科技计划重大项目(2011H6016)

关键词频繁项集高效用项集伪投影事务合并 frequent itemsets high utility itemsets pseudo projection transaction merging

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献2

1DENG ZhiHong,WANG ZhongHui,JIANG JiaJian.A new algorithm for fast mining frequent itemsets using N-lists[J].Science China(Information Sciences),2012,55(9):2008-2030. 被引量：25
2李慧,刘贵全,瞿春燕.频繁和高效用项集挖掘[J].计算机科学,2015,42(5):82-87. 被引量：4

二级参考文献55

1HaHan J W, Pei J, Yin Y W. Mining frequent itemsets without candidate generation. In: The 2000 ACM SIGMOD International Conference on Management of data (SIGMOD’00), New York, 2000. 1-12.
2AgAgrawal R, Imielinski T, Swami A. Mining association rules between sets of items in large databases. In: The 1993 ACM SIGMOD International Conference on Management of Data (SIGMOD’93), Washington, 1993. 207-216.
3HaHan J, Cheng H, Xin D, et al. Frequent itemset mining: current status and future directions. Data Min Knowl Discov,2007, 15: 55-86.
4BaBaralis E, Cerquitelli T, Chiusano S. IMine: index support for item set mining. IEEE TKDE J, 2009, 21: 493-506.
5ZaZaki M J, Gouda K. Fast vertical mining using diffsets, In: The 9th ACM SIGKDD International Conference on. Knowledge Discovery and Data Mining (SIGKDD’03), Washington, 2003. 326-335.
6DeDeng Z H, Wang Z H. A new fast vertical method for mining frequent itemsets. Int J Comput Intell Syst, 2010, 3:733-744.
7AgAgrawal R, Srikant R. Fast algorithm for mining Association rules. In: The 20th International Conference on Very Large Data Bases (VLDB’94), Santiago de Chile, 1994. 487-499.
8SaSavasere A, Omiecinski E, Navathe S. An efficient algorithm for mining association rules in large databases. In: The21th International Conference on Very Large Data Bases (VLDB’95), Zurich, 1995. 432-443.
9ShShenoy P, Haritsa J R, Sundarshan S, et al. Turbo-charging vertical mining of large databases. In: ACM International Conference on Management of Data and Symposium on Principles of Database Systems (SIGMOD’00), Dallas, 2000.22-33.
10ZZaki M J. Scalable algorithms for association mining. IEEE TKDE J, 2000, 12: 372-390.

共引文献27

1沈戈晖,刘沛东,邓志鸿.NB-MAFIA:基于N-List的最长频繁项集挖掘算法[J].北京大学学报（自然科学版）,2016,52(2):199-209. 被引量：5
2徐永秀,刘旭敏,徐维祥.基于间隔链表改进的频繁项集挖掘算法[J].计算机应用,2016,36(4):997-1001. 被引量：4
3方炜,李万清,俞东进,袁友伟,黄东发.时空大数据的伴随车高效挖掘算法研究[J].工业控制计算机,2016,29(3):18-20. 被引量：1
4吴惠明,杨威,姜芃,高新闻.基于FP-Growth算法的盾构掘进参数与隧道管片渗漏关联性分析[J].隧道建设,2016,36(5):513-517. 被引量：4
5陈奇,张曦煌.基于N-list的并行频繁项集挖掘算法[J].微电子学与计算机,2017,34(5):40-44.
6谭龙,秦琦冰.基于dSFO-Set的可消除项集挖掘算法[J].计算机工程与设计,2017,38(6):1496-1502.
7李校林,杜托,刘彪.基于B-list的快速频繁模式挖掘算法[J].计算机应用,2017,37(8):2357-2361. 被引量：6
8翟悦,王璨,孙建言.一种改进的基于N-List的频繁项集挖掘算法[J].计算机应用与软件,2018,35(9):67-72. 被引量：6
9李校林,杜托,谢勇.基于Hadoop的大数据频繁模式挖掘算法[J].微电子学与计算机,2018,35(9):14-19. 被引量：9
10孙俊,张曦煌.基于节点集Top-k频繁模式挖掘算法[J].计算机工程与应用,2017,53(6):101-105. 被引量：2

同被引文献3

1郭宇红,童云海,唐世渭,吴冷冬.带学习的同步隐私保护频繁模式挖掘[J].软件学报,2011,22(8):1749-1760. 被引量：4
2丁丽萍,卢国庆.面向频繁模式挖掘的差分隐私保护研究综述[J].通信学报,2014,35(10):200-209. 被引量：19
3蒋辰,杨庚,白云璐,马君梅.面向隐私保护的频繁项集挖掘算法[J].信息网络安全,2019(4):73-81. 被引量：6

引证文献1

1郭宇红,童云海.隐私保护频繁项集挖掘中的分组随机化模型[J].华侨大学学报（自然科学版）,2020,41(2):230-236. 被引量：4

二级引证文献4

1郭宇红,童云海,苏燕青.分组随机化隐私保护频繁模式挖掘[J].软件学报,2021,32(12):3929-3944. 被引量：2
2耿立校,李恒昱,刘丽莎.基于主成分分析的模糊频繁项集合挖掘方法[J].计算机仿真,2022,39(2):410-413. 被引量：2
3刘新,徐阳,李宝山,弓彦章,罗丹.抗恶意敌手的保密关联挖掘方案[J].计算机工程与设计,2023,44(11):3258-3265.
4刘新,徐阳,李宝山.隐私保护关联挖掘在职务犯罪预警中的应用[J].内蒙古科技大学学报,2023,42(4):359-366.

1茹蓓,贺新征.减少候选项集的数据流高效用项集挖掘算法[J].计算机应用研究,2017,34(11):3379-3383. 被引量：3
2王红梅,李芬田,王泽儒.基于滑动窗口数据流频繁项集挖掘模型综述[J].长春工业大学学报,2017,38(5):484-490. 被引量：4
3曾俊.一种基于Hadoop架构的并行挖掘算法研究[J].现代电子技术,2018,41(1):117-119. 被引量：13
4乔天成.高维数据集之中基于距离的离群快速检测算法[J].科技创新与生产力,2017(11):67-71.
5王彩英,王士智,李平.稀土萃取分离工艺的改进与废水循环利用研究[J].稀有金属与硬质合金,2017,45(5):7-10. 被引量：6
6赵康成,王国梁.小区合并场景下基于RRU测量的问题定位[J].信息通信,2017,30(7):210-212.
7杨滟,黄小红,马严.基于园区网络拓扑的告警关联规则挖掘算法[J].中国教育网络,2017(12):76-78. 被引量：1
8张健,刘韶涛.事务约简和2项集支持度矩阵快速剪枝的Apriori改进算法[J].华侨大学学报（自然科学版）,2017,38(5):727-731. 被引量：3
9王燕,张立毅.基于修正压缩感知的信道估计算法[J].天津大学学报（自然科学与工程技术版）,2017,50(11):1185-1190.
10杨志农.人民法院数据共享交换系统建设探索[J].网络安全技术与应用,2017(12):150-151. 被引量：2

华侨大学学报（自然科学版）

2017年第6期

浏览历史

内容加载中请稍等...

改进的频繁和高效用项集挖掘算法被引量：1

参考文献2

二级参考文献55

共引文献27

同被引文献3

引证文献1

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

改进的频繁和高效用项集挖掘算法 被引量：1

参考文献2

二级参考文献55

共引文献27

同被引文献3

引证文献1

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

改进的频繁和高效用项集挖掘算法被引量：1