基于节点集Top-k频繁模式挖掘算法被引量：2

Top-k frequent patterns based on nodesets

下载PDF

导出

摘要频繁模式挖掘的模式数量通常过于巨大,在实际应用中只有少量的频繁模式被使用。Top-k频繁模式挖掘通过排列模式频数限制频繁模式的数量,有效提高了算法效率。提出了TPN(Top-k-Patterns based on Nodesets)算法,该算法使用了节点集的概念,将数据压缩于Poc-tree,通过Top-k-rank表重新计算最小支持度限制生成候选模式的数量。实验通过与ATFP,Top-k-FP-growth算法比较,证明该算法有较好的效率。 The number of mined patterns is usually too large and a small number of frequent patterns are used in real application.Therefore, the mining of top-rank-k frequent patterns which limits the number of mined frequent patterns by ranking them in frequency, has improved the efficiency of the algorithm. This paper proposes the TPN algorithm for mining top-k frequent patterns. The TPN employs a new data structure, Nodesets, to represent patterns, compressing the data to Poc-tree and computing min support patterns to limit candidate items by the top-k- rank table. The experiments are conducted to evaluate TPN and ATFP, Top-k-FP-growth in terms of mining time for two datasets. The experimental results show that TPN is more efficient and faster.

作者孙俊张曦煌 SUN Jun,;ZHANG Xihuang(School of Internet of Things Engineering, Jiangnan University, Wuxi, Jiangsu 214122, China)

机构地区江南大学物联网工程学院

出处《计算机工程与应用》 CSCD 北大核心 2017年第6期101-105,共5页 Computer Engineering and Applications

基金国家自然科学基金(No.61170120)

关键词数据挖掘 TOP-K 频繁模式节点集 data mining top-k frequent patterns nodesets

分类号 TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献2

1敖富江,杜静,陈彬,黄柯棣.一种基于混合搜索的高效Top-K最频繁模式挖掘算法[J].国防科技大学学报,2009,31(2):90-93. 被引量：2
2DENG ZhiHong,WANG ZhongHui,JIANG JiaJian.A new algorithm for fast mining frequent itemsets using N-lists[J].Science China(Information Sciences),2012,55(9):2008-2030. 被引量：25

二级参考文献36

1Agrawal R, Srikant R. Fast Algorithms for Mining Association Rules[C]//Proc. Of the 20^th Intl. Conf.on Very Large Databases (VLDB'94), Santiago, Chile, Sept, 1994, 487-499.
2Goethals B. The FIMI Repository[EB]. http://fimi.es.helsinki.fi, 2003.
3Hirate Y, Iwahashi E, Yamaha H. TF2P-growth: An Efficient Algorithm for Mining Frequent Patterns without Any Thresholds[C]//Proc. of ICDM04. Brighton, UK, October, 2004.
4Quang T M, Oyanagi S, Yamazaki K. KxMiner: An Efficient Algorithm for Mining Top-K Frequent Patterns[C]//LNAI 4093, Springer-verlag, Berlin, Heidelberg, 2006, 436-447.
5Quang T M, Oyanagi S, Yarnazaki K. Mining the K-most Interesting Frequent Pallems Sequentially[C]//Proc. of Intelligent Data Engineering and Automated Lerning (IDEAL06), 2006, 620 - 628.
6HaHan J W, Pei J, Yin Y W. Mining frequent itemsets without candidate generation. In: The 2000 ACM SIGMOD International Conference on Management of data (SIGMOD’00), New York, 2000. 1-12.
7AgAgrawal R, Imielinski T, Swami A. Mining association rules between sets of items in large databases. In: The 1993 ACM SIGMOD International Conference on Management of Data (SIGMOD’93), Washington, 1993. 207-216.
8HaHan J, Cheng H, Xin D, et al. Frequent itemset mining: current status and future directions. Data Min Knowl Discov,2007, 15: 55-86.
9BaBaralis E, Cerquitelli T, Chiusano S. IMine: index support for item set mining. IEEE TKDE J, 2009, 21: 493-506.
10ZaZaki M J, Gouda K. Fast vertical mining using diffsets, In: The 9th ACM SIGKDD International Conference on. Knowledge Discovery and Data Mining (SIGKDD’03), Washington, 2003. 326-335.

共引文献25

1吐尔地·托合提,维尼拉·木沙江,艾斯卡尔·艾木都拉.基于频繁模式挖掘的维吾尔文智能组词方法[J].计算机应用,2012,32(10):2920-2922. 被引量：6
2沈戈晖,刘沛东,邓志鸿.NB-MAFIA:基于N-List的最长频繁项集挖掘算法[J].北京大学学报（自然科学版）,2016,52(2):199-209. 被引量：5
3徐永秀,刘旭敏,徐维祥.基于间隔链表改进的频繁项集挖掘算法[J].计算机应用,2016,36(4):997-1001. 被引量：4
4方炜,李万清,俞东进,袁友伟,黄东发.时空大数据的伴随车高效挖掘算法研究[J].工业控制计算机,2016,29(3):18-20. 被引量：1
5吴惠明,杨威,姜芃,高新闻.基于FP-Growth算法的盾构掘进参数与隧道管片渗漏关联性分析[J].隧道建设,2016,36(5):513-517. 被引量：4
6陈奇,张曦煌.基于N-list的并行频繁项集挖掘算法[J].微电子学与计算机,2017,34(5):40-44.
7谭龙,秦琦冰.基于dSFO-Set的可消除项集挖掘算法[J].计算机工程与设计,2017,38(6):1496-1502.
8李校林,杜托,刘彪.基于B-list的快速频繁模式挖掘算法[J].计算机应用,2017,37(8):2357-2361. 被引量：6
9翟悦,王璨,孙建言.一种改进的基于N-List的频繁项集挖掘算法[J].计算机应用与软件,2018,35(9):67-72. 被引量：6
10李校林,杜托,谢勇.基于Hadoop的大数据频繁模式挖掘算法[J].微电子学与计算机,2018,35(9):14-19. 被引量：9

同被引文献22

1杨俊瑶,蒙祖强,蒋亮.一种基于拓扑信息的物流频繁路径挖掘算法[J].计算机科学,2015,42(4):258-262. 被引量：7
2黄金晶,叶施仁,何福男.基于MapReduce的频繁项集挖掘算法研究[J].物流技术,2015,34(8):178-181. 被引量：3
3张玉峰,曾奕棠.基于动态数据挖掘的物流信息分析模型研究[J].情报科学,2016,34(1):15-19. 被引量：12
4徐永秀,刘旭敏,徐维祥.基于间隔链表改进的频繁项集挖掘算法[J].计算机应用,2016,36(4):997-1001. 被引量：4
5田卫东,许静文.基于模糊等价类的频繁项集精简表示方法[J].计算机应用研究,2016,33(7):1936-1940. 被引量：3
6朱婧.射频识别在茶叶物流信息追溯管理中的应用研究[J].福建茶叶,2016,38(10):358-359. 被引量：3
7柳萌萌,赵书良,韩玉辉,苏东海,李晓超,陈敏.多尺度数据挖掘方法[J].软件学报,2016,27(12):3030-3050. 被引量：28
8林媛.非结构化网络中有价值信息数据挖掘研究[J].计算机仿真,2017,34(2):414-417. 被引量：22
9戴春妮.基于聚类特征自适应机制的无线传感网异常节点检测算法[J].微电子学与计算机,2017,34(4):76-82. 被引量：14
10张亚利.大数据中网络节点拓扑不稳定性的评估模型设计[J].科学技术与工程,2017,17(15):284-289. 被引量：3

引证文献2

1苏卉,李玉辉,张先荣.基于射频识别的物流频繁路径数据挖掘仿真[J].计算机仿真,2019,36(9):357-360. 被引量：2
2张永华,林孔升,冯淞耀.安全资源池数据节点异常自动挖掘方法研究[J].自动化与仪器仪表,2020(7):73-76. 被引量：4

二级引证文献6

1张雪琴,彭露苇.35 kV变电站造价模型异常数据溢出控制的研究[J].电子设计工程,2021,29(4):145-149. 被引量：1
2张正义,崔健.基于并行Apriori的铁路物流配送FPMA[J].计算机仿真,2021,38(6):104-108. 被引量：1
3陈广,宋志伟,陈少兵,贺绍鹏,毛烨华,李泽坤.数据感知技术在电力物资供应链数据质量管理中的应用[J].科技管理研究,2021,41(18):182-191. 被引量：21
4王景兰,方晓.基于层次频繁模式树的数据自动挖掘算法[J].上海电机学院学报,2022,25(4):239-242. 被引量：2
5杨轶杰,许翔,谢涛,马俊杰.铁路供电信息系统安全资源池研究[J].铁路计算机应用,2023,32(11):73-76.
6李锦祥,郑少峰.人工智能应用于物流领域的研究热点、趋势——基于CiteSpace的可视化分析[J].物流科技,2024,47(7):18-22.

1App播报[J].新电脑,2016,0(10):55-55.
2周庆,胡月,廖晓峰.分组排列模式下图像加密算法的扩散性能分析与实现[J].电子与信息学报,2010,32(8):2015-2018. 被引量：1
3刘丹,刘伟,左朝树,刘凯.SEC-Tree的安全WSNS路由协议[J].电子科技大学学报,2008,37(6):913-916. 被引量：1
4杨明,吕静.一种基于C-Tree的属性约简增量式更新算法[J].控制与决策,2012,27(12):1769-1775. 被引量：7
5PIVOT3针对分布式视频监控推出可扩展的CLOUDBANK应用[J].计算机与网络,2011,37(10):38-38.
6IPS＋LED,AOC＂爱e＂如虎添e 画质：添了e，显示性能提升了多少？[J].微电脑世界,2011(2):33-34.
7吴淑燕,许涛.PageRank算法的原理简介[J].图书情报工作,2003,47(2):55-60. 被引量：35
8孙佳郡,刘子龙,何明军.基于FPGA的高效率SDRAM读写双口控制器设计[J].制造业自动化,2013,35(20):115-117. 被引量：4
9陈奇,张曦煌.基于N-list的并行频繁项集挖掘算法[J].微电子学与计算机,2017,34(5):40-44.
10全球首歇IPS＋LED[J].电脑乐园,2011(4):5-5.

计算机工程与应用

2017年第6期

浏览历史

内容加载中请稍等...

基于节点集Top-k频繁模式挖掘算法被引量：2

参考文献2

二级参考文献36

共引文献25

同被引文献22

引证文献2

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于节点集Top-k频繁模式挖掘算法 被引量：2

参考文献2

二级参考文献36

共引文献25

同被引文献22

引证文献2

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于节点集Top-k频繁模式挖掘算法被引量：2