基于预制数据库的FP-tree构造算法

An Algorithm to Build the FP-tree Based on Prefabricated Database

下载PDF

导出

摘要以Apriori类的候选集产生-检查迭代法为代表的频繁模式挖掘在数据挖掘中扮演了十分重要的角色,详细研究了FP-growth频繁模式挖掘算法存在的瓶颈,提出了基于预制数据库的PFP-tree构造算法,该算法既能有效地利用FP-growth算法的优点,又能利用预制数据库技术将大型数据库按时间区段化成多个视图分而论之,适于并行运算,大大提高了速度性能。该算法还能有效地避免重复运算,有效地支持数据库的数据更新,具有良好的可伸缩性。 The frequent patterns mining method that is represented by the Apriori-like candidate set generation-and test approach plays an essential role in data mining. The FP-growth algorithm of frequent patterns mining is the most excellent fast algorithm.However, the program written by the algorithm will access a database frequently. It will take a long time greatly to access a large-scale database frequently. This paper analyzes the bottleneck of the algorithm and propose an algorithm to build the FP-tree on prefabricated database. The algorithm not only heirs all the advantages in FP-growth method, but also can be used to a side-by-side procedure efficiently. Base on the large-scale database is divided to small view by using prefabricated database technique; it will avoid the repeated calculation and support the update of the database efficiently.

作者陈天敏姜丽红

机构地区上海交通大学计算机科学与工程系

出处《计算机工程》 CAS CSCD 北大核心 2004年第B12期58-61,共4页 Computer Engineering

关键词数据挖掘频繁模式树预制数据库频繁模式树合并 Data mining Frequent patterns-tree Prefabricated database Consolidation of frequent patterns-tree

分类号 TP393.09 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1宋余庆,朱玉全,孙志挥,陈耿.基于FP-Tree的最大频繁项目集挖掘及更新算法[J].软件学报,2003,14(9):1586-1592. 被引量：164

二级参考文献1

1路松峰,卢正鼎.快速开采最大频繁项目集[J].软件学报,2001,12(2):293-297. 被引量：113

共引文献163

1谢志强,朱孟杰,杨静.基于改进FP-树的最大项目集挖掘算法[J].计算机应用研究,2009,26(2):502-505. 被引量：1
2姜晗,贾泂.基于标记域FP-Tree快速挖掘最大频繁项集[J].计算机研究与发展,2007,44(z2):334-349. 被引量：4
3杨种学.基于并行FP-growth算法挖掘网上关联交易规则[J].南京晓庄学院学报,2005,21(5):65-70.
4王盛,董黎刚,李群.一种基于逆序编码的关联规则挖掘研究[J].杭州电子科技大学学报（自然科学版）,2010,30(5):169-172. 被引量：1
5朱玉全,宋余庆,陈耿.约束最大频繁项目集的增量式更新算法[J].计算机工程,2004,30(18):31-32.
6杨君锐,赵群礼.一种不产生候选集的最大频繁集快速挖掘算法[J].微电子学与计算机,2004,21(11):125-128. 被引量：4
7张莹,韩芳溪,柴乔林.基于频繁模式树的AOI聚类算法[J].计算机工程与应用,2004,40(35):178-179.
8李清峰,杨路明,张晓峰.关联规则中最大频繁项目集的研究[J].计算机应用研究,2005,22(1):93-95. 被引量：3
9吉根林,杨明,宋余庆,孙志挥.最大频繁项目集的快速更新[J].计算机学报,2005,28(1):128-135. 被引量：47
10雷红艳,邹汉斌.基于反向矩阵的最大频集的交互式挖掘算法[J].计算机与现代化,2005(3):1-4.

1郭立,张守志,汪卫,施伯乐.一种增量式非负矩阵分解算法[J].计算机工程,2010,36(4):66-68. 被引量：3
2何炎祥,孔维强,向剑文,朱骁峰.WebLog访问序列模式挖掘[J].计算机工程与应用,2003,39(27):206-209. 被引量：4
3曹凯.机器人三维定位系统中关键技术的研究[J].数字技术与应用,2013,31(4):149-149.
4张石,杜恺,张伟.基于动态融合蚁群遗传算法的医学图像配准[J].计算机工程,2008,34(1):227-229. 被引量：2
5张培珍,杨根源,周祖华,马良.一种基于小波变换的图像压缩算法[J].舰船电子工程,2008,28(11):96-99.
6王秀峰,刘丹.非线性系统辨识——GMDH的一种新算法及其应用[J].自动化学报,1990,16(4):310-316. 被引量：7
7尚海林.图像区域不变矩的快速计算方法[J].光学技术,2012,38(6):756-760. 被引量：3
8刘冲,张玮炜.C语言嵌套循环的常见应用[J].商情,2008(5):168-168.
9刘伟杰,王雪涛.提升小波变换结合改进的SPIHT算法实现图像压缩[J].光盘技术,2008(2):53-55. 被引量：1
10祝仰凯,高茂庭.基于增量式潜在语义分析的构件检索算法[J].现代计算机（中旬刊）,2016(11):20-25.

计算机工程

2004年第B12期

浏览历史

内容加载中请稍等...

基于预制数据库的FP-tree构造算法

参考文献1

二级参考文献1

共引文献163

相关作者

相关机构

相关主题

浏览历史