基于事务线索树的一次扫描关联规则增量挖掘算法被引量：1

The One-Time Scanning Incremental Mining Algorithm of Association Rules Based on a Transaction Thread Tree

下载PDF

导出

摘要首先将事务数据库压缩存储到一棵事务线索树(TT-tree)的结点上,并建立这些结点的索引表,然后寻找结点索引表的最后结点到根结点的全部路径,这些路径及路径的交集包含了用于挖掘关联规则的频繁集.该算法只需扫描事务数据库一次,由于采用了逆向搜索TT-tree的方法,搜索的时间开销非常少.该算法可以挖掘中短模式的海量数据,具有很好的伸缩性,同时该算法具有增量挖掘的功能.通过大量的实验数据进行比较,该算法的速度约是Apriori算法的10倍. A novel incremental mining algorithm of association rules is presented in this paper. First, transaction database is compressed and stored in a transaction thread tree (TT-tree). Then the index table of the nodes is established. Finally, all paths from leaf node to root node are obtained with the reverse search method. The frequent sets are included in these paths. The algorithm is very efficient since it scans transaction database only one time. In addition to efficiency, our algorithm is both scalable and incremental. The experimental results show that our algorithm is 10 times faster than that of the Apriori method.

作者业宁董逸生王厚立

机构地区东南大学计算机科学与工程系南京林业大学计算机系

出处《应用科学学报》 CAS CSCD 2004年第2期200-204,共5页 Journal of Applied Sciences

基金国家自然科学基金(30271048) 江苏省九五重点攻关课题(BJ98017-1) 江苏省十五高科技(BJ2001013) 校科研基金重点课题(X02-070-1(Z))资助项目

关键词事务线索树一次扫描关联规则增量挖掘算法可伸缩性频繁集事务数据库 frequency set transaction thread tree(TT-tree) incremental scalability

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献5

1Agrawal R, Imielinski T, Swami A. Mining association rules between sets of items in large databases[A]. In: Bunemuu P, Jajodia S eds. Proceedings of the 1993 ACM SIGMOD Conference on Management of Data[C]. New York, NY: ACM Press, 1993. 207-216.
2Park J S, Chen M S, Yu P S. An effective hash-based algorithm for mining association rules[A]. In Proc.1995 ACM-SIGMOD Int. Conf, Management of Data (SIGMOD'95)[C]. San Jose, CA, May 1995. 175-186.
3Hah J W, Yin Y W. Mining frequent patterns without candidate generation[A]. In: Proc SIGMOD Conference[C]. 2000. 1-12.
4毛国君,刘椿年.基于项目序列集操作的关联规则挖掘算法[J].计算机学报,2002,25(4):417-422. 被引量：37
5HanJiawei MichelineKambe.数据挖掘概念与技术[M].北京：机械工业出版社,2001..

二级参考文献1

1程继华,郭建生,施鹏飞.挖掘所关注规则的多策略方法研究[J].计算机学报,2000,23(1):47-51. 被引量：22

共引文献185

1谢志强,朱孟杰,杨静.基于改进FP-树的最大项目集挖掘算法[J].计算机应用研究,2009,26(2):502-505. 被引量：1
2王果,何晓华,骆晓艳,胡志波,陈素.基于事物单属性的挖掘算法的研究[J].商业文化（学术版）,2009,0(8):316-316. 被引量：1
3马建红,王万森.基于数据仓库的保险管理系统的设计与实现[J].微机发展,2004,14(7):55-58. 被引量：9
4马光志,李远敏.基于电子病历的频繁模式挖掘研究[J].计算机工程与应用,2004,40(21):226-229. 被引量：5
5赵栋,卢炎生,王涛.一种挖掘free项目集的快速算法[J].小型微型计算机系统,2004,25(10):1853-1856.
6赵欢,谭华.Apriori算法在语音合成应用中的一种改进[J].湖南大学学报（自然科学版）,2004,31(5):94-98. 被引量：2
7罗可,林睦纲,郗东妹.数据挖掘中分类算法综述[J].计算机工程,2005,31(1):3-5. 被引量：62
8彭佳红,贺志勇,林雪梅.一种基于数据挖掘的混合生产过程质量控制方法[J].计算机工程与设计,2004,25(10):1692-1694. 被引量：2
9耿焕同,陈少军.一种基于传统VSM和词共现概念的中文文本聚类的研究[J].安徽师范大学学报（自然科学版）,2005,28(1):27-30. 被引量：2
10李林,崔志明.用户Web日志序列模式挖掘研究[J].微机发展,2005,15(5):119-121. 被引量：4

同被引文献5

1程立平.基于改进的Apriori下的增量挖掘[J].大众科技,2005,7(8):40-41. 被引量：1
2蒙韧,苏毅娟,朱晓峰,张继连.数据挖掘中的增量式关联规则更新算法[J].广西科学院学报,2006,22(2):125-128. 被引量：4
3何宏,肖建华,肖伟平.关联规则增量式更新算法的研究[J].湘潭大学自然科学学报,2006,28(3):36-39. 被引量：1
4宋中山,成林辉,吴立峰.一种基于关联规则的增量数据挖掘算法[J].湖北大学学报（自然科学版）,2006,28(3):240-243. 被引量：9
5Jiawei Han.数据挖掘:概念与技术[M].北京:机械工业出版社,2001.

引证文献1

1林芳.基于信息检索与搜索引擎数据挖掘方法探究[J].中国电子商务,2011(10):57-58.

1邓水光,黄龙涛,吴斌,尹健伟,李革新.一种QoS最优的语义Web服务自动组合方法[J].计算机学报,2013,36(5):1015-1030. 被引量：16
2周毅,崔刚.基于机器视觉和A*算法的迷宫机器人路径规划[J].微计算机信息,2010(8):155-156. 被引量：6
3陈煜,徐维祥.基于逆向搜索的关联规则更新算法[J].计算机工程,2011,37(8):25-27. 被引量：2
4杨杰,丁伟.一个基于逆向搜索的分布式证书路径构建算法[J].计算机工程,2007,33(1):178-180.
5罗国富,邹景超.HZCAPP专家系统推理机的开发[J].郑州轻工业学院学报,1996,11(4):5-8.
6段立,侯兴哲,陈俐冰,慕福林,王懿,孙洪亮.基于改进DAG的Web服务组合优化[J].计算机系统应用,2015,24(2):22-27. 被引量：2
7侯仰拴,石涛,胡玉新.HJ-1C卫星实时软件帧同步算法研究与实现[J].雷达学报（中英文）,2014,3(3):326-331. 被引量：4
8刘威,郭渊博,雷新锋,李俊锋.改进Athena算法的多协议攻击自动化验证方法[J].计算机科学,2014,41(12):112-117.
9曹建,张波,杨昌盛,赵岩.基于CIC抽取滤波器的谐波分析算法[J].计算机应用,2009,29(7):1951-1953.
10谭旭,谭泓,陈英武.一种新的Petri网推理算法在贫血诊断中的应用[J].计算机工程与应用,2006,42(11):222-224. 被引量：6

应用科学学报

2004年第2期

浏览历史

内容加载中请稍等...

基于事务线索树的一次扫描关联规则增量挖掘算法被引量：1

参考文献5

二级参考文献1

共引文献185

同被引文献5

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于事务线索树的一次扫描关联规则增量挖掘算法 被引量：1

参考文献5

二级参考文献1

共引文献185

同被引文献5

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于事务线索树的一次扫描关联规则增量挖掘算法被引量：1