一种基于前缀广义表的快速间接关联挖掘算法

An algorithm based on prefix general list for mining indirect associations

下载PDF

导出

摘要间接关联是数据挖掘领域中一种数据项之间的关联关系,可有效地应用于市场营销及Web日志分析等领域.现有的间接关联挖掘算法采用Apriori算法框架,需挖掘出所有的频繁项目集,因而存在挖掘效率低的缺陷.为此,提出了一种基于前缀广义表的快速间接关联挖掘算法,该算法无须生成所有的频繁项目集且仅须扫描数据库2遍,可有效提高间接关联的挖掘效率. Indirect association is an associated relationship between items and frequent itemsets in data sets. There are many potential applications for indirect associations, such as database marketing and web - log analysis, etc. Existing algorithms need to generate all frequent itemsets using Apriori - like framework. Hence, they are in low efficiency. This paper proposes an algorithm based on prefix general list for mining indirect associations-ABPGLMIA, which improves the mining efficiency of indirect associations by scanning database twice. Experimental results show that the algorithm ABPGLMIA is efficient.

作者杨明杨萍

机构地区安徽工程科技学院计算机科学与工程系安徽工程科技学院应用数理系

出处《安徽工程科技学院学报（自然科学版）》 2004年第4期40-45,共6页 Journal of Anhui University of Technology and Science

基金安徽省自然科学基金资助项目(03042205)安徽省教育厅教学研究基金资助项目(2003kj029)

关键词间接关联挖掘算法广义表频繁项目集 WEB日志数据项 APRIORI算法市场营销效率关联关系 data mining indirect association prefix general list association rule

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论] TP316 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献9

1[1]Agrawal R, ImielinSki T, Swami A. Mining association rules between sets of items in large database[A]. Proceedings of the ACM SIGMOD International Conference on Management of Data[C]. Washington, DC, 1993. 207 - 216.
2[2]Agrawal R, Srikant R. Fast algorithms for mining association rules[A]. Proceedings of the 20th International Conference Very Large Data Bases(VLDB' 94) [ C]. Santiago, Chile, 1994,487 - 499.
3杨明,孙志挥,吉根林.快速挖掘全局频繁项目集[J].计算机研究与发展,2003,40(4):620-626. 被引量：35
4[5]Cheung D, Hah J, Ng V, et al. Maintenance of discovered association rules in large databases: an incremental updating technique[A]. Proceedings of the 12thInternational Conference on Data Engineering[C]. New Orleans, Louisiana, USA,1996.106- 114.
5[6]Cheung S LEE, Kao B. A general incremental technique for maintaining discovered association rules[A]. Proceedings of the 5th International Conference on Database Systems for Advanced Applications[C]. Melbourne, Australia, 1997. 185 - 194.
6[7]Han J W, Pei J, Yin Y. Mining frequent patterns without candidate generation[ A]. Proceedings of the ACM. SIGMOD International Conference on Management of Data[C]. Dallas,USA, 2000, 1 - 12.
7杨明,孙志挥,吉根林.一种基于分布式数据库的全局频繁项目集更新算法[J].东南大学学报（自然科学版）,2002,32(6):879-883. 被引量：4
8[9]Pang - Ning Tan, Vipin Kumar, Jaideep Srivastava. Indirect association: Mining Higher Order Dependencies in Data[A].PKDD, 2000. 632 - 637.
9[10]Pang- Ning Tan, Vipin Kumar. Mining Indirect Associations in Web Data[A]. WebKDD 2001: Mining Log Data Across All Customer TouchPoints[C], 2001.

二级参考文献6

1RAgrawa1 TImie1inSki Aswami.Mining association ru1es between sets of items in 1arge database[J].The ACM SIGMOD Intemationa1 Conf on Management of Data, Washington, DC,1993,.
2冯玉才,冯剑琳.关联规则的增量式更新算法[J].软件学报,1998,9(4):301-306. 被引量：227
3路松峰,卢正鼎.快速开采最大频繁项目集[J].软件学报,2001,12(2):293-297. 被引量：113
4杨明,孙志挥,吉根林.快速挖掘全局频繁项目集[J].计算机研究与发展,2003,40(4):620-626. 被引量：35
5杨明,孙志挥,赵传申.交易数据库的加权关联规则增量更新算法[J].计算机工程与应用,2002,38(1):71-73. 被引量：6
6杨明,孙志挥.一种基于前缀广义表的关联规则增量式更新算法[J].计算机学报,2003,26(10):1318-1325. 被引量：23

共引文献35

1杨明,孙志挥,宋余庆.快速更新全局频繁项目集[J].软件学报,2004,15(8):1189-1197. 被引量：18
2冀振明,陶世群.基于电信运营中大客户流失的数据挖掘模型[J].计算机工程与应用,2004,40(23):169-171. 被引量：5
3杨明,孙志挥.一种基于最大加权频繁项目集的数据库相似性判别算法[J].计算机研究与发展,2004,41(10):1774-1779. 被引量：1
4李宏,杜剑峰,陈松乔.分布式数据库约束性关联规则挖掘[J].中南大学学报（自然科学版）,2004,35(6):998-1003. 被引量：1
5杜威,邹先霞.基于PC-树的关联规则挖掘方法[J].计算机工程与设计,2005,26(2):445-447. 被引量：3
6陆介平,杨明,孙志挥,鞠时光.快速挖掘全局最大频繁项目集[J].软件学报,2005,16(4):553-560. 被引量：27
7阮幼林,李庆华,刘干.分布环境中的并行频繁模式挖掘算法[J].计算机工程与应用,2005,41(25):1-3. 被引量：3
8曹洪其,姜志峰,孙志挥.分布式数据库多层关联规则挖掘算法研究[J].计算机应用,2005,25(12):2858-2861. 被引量：1
9何波,王华秋,刘贞,王越.快速挖掘频繁项集的并行算法[J].计算机应用,2006,26(2):391-392. 被引量：5
10顾海花,赵传申,孙志挥.一种基于多关联规则的全局快速分类算法[J].计算机工程与应用,2006,42(22):161-163.

1陈乐然,王刚,陈威,徐小天.VMware虚拟化环境安全风险与防护方案研究[J].华北电力技术,2014(9):61-65. 被引量：3
2杨明,孙志挥.一种基于前缀广义表的关联规则增量式更新算法[J].计算机学报,2003,26(10):1318-1325. 被引量：23
3倪旻,徐晓飞,邓胜春,郭茂祖.一种快速的间接关联挖掘算法[J].高技术通讯,2004,14(7):49-52. 被引量：1
4倪旻,徐晓飞,邓胜春,问晓先.TRISCAN-IA:一种间接关联挖掘的快速算法[J].哈尔滨工业大学学报,2004,36(5):578-581.
5段巧灵,李芬,张莉.多数据库中的间接关联规则挖掘算法[J].软件导刊,2016,15(9):49-51. 被引量：1
6薄宏,任玉杰,曹惠茹.基于间接关联规则的数据挖掘算法研究[J].计算机技术与发展,2012,22(11):120-122. 被引量：1
7刘永增,张晓景,李先毅.基于Hadoop/Hive的web日志分析系统的设计[J].广西大学学报（自然科学版）,2011,36(A01):314-317. 被引量：24
8江三锋,王元亮.基于Hive的海量web日志分析系统设计研究[J].软件,2015,36(4):93-96. 被引量：9
9林尤舜,钟声.基于RBAC的权限管理系统的设计与实现[J].现代机械,2009(3):59-60. 被引量：3
10李亚楠,许晟,王斌.基于加权SimRank的中文查询推荐研究[J].中文信息学报,2010,24(3):3-10. 被引量：15

安徽工程科技学院学报（自然科学版）

2004年第4期

浏览历史

内容加载中请稍等...

一种基于前缀广义表的快速间接关联挖掘算法

参考文献9

二级参考文献6

共引文献35

相关作者

相关机构

相关主题

浏览历史