关联规则挖掘中若干关键技术的研究被引量：62

Study of Some Key Techniques in Mining Association Rule

下载PDF

导出

摘要 Apriori类算法已经成为关联规则挖掘中的经典算法,其技术难点及运算量主要集中在以下两个方面:①如何确定候选频繁项目集和计算项目集的支持数;②如何减少候选频繁项目集的个数以及扫描数据库的次数·目前已提出了许多改进方法来解决第2个问题,并已取得了很好的效果·然而,对于第1个问题,仍沿用Apriori算法中的解决方案,其运算量是较大的·为此,提出了一种基于二进制形式的候选频繁项目集生成和相应的计算支持数算法,该算法只需对挖掘对象进行一些“或”、“与”、“异或”等逻辑运算操作,显著降低了算法的实现难度,将该算法与Apriori类算法相结合,可以进一步提高算法的执行效率,实验结果也表明算法是有效、快速的· The apriori algorithm has become a classic method for mining association rules. The difficulties and operation quantity of the apriori algorithm consist of the following two aspects：（1） how to generate candidate frequent itemsets and to calculate its support, （2） how to reduce the size of candidate frequent itemsets and times of accessing I/O. At present, there are many methods that can solve the second problems very well. However, very few methods have been presented to solve the first problem. An efficient and fast algorithm based on binary format for discovering candidate frequent itemsets and calculating the support of itemsets is proposed, which only executes some logical operation. A performance comparison of this algorithm with the apriori-like algorithms is given, and the experiments show that the new algorithm is more efficient.

作者陈耿朱玉全杨鹤标陆介平宋余庆孙志挥

机构地区东南大学计算机科学与工程系江苏大学计算机科学与通信工程学院

出处《计算机研究与发展》 EI CSCD 北大核心 2005年第10期1785-1789,共5页 Journal of Computer Research and Development

基金江苏大学科研启动基金项目(04KJD001) 国家自然科学基金项目(70371015)

关键词数据挖掘关联规则频繁项目集 data mining association rules frequent itemsets

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献12

1R. Agrawal, T. Imielinski, A. Swami. Mining association rules between sets of items in large databases. ACM SIGMOD Int'l Conf. Management of Data, Washington, D. C., 1993.
2Han J, Kamber. MData Mining: Concepts and Techniques.Beijing: High Education Press, 2001.
3B. Goethals. Survey of frequent pattern mining. Helsinki Institute for Information Technology, Technical Report, 2003.
4R. Agrawal, R. Srikant. Fast algorithm for mining association rules. The 20th Int'l Conf. VLDB, Santiago, Chile, 1994.
5M. Houtsma, A. Swami. Set-oriented mining for association rules in relational databases. In: Yu P., Chen A, eds. Proc. Int'l Conf. Data Engineering. Los Alamitos, CA: IEEE Computer Society Press, 1995. 25～33.
6A. Savasere, E. Omiecinski, S. Navathe. An efficient algorithm for mining association rules. The 21st Int' l Conf. VLDB, Zurich,Switzerland, 1995.
7J. Han, Y. Fu. Discovery of multiple-level association rules from large databases. The 21st Int'l Conf. VLDB, Zurich,Switzerland, 1995.
8R. Bayardo. Efficiently mining long patterns from databases. In:L. M. Haas, A. Tiwary, eds. Proc. ACM SIGMOD Int'l Conf.Management of Data. New York: ACM Press, 1998. 85～93.
9Lin, Dao-I, Z. M. Kedem. Pincer-Search: A new algorithm for discovering the maximum frequent set. In: H. J. Schek, F.Saltor, I. Ramos et al. eds. Proc. 6th European Conf.Extending Database Technology. Berlin: Springer-Veriag, 1998.105～119.
10朱玉全,孙志挥,赵传申.快速更新频繁项集[J].计算机研究与发展,2003,40(1):94-99. 被引量：63

二级参考文献16

1Jhan M Kamber著范明孟小峰等译.数据挖掘:概念与技术[M].北京:机械工业出版社,2001..
2[1]R Agrawal, T Imielinski, A Swami. Mining association rules between sets of items in large databases. In: Peter Buneman, Sushil Ajodia eds. Proc of ACM SIGMOD Conf on Management of Data, New York: ACM Press, 1993. 207～216
3[2]J Han, J Pei. Mining frequent patterns by pattern-growth: Methodology and implications. ACM SIGKDD Explorations (Special Issue on Scalable Data Mining Algorithms), 2000, 2(2): 14～20
4[3]J Han, J Pei, Y Yin. Mining frequent patterns without candidate generation, In: M Dunham, J Naughton, W Chen eds. Proc of 2000 ACM-SIGMOD Int'l Conf on Management of Data (SIGMOD'00). Dallas, TX, New York: ACM Press, 2000. 1～12
5[4]J Roberto, Jr Bayardo. Efficiently mining long patterns from databases. In: Ashutosh Tiwary, Boeing Co eds. Proc of the 1998 ACM-SIGMOD Int'l Conf on Management of Data (SIGMOD'98), New York: ACM Press, 1998. 85～93
6[5]D-I Lin, Z M Kedem. Pincer-Search: A new algorithm for discovering the maximum frequent set. In: Bertram Ludscher, Wolfgang May eds. Proc of the 6th European Conf on Extending database technology, Proceedings, Lecture Note in Computer 1377. Berlin: Springer 1998, 1998. 105～119
7[6]Z Pawlak. Rough Sets Theoretical Aspects of Reasoning about Data. Holland: Kluwer Academic Publishers, 1991
8[7]Hu Xiaohua. Knowledge discovery in database: An attribute-oriented rough set approach [Dissertation]. University of Regina, Canada, 1995
9[8]Collections of data for developing, evaluating, and comparing learning methods. 2001. http://www.cs.toronto.edu/～delve/data/mushrooms/desc.html
10R Agrawal, T Imielinski, A Swami. Mining association rules between sets of items in large databases. The ACM SIGMOD Int'l Conf Management of Data,Washington D C, 1993

共引文献80

1易彤,徐宝文,吴方君.一种基于FP树的挖掘关联规则的增量更新算法[J].计算机学报,2004,27(5):703-710. 被引量：32
2朱玉全,宋余庆,陈耿.约束最大频繁项目集的增量式更新算法[J].计算机工程,2004,30(18):31-32.
3杨君锐.关联规则增量式快速更新方法的研究[J].微电子学与计算机,2004,21(9):120-124. 被引量：7
4何丽,韩文秀.一种基于后缀树的Web访问模式挖掘算法[J].计算机应用,2004,24(11):68-70. 被引量：6
5杨君锐.频繁项目集二次挖掘方法研究[J].系统工程与电子技术,2004,26(11):1701-1704.
6李清峰,杨路明,张晓峰.关联规则中最大频繁项目集的研究[J].计算机应用研究,2005,22(1):93-95. 被引量：3
7李华君,周海岩.基于项目集知识库的关联规则挖掘与更新的高效算法[J].计算机工程与设计,2004,25(12):2198-2201. 被引量：4
8杜威,邹先霞.基于PC-树的关联规则挖掘方法[J].计算机工程与设计,2005,26(2):445-447. 被引量：3
9宋余庆,朱玉全,孙志挥,杨鹤标.一种基于频繁模式树的约束最大频繁项目集挖掘及其更新算法[J].计算机研究与发展,2005,42(5):777-783. 被引量：21
10朱玉全,宋余庆,陈耿.关联规则挖掘中增量式更新算法的研究[J].计算机工程与应用,2005,41(15):186-187. 被引量：8

同被引文献399

1于剑,黄力行,陶建华.汉语对话语气韵律建模方法[J].清华大学学报（自然科学版）,2008,48(S1):658-663. 被引量：3
2吕杰林,陈是维.基于相关性度量的关联规则挖掘[J].浙江大学学报（理学版）,2012,39(3):284-288. 被引量：15
3王盛,董黎刚,李群.一种基于逆序编码的关联规则挖掘研究[J].杭州电子科技大学学报（自然科学版）,2010,30(5):169-172. 被引量：1
4何友全,肖建,黄碧霞,雷妍,熊启军.一种用于数据挖掘的二进制挖掘算法[J].计算机应用研究,2004,21(5):15-16. 被引量：3
5易彤,徐宝文,吴方君.一种基于FP树的挖掘关联规则的增量更新算法[J].计算机学报,2004,27(5):703-710. 被引量：32
6马光志,李远敏.基于电子病历的频繁模式挖掘研究[J].计算机工程与应用,2004,40(21):226-229. 被引量：5
7陆建江,张文献.关联规则挖掘的基本算法[J].计算机工程,2004,30(15):34-35. 被引量：9
8王大玲,于戈,鲍玉斌.一种具有最大推荐非空率的关联规则挖掘方法[J].软件学报,2004,15(8):1182-1188. 被引量：11
9陈安龙,唐常杰,陶宏才,元昌安,谢方军.基于极大团和FP-Tree的挖掘关联规则的改进算法[J].软件学报,2004,15(8):1198-1207. 被引量：30
10徐健辉.生成频繁项集的逻辑“与”运算算法[J].计算机应用,2004,24(11):88-90. 被引量：5

引证文献62

1李华.二进制挖掘算法在Web使用挖掘中的应用[J].计算机时代,2009(4):56-57.
2王盛,董黎刚,李群.一种基于逆序编码的关联规则挖掘研究[J].杭州电子科技大学学报（自然科学版）,2010,30(5):169-172. 被引量：1
3周翠红,贺建军.挖掘关联规则中对Apriori算法的一个改进[J].湖南城市学院学报（自然科学版）,2006,15(4):67-69. 被引量：2
4国伟,王浩.关联规则与直接模糊聚类算法在个性化推荐中的应用[J].电脑开发与应用,2007,20(10):44-46.
5唐培丽,解飞,胡明.基于数据仓库的多维关联规则挖掘在电信系统中的应用[J].情报科学,2007,25(10):1552-1555.
6吕橙,郝莹,张翰韬.基于垂直二进制位图的频繁模式挖掘算法[J].山东大学学报（理学版）,2007,42(5):24-29. 被引量：2
7戴新喜,白似雪.一种高效的基于模式矩阵的Apriori改进算法[J].广西师范大学学报（自然科学版）,2007,25(4):176-179. 被引量：7
8胡明,唐培丽,许建潮.基于OLAP的多维关联规则挖掘研究[J].东北师大学报（自然科学版）,2007,39(4):54-59. 被引量：2
9刘江华,戴新喜,白似雪.基于模式矩阵的P_Matrix算法[J].南昌大学学报（理科版）,2007,31(5):496-499. 被引量：4
10解飞,唐培丽,魏宁.基于数据立方体的关联规则挖掘方法研究[J].气象水文海洋仪器,2008(1):76-80. 被引量：2

二级引证文献154

1彭博一,张钊,蒋鸿宇.一种基于改进自编码器的二进制协议聚类方法[J].太赫兹科学与电子信息学报,2021,19(4):712-716. 被引量：1
2李松生,赵燕伟,顾熙仁.改进的FUP算法在五金产品质量分析系统中的应用[J].吉林大学学报（工学版）,2012,42(S1):251-254. 被引量：1
3高家明,薛京生,肖涛.基于FP-Growth关联规则算法的接警参数挖掘分析[J].软件,2013,34(8):67-69.
4白似雪,朱涛,梅君.基于图的Apriori改进算法[J].南昌大学学报（工科版）,2009,31(1):36-39. 被引量：10
5罗爱萍.空间跨层关联规则挖掘算法的研究[J].西南师范大学学报（自然科学版）,2009,34(4):68-72. 被引量：5
6熊江,方刚,刘雨露,唐曙光.空间拓扑关联的双向挖掘研究[J].计算机工程与应用,2009,45(22):126-128. 被引量：4
7曾碧波,黄小红,赵健伍,韩冬,卢国潇.TPS SCADA系统中基于电能分析的数据仓库模型设计[J].工业控制计算机,2009,22(9):37-39. 被引量：4
8张月琴.基于0-1矩阵的频繁项集挖掘算法研究[J].计算机工程与设计,2009,30(20):4662-4664. 被引量：8
9汤小斌,方刚.一种用于空间横向挖掘的拓扑关联规则算法[J].计算机工程与应用,2010,46(1):109-111. 被引量：4
10任永功,张亮,付玉.一种基于频繁模式树的最大频繁项目集挖掘算法[J].小型微型计算机系统,2010,31(2):317-321. 被引量：6

1何宏,肖建华,肖伟平.基于数组的频繁项目集的挖掘算法[J].邵阳学院学报（自然科学版）,2005,2(4):52-54. 被引量：4
2吉根林,赵斌,孙志挥.利用Hash树生成频繁项目集的新方法[J].小型微型计算机系统,2004,25(10):1841-1843.
3赵官宝,刘云.一种基于位表的有效频繁项集挖掘算法[J].山东大学学报（理学版）,2015,50(5):23-29. 被引量：4
4周启海,陈勇明.基于敏捷分桶的频繁项目集生成新算法[J].计算机科学,2007,34(12):168-170.
5张心静,于嘉威,王红梅.基于回溯的最大频繁项集挖掘算法[J].电子科技,2016,29(8):78-81.
6高峰,谢剑英.一种无冗余的关联规则发现算法[J].上海交通大学学报,2001,35(2):256-258. 被引量：12
7郭平,刘潭仁.基于图结构的候选序列生成算法[J].计算机科学,2004,31(1):136-139. 被引量：4
8阮幼林,李庆华,杨世达.一种基于事务树的快速频繁项集挖掘与更新算法[J].计算机科学,2005,32(2):210-212. 被引量：3
9邓小妮,罗雪山,邓苏.一种基于Apriori的动态关联规则挖掘方法[J].电脑与信息技术,2003,11(5):1-3. 被引量：1
10陈耿,倪巍伟,朱玉全,孙志挥.基于分布数据库的快速关联规则挖掘算法[J].计算机工程与应用,2006,42(4):165-167. 被引量：13

计算机研究与发展

2005年第10期

浏览历史

内容加载中请稍等...

关联规则挖掘中若干关键技术的研究被引量：62

参考文献12

二级参考文献16

共引文献80

同被引文献399

引证文献62

二级引证文献154

相关作者

相关机构

相关主题

浏览历史

关联规则挖掘中若干关键技术的研究 被引量：62

参考文献12

二级参考文献16

共引文献80

同被引文献399

引证文献62

二级引证文献154

相关作者

相关机构

相关主题

浏览历史

关联规则挖掘中若干关键技术的研究被引量：62