期刊文献+

Apriori算法的三种优化方法 被引量:71

Three Optimized Methods of Apriori Algorithm
下载PDF
导出
摘要 通过对Apriori算法的思想和性能的分析,认为Apriori算法存在以下三点不足:(1)由K阶频繁集生成K+1阶候选频繁集时,在K+1阶候选频繁集中过滤掉非频繁集的策略值得进一步改进;(2)连接程序中相同的项目重复比较太多,因而其效率值得进一步改进;(3)在回扫数据库时有许多不必比较的项目或事务重复比较。根据上述三点不足,提出了相应的三种优化策略来优化Apriori算法,得到一效率较高的改进Apriori算法。 In this paper,after the principle and efficiency of the Apriori algorithm are analyzed,authors think that there are three following disadvantages:First,when candidate frequent(K+1)-itemsets are generated from frequent K-itemsets,the strategy of deleting infrequent (K+1)-itemsets from candidate frequent(K+1)-itemsets is not perfect;Second,the join procedure of Apriori algorithm is not very good because the comparison times of the same item is excessive;In the end,many items or transactions which need not be scanned are scanned repeatedly.According to the above three disadvantages,three corresponding optimized strategies are used to optimize the Apriori algorithm,and present an improved Apriori algorithm,which is more efficient than the original Apriori Algorithm.
出处 《计算机工程与应用》 CSCD 北大核心 2004年第36期190-192,202,共4页 Computer Engineering and Applications
关键词 关联规则 APRIORI算法 频繁项集 非频繁项集 association rule,Apriori algorithm,frequent itemset,infrequent itemset
  • 相关文献

参考文献6

  • 1R Agrawal ,T Imielinski,A Swami.Mining Association Rules between Sets of Items in Large Database[C].In:Proceedings of the ACM SIGMOD Conference on Management of Data,1993:207~216
  • 2Han J,Kamber M.DataMining:Concepts and Techniques[M].Beijing:Higher Education Press,2001
  • 3吉根林,孙志挥.数据挖掘技术[J].中国图象图形学报(A辑),2001,6(8):715-721. 被引量:51
  • 4徐章艳,张师超,区玉明,卢景丽,刘美玲.挖掘关联规则中的一种优化的Apriori算法[J].计算机工程,2003,29(19):83-84. 被引量:49
  • 5http://ftp.ics.uci.edu/pub/machine-learning-databases/mushroom/
  • 6http ://www.cse.cuhk.edu.hk/~kdd/data/IBM_VC++.zip

二级参考文献19

  • 1李德毅,孟海军,史雪梅.隶属云和隶属云发生器[J].计算机研究与发展,1995,32(6):15-20. 被引量:1212
  • 2方开泰.实用多元统计分析[M].上海:华东师范大学出版社,1992..
  • 3万家华 刘冰 等.知识发现中的可视化[J].计算机科学,2000,27:131-134.
  • 4淮晓永 熊范伦 等.一种基于粗集理论的增量式分类规则知识挖掘方法[J].南京大学学报(自然科学版,计算机专辑),2000,36(11):203-209.
  • 5田金兰 李奔.数据挖掘工具分类器[J].计算机世界,1999,5:31-31.
  • 6史东辉 蔡庆生.数据库中数据离群挖掘技术[J].南京大学学报:自然科学版,2000,36:82-86.
  • 7郭学军 陈晓云.粗集方法在数据挖掘中的应用[J].兰州大学学报:自然科学版,1999,35:276-279.
  • 8何新贵.数据采掘中的模糊技术[J].计算机科学,1998,25:129-131.
  • 9胡侃,夏绍玮.基于大型数据仓库的数据采掘:研究综述[J].软件学报,1998,9(1):53-63. 被引量:255
  • 10冯玉才,冯剑琳.关联规则的增量式更新算法[J].软件学报,1998,9(4):301-306. 被引量:227

共引文献97

同被引文献351

引证文献71

二级引证文献433

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部