期刊文献+

挖掘关联规则算法的优化处理 被引量:8

Algorithm Optimization of Mining Association Rules
下载PDF
导出
摘要 在挖掘关联规则的执行过程中,早期循环生成最大项目集的过程是很重要的。文中提出基于哈希表的算法,对生成侯选项目集的过程进行了优化,尤其是对生成二维侯选项目集更是有效。由于在早期循环中,生成侯选项目集的势较小,使得能更有效地修剪数据库,从而减小了后期循环的计算代价,同时也减小了I/O请求。 To find all the large itemsets from candidate sets in eary iterations is usually the domaining factor foroverall data-mining performance. In the paper,we option the algorithm Apriori for the candidate set generation. It is ahash-based algorithm and is especially effective for the generation of candidate set for large 2-itemsets. Furthermore thegeneration of smaller candidate sets enables us to effectively trim the transaction database size at a much earier stageof the iterations,thereby reducing the computational cost for later iterations. The advantage of proposed algorithm alsoprovides us the opportunity of reducing the amount of disk I/O required.
出处 《计算机工程与应用》 CSCD 北大核心 2000年第8期99-102,共4页 Computer Engineering and Applications
关键词 数据挖掘 关联规则 算法 优化处理 数据库 Data Mining, Association Rules, Hashing
  • 相关文献

参考文献2

二级参考文献21

  • 1Ma Xiaoqiang,香港大学技术报告,1996年
  • 2Han J,Proceedings of ACM SIGMOD International Conference’96 on Management of Data (SIGMOD’96),1996年
  • 3Cheung D,Proceedings of the International Conference’96 on Data Engineering (ICDE’96),1996年
  • 4Han Jiawei,Proceedings of the International Conference’96 on Data Mining and Knowledge Discovery (KDD’96),1996年,250页
  • 5Lu Hongjun,IEEE Trans Knowl Data Eng,1996年,8卷,6期,957页
  • 6Wang Shan,计算机世界,1996年,7卷,28期,101页
  • 7Guo Yibin,PC World China(in Chinese),1996年,26页
  • 8Jia Hong,中国计算机用户,1996年,6页
  • 9Han J,Proceedings of 1995 International Conference on Very Large Data Bases (VLDB’95),1995年,420页
  • 10Han J,Proceedings of the 4th International Conference on Information and Knowledge Management (CIKM’95),1995年,19页

共引文献286

同被引文献42

  • 1颜雪松,蔡之华,蒋良孝,贺毅.关联规则挖掘综述[J].计算机应用研究,2002,19(11):1-4. 被引量:6
  • 2张维.基于精集理论的数据挖掘方法研究[M].武汉:湖北大学,2002..
  • 3黄欣 杨杰.基于遗传算法Best-First图搜索的约简集求解算法[J].上海交通大学学报,2001,27(3):167-169.
  • 4谭浩强.软件工程系统分析与设计[M].北京:清华大学出版社.2006年.
  • 5[美]Innm,W.H.等著:邢国庆等译,企业信息工厂[M].北京:北京电子工业出版社.2004.
  • 6Han J, Kamber M. DataMining: Concepts and Techniques[ M ]. Beijing:Higher Education Press, 200.
  • 7R Agrawal, T lmielinski, A Swami. Mining Association Rules between Sets of Items in Large Database[C]. Proceedings of the ACM SIGMOD Conference on Management of Data 1993:207 - 216.
  • 8Hart J, Kamber M. DataMining: Concepts and Techniques[ M]. Beijing:Higher Education Press,2001.
  • 9Chengli Zhang, Shichao Zhang. Association Rule Mining[ M ]. Springm- Verlag Berlin Heidelberg,2002.
  • 10邓苏等编著,张维明.数据仓库原理与应用[M]电子工业出版社,2002.

引证文献8

二级引证文献21

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部