期刊文献+

基于索引数组的频繁项集挖掘算法 被引量:2

Frequent itemsets mining algorithm based on index array
下载PDF
导出
摘要 基于现有的关联规则挖掘算法,提出了一种通过循环迭代增加项为项集后缀的方式产生所有项集的新方法,构造了一种新的数据结构—索引数组,存储所发现的频繁1-项集及其相关信息,以便快速发现项集与事务之间的关系;并提出了一种基于索引数组的频繁项集挖掘新算法。该算法只需扫描数据库两次就能发现所有频繁项集。实验结果表明,该算法可以有效提高频繁项集的挖掘效率。 The paper presented a new approach of increasing item to suffix of itemset reeursively according to the classical association rule mining algorithms. And used a new data structure--index array to store frequent 1-itemset and its correlative information. So the relations of itemsets and transactions were found quickly. Presented a frequent itemsets mining algorithm based on index array and could mine all frequent itemsets through scanning database only twice. The experimental results show that the proposed algorithm outperforms similar state-of-the-art algorithms.
出处 《计算机应用研究》 CSCD 北大核心 2009年第1期44-46,共3页 Application Research of Computers
基金 国家自然科学基金资助项目(60773100) 国家教育部科学技术研究重点资助项目(205014) 河北省教育厅科研计划资助项目(2006143)
关键词 数据挖掘 关联规则 频繁项集 索引数组 data mining association rule frequent itemsets index array
  • 相关文献

参考文献13

二级参考文献28

共引文献64

同被引文献16

  • 1JiaweiH MichlineK.数据挖掘概念与技术[M].北京:机械工业出版社,2001..
  • 2TAN P-N,STEINBACH M,KUMAR V.数据挖掘导论[M].范明,范宏建,译.北京:人民邮电出版社,2006.
  • 3毛国君.数据挖掘原理与算法[M].北京:清华大学出版社,2007.
  • 4Agrawal R, Imieliski T. Mining Association Rules Between Sets of Items in Large Database[C]//Proc of the ACM SIG- MOD Intl Conf on Management of Data, 1993:207 216.
  • 5Wang P J, Shi L, Bai J N, et al. Mining Association Rules Based on Apriori Algorithm and Application[ C]//Proc of the 2009 Intl Forum on Computer Science-Technology and Applications. 2009 : 141-143.
  • 6Agrawal R, Imielinski T, Swami A. Mining association rules between sets of items in large databases [ C //Proc of ACM SIGMOP Conference on Management of Data. New York: ACM Press, 1993: 207-216.
  • 7Wu F, Chiang S W, Lin J R. A new approach to mine frequent patterns using item-transformation methods [ J ]. Information Systems, 2007, 32 (7) : 1056-1072.
  • 8刘星沙,谭利球,熊拥军.关联规则挖掘算法及其应用研究[J].计算机工程与科学,2007,29(1):83-85. 被引量:36
  • 9李新良,陈湘涛.数据挖掘中关联规则算法的研究[J].计算机工程与科学,2007,29(12):111-113. 被引量:16
  • 10王强.基于事务标识列表的关联规则挖掘算法[J].现代图书情报技术,2008(8):63-69. 被引量:4

引证文献2

二级引证文献11

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部