分段扫描生成频繁项目序列集的挖掘算法

An Algorithm for Mining Frequent Itemsequences by Partitioning Data

下载PDF

导出

摘要关联规则挖掘是数据挖掘研究的重要分支。发现频繁项目序列集又是关联规则挖掘中的一个关键阶段。十几年来,许多发现频繁项目集的算法已经被提出。近几年来,人们更关注于在大型数据集中高效发现频繁项目集的算法研究,特别是在减少数据库的扫描次数、提高内存利用率等方面。该文提出一个称为DFISP的算法,它是基于数据分段扫描策略的,并且只需两次数据库扫描即可完成频繁项目序列集的生成。实验表明,DFISP算法是稳定而高效的。 Mining association rules from databases is an important research branch of data mining,and discovering frequent itemsets or itemsequences is a key phase in mining association rules.Many algorithms have been proposed in the literatures.Recent researches have paid more attention to high mining efficiency,including reducing the number of passes over databases,memory usage and I /O costs.This paper gives a new algorithm for discovering frequent itemsequences,called DFISP,which employs two passes over databases and improves its mining efficiency in large databases by using data-partitioning scan technique.Experimental results show that it could keep memory usage space within acceptable ranges as well as achieve satisfying execution efficiency as increasing the size of the databases.

作者毛国君刘椿年

机构地区北京市多媒体与智能软件重点实验室北京工业大学计算机学院

出处《计算机工程与应用》 CSCD 北大核心 2004年第7期19-21,202,共4页 Computer Engineering and Applications

基金国家自然科学基金(编号:60173014) 北京市自然科学基金(编号:4022003) 北京市教委资金资助

关键词数据挖掘关联规则项目序列(集) 数据分段扫描 Data Mining,Association Rules,Itemsequences(Itemsequence Sets),Data-Partitioning Scan

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献1

1毛国君,刘椿年.基于项目序列集操作的关联规则挖掘算法[J].计算机学报,2002,25(4):417-422. 被引量：37

二级参考文献1

1程继华,郭建生,施鹏飞.挖掘所关注规则的多策略方法研究[J].计算机学报,2000,23(1):47-51. 被引量：22

共引文献36

1谢志强,朱孟杰,杨静.基于改进FP-树的最大项目集挖掘算法[J].计算机应用研究,2009,26(2):502-505. 被引量：1
2王果,何晓华,骆晓艳,胡志波,陈素.基于事物单属性的挖掘算法的研究[J].商业文化（学术版）,2009,0(8):316-316. 被引量：1
3马光志,李远敏.基于电子病历的频繁模式挖掘研究[J].计算机工程与应用,2004,40(21):226-229. 被引量：5
4赵栋,卢炎生,王涛.一种挖掘free项目集的快速算法[J].小型微型计算机系统,2004,25(10):1853-1856.
5徐爱萍,刘德喜.关联规则的下钻研究[J].计算机工程,2006,32(1):87-89.
6徐爱萍,刘德喜.基于扩展集合操作的频繁项集挖掘算法研究[J].武汉大学学报（信息科学版）,2006,31(2):184-187. 被引量：3
7刘德喜,何炎祥,邢显黎.基于下钻操作的多层关联规则挖掘算法研究[J].三峡大学学报（自然科学版）,2006,28(2):169-173.
8陈嶷瑛,武强,李文斌.频繁项目集及相关事务集的挖掘算法[J].计算机工程与应用,2006,42(15):176-178. 被引量：1
9陈嶷瑛,武强,李文斌.基于事务树操作的关联规则挖掘算法[J].计算机工程,2006,32(14):40-42. 被引量：4
10孔令富,王晗,练秋生.一种基于关联规则挖掘的组织数据方法[J].计算机工程,2006,32(21):12-14. 被引量：5

1张青.关联规则挖掘算法的优化[J].河南科学,2015,33(1):65-68.
2何婧,王丽珍,邹力鹍,张忠玉.一种快速发现最大频繁项目集的序列算法[J].计算机工程,2003,29(16):62-64.
3毛国君,刘椿年.基于项目序列集亚操作和数据分割的最大频繁项目序列挖掘方法(英文)[J].自动化学报,2004,30(5):772-777.
4张吉武.网络课程平台数据库关联规则挖掘算法研究[J].科技信息,2011(31):255-256.
5赵航,杨立生.分段扫描算法在单目视觉道路检测中的应用[J].现代电子技术,2013,36(4):56-59.
6毛国君,刘椿年.基于项目序列集操作的关联规则挖掘算法[J].计算机学报,2002,25(4):417-422. 被引量：37
7张青.Apriori挖掘算法的优化研究[J].河南科技,2014,33(11X):14-15. 被引量：1
8连志春,伊凤新.一种改进的频繁模式树生长算法[J].应用科技,2008,35(6):47-51. 被引量：2
9石广田,翟文正,周维琴.基于Bresenham的高效直线生成集成算法[J].组合机床与自动化加工技术,2006(7):22-25. 被引量：2
10毋帅,乐嘉锦,陈德华.基于项目传递打分和项目预测的协同过滤推荐[J].东华大学学报（自然科学版）,2012,38(4):430-434.

计算机工程与应用

2004年第7期

浏览历史

内容加载中请稍等...

分段扫描生成频繁项目序列集的挖掘算法

参考文献1

二级参考文献1

共引文献36

相关作者

相关机构

相关主题

浏览历史