数据流上最近频繁项集挖掘算法被引量：1

Method for finding recent frequent itemsets over data streams

下载PDF

导出

摘要数据流频繁项集挖掘是指在数据流中找出出现频数大于给定的最小支持度的项集过程。随着一些新兴应用如传感器网络、网络监控等的出现,数据流中频繁项集挖掘引起了很大的重视。提出了一种新颖的数据流频繁项集挖掘算法RFIF。不同于现有算法,RFIF算法针对现实中的一些实际应用,更多的考虑最近时间发生的事件,但也不完全抛弃历史数据,通过引入GIMT函数,逐渐加大项集支持度的阈值,减少对历史数据中频繁项集的维护。实验验证了算法的有效性。 Mining frequent itemsets in data streams means to find itemsets whose frequence more than minmum support threshold.Due to be widely used for rising applications,such as sensor network,newtwork traffic monitor,mining frequent itemsets in data streams will have a profound future.This paper proposes a new method-RFIF in order to mine frequent itemsets in data streams.RFIF aims at some practical applications in real life,it pays more attention to recent events,but also not discard historical data absolutely.Through using function GIMT,the threshold of maintaining data is increased,and the number of historical data is reduced.At last,the experiment results prove the effectiveness of RFIF.

作者舒平达陈华辉

机构地区宁波大学信息科学与工程学院

出处《计算机工程与应用》 CSCD 北大核心 2009年第18期152-155,共4页 Computer Engineering and Applications

关键词数据流数据挖掘频繁项集 data streams data mining frequent itemsets

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献11

1Agrawal R,Srikant R.Fast algorithms for mining association rules[C]// Proceedings of International Conference on Very Large Databases,1994:487-499.
2Han J,Pei J,Yin Y.Mining frequent patterns without candidate generation[C]//Proe of ACM-SIGMOD Conference, 2000: 1-12.
3Manku G,Motwani R.Approximate frequency counts over data streams[C]//Proceedings of the 28th International Conference on Vetry Large Data Bases Over Data Streams.Kong,China:Morgan Kanfmann, 2002 : 346-357.
4Charikara M,Chenb K,Coltone M F.Finding frequent items in data streams[J].Theoretieal Computer Seienee, 2004,312: 3-15.
5Cormode G,Muthukrishnan S.An improved data stream summary: The count-min sketch and its applications[J].Journal of Algorithms, 2005,55 : 58-78.
6Chang J H.Lee W S.A sliding window method for finding recently frequent itemsets over online data streams[J].Journal of Information Science and Engineering,2004,20:753-762.
7刘学军,徐宏炳,董逸生,钱江波,王永利.基于滑动窗口的数据流闭合频繁模式的挖掘[J].计算机研究与发展,2006,43(10):1738-1743. 被引量：26
8Chi Yun,Wang Hai-xun,Yu P S,et al.Moment:Maintaining closed frequent itemsets over a stream sliding window[J].Journal of Information Science and Engineering,2004,20:753-762.
9Giannella C,Han Jia-wei,Pei Jian,et al.Mining frequent patterns in data streams at multiple time granuXarities [M]//Next Generation Data Mining.Cambridge, Massachusetts : [s.n.], 2002: 191-212.
10Barouni-Ebrahimi M,Ghorbani A A.An online frequency rate based algorithm for mining frequent sequences in evolving data streams[C]//Communication Networks and Services Research Conference, Fredericton, Canada, 14-17 May 2007 : 125-132.

二级参考文献13

1Wei Guang Teng,Ming-Syan Chen,Philip S Yu.A regression-based temporal pattern mining scheme for data streams[C].The Int'l Conf on Very Large Data Bases(VLDB 2003),Berlin,Germany,2003
2Graham Cormode,Flip Korn,S Muthukrishnan,et al.Finding hierarchical heavy hitters in data streams[C].The Int'l Conf on Very Large Data Bases (VLDB 2003),Berlin,Germany,2003
3Graham Cormode,S Muthukrishnan.What's hot and What's not:Tracking most frequent items dynamically[C].The ACM Symp on Principles of Database Systems (PODS 2003),San Diego,CA,USA,2003
4C Sirish,M J Franklin.Streaming queries over streaming data[C].The 28th Int'l Conf on Very Large Data Bases,Hong Kong,2002
5C Giannella,J Han,J Pei,et al.Mining frequent patterns in data streams at multiple time granularities[G].In:H Kargupta,A Joshi,K Sivakumar,et al,eds.Next Generation Data Mining.Cambridge,Mass:MIT Press,2003
6G S Manku,R Motwani.Approximate frequency counts over streaming data[C].The 28th Int'l Conference on Very Large Data Bases (VLDB 2002),Hong Kong,2002
7Song Guojie,Wang Tengjiao,Tang Shiwei,et al.Estimation and maintenance of frequent pattern in data streams[C].National Data Base Conference 2003,Changsha,2003
8Joong Hyuk Chang,Won Suk Lee.Finding recent frequent itemsets adaptively over online data streams[C].The 9th ACM SIGKDD Int'l Conf on Knowledge Discovery and Data Mining (KDD 03),Washington,DC,2003
9N Pasquier,Y Bastide,R Taouil,et al.Discovering frequent closed itemsets for association rules[C].In:Beeri C,et al,eds.Proc of the 7th Int'l Conf on Database Theory.Berlin:Springer-Verlag,1999.398-416
10J Pei,J Han,R Mao.CLOSET:An efficient algorithm for mining frequent closed itemsets[C].In:D Gunopulos,et al,eds.Proc of the 2000 ACM SIGMOD Int'l Workshop on Data Mining and Knowledge Discovery.New York:ACM Press,2000.21-30

共引文献25

1孙莉.数据库和数据流频繁项集挖掘算法研究[J].现代机械,2007(5):54-57.
2敖富江,杜静,颜跃进,黄柯棣.在线挖掘数据流滑动窗口中频繁闭项集[J].系统工程与电子技术,2009,31(5):1235-1240. 被引量：2
3李俊,杨天奇.基于滑动窗口的数据流频繁闭项集挖掘[J].计算机工程,2009,35(13):37-39. 被引量：3
4唐懿芳,穆志纯,张师超,钟达夫.挖掘数据流频繁模式的相关技术和算法研究综述[J].计算机工程与应用,2009,45(26):121-125. 被引量：6
5舒平达,陈华辉.支持多时间粒度的数据流上最频繁K项挖掘[J].宁波大学学报（理工版）,2009,22(4):500-505. 被引量：1
6胡为成,王本年,程转流.基于DSCFCI_tree的带项目约束的数据流频繁闭合模式挖掘算法[J].中国科学技术大学学报,2009,39(11):1194-1201. 被引量：2
7杨蓓,黄厚宽.挖掘数据流界标窗口Top-K频繁项集[J].计算机研究与发展,2010,47(3):463-473. 被引量：6
8王敏,赵晓雷.数据流频繁模式挖掘[J].渭南师范学院学报,2010,25(2):71-74.
9倪志伟,姜苗,王超,戴奇波.在线挖掘数据流混合窗口中闭频繁项集[J].系统仿真学报,2010,22(9):2110-2114. 被引量：2
10伍智平.一种基于数据流的网络软件系统逆向工程方法[J].科学技术与工程,2011,11(4):851-854. 被引量：1

同被引文献7

1王鹏,吴晓晨,王晨,汪卫,施伯乐.CAPE——数据流上的基于频繁模式的分类算法[J].计算机研究与发展,2004,41(10):1677-1683. 被引量：7
2马瑞民,王小龙.NBCC:一种数据流上变化的挖掘算法[J].计算机工程与应用,2006,42(7):166-168. 被引量：1
3李国徽,陈辉.挖掘数据流任意滑动时间窗口内频繁模式[J].软件学报,2008,19(10):2585-2596. 被引量：45
4张天成,岳德君,于戈,林树宽,谷峪.数据流挖掘研究及其进展[J].小型微型计算机系统,2008,29(12):2241-2246. 被引量：5
5黄崇争,李海峰,陈红.数据流上近似非可导项集的挖掘算法[J].计算机学报,2010,33(8):1427-1436. 被引量：1
6陶克,王意洁.数据流上的频繁闭项集挖掘算法[J].计算机工程,2010,36(18):49-51. 被引量：1
7李海峰,章宁,朱建明,曹怀虎.时间敏感数据流上的频繁项集挖掘算法[J].计算机学报,2012,35(11):2283-2293. 被引量：29

引证文献1

1沈森.数据流上变化的挖掘算法运用[J].信息技术与信息化,2021(11):89-91.

1顾嘉臻,钱俊谕,王珊,邹晨曦.建筑工程中BIM＋GIS集成技术的应用研究[J].中国房地产业,2017,0(6):173-173. 被引量：1
2仲勇.单列数据巧转换为多列数据[J].现代计算机（中旬刊）,2005(11):90-90.
3陈琳,赵政文,李强.大规模图挖掘算法并行化研究[J].计算机工程与设计,2012,33(9):3465-3469.
4葛志远,姚春光,王盛青,唐忠,傅海帆.基于Windows的GIMS——灰色系统信息管理系统[J].电脑与信息技术,1996,4(1):15-17.
5王志霞,王春梅.我用Excel背单词[J].电脑知识与技术（过刊）,2006(6):49-49.
6飞雪散花.GIMP——又一个顶级图片处理利器（下）[J].软件指南,2008(9):68-70.
7艾灵仙.用Split函数实现网络多选题型的评分[J].农业网络信息,2005(6):60-60.
8飞雪散花.GIMP--又一个顶级图片处理利器（上）[J].软件指南,2008(8):65-67.
9唐英干,王伟伟.基于hat函数运算矩阵的分数阶系统辨识[J].燕山大学学报,2015,39(4):322-328. 被引量：3
10朱思奇,王亦民.C#编程实现半开扫描器[J].黑客防线,2007(8):84-85.

计算机工程与应用

2009年第18期

浏览历史

内容加载中请稍等...

数据流上最近频繁项集挖掘算法被引量：1

参考文献11

二级参考文献13

共引文献25

同被引文献7

引证文献1

相关作者

相关机构

相关主题

浏览历史

数据流上最近频繁项集挖掘算法 被引量：1

参考文献11

二级参考文献13

共引文献25

同被引文献7

引证文献1

相关作者

相关机构

相关主题

浏览历史

数据流上最近频繁项集挖掘算法被引量：1