基于散列和计数方法的网络流频繁项挖掘算法被引量：2

Frequent items mining algorithm over network flows based on the combination of hash method and counting method

导出

摘要在分析基于计数的流频繁项挖掘算法的优缺点后,针对网络流的实际特性,提出了基于散列方法和计数方法的网络流频繁项挖掘(CBFTSFIM)算法.算法首先采用改进的计数型布鲁姆过滤器(CBF)在不用保存网络流信息的情况下过滤掉部分非频繁项流,使得需要进一步处理的流数目大为减少;然后采用基于时间和流长约束的频繁项挖掘(TSFIM)算法实现流频繁项提取.实际流量数据测试表明:CBFTSFIM算法具有非常高的空间利用率,其在流频繁项提取、流长统计效果上明显优于空间节约计数(SS)等算法. The advantage and deficiency of counting method for frequent items mining over data streams were discussed at first. Then, an efficient frequent items mining algorithm CBF-TSFIM （counting blooming filter and time-space based frequent items mining） over network flows was pro- posed based on the combination of hash method and counting method according to the property of net- work flows. The algorithm CBF_ TSFIM improved the counting blooming filter （CBF） to filter some infrequent items and used TSFIM （time-space based frequent items mining） to identify frequent items. The experiment over real network traffic shows that CBF_ TSFIM is very space-saving and much more accurate than other algorithms like SS （space saving） in the criterion of frequent items identifying and flow length counting.

作者赵小欢夏靖波付凯

机构地区空军工程大学信息与导航学院

出处《华中科技大学学报（自然科学版）》 EI CAS CSCD 北大核心 2013年第9期57-62,共6页 Journal of Huazhong University of Science and Technology(Natural Science Edition)

基金陕西省自然科学基金资助项目(2012JZ8005)

关键词网络流数据挖掘散列方法频繁项计数方法计数型布鲁姆过滤器(CBF) network flows data mining hash method frequent item counting method countingblooming filter （CBF）

分类号 TP393 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1王伟平,李建中,张冬冬,郭龙江.一种有效的挖掘数据流近似频繁项算法[J].软件学报,2007,18(4):884-892. 被引量：33
2张玉,方滨兴,张永铮.高速网络监控中大流量对象的识别[J].中国科学：信息科学,2010,40(2):340-355. 被引量：11
3裴育杰,王洪波,程时端.基于两级LRU机制的大流检测算法[J].电子学报,2009,37(4):684-691. 被引量：20
4王风宇,云晓春,王晓峰,王勇.高速网络监控中大流量对象的提取[J].软件学报,2007,18(12):3060-3070. 被引量：22
5谢冬青,周再红,骆嘉伟.基于LRU和SCBF的大象流提取及其在DDoS防御中的应用[J].计算机研究与发展,2011,48(8):1517-1523. 被引量：14

二级参考文献79

1龚俭,彭艳兵,杨望,刘卫江.基于BloomFilter的大规模异常TCP连接参数再现方法[J].软件学报,2006,17(3):434-444. 被引量：24
2周明中,龚俭,丁伟,程光.基于MGCBF算法的长流信息统计[J].东南大学学报（自然科学版）,2006,36(3):472-476. 被引量：5
3潘云鹤,王金龙,徐从富.数据流频繁模式挖掘研究进展[J].自动化学报,2006,32(4):594-602. 被引量：34
4王洪波,韦安明,林宇,程时端.流测量中基于测量缓冲区的时间分层分组抽样[J].软件学报,2006,17(8):1775-1784. 被引量：13
5王伟平,李建中,张冬冬,郭龙江.一种有效的挖掘数据流近似频繁项算法[J].软件学报,2007,18(4):884-892. 被引量：33
6N Brownlee,C Mills,and G Ruth. Traffic Flow Measurement: Architecture[ S]. IETF RFC 2722,1999.
7W Fang and L Peterson. Inter-AS traffic patterns and their implications[ A]. In Proceedings of IEEE GLOBECOM[ C ]. New York: IEEE, 1999. 1859 - 1868.
8C Estan and G Varghese. New directions in traffic rneasurement and accounting[ A]. In Proceedings of ACM SIGCOMM[ C]. New York:ACM,2002.323- 336.
9Sampled Netflow[ OL ]. http://www. cisco. com/en/US/ docs/ios/12 _ 0s/feature/guide/12s _ sanf. html.
10A Feldmann, A Greenberg, C Lund, N Reingold, J Rexford, and F True. Deriving traffic demands for operational IP networks: methodology and experience[ J]. IEEE/ACM Transactions on Networking, 2001.9(3) :265 - 280.

共引文献63

1邝祝芳,阳国贵,辛动军.SWFPM:一种有效的数据流频繁项挖掘算法[J].计算机应用研究,2009,26(2):466-469. 被引量：4
2张玉,方滨兴,张永铮.高速网络监控中大流量对象的识别[J].中国科学：信息科学,2010,40(2):340-355. 被引量：11
3高宏宾,张小彬,杨海振.一种实时挖掘数据流近似频繁项的算法[J].计算机应用,2008,28(S2):219-222. 被引量：2
4李建中,高宏.无线传感器网络的研究进展[J].计算机研究与发展,2008,45(1):1-15. 被引量：439
5王秀坤,王铁存,周国能,冯维.挖掘数据流近似频繁项的改进算法[J].计算机工程与应用,2008,44(13):150-152.
6邝祝芳,谭骏珊,杨卫民,辛动军.基于渐增最小支持度函数的数据流频繁项挖掘[J].微电子学与计算机,2008,25(10):196-198.
7祖悦,党德玉.网格环境下基于分布式数据流频繁模式的数据更新算法[J].吉林化工学院学报,2009,26(1):54-58.
8吴枫,仲妍,金鑫,吴泉源,贾焰,杨树强.滑动窗口内进化数据流任意形状聚类算法[J].小型微型计算机系统,2009,30(5):887-890. 被引量：6
9蒲天银,秦拯.安全态势数据源近似频繁项分析算法应用[J].福建电脑,2009(8):84-84.
10张啸剑,邵超,张亚东.动态Web点击流中频繁访问序列的挖掘[J].计算机工程,2009,35(14):58-59. 被引量：1

同被引文献26

1张玉,方滨兴,张永铮.高速网络监控中大流量对象的识别[J].中国科学：信息科学,2010,40(2):340-355. 被引量：11
2王风宇,云晓春,王晓峰,王勇.高速网络监控中大流量对象的提取[J].软件学报,2007,18(12):3060-3070. 被引量：22
3Hyunsang C, Heejo L. Identifying botnets by capturing group activities in DNS traffic[J]. Computer Networks, 2012, 56(1): 20-33.
4Estan C, Varghese G. New directions in traffic measurement and accounting: focusing on the elephants, ignoring the mice[J]. ACM Transactions on Computer Systems, 2003, 21(3): 270-313.
5Manku G S, Motwani R. Approximate frequency counts over data streams[C]//Proc of the 28th International Conference on Very Large Data Bases, Hong Kong, 2002:346-357.
6Cormode G, Muthukrishnan S. What's hot and what's not: tracking most frequent items dynamically[J]. ACM Transactions on Database Systems, 2005, 30(1): 249-278.
7Karp R M, Shenker S, Papadimitriou C H. A simple algorithm for finding frequent elements in streams and bags[J]. ACM Transactions on Database Systems, 2003, 28(1): 51-55.
8Metwally A, Agrawal D, Abbadi A E. Efficient computation of frequent and Top-k elements in data streams //Proc. of the International Conference on Data Theory. Edinburgh: Springer-Verlag, 2005:398-412.
9Cormode G, Hadjieleftheriou M. Finding the frequent items in streams of data[J]. Communications of ACM, 2009, 52(10): 97-105.
10Liu H Y, Lin Y, Han J W. Methods for mining frequent items in data streams: an overview[J]. Knowledge and Information System, 2011, 26(1): 1-30.

引证文献2

1赵小欢,李明辉.基于CBF-SS策略的大流识别算法[J].中国科学院大学学报（中英文）,2015,32(3):391-397. 被引量：1
2徐敏,夏靖波,申健,陈珍.基于LEAST的高速网络大流检测算法[J].空军工程大学学报（自然科学版）,2015,16(4):62-65. 被引量：3

二级引证文献4

1徐敏,夏靖波.基于WinPcap的网络流量监控界面优化设计[J].电子科技,2015,28(9):31-34. 被引量：3
2陈珍,夏靖波,柏骏,徐敏.基于进化深度学习的特征提取算法[J].计算机科学,2015,42(11):288-292. 被引量：18
3夏靖波,任高明.网络流量分布式测量新方法[J].电子设计工程,2016,24(3):137-140. 被引量：2
4严军荣,叶景畅,潘鹏.一种大象流两级识别方法[J].电信科学,2017,33(3):36-43. 被引量：9

1赵小欢,李明辉.基于CBF-SS策略的大流识别算法[J].中国科学院大学学报（中英文）,2015,32(3):391-397. 被引量：1
2刘娜,沈西挺.关联规则挖掘算法中散列方法改进的研究[J].才智,2008,0(1):52-53.
3赵小欢,夏靖波,付凯,李明辉.高速网络流频繁项挖掘算法[J].计算机研究与发展,2014,51(11):2458-2469. 被引量：5
4夏靖波,赵小欢,柏骏,郭威武.基于时间和流长约束的网络流频繁项挖掘算法[J].中国科学技术大学学报,2013,43(10):790-798. 被引量：3
5刘晓陆,刘渊,王春龙.一种基于FEFS与CBF的网络大流识别算法[J].计算机工程,2015,41(9):68-73. 被引量：2
6吴亚联,雷天齐,龚能,龙辉,康灿平.一种改进的DV-Hop定位算法在配电线路故障定位中的应用[J].湘潭大学自然科学学报,2016,38(1):82-85. 被引量：2
7刘刚,邵志清,肖立中,温盛军,梁宏昊.嵌入式系统开发中的设计模式[J].计算机应用,2006,26(9):2236-2239. 被引量：2
8王春龙,刘渊,郑哲渊.基于LRU和扩展CBF的网络大流检测[J].计算机工程与应用,2015,51(13):66-71. 被引量：1
9王昌周,刘明华,王能斌.一种改进的动态散列方法[J].小型微型计算机系统,1994,15(9):1-6.
10薛晓燕.一种快速检索算法的设计与实现[J].新浪潮,1996(2):22-23.

华中科技大学学报（自然科学版）

2013年第9期

浏览历史

内容加载中请稍等...

基于散列和计数方法的网络流频繁项挖掘算法被引量：2

参考文献5

二级参考文献79

共引文献63

同被引文献26

引证文献2

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于散列和计数方法的网络流频繁项挖掘算法 被引量：2

参考文献5

二级参考文献79

共引文献63

同被引文献26

引证文献2

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于散列和计数方法的网络流频繁项挖掘算法被引量：2