基于随机森林算法的网络流量分类方法被引量：9

Research on Classification of Network Traffic Based on Random Forests Algorithm

下载PDF

导出

摘要精确的网络流量分类是实现互联网可控可管的关键,传统的单一分类算法需要构建基于特定假设的某种模型,算法对于待分类数据的分布要求高,不能满足复杂多变的网络流量的分类要求。基于此,采用多决策树组合的随机森林算法实现网络流量分类。通过实际网络流量数据实验表明,在各种情况下,随机森林算法都能显著改善网络流量特别是小比例样本的分类效果,算法降低了单一算法过于依赖特定假设模型的要求,对于待分类样本的分布要求低,随机森林算法具有良好的分类效果和鲁棒性。 The accurate classification of network traffic is the key of implementing the function of the controllable and manageability of Internet, which is important for network management and network security. The common single classification algorithms usually need to abide by specific hypothesis for modeling and have strict restriction on the distribution of datasets to be processed. Thus, these algorithms can＇t satisfy the need of classification of network traffic with the property of muhifractal and burst at all time. On the basis, the Random Forests （RF） algorithm which combines with multiple decision trees is used to classify traffic. The experiments on network traffic show that RF is capable of improving the classification effect of traffic especially for small flows whose ratio is small in the datasets and loosening the restriction of single classifier which abides by specific hypothesis obviously. Meanwhile, RF has a weaker restriction on the distribution of network traffic and it performs perfectly on the classification of network traffic and has stronger adaptability and robustness than any single classifier.

作者赵小欢夏靖波李明辉

机构地区空军工程大学信息与导航学院空军后勤部

出处《中国电子科学研究院学报》 2013年第2期184-190,共7页 Journal of China Academy of Electronics and Information Technology

基金陕西省自然科学基础研究计划重点项目(2012JZ8005) 全军军事学研究生课题项目(2010XXXX-488 2011XXX-X23)

关键词流量分类流量特征选择组合分类器随机森林算法 traffic classification traffic feature selection ensemble classifier Random Forests algorithm

分类号 TP393 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献11

1ETHEMALPAYDIN.机器学习导论[M].范明,昝红英,牛常勇,译.北京:机械工业出版社,2009:230-231.
2BREIMAN L. Random Forests [ J]. Machine Learning, 2001, 45(1) : 5-32.
3NGUYEN THUY T T, GRENVILLE ARMITAGE. A Sur- vey of Techniques for Internet Traffic Classification Using Machine Learning[J]. IEEE Communications Surveys & Tutorials, 2008, 10(4) : 56-76.
4HYUNCHUL KIM, KIMBERLY C CLAFFY, MARINA FO- MENKOV, et al. Internet Traffic Classification Demysti- fied : Myths, Caveats, and the Best Practices [ C ]//2008 ACM CoNEXT Conference, New York : ACM ,2008 : 1-12.
5WEI LI, MARCO CANINI, ANDREW W MOORE, et al. Efficient Application Identification and the Temporal and Spatial Stability of Classification Schema [ J ]. Computer Networks, 2009, 53 (6) : 790-809.
6ARTHUR CALLADO,JUDITH KELENER, DJAMEL SA- DOK,et al. Better Network Traffic Identification Through the Independent Combination of Techniques [ J ]. Journal of Network and Computer Applications, 2010,33 ( 4 ) :433- 446.
7ALBERTO DAINOTYI, ANTONIO PESCAPE, KIMBER- LY C CLAFFY. Issues and Future Directions in Traffic Classification[ J]. IEEE Network, 2012, 26(1) : 35-40.
8MOORE A W,ZUEV D. Internet Traffic Classification Using Bayesian Analysis Techniques [ C ]//in Proc. ACM Sigmet- rics, 2005:50-60.
9PIETRZYK M, URVOY-KEI.I.ER G, COSTEUX J-L. Re- vealing the Unknown ADSL Traffic Using Statistical Meth- ods [ J ]. Lecture Notes in Computer Science, 2009,5 537 ( 1 ) : 75-83.
10GRINGOLI F, SALGARELLI L, DUSI M, et al. GT: Pick- ing up the Truth from the Ground for Interuet Traffic [ J ]. ACM SIGCOMM Computer Communication Review, 2009, 39(5) : 13-18.

同被引文献68

1王海波,仲秋雁.基于数据挖掘的客户关系管理体系结构研究[J].大连理工大学学报（社会科学版）,2004,25(2):42-46. 被引量：27
2董师师,黄哲学.随机森林理论浅析[J].集成技术,2013,2(1):1-7. 被引量：146
3张均锋,丁桦.边坡稳定性分析的三维极限平衡法及应用[J].岩石力学与工程学报,2005,24(3):365-370. 被引量：78
4果敢,于力,魏然.无线网络优化的路测[J].电信技术,2005(1):20-22. 被引量：10
5张华伟,王明文,甘丽新.基于随机森林的文本分类模型研究[J].山东大学学报（理学版）,2006,41(3):5-9. 被引量：58
6梁静,徐亮,程文堂.机器学习算法在药物专利分类中的应用研究[J].计算机与应用化学,2007,24(10):1341-1344. 被引量：6
7Sharma R K,Mehta B S,Jamwal C S. Cut slope stability evaluation of NH-21 along Nalayan-Gambhrola section,Bilaspur district,Himachal Pradesh,India[J].{H}Natural Hazards,2013,(06):249-270.
8Chen Z,Wang X,Haberfield C. A three-dimensional slope stability analysis method using the upper bound theorem Part Ⅰ theory and methods[J].{H}International Journal of Rock Mechanics and Mining Sciences,2001,(03):369-378.
9Breiman L. Random forests[J].{H}Machine Learning,2001,(01):5-32.
10Gorog P,Torok A. Slope stability assessment of weathered clay by using field data and computer modeling:a case study from Budapest[J].{H}NATURAL HAZARDS AND EARTH SYSTEM SCIENCES,2007,(03):417-422.

引证文献9

1温廷新,张波.露天煤矿边坡稳定性的随机森林预测模型[J].科技导报,2014,32(4):105-109. 被引量：21
2李军.基于随机森林算法的B2B客户分级系统的设计[J].现代电子技术,2015,38(15):99-103. 被引量：2
3刘彤.海量非线性网络流量数据分类模型的仿真分析[J].计算机仿真,2015,32(12):255-258. 被引量：3
4刘珍,王若愚,蔡先发,唐德玉.互联网流量分类中流量特征研究[J].计算机应用研究,2017,34(1):8-14. 被引量：10
5邢易,李树枝.基于随机森林的点蚀电位预测[J].电焊机,2020,50(5):45-49. 被引量：1
6吴克河,张英,崔文超,程瑞.一种基于随机森林算法的MQTT异常流量检测方法[J].计算机与现代化,2021(1):61-64. 被引量：7
7李柯,田华锋.无线网络问题智能诊断工具[J].长江信息通信,2022,35(12):219-221.
8吴挡平,张忠林,曹婷婷.基于Stacking策略的稳定性分类器组合模型研究[J].小型微型计算机系统,2019,40(5):1045-1049. 被引量：10
9Tong Wang,Lei Zhao,Yanfeng Cao,Zhijian Qu,Panjing Li.Medical Data Visualization Analysis and Processing Based on Machine Learning[J].Journal of Computer and Communications,2018,6(11):299-310.

二级引证文献54

1屈丹丹,杨涛,朱垚,胡孔法.基于字向量的BiGRU-CRF肺癌医案四诊信息实体抽取研究[J].世界科学技术-中医药现代化,2021,23(9):3118-3125. 被引量：6
2许东.基于FLAC模拟的露天煤矿边坡稳定性分析评价[J].西部探矿工程,2019,31(1):84-86. 被引量：5
3仲维清,白雪.爆破振动对矿山边坡稳定性影响的预测[J].辽宁工程技术大学学报（自然科学版）,2015,34(9):1074-1078. 被引量：3
4王志宏,韩璐,戚磊.随机森林分类方法在储层岩性识别中的应用[J].辽宁工程技术大学学报（自然科学版）,2015,34(9):1083-1088. 被引量：15
5胡添翼,杨光,陈波,俞扬,陶园.基于Pearson相关性检验的ARIMA边坡位移监测模型[J].水利水电技术,2016,47(1):71-75. 被引量：16
6邵良杉,赵藤野,温廷新,闫冬,司翠红.PSO-BP神经网络在露天矿卡车油耗预测中的应用[J].辽宁工程技术大学学报（自然科学版）,2016,35(7):689-694. 被引量：12
7冯东梅,陈雪,王丹,白雪.爆破振动对边坡稳定性影响的FA-IGA-LSSVM模型[J].辽宁工程技术大学学报（自然科学版）,2016,35(7):717-721. 被引量：6
8武怀生.多干扰网络的海量数据优化调度模型仿真分析[J].微电子学与计算机,2016,33(9):155-158. 被引量：2
9魏波,陈长庆.海量无线网络信道负载均衡优化调度仿真[J].计算机仿真,2017,34(1):280-283. 被引量：4
10胡添翼,戴波,何启,薛洋,黄梦婧.基于随机森林分类算法的边坡稳定预测模型[J].人民黄河,2017,39(5):115-118. 被引量：10

1叶惠.Net Optics:做智能管道的关键部件[J].通讯世界,2012(5):62-62.
2赵江云,董平,高德云.移动路由系统中认证机制[J].计算机与现代化,2015(3):117-121.
3吴亦川,彭晋,段晓东.基于IMS的DSN P2P流媒体系统[J].移动通信,2010,34(8):66-70. 被引量：1
4王荣华,王永强.局域网监控管理技术[J].信息网络安全,2004(1):37-39. 被引量：4
5李志奎.协同工作打造可控可管的校园网络[J].中国教育网络,2007(11):63-63.
6孟洛明.IP网的可测可控可管：问题、现状和若干重要研究方向[J].中兴通讯技术,2010,16(B08):30-35.
7沈淑娟,姜建国,曹建春.手写体字符识别的多特征多分类器设计[J].计算机工程与应用,2004,40(16):116-118. 被引量：4
8石利军,梁建武.基于IMS的可控可管P2P网络电视架构的研究[J].电视技术,2011,35(20):46-49.
9孙飞,徐世武,张岩.利用目标类样本的遥感分类策略[J].测绘科学,2016,41(2):133-139. 被引量：2
10刘立圆,夏文英,南晓青.高校校园网络的规划与设计[J].电子制作,2014,22(1X):150-150. 被引量：3

中国电子科学研究院学报

2013年第2期

浏览历史

内容加载中请稍等...

基于随机森林算法的网络流量分类方法被引量：9

参考文献11

同被引文献68

引证文献9

二级引证文献54

相关作者

相关机构

相关主题

浏览历史

基于随机森林算法的网络流量分类方法 被引量：9

参考文献11

同被引文献68

引证文献9

二级引证文献54

相关作者

相关机构

相关主题

浏览历史

基于随机森林算法的网络流量分类方法被引量：9