基于马氏距离的重采样方法在流量识别中的应用被引量：1

Application of Resampling Method Based on Mahalanobis Distance in Traffic Identification

下载PDF

导出

摘要针对网络流量识别中的多分类数据分布不均衡的问题,本文提出了一种基于马氏距离的重采样方法。首先,将网络流量数据进行零均值化处理并转换至主成分空间;再根据少数类样本数据到集合中心点之间的马氏距离对其进行新样本的生成;之后将新生成的样本数据转换至原始空间并进行逆零均值化处理;最后返回所有新生成的样本数据。使用剑桥大学公共网络流量数据进行流量分类实验,实验结果表明该方法能够有效提升少数类的识别准确率,并且比现有的重采样方法和成本敏感方法能够获得更好的分类效果。 Aiming at the problems of multi-class imbalance of data distribution in traffic identification,this paper proposed a novel resampling method based on Mahalanobis distance.First,the network traffic data is normalized and transformed to the principal component space;second,a new sample is generated for a minority class based on the Mahalanobis distance from the samples to the center point of the data set;third the newly generated sample is then transfomed to the original space and performed an anti-normalization process;and finally,all the new samples are returned to original data set.The public Internet traffic traces of Cambridge University is used for traffic classification experiment,the results show that the proposed method can effectively improve the accuracy of the minority classes in traffic data sets,and it can obtain better classification performance than the existing resampling methods and cost-sensitive methods.

作者时鸿涛李洪平刘竞 SHI Hong-Tao;LI Hong-Ping;LIU Jing(College of Information Science and Engineering,Ocean University of China,Qingdao 266100,China)

机构地区中国海洋大学信息工程学院

出处《中国海洋大学学报（自然科学版）》 CAS CSCD 北大核心 2019年第8期136-141,共6页 Periodical of Ocean University of China

基金国家高技术研究发展计划项目(2013AA09A506-4)资助~~

关键词马氏距离主成分分析流量识别多分类不均衡重采样方法 Mahalanobis distance principal component analysis traffic identification multi-class imbalance resampling method

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1时鸿涛,盖凌云,郭忠文.一种基于小波谱的流量识别方法[J].计算机工程,2012,38(12):72-74. 被引量：2

二级参考文献7

1IANA.IANA Port Number List[EB/OL].(2011-01-04).http://www.iana.org/assignments/as-numbers/as-numbers.xml.
2Madhukar A,Williamson C.A Longitudinal Study of P2P TrafficClassification[C]//Proc.of IEEE International Symposium onModeling Analysis,and Simulation of Computer and Telecommu-nication Systems.[S.l.]:IEEE Press,2006:179-188.
3Subhabrata S,Spatscheck O,Wang Dongmei.Accurate,Scalablein Network Identification of P2P Traffic Using Application Signa-tures[C]//Proc.of the 13th International Conference on WorldWide Web.New York,USA:ACM Press,2004:512-520.
4Won Y J,Park B C,Ju Hong-Taek,et al.A Hybrid Approach forAccurate Application Traffic Identification[C]//Proc.of the 4thIEEE/IFIP Workshop on End-to-end Monitoring Techniques andServices.Vancouver,Canada:[s.n.],2006:1-8.
5Lelandw E,Taqqum S,Willinger W,et al.On the Self-similarNature of Ethernet Traffic[J].IEEE/ACM Transactions onNetworking,1994,2(1):1-15.
6Abry P,Veitch P.Wavelet Analysis of Long-range DependenceTraffic[J].IEEE Transactions on Information Theory,1998,44(1):2-15.
7张骏温,陈海文,陈常嘉.因特网业务量多重分形性本质成因的研究[J].软件学报,2002,13(3):470-474. 被引量：15

共引文献1

1谭红春,耿英保,马春.校园网流量采集与P2P特征码的提取[J].齐鲁工业大学学报,2016,30(4):75-80.

同被引文献4

1尹海蛟,杨昭,陈爱强,张娜.采后热处理对黄瓜颜色变化的影响[J].食品工业科技,2012,33(7):364-367. 被引量：2
2石吉勇,张芳,胡雪桃,邹小波,陈武,翟晓东.基于高光谱技术的乳杆菌快速鉴别[J].中国食品学报,2018,18(8):208-213. 被引量：5
3殷勇,赵玉珍,于慧春.基于多种变量分析方法鉴别食醋种类电子鼻信号特征筛选[J].农业工程学报,2018,34(15):290-297. 被引量：10
4肖维强,黄秉智,戴宏芬,杨兴玉,许林兵.不同条件对‘巴西蕉’和‘南天黄’香蕉后熟的影响[J].食品科学,2019,40(7):254-260. 被引量：8

引证文献1

1薛书凝,殷勇,于慧春,袁云霞,马帅帅.香蕉贮藏中腐败基准确定与高光谱信息表征及腐败预警模型构建[J].光谱学与光谱分析,2020,40(12):3871-3877. 被引量：5

二级引证文献5

1郭闯,郭志明,孙力,宋烨,邹小波.水果腐败传感监测系统设计与试验[J].食品与机械,2021,37(9):66-72.
2陈远哲,王巧华,高升,梅璐.皮蛋凝胶品质含水率和弹性的高光谱预测及其可视化[J].食品科学,2022,43(2):324-331. 被引量：5
3张飞,罗华平,高峰,王长旭,张辉,于智海,王玉婷.高光谱成像技术在水果品质无损检测中的研究现状[J].新疆农机化,2021(6):18-21. 被引量：8
4王志豪,殷勇,于慧春,袁云霞,薛书凝.均值+方差二维表征高光谱信息的苹果腐败预警方法[J].光谱学与光谱分析,2022,42(7):2290-2296. 被引量：1
5褚璇,张焜,朱立学,韦鸿钰,马稚昱,刘洪利,苗圃.基于近红外光谱的腐皮镰孢菌侵染香蕉过程表征研究[J].仲恺农业工程学院学报,2022,35(4):50-55.

1刘兵.彩色多普勒超声诊断膝关节积液的临床应用价值[J].双足与保健,2019,28(2):63-64. 被引量：2
2吴雨茜,王俊丽,杨丽,余淼淼.代价敏感深度学习方法研究综述[J].计算机科学,2019,46(5):1-12. 被引量：20
3邢晗.新课标指导下的高中英语分层教学模式初探[J].辽宁教育,2019(11):14-17. 被引量：5
4高超,许翰林.基于支持向量机的不均衡文本分类方法[J].现代电子技术,2018,41(15):183-186. 被引量：8
5单剑锋,杨雨.粒子群优化的流形SVM模拟电路故障诊断[J].机械科学与技术,2019,38(2):260-264. 被引量：9
6胡东海,邵元,陈莹,夏士雄.基于改进粒子滤波的室内自适应定位算法[J].计算机工程与应用,2019,55(9):65-71. 被引量：8
7李轶伦.间质性肺疾病的HRCT影像学特点分析[J].继续医学教育,2019,33(3):127-129. 被引量：2
8陈淑真,朱建平,尤添革,刘金福,林燕红.基于SMOTERF算法处理客户流失不平衡问题的研究[J].数学的实践与认识,2019,49(9):204-210. 被引量：6
9邓绯.基于支持向量机网络流量识别的研究[J].兰州文理学院学报（自然科学版）,2019,33(2):62-66. 被引量：1
10倪胜.医院网络流量控制及关键技术研究[J].信息周刊,2019,0(4):0117-0117.

中国海洋大学学报（自然科学版）

2019年第8期

浏览历史

内容加载中请稍等...

基于马氏距离的重采样方法在流量识别中的应用被引量：1

参考文献1

二级参考文献7

共引文献1

同被引文献4

引证文献1

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于马氏距离的重采样方法在流量识别中的应用 被引量：1

参考文献1

二级参考文献7

共引文献1

同被引文献4

引证文献1

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于马氏距离的重采样方法在流量识别中的应用被引量：1