基于机器学习的云平台故障排查方法被引量：4

A Fault Detection Method for Cloud Platform Based on Machine Learning

下载PDF

导出

摘要随着云计算的发展,越来越多的企业将系统部署在云环境中,大大提高了企业应用服务的灵活性、弹性、扩展性和效率,浙江电网容器云平台是云计算在电力系统的典型应用。然而,云计算的弹性架构也导致企业应用的运维变得更复杂和难以监控,当前运维手段大多缺乏清晰的云上应用访问可见性,给云环境下的故障排查带来了困难。针对这一问题,提出一种基于机器学习的故障排查方法。首先,通过层次聚类方法动态生成节点的网络拓扑结构,实时监测浙江电网容器云平台的各节点性能指标,以此作为特征向量;然后,采用支持向量机和随机搜索方法对其进行故障分类,达到实时排查故障的目的,有效提高了该云平台的性能和可靠性,验证了机器学习方法在电力系统中的应用前景。 With the development of cloud computing,more and more enterprises have deployed their systems into the cloud environment,which greatly improves the flexibility,elasticity,scalability and efficiency of enterprise application services.The container platform of Zhejiang power grid typifies the application of cloud computing in power systems.However,the flexible architecture of cloud computing also makes the operation and maintenance of enterprise applications more complex and harder to monitor.Most current operation and maintenance methods lack clear visibility of application access on the cloud,which brings difficulties to troubleshooting in the cloud environment.This paper proposes a fault detection method based on machine learning.This method firstly dynamically generates network topology structure by a hierarchical clustering approach,monitors the performance metrics of all nodes in the container platform of Zhejiang power grid in real time,and these metrics are regarded as feature vectors.Then,support vector machine(SVM)and random search method are used for fault classification.The method achieves the goal of real-time troubleshooting,effectively improves the reliability and performance of cloud platform and verifies the application prospect of machine learning methods in power system.

作者王艳艳张文正沈佳辉王亭李小真 WANG Yanyan;ZHANG Wenzheng;SHEN Jiahui;WANG Ting;LI Xiaozhen(State Grid Zhejiang Electric Power Co.,Ltd.Information&Telecommunication Branch,Hangzhou 310016,China;Zhejiang Huayun Information Technology Co.,Ltd.,Hangzhou 310012,China)

机构地区国网浙江省电力有限公司信息通信分公司浙江华云信息科技有限公司

出处《浙江电力》 2021年第12期124-130,共7页 Zhejiang Electric Power

基金信通业务综合监控平台实施项目(B311XT200048)。

关键词机器学习云计算支持向量机平均链接聚类网络拓扑识别故障排查 machine learning cloud computing support vector machine average link clustering network topology identification fault detection

分类号 TP393.09 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献11

1阙凌燕,蒋正威,肖艳炜,卢敏.调控云关键技术研究及展望[J].浙江电力,2019,38(8):1-7. 被引量：23
2程方慧,庄洪杰.基于SNMP的网络拓扑发现[J].中国新通信,2017,19(19):126-127. 被引量：1
3段文雪,胡铭,周琼,吴庭明,周俊龙,刘晓,魏同权,陈铭松.云计算系统可靠性研究综述[J].计算机研究与发展,2020,57(1):102-123. 被引量：48
4曹蓉.计算机网络流量异常检测技术研究[J].计算机产品与流通,2020,0(7):31-31. 被引量：1
5章永来,周耀鉴.聚类算法综述[J].计算机应用,2019,39(7):1869-1882. 被引量：205
6韩云春,薛俊华,周伟,罗勇,任波,张芹芹,夏盆军,杨理强.基于微量元素特征及Fisher判别函数的寺河矿煤层识别方法[J].能源与环保,2018,40(7):49-53. 被引量：3
7Mohamed A. Mahfouz.AVLINK： Robust Clustering Algorithm based on Average Link Applied to Protein Sequence Analysis[J].Journal of Mathematics and System Science,2016,6(5):205-214. 被引量：1
8周建平,李聪,万书亭,杨晓红.基于优化型SVM的高压断路器故障诊断方法研究[J].浙江电力,2019,38(3):14-19. 被引量：7
9李周,许红升,叶彬,葛斐,荣秀婷,徐强.电力通信网结构优化及拓扑生成算法[J].电气自动化,2017,39(5):20-23. 被引量：6
10甄凯成,黄河,宋良图.基于Netty和Kafka的物联网数据接入系统[J].计算机工程与应用,2020,56(5):135-140. 被引量：30

二级参考文献105

1曹阳,高志远,杨胜春,姚建国,梁云,孙云枫.云计算模式在电力调度系统中的应用[J].中国电力,2012,45(6):14-17. 被引量：37
2王鼎,钱科军,高一丹,赵慧,俞瑜,秦舒斐.云计算平台技术及其在电网调度中的应用[J].电网与清洁能源,2015,31(4):72-78. 被引量：19
3滕辉.煤中微量元素特征在煤层对比中的应用[J].煤田地质与勘探,1989,17(1):6-8. 被引量：6
4臧李纳,赵庆琦.微波辐射法在无机化学的应用[J].中山大学研究生学刊（自然科学与医学版）,2000,21(2):77-82. 被引量：4
5徐晶,许炜.消息中间件综述[J].计算机工程,2005,31(16):73-76. 被引量：83
6张春环,雷蕾,纪越峰.一种新的网络仿真拓扑生成器[J].系统仿真学报,2006,18(11):3115-3117. 被引量：4
7P. H. A. Sneath and R. R. Sokal, "Numerical Taxonomy- The Principles and Practice of Numerical Classification," W. H. Freeman, San Francisco, 1973.
8George Karypis, Eui-Hong (Sam) Han, and Vipin Kumar, "Chameleon: A hierarchical clustering using dynamic modeling,". Computer, 32(8): pp. 68-75, 1999.
9L. Kaufman and P. J. Rousseeuw, "Clustering by means of medoids" in Statistical Data Analysis Based on the Norm," Y. Dodge, Ed., pp. 405-416. North Holland Elsevier, Amsterdam, 1987.
10L. Kaufman and P. J. Rousseeuw, "Finding Groups in Data, an Introduction to Cluster Analysis," John Wiley &Sons, Brussels, Belgium, 1990.

共引文献319

1祝国宇,沙树名,宋少锋,梁阳.基于调控云的电网接线图全息化展示技术应用[J].计算机系统应用,2020(11):80-86. 被引量：7
2苏珮瑶,黄磊,张晓东,姜越朋,尹涛,于方杰,陈戈.面向海水淡化的原海水水质监测与悬浮物浓度研究[J].中国海洋大学学报（自然科学版）,2023,53(S01):11-18.
3冯建英,石岩,王博,穆维松.基于聚类分析的数据挖掘技术及其农业应用研究进展[J].农业机械学报,2022,53(S01):201-212. 被引量：13
4许文坚,高维新,程耀坤.基于钻石模型的广东省生猪产业竞争力评价分析[J].现代畜牧兽医,2022(12):56-62. 被引量：2
5刘振宇,丁宇祺.自然环境中被遮挡果实的识别方法研究[J].计算机应用研究,2020,37(S02):333-335. 被引量：6
6张仲宸,周浩,林波荣,李嘉麒,田昕,吴佳欣,陈帅元,黄莉.基于数据挖掘的办公建筑运行阶段碳排放分析[J].建筑节能,2020,48(11):1-6. 被引量：8
7薛丁文,李建中.基于KD树的k-means聚类算法优化[J].智能计算机与应用,2021,11(11):194-197. 被引量：6
8周迪民.云计算的智能交通应用系统[J].办公自动化,2020(24):56-57. 被引量：3
9宗万隆,吴厚春,王剑.滁州电力基于“地县一体化”传输网络优化的研究[J].无线互联科技,2017,14(23):16-18. 被引量：1
10曾伟忠,袁咏诗.兼顾可靠性与通信效率的电力通信网络协调优化方法[J].电气自动化,2018,40(4):102-104. 被引量：4

同被引文献61

1李鹏钦,张长胜,李英娜,李川.改进Stacking算法的光伏发电功率预测[J].应用科学学报,2022,40(2):288-301. 被引量：4
2葛晓旭,张钰.互联网+智能电表发展前景分析及市场容量预测[J].黑龙江电力,2020,42(1):56-60. 被引量：6
3李立浧.基于层次分析法的架空输电线路状态评估[J].电气时代,2020,0(2):30-32. 被引量：3
4祝贺.输电塔脉动风时程模拟的自回归模型技术[J].浙江电力,2006,25(2):6-8. 被引量：2
5张琦,韩祯祥,曹绍杰,顾雪平.用于暂态稳定评估的人工神经网络输入空间压缩方法[J].电力系统自动化,2001,25(2):32-35. 被引量：24
6杨挺,赵黎媛,王成山.人工智能在电力系统及综合能源系统中的应用综述[J].电力系统自动化,2019,43(1):2-14. 被引量：229
7张明远,徐人恒,张秋月,依溥治.智能电能表数据通讯安全性分析[J].电测与仪表,2014,51(23):24-27. 被引量：23
8梁培沛,孙玉彬,陈铁,周雪琴,岳俊红.风电机组齿轮箱油液监测典型案例分析[J].润滑与密封,2016,41(4):141-145. 被引量：16
9孙玉彬.基于统计方法的风电机组油液监测诊断标准的设置方法[J].润滑与密封,2016,41(8):136-141. 被引量：5
10伍少成,刘涛,肖勇,赵伟,张之涵,黄松岭.基于测量仪器云的电子式电能表远程在线检测系统[J].电测与仪表,2017,54(4):80-85. 被引量：8

引证文献4

1吴晨曦,李博亚,孙弼洋,钟素鹏.基于双向长短期记忆网络的输电线路状态画像与评估[J].浙江电力,2022,41(10):34-41. 被引量：2
2钱亮,张赢,左勇.基于云平台的数据保护功能智能电能表设计[J].物联网技术,2023,13(9):131-134. 被引量：3
3宋思瑜,林正文,赵薇,黄文广,刘广臣.基于Stacking集成学习的风机主轴止推轴承故障预警研究[J].电力大数据,2023,26(6):68-79. 被引量：1
4周楠,蔡頔,刘凯伦,郭曼.基于边缘云计算的移动端电力数据交互技术研究[J].电子设计工程,2024,32(10):87-91.

二级引证文献6

1罗昌宏,陈铭.基于大数据分析的500kV输电线路状态评估分析[J].电气技术与经济,2023(9):339-342. 被引量：1
2姜昊,陈志.智能电能表的远程数据滤波与校验[J].模具制造,2023,23(12):188-189.
3兰宇田,姚伟,张文栋,刘世超,仇玉强.基于CatBoost的新型电力系统两阶段轻量化暂稳智能评估方法[J].山东电力技术,2024,51(2):1-10.
4黄丽,娜木汗.互联网时代智能化计量检定技术与应用策略研究[J].办公自动化,2024,29(11):33-35.
5范利良,高平,姚鑫,戚东辉.基于Netty的智能抄表系统的设计与实现[J].物联网技术,2024,14(9):139-141.
6马士东,龚文斌,万安平.基于迁移学习的海上风电机组主轴承故障诊断[J].电力大数据,2024,27(4):16-24.

1薛磊,唐旭清.基于中心团的重叠社区检测算法[J].计算机科学,2020,47(8):157-163. 被引量：2
2李康.高压电力电缆故障起因及排查方法探析[J].太原铁道科技,2021(3):18-20.
3朱正发.驻车空调与暖风系统设计及故障排查方法[J].智慧工厂,2021(9):62-67.
4于平.故障树诊断法在工程机械故障排查中的应用探析[J].科技创新与应用,2021,11(33):121-124. 被引量：3
5张文迪,陈鹏宗.数据骨干网SDN域控制器与超级控制器建设方案[J].科学技术创新,2020(30):77-78. 被引量：2
6毛凌志.基于uni-app满分教育小程序设计与实现[J].数字技术与应用,2021,39(11):196-198. 被引量：3
7杨隽琳.我身边的他们[J].当代电力文化,2021(11):45-45.
8李明照,王国勇.一种可靠的高弹性云构架设计与实验[J].沈阳工业大学学报,2022,44(1):74-78.
9张艳红.基于多方法对比论证的路段划分体系研究及应用[J].武汉理工大学学报,2020,42(9):65-74. 被引量：1
10王英奇,杜文风,王辉,赵艳男.基于深度学习的两分叉铸钢节点智能生成方法[J].河南大学学报（自然科学版）,2021,51(6):685-692. 被引量：1

浙江电力

2021年第12期

浏览历史

内容加载中请稍等...

基于机器学习的云平台故障排查方法被引量：4

参考文献11

二级参考文献105

共引文献319

同被引文献61

引证文献4

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于机器学习的云平台故障排查方法 被引量：4

参考文献11

二级参考文献105

共引文献319

同被引文献61

引证文献4

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于机器学习的云平台故障排查方法被引量：4