基于FP-Growth改进算法的云服务器故障数据分析被引量：9

Analysis of cloud server fault data based on improved FP-Growth algorithm

下载PDF

导出

摘要针对云服务器使用过程中参数异常的问题,介绍了云服务器的参数数据获取、数据清洗整理和有效分析过程。针对现有频繁模式增长(FP-Growth)算法中存在的条件FP-tree构建过程过于冗余以及数据量级越大处理效率越低的问题,提出了一种改进的FP-Growth算法,引入数组标记策略,每个FP-tree节点只保留指向父节点的指针。改进算法在挖掘过程中无需生成条件FP-tree,减少了时空消耗。实验结果表明,改进后的FP-Growth并行算法能够有效地提高云平台虚拟机异常数据的关联分析效率,并且改进算法也适用于较大规模数据集的数据挖掘工作。 In order to analyze the problem of abnormal parameters in the process of using the cloud server,the process of parameter data acquisition,data cleaning,and effective analysis of the cloud server is introduced.Aiming at the problems that the conditional FP-tree construction process is too redundant and the larger amount of data causes lower processing efficiency in the existing FP-Growth algorithm,an improved FP-Growth algorithm is proposed.It introduces the array tagging strategy,and each FP-tree node retains only pointers to the parent node.It does not need to generate a conditional FP-tree during the mining process,thus reducing time and space consumption.Experimental results show that the improved FP-Growth parallel algorithm can effectively improve the correlation analysis efficiency of abnormal data of cloud platform virtual machines,and is also suitable for data mining of large-scale data sets.

作者何望林果园 HE Wang;LIN Guo-yuan(School of Computer Science and Technology,China University of Mining and Technology,Xuzhou 221000;Digitization of Mine,Engineering Research Center of Ministry of Education of China,Xuzhou 221000,China)

机构地区中国矿业大学计算机科学与技术学院矿山数字化教育部工程研究中心

出处《计算机工程与科学》 CSCD 北大核心 2020年第5期770-775,共6页 Computer Engineering & Science

基金中央高校基本科研业务费专项资金(2017XKQY079)。

关键词云服务器故障分析 FP-GROWTH算法数据挖掘 cloud server fault analysis FP-Growth algorithm data mining

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1张元龙.基于云平台的数据备份分析[J].电子世界,2018,0(15):101-101. 被引量：3
2李敏,李春平.频繁模式挖掘算法分析和比较[J].计算机应用,2005,25(B12):166-171. 被引量：11

二级参考文献21

1HAND D, MANNILA H, SMYTH P. Principles of Data Mining[ M]. Massachusetts Institute of Technology, 2001.
2MANNIEA H. Methods and problems in data mining[ A]. Proceedings of the 6th International Conference on Database Theory[ C],1997.41 -55.
3KRISHNAMURTHY R, IMIELINSKI T. Practitioner Problems in Need of Database Research: Research Directions in Knowledge Discovery[A]. Vol. 20, No. 3 of SIGMOD Record[ C], Sept. 1991.76-78.
4HAN J, KAMBER M. Data Mining: Concepts and Techniuqes[ M].Morgan Kaufmann Publishers, San Francisco, CA, 2001.
5AGRAWAL R, IMIELINSKI T, A. Swami. Mining association rules between sets of items in large databases[ A]. Proceedings of ACM SIGMOD International Conference on Management of data [ C],1993. 207-216.
6AGRAWAL R, SRIKANT R. Fast algorithms for mining association rules[ A]. In J. B. Bocca, M. Jarke, and C. Zaniolo, editors, Proceedings of the 20th International Confererice on Very Large Database[C], MorganKaufmann, 1994. 487 -499.
7PARK JS, CHEN MS, YU PS. An effective hash - based algorithm for mining association rules[ A]. Proceedings of ACM SIGMOD International Conference on Management of Data[ C], San Jose, CA,May 1995. 175 - 186.
8TOIVONEN H. Sampling large databases for association rules[ A].Proceedings of the 22nd International Conference on Very Large Database[C], Bombay, India, September 1996. 134-145.
9BRIN S, MOTWANI R, ULLMAN JD, TSUR S. Dynamic itemset counting and implication rules for market basket data[ A]. In Proceedings of the 1997 ACM SIGMOD International Conference on Management of Data[ C], 1997. 255 -264.
10SAVASERE A, OMIECINSKI E, NAVATHE S. An efficient algorithm for mining association rules in large databases[ R]. In 21st VLDB Conference, 1995.

共引文献12

1赵卫绩.一种改进的Eclat算法[J].科学技术与工程,2009,9(24):7506-7508. 被引量：1
2刘井莲.一种改进的Eclat算法[J].科学技术与工程,2010,10(8):2007-2009.
3熊忠阳,陈培恩,张玉芳.基于散列布尔矩阵的关联规则Eclat改进算法[J].计算机应用研究,2010,27(4):1323-1325. 被引量：18
4刘井莲.Eclat与Eclat+算法的比较分析[J].绥化学院学报,2010,30(2):189-190. 被引量：1
5金瑶.一种基于自适应步长及动态修剪的Apriori改进算法[J].宜春学院学报,2009,31(6):81-83. 被引量：1
6陈康.基于Eclat算法的图书推荐系统仿真[J].计算机仿真,2010,27(9):311-314. 被引量：4
7冯培恩,刘屿,邱清盈,李立新.提高Eclat算法效率的策略[J].浙江大学学报（工学版）,2013,47(2):223-230. 被引量：13
8田磊,崔广才,何旭,陈建新.基于聚类布尔矩阵的Apriori算法的研究[J].长春理工大学学报（自然科学版）,2017,40(5):109-114.
9瞿珊珊,周晓光.面向流域水资源自由文本的属性抽取方法[J].情报探索,2018(5):63-67.
10李维娜,任家东.软件群体中基于交互序列的频繁模式挖掘算法研究[J].小型微型计算机系统,2018,39(5):1046-1051. 被引量：5

同被引文献85

1宫灿锋,贺勇,周宁,吴坡,张江南,阮冲.冗余服务器故障检测和可靠切换方法的研究及应用[J].河南电力,2021(S02):76-79. 被引量：2
2唐琳,王顺阳,王永刚,张天冉,董月娇.一种基于视频图像识别的服务器故障辅助诊断系统[J].科技通报,2020(8):58-61. 被引量：4
3汪赫瑜,夏航,任建华.混合深层协同过滤的SVD++推荐方法[J].辽宁工程技术大学学报（自然科学版）,2020(6):524-532. 被引量：1
4蒋祖跃.秦山核电厂反应堆保护系统及其相关设备数字化改造规划和实施策略[J].原子能科学技术,2010,44(1):65-69. 被引量：9
5刘永阔,谢春丽,成守宇,夏虹.核电站分布式智能故障诊断系统研究与设计[J].原子能科学技术,2011,45(6):688-694. 被引量：9
6郑元兵,孙才新,李剑,陈伟根,王有元.变压器故障特征量可信度的关联规则分析[J].高电压技术,2012,38(1):82-88. 被引量：27
7李汉彪,刘渊.一种SVM入侵检测的融合新策略[J].计算机工程与应用,2012,48(4):87-90. 被引量：13
8梁飞,闫宏印.基于聚类分析的动态自适应入侵检测模式研究[J].计算机工程与设计,2013,34(3):814-820. 被引量：7
9高麒瀚,江德正.智能化工艺系统设计平台技术在核电工程设计的应用探讨[J].核科学与工程,2014,34(1):125-133. 被引量：3
10李默,梁永全.基于标签和关联规则挖掘的图书组合推荐系统模型研究[J].计算机应用研究,2014,31(8):2390-2393. 被引量：22

引证文献9

1杨宇环,张开生.融合FP-Growth和RBM的图书推荐算法研究[J].陕西科技大学学报,2021,39(4):156-160. 被引量：4
2余飞娅,叶文波.基于FP-Growth算法的计量主站告警分析研究[J].电气自动化,2021,43(6):30-32.
3王辉登.基于无线传感网络的网络磁盘设备故障监测方法研究[J].信息与电脑,2022,34(1):38-40. 被引量：1
4汪海枝,李磊.网络服务器故障自动编码修复方法仿真与研究[J].计算机仿真,2022,39(4):482-486. 被引量：1
5刘龙庚.基于异构网络空管安全监控关联算法研究[J].信息网络安全,2022(4):58-66. 被引量：2
6吴文波.基于大数据技术的服务器磁盘故障诊断方法[J].信息记录材料,2022,23(6):170-172.
7唐宇,代琪,杨梦园,陈丽芳.改进麻雀搜索算法优化SVM的异常点检测[J].计算机工程与科学,2023,45(2):346-354. 被引量：4
8崔文浩,郑胜,秦雄杰,曾曙光.基于多尺度时间窗口的核电运行数据关联性分析方法研究[J].南方能源建设,2023,10(2):143-150.
9王士森,徐慧.关联规则算法在医疗设备管理系统设计与应用[J].机械设计与制造工程,2023,52(12):127-130.

二级引证文献12

1王民华.基于ISSA-SVM的无煤柱自成巷技术适应性评价模型[J].山西能源学院学报,2023,36(3):7-9.
2张炎亮,李营.基于多尺度排列熵和IWOA-SVM的滚动轴承故障诊断[J].电子测量技术,2023,46(19):29-34.
3谢妙,邓育林,吕洁.基于深度受限玻尔兹曼机的个性化推荐算法[J].数据采集与处理,2022,37(2):456-462. 被引量：4
4吴文波.基于大数据技术的服务器磁盘故障诊断方法[J].信息记录材料,2022,23(6):170-172.
5陈帜,张文德,刘田.基于图卷积神经网络的图书推荐方法研究[J].情报探索,2022(10):1-5. 被引量：2
6秦国宾.融合多源信息的高校智能图书推荐算法[J].信息与电脑,2022,34(20):94-96.
7姜建武,王博.高维数据组合关联关系挖掘方法[J].科学技术与工程,2023,23(4):1615-1624.
8陈庆斌,杨耿煌,耿丽清,石迅,郑虎虎.基于改进麻雀搜索算法的配送中心选址研究[J].天津职业技术师范大学学报,2023,33(2):14-19.
9刘晶.结合会员借阅行为的图书馆启发式借阅流程模型构建[J].微型电脑应用,2023,39(9):155-158.
10于瑞业.基于ISSA-SVM的煤矿变压器故障诊断方法研究[J].机械管理开发,2024,39(1):227-228.

1徐竞辉,史力思,谢骥.电网故障信息数据挖掘技术的分析[J].科技创新导报,2019,16(33):137-137.
2张成新.HXD1型机车数据分析软件在故障预防和处理中的应用[J].工程技术与管理（新加坡）,2019,3(10):29-31.
3管洪芬.找个理由去原谅[J].恋爱．婚姻．家庭（青春）（下）,2020,0(4):21-21.
4彭浩,佃松宜.基于改进FP-growth的用户兴趣推荐算法的设计与实现[J].微电子学与计算机,2020,37(2):8-13. 被引量：5
5刘思怡,苏运,张焰.基于FP-Growth算法的10kV配电网分支线断线故障诊断与定位方法[J].电网技术,2019,43(12):4575-4581. 被引量：44
6檀腾飞.铁路电力线路自动化技术的探索与研究[J].幸福生活指南,2019,0(26):0126-0126.
7张慧琴,吉植强.基于介电特性检测土壤污染的研究进展[J].地下水,2020,42(2):64-66.
8李瑞.铁路电力系统故障快速隔离恢复技术研究[J].电气化铁道,2020,31(1):64-66. 被引量：3
9齐安智.一种基于改进模拟退火算法的TSP问题的应用研究[J].信息与电脑,2020,32(3):32-34. 被引量：1
10张嫄,刘宇清,杨可捷,陶方英,韩巍.前庭功能检查在眩晕症诊断中的效果观察[J].临床医药文献电子杂志,2020,7(18):148-148. 被引量：1

计算机工程与科学

2020年第5期

浏览历史

内容加载中请稍等...

基于FP-Growth改进算法的云服务器故障数据分析被引量：9

参考文献2

二级参考文献21

共引文献12

同被引文献85

引证文献9

二级引证文献12

相关作者

相关机构

相关主题

浏览历史

基于FP-Growth改进算法的云服务器故障数据分析 被引量：9

参考文献2

二级参考文献21

共引文献12

同被引文献85

引证文献9

二级引证文献12

相关作者

相关机构

相关主题

浏览历史

基于FP-Growth改进算法的云服务器故障数据分析被引量：9