基于深度强化学习的故障硬盘预测与处理方法被引量：2

Deep Reinforcement Learning Based on Disk Failure Prediction and Operation Method

下载PDF

导出

摘要大数据技术发展产生的海量数据急需一种可靠的数据存储方法,现有的主动故障预测方法相比被动容错机制可取得更好的效果,但是故障硬盘预测领域仍有一些问题亟待解决。当前的故障硬盘预测方法大多是离线的,通过滑动窗口将硬盘数据切分为样本,使用欠采样或过采样解决样本不平衡问题。然而,硬盘数据的分布会随时间变化,下采样可能会丢失一些有用特征,过采样可能会导致训练过拟合,该样本使用方式也忽略了样本之间的时间相关性。为了解决这些问题,将存储系统中硬盘的整个运行维护过程视为一个顺序决策过程,使用深度强化学习DQN算法求解。在强化学习语境下,样本不平衡问题转化为稀疏奖励问题。通过奖励塑造及探索机制解决稀疏奖励问题,在模型部署后利用经验回放实现模型在线学习。在开源数据集BackBlaze上的实验验证了该方法的有效性。 The massive amount of data generated by the development of big data technology urgently requires a reliable data storage method.The existing proactive failure prediction methods have achieved better performance than traditional reactive methods,but some problems still exist to be solved in the disk failure prediction.Most current methods are offline and divide data into samples through a sliding window with subsampling or oversampling to solve the imbalance problem.However,the distribution of hard disk data changes over time,subsampling may lose some valuable features,and oversampling may lead to training overfitting.Meanwhile,these methods ignore the temporal dependency of disk data.To solve these problems,the proposed method casts a hard disk′s entire operation and maintenance process in the storage system as a markov decision process,which is solved using the reinforcement learning method DQN.Based on reinforcement learning,the imbalance problem turns into the sparse reward problem,which is solved by reward shaping and exploration.The replay buffer can update the model online by the stored tuples.Experiments on the open-source dataset BackBlaze verify the effectiveness of the proposed method.

作者管文白房笑宇夏彬 GUAN Wen-bai;FANG Xiao-yu;XIA Bin(School of Computer Science,Nanjing University of Posts and Telecommunications;Jiangsu Key Laboratory of Big Data Security and Intelligent Processing,Nanjing 210023,China)

机构地区南京邮电大学计算机学院、软件学院、网络空间安全学院江苏省大数据安全与智能处理重点实验室

出处《软件导刊》 2023年第3期18-26,共9页 Software Guide

基金国家自然科学基金面上项目(61872186) 南京邮电大学校级自然科学基金项目(NY221070)。

关键词硬盘故障故障预测深度强化学习 DQN算法奖励塑造 hard disk failure failure prediction deep reinforcement learning DQN reward shaping

分类号 TP333 [自动化与计算机技术—计算机系统结构] TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献2

1王宇菲,董小社,王龙翔,陈维多,陈衡.采用数据降维的固态硬盘故障检测方法[J].西安交通大学学报,2022,56(11):176-185. 被引量：4
2李港,李莉,林国义,董怡.硬盘故障预测模型的建立与实现[J].控制工程,2022,29(10):1788-1792. 被引量：2

二级参考文献5

1陈小红,李霞,王娜.高维多目标优化中基于稀疏特征选择的目标降维方法[J].电子学报,2015,43(7):1300-1307. 被引量：14
2王梓仲,王海霞,邵艾然,汪东升.一种混合局部恢复码及Hitchhiker码的存储策略[J].计算机学报,2020,43(4):618-630. 被引量：4
3宋昱,孙文赟,陈昌盛.对数变换主成分分析的图像识别[J].西安交通大学学报,2021,55(1):33-42. 被引量：6
4高聪明,石亮,刘凯,薛春,舒继武.闪存固态硬盘系统结构与技术[J].计算机研究与发展,2021,58(7):1518-1532. 被引量：10
5万洪浩,邓明翥,肖侬,刘芳.一种面向RAID6固态阵列的数据盘失效快速修复方法[J].计算机研究与发展,2015,52(S2):62-67. 被引量：2

共引文献4

1邱辉.基于人工智能的信息化产品检验检测技术研究[J].互联网周刊,2024(1):74-76. 被引量：2
2孟苓辉,董明,张诚权,侯波,肖庆中,周振威.机械硬盘加速寿命试验及状态监测技术研究[J].电子产品可靠性与环境试验,2024,42(3):34-40.
3袁晶丽.基于机器视觉的煤矿井下传送带故障自动检测研究[J].自动化应用,2024,65(13):205-207.
4王艳,刘亚东,皮婵娟,施君豪.一种融合注意力机制的CNN-BiGRU磁盘故障预测方法研究[J].大数据,2024,10(5):109-122.

同被引文献23

1袁建虎,韩涛,唐建,安立周.基于小波时频图和CNN的滚动轴承智能故障诊断方法[J].机械设计与研究,2017,33(2):93-97. 被引量：99
2赵文清,严海,邵绪强.改进的非极大值抑制算法的目标检测[J].中国图象图形学报,2018,23(11):1676-1685. 被引量：55
3丁育林,汪俊瑛.南京市六合区大厂街道居民生活用水现状及节水对策[J].科技资讯,2018,16(20):103-104. 被引量：1
4肖雄,王健翔,张勇军,郭强,宗胜悦.一种用于轴承故障诊断的二维卷积神经网络优化方法[J].中国电机工程学报,2019,39(15):4558-4567. 被引量：83
5李俊,刘永葆,余又红.卷积神经网络和峭度在轴承故障诊断中的应用[J].航空动力学报,2019,34(11):2423-2431. 被引量：34
6宫文峰,陈辉,张泽辉,张美玲,管聪,王鑫.基于改进卷积神经网络的滚动轴承智能故障诊断研究[J].振动工程学报,2020,33(2):400-413. 被引量：72
7殷芙萍,江秋语.基于神经网络的大数据分析方法[J].软件导刊,2020,19(9):39-42. 被引量：5
8朱浩,宁芊,雷印杰,陈炳才,严华.基于注意力机制-Inception-CNN模型的滚动轴承故障分类[J].振动与冲击,2020,39(19):84-93. 被引量：31
9张慧敏.基于图像智能分析的全天候危岩崩塌灾害实时监测设备研究[J].科技资讯,2020,18(27):44-46. 被引量：4
10宋霖,宿磊,李可,苏文胜.基于SSD和1DCNN的滚动轴承故障诊断方法[J].华中科技大学学报（自然科学版）,2020,48(12):38-43. 被引量：16

引证文献2

1季利鹏,郝健,曹家宁,王杭.基于改进1D-CNN的轴承故障实时诊断方法[J].软件导刊,2023,22(7):32-37. 被引量：1
2于婉婷.基于图像检测的节水智能控制系统[J].科技资讯,2023,21(23):27-31.

二级引证文献1

1张伟业,缪维跑,闻麒,李春.基于改进CEEMDAN-CNN的轴承故障诊断研究[J].热能动力工程,2024,39(8):164-173.

1朱永红.公路软土路基沉降预测方法研究[J].中文科技期刊数据库（文摘版）工程技术,2021(4):102-103.
2程修远,方癸华,林嵩凯.计算机硬盘故障问题中的数据恢复技术研究[J].信息与电脑,2023,35(2):54-56. 被引量：2
3孙龙,石志敏.轨道交通接触网故障及处理策略探讨[J].中文科技期刊数据库（文摘版）工程技术,2022(12):0025-0028.
4崔晓哲.风电机组的日常运维及检修技术分析[J].集成电路应用,2023,40(2):312-314. 被引量：1
5李燕飞,李春光,卜笛祺.SVM在机械液压传动系统故障预测中的应用研究[J].自动化与仪器仪表,2023(2):42-45. 被引量：4
6陆航,董威,董光磊.国内外轨道交通PHM应用现状综述[J].中国铁路,2023(4):82-93. 被引量：6
7李成.基于人工神经网络的海上风机故障预测方法[J].电力系统装备,2023(2):113-115.
8李奕宁.计算机硬件故障与维修方法分析[J].集成电路应用,2023,40(2):232-233.
9张启阳,陈希亮,张巧.基于轨迹感知的稀疏奖励探索方法[J].计算机科学,2023,50(1):262-269.
10刘鸣慧,熊建斌,苏乃权,李春林,岑健,张钰妤.基于深度学习的石化机组轴承故障诊断综述[J].机床与液压,2023,51(6):171-180. 被引量：5

软件导刊

2023年第3期

浏览历史

内容加载中请稍等...

基于深度强化学习的故障硬盘预测与处理方法被引量：2

参考文献2

二级参考文献5

共引文献4

同被引文献23

引证文献2

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于深度强化学习的故障硬盘预测与处理方法 被引量：2

参考文献2

二级参考文献5

共引文献4

同被引文献23

引证文献2

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于深度强化学习的故障硬盘预测与处理方法被引量：2