基于补偿回滚的操作系统故障自恢复技术被引量：2

A New Operating System Fault Recovery Technique Based on Kernel Compensation and Process State Roll-Back

下载PDF

导出

摘要操作系统故障根据传播特性可分为process-local和kernel-global 2类,分别造成进程局部数据和内核全局状态的错误。现有技术通过重启系统或故障进程实现对进程局部数据错误的恢复,但未考虑内核全局状态的不一致问题,不能保证对kernel-global类型故障的恢复效果。针对以上问题,提出了一种基于补偿回滚的故障自恢复技术。该技术通过监测内核全局方法调用,在进程局部数据被正确恢复的前提下,利用补偿操作对不一致的内核全局状态进行恢复,控制了故障的传播效应,减小了单点故障造成的影响。此外,该技术以内核模块的形式实现,不需要对目标操作系统进行修改,可便捷地实现功能扩展和移植。故障注入实验结果表明,在保证系统功能正常的前提下,该技术能对91.6%的故障进行有效恢复,且带来的系统负载较小。 Sections 1 through 4 of the full paper explain and evaluate a new fault recovery technique based on ker- nel motion compensation and process state roll-back. The core of our thinking and that of sections 1 through 4 con- sists of：（1） past research papers on operating system fault recovery mainly focus on the data loss caused by process-local faults and the global state inconsistency caused by kernel-global faults is neglected; we propose a new fault recovery technique based on kernel motion compensation and process state roll-back model; it can minimize the propagation of faults and ensure the consistency of global state ; this technique is implemented as loadable kernel module which makes it easy to expand functionality ; （2） section 2 presents the design of kernel motion compensa- tion and process state roll-back model ; （3） section 3 presents the implementation details of this technique in Linux operating system; （4） evaluation results presented in section 4 and their analysis show preliminarily the effective- ness of the proposed technique.

作者朱怡安史佳龙

机构地区西北工业大学计算机学院

出处《西北工业大学学报》 EI CAS CSCD 北大核心 2015年第5期709-715,共7页 Journal of Northwestern Polytechnical University

基金航天支撑技术基金(2013-HT-XGD(10)) 陕西省科学技术研究发展计划项目(2014K05-25) 陕西省科学技术研究发展计划项目(2015GY035) 航空科学基金(20130753006)资助

关键词操作系统内核补偿进程状态回滚故障自恢复 adaptive algorithms, approximation algorithms, backstepping, conception design, cost functions,computer simulation, computer software, design, dynamic models, efficiency, embedded software,embedded systems, estimation, failure modes, fault detection, fault tolerance, global optimization,intelligent systems, mathematical models, models, motion compensation , real time control,reliability analysis, safety engineering, software reliability fault recovery, kernel compensation, op-erating system, process state roll-back

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献12

1Deshpande B D. System and Methods for Self-Healing from Operating System Faults in KemeVSupervisory Mode[P] US8930764 B2,2014.
2Hamann P S, Perry R L. Compensation Recommendations[P] US20140032382 AI, 2014.
3Asghari SA, Kaynak 0, Taheri H. An Investigation Into Soft Error Detection Efficiency at Operating System Level[J] . The Scientific WorldJournal, 2014( 1): 1-9.
4Yoshimura T, Yamada H, Kono K. Is Linux Kernel Oops Useful or Not?[C] //Proceedings of the Eighth USENIX Conference on Hot Topics in System Dependability, 2012: 2-7.
5Frei R, McWilliam R, Derrick B, Purvis A, Tiwari A, Serugendo G D M. Self-Healing and Self-Repairing Technologies[J]. The InternationalJournal of Advanced Manufacturing Technology, 2013, 69( 5/6/7/8): 1033-1061.
6Davis T A, Bishop A K, Cruzan CJ. Detecting and Recovering from Process Failures[P] US8103905 B2, 2013.
7Kato Y, Saito S, Mouri K, Matsuo H. Faster Recovery From Operating System Failure and File Cache Missing[C] //Proceedings of the International Multi Conference of Engineers and Computer Scientists, 2012.
8Mousa N M. Avida Checkpoint/Restart Implementation[J]. McNair Scholars ResearchJournal, 2014, 10: 10-14.
9Schneider C, Barker A, Dobson S. Autonomous Fault Detection in Self-Healing Systems: Comparing Hidden Markov Models and Artificial Neural Networks[C] // Proceedings of International Workshop on Adaptive Self-Tuning Computing Systems, ACM, New York, 2014: 24-33.
10Hargrove PH, DuellJ C. Berkeley Lab Checkpoint/Restart (blcr) for Linux Clusters[J].Journal of Physics: Conference Series, lOP Publishing, 2006 ( 46) : 494-503.

同被引文献14

1李亚兰,董昱,南接龙.基于CEEMD特征提取的无绝缘轨道电路补偿电容故障诊断[J].计算机测量与控制,2015,23(2):378-381. 被引量：15
2杨晨,闫薇,王雅轩.基于信道功耗测试的Petri网故障诊断算法[J].计算机仿真,2015,32(4):252-256. 被引量：6
3陈绍炜,吴敏华,赵帅.基于PCA和ELM的模拟电路故障诊断[J].计算机工程与应用,2015,51(11):248-251. 被引量：14
4蒋勇,赵作鹏.多属性加权模糊贝叶斯的复杂网络故障自修复技术[J].计算机应用研究,2015,32(8):2378-2381. 被引量：6
5洪硕果,沈苏彬.一种SDN网络的故障自动恢复方案[J].计算机技术与发展,2015,25(11):87-92. 被引量：2
6谢涛,何怡刚,李珩.模拟电路故障诊断新方法[J].计算机工程与应用,2015,51(21):52-57. 被引量：2
7王涛,蔡金燕,孟亚峰.一种基于LUT和二模冗余的胚胎数字电路故障检测方法[J].微电子学与计算机,2016,33(7):102-105. 被引量：10
8朱书宏,兰少华.基于OpenFlow的主动式节点失效保护机制[J].计算机工程与科学,2016,38(10):2018-2024. 被引量：1
9张峻宾,蔡金燕,孟亚峰.基于EHW和RBT的电路故障自修复策略性能分析[J].北京航空航天大学学报,2016,42(11):2423-2435. 被引量：7
10李鸿坤,陈坚红,盛德仁,李蔚.热力参数的KPCA-RBF网络建模及传感器故障诊断方法[J].振动．测试与诊断,2016,36(6):1044-1049. 被引量：6

引证文献2

1王银.嵌入式数字电路瞬态故障自修复方法研究[J].科技通报,2017,33(9):154-158. 被引量：3
2崔佳,姜艳,宋磊,曾学文.面向SDN数据平面故障恢复的备份机制[J].网络新媒体技术,2022,11(2):18-24. 被引量：1

二级引证文献4

1姜军,卓嘎,王朝霞.西藏数字壁画泥斑病害自动标定修复方法仿真[J].计算机仿真,2018,35(11):215-219. 被引量：3
2朱荣军.嵌入式车载导航双定位系统瞬时故障恢复方法[J].内蒙古民族大学学报（自然科学版）,2018,33(6):485-488. 被引量：2
3王帅帅,樊瑶,李育博,石英男.壁画图像的智能数字化修复——以藏族壁画为例[J].现代信息科技,2021,5(3):121-123. 被引量：2
4鲁田思,梁志达.基于医院网络的交换机配置文件批量备份技术[J].移动信息,2024,46(1):50-52.

1曹毅.软件自恢复技术[J].浙江大学学报（自然科学版）,1992,26(1):11-18.
2李和平.微机系统的自恢复技术与信息保护[J].新技术应用,1990(2):32-36.
3李晓勇.介绍几种软件自恢复技术[J].电脑与数控,1990(2):38-39.
4李睿.Windows系统崩溃后快速恢复Oracle数据库的妙招[J].计算机光盘软件与应用,2014,17(2):85-86.
5丁敏华,林桂凤.单片机工业测控系统抗干扰、自恢复技术[J].工业控制计算机,1992(3):30-31. 被引量：3
6赵培亮.服务器操作系统故障后的数据急救[J].科学之友（下）,2008(11):133-134.
7杜鹃.微博传播属性以及盈利模式探讨[J].艺术科技,2012,25(5):36-36.
8柯敏毅.提高微机工业控制系统可靠性的几种方法[J].计算机工程,2002,28(6):192-194. 被引量：2
9刘磊.网络软件故障[J].网管员世界,2010(20):82-103.
10李佳伦,陈刚.一种分区级的快速数据恢复方法[J].网管员世界,2012(6):79-82.

西北工业大学学报

2015年第5期

浏览历史

内容加载中请稍等...

基于补偿回滚的操作系统故障自恢复技术被引量：2

参考文献12

同被引文献14

引证文献2

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于补偿回滚的操作系统故障自恢复技术 被引量：2

参考文献12

同被引文献14

引证文献2

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于补偿回滚的操作系统故障自恢复技术被引量：2