-
题名错误流模型:硬件故障的软件传播建模与分析
被引量:9
- 1
-
-
作者
杨学军
高珑
-
机构
国防科学技术大学计算机学院
-
出处
《软件学报》
EI
CSCD
北大核心
2007年第4期808-820,共13页
-
基金
SupportedbytheNationalNaturalScienceFoundationofChina
theNationalScienceFundforDistinguishedYoungScholarsofChinaunderGrantNo.60621003(国家自然科学基金创新研究群体)
-
文摘
无论是可靠性工程还是软件可靠性中的可靠性模型,都难以描述硬件故障在程序中的传播问题.首先建立了计算数据流模型,并以无穷存储机器的指令集为例,说明可以为任意程序建立计算数据流图.在计算数据流模型的基础上,进一步建立了错误流模型.把计算过程中的错误分成物理错误和传播错误两种,通过分析这两种错误的本质和传播规律,给出了6条有关错误传播的规则和2条独立定律.根据这些规则和定律,能够计算出在程序运行过程中,任意时刻在任意位置上出现错误的概率.最后以一个简单的无穷存储机器程序为例,简要地展示了错误流模型描述硬件故障在程序中传播的能力.
-
关键词
软件实现的硬件容错
可靠性
计算数据流模型
错误流模型
错误传播
-
Keywords
SIHFT (software implemented hardware fault tolerance)
reliability
computational data flow model
error flow model
error propagation
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名高效的部分冗余容错编译:复制错误流关键子图
被引量:3
- 2
-
-
作者
高珑
王之元
杨学军
-
机构
国防科学技术大学计算机学院
-
出处
《软件学报》
EI
CSCD
北大核心
2007年第9期2105-2116,共12页
-
基金
Supported by the National Natural Science Foundation of China under Grant No.60621003(国家自然科学基金)
-
文摘
传统的容错编译通常复制所有的计算并且使用完全冗余的存储单元来保证容错.这种完全冗余在存储空间和性能上的开销都是相当大的.在错误流分析的基础上提出错误流图的关键子图的概念以及通过关键结点和关键路径生成关键子图的方法,并设计了通过复制错误流关键子图实现部分冗余的算法.在保证有效容错能力的同时,部分冗余明显减小了经过容错编译的程序在存储空间和性能上的开销.实验显示,与复制全部错误流图的完全冗余相比,在结点覆盖率降低6.25%的情况下,部分冗余算法最多能够减少寄存器的使用数量6.25%,减少功耗超过17%,减少执行时间接近26%,同时提高性能超过22%.
-
关键词
面向硬件故障的软件容错
错误流模型
关键子图
部分冗余
容错编译
-
Keywords
SIHFT(software implemented hardware fault tolerance)
error flow mode
critical subgraph
partialredundancy
fault tolerance compilation
-
分类号
TP314
[自动化与计算机技术—计算机软件与理论]
-
-
题名高性能低功耗的容错编译技术:错误流压缩算法
被引量:4
- 3
-
-
作者
高珑
杨学军
-
机构
国防科学技术大学计算机学院
-
出处
《软件学报》
EI
CSCD
北大核心
2006年第12期2425-2437,共13页
-
基金
国家高技术研究发展计划(863)No.2002AA1Z2101~~
-
文摘
在许多关键应用中,计算机的高性能、低功耗和高可靠性是必须同时满足的要求.传统的软件容错技术频繁使用和比较分支指令检测错误,带来了巨大的性能和功耗的开销.提出了基于计算数据流模型的错误流模型,并设计了错误流压缩算法.在错误流压缩算法中,利用附加计算压缩了错误流的直径,显著减少了分支指令的数量,而总指令数不变.针对StreamIT提供的快速傅立叶变换测试程序,采用Wattch对错误流压缩算法进行模拟测试.实验结果表明,当循环参数n=225时,与传统的EDDI算法相比,使用错误流压缩算法可减少分支指令24%以上,IPC提高超过12%,同时,功耗减少了将近5%.给出的推算表明在该实验中,如果内层循环体的存储指令数量为8,分支指令的减少可以达到43%以上.
-
关键词
软件容错
COTS
错误流模型
错误流压缩算法
分支指令
高性能
低功耗
-
Keywords
SIHFT (software implemented hardware fault tolerance)
COTS
error flow model
error flow compressing algorithm
branch instruction
high performance
low power dissipation
-
分类号
TP31
[自动化与计算机技术—计算机软件与理论]
-