期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
利用AdaBoost的SDC错误检测方法 被引量:2
1
作者 刘阳 庄毅 《小型微型计算机系统》 CSCD 北大核心 2022年第4期882-888,共7页
单粒子翻转引起的静默数据损坏(SDC)错误是影响嵌入式系统可靠性的关键因素.针对SDC错误难以检测的问题,本文提出了一种基于AdaBoost的SDC错误检测方法.方法首先将物理空间中的单粒子多位翻转映射到单一指令中,并建立故障模型;然后根据... 单粒子翻转引起的静默数据损坏(SDC)错误是影响嵌入式系统可靠性的关键因素.针对SDC错误难以检测的问题,本文提出了一种基于AdaBoost的SDC错误检测方法.方法首先将物理空间中的单粒子多位翻转映射到单一指令中,并建立故障模型;然后根据故障模型对目标程序进行故障注入以获取故障注入仿真实验结果,使用AdaBoost算法训练指令SDC脆弱性模型;最后根据模型预测结果对目标程序进行粒度可配置的指令冗余以达到检测SDC错误的目的.实验结果表明,与现有方法相比,本文提出的利用AdaBoost的SDC错误检测方法有着较高的检测率和较低的时空开销. 展开更多
关键词 静默数据损坏 错误检测 ADABOOST 多位翻转 指令
下载PDF
低代价锁步EDDI:处理器瞬时故障检测机制 被引量:3
2
作者 王超 傅忠传 +1 位作者 陈红松 崔刚 《计算机学报》 EI CSCD 北大核心 2012年第12期2562-2572,共11页
随着ULSI工艺步入深亚微米时代,处理器内部组合逻辑的瞬时故障敏感性迅速提高,文中在设计初期将硬件寄存器纠检错能力和系统软件检错能力纳入考虑,兼顾处理器内组合逻辑、时序逻辑两类部件,设计应用级"低代价锁步EDDI(Error Detect... 随着ULSI工艺步入深亚微米时代,处理器内部组合逻辑的瞬时故障敏感性迅速提高,文中在设计初期将硬件寄存器纠检错能力和系统软件检错能力纳入考虑,兼顾处理器内组合逻辑、时序逻辑两类部件,设计应用级"低代价锁步EDDI(Error Detection by Duplicated Instructions)"机制.创新如下:(1)提出基于概率论的故障漏检率量化估计方法,为纠检错与性能折中进行指导.以往的应用级检错机制在设计过程中并没有考虑到下层操作系统的检错能力,这会造成可靠性估计不足而带来性能损失.文中依照指令流经的部件将故障划分为不同子类,并将操作系统纳入考虑,提出基于概率论的故障漏检率量化估计方法,理论估计与故障注入结果拟合良好.(2)低代价锁步EDDI机制,结合硬件纠检错能力,兼顾处理器内组合逻辑和时序逻辑两类部件,大幅降低了性能代价.提出独特的低代价锁步指令复制规则,并通过编译链前端的寄存器分配,大幅减少了寄存器预留数,有效缓解了寄存器压力,降低了访存代价,提高了寄存器的性能.寄存器预留也保证了本机制无需修改编译器传参规则,无需重新编译系统库,提高了通用性.(3)采用单比特故障模型,基于SPARC体系结构,选取处理器中代表性部件:解码(DecoderUnit)单元、地址生成(Address GEN Unit)单元、算逻单元(ALU)进行故障注入,对低代价锁步EDDI实现代价进行详细评测.与全复制EDDI相比,低代价锁步EDDI仅以故障漏检率SDC(Silent Data Corruption)平均升高0.8%的代价,换取了动态执行指令数平均减少36.1%,执行时间平均降低35.2%的性能优势. 展开更多
关键词 EDDI 故障漏检率 组合逻辑 瞬时故障 SEU
下载PDF
一种基于不变量的软错误检测方法 被引量:5
3
作者 马骏驰 汪芸 《软件学报》 EI CSCD 北大核心 2016年第2期219-230,共12页
软错误是高辐照空间环境下影响计算可靠性的主要因素,结果错误(silent data corruption,简称SDC)是软错误造成的一种特殊的故障类型.针对SDC难以检测的问题,提出了一种基于不变量的检测方法.不变量是运行时刻保持不变的程序特征.在软错... 软错误是高辐照空间环境下影响计算可靠性的主要因素,结果错误(silent data corruption,简称SDC)是软错误造成的一种特殊的故障类型.针对SDC难以检测的问题,提出了一种基于不变量的检测方法.不变量是运行时刻保持不变的程序特征.在软错误发生后,由于程序受到影响,不变量一般不再满足.根据该原理,在源代码中插入以不变量为内容的断言,利用发生软错误后断言报错来检测软错误.首先,根据错误传播分析确定了检测位置,提取了检测位置的不变量;定义了表征不变量检测能力的渗透率,在同一检测位置依据渗透率将不变量转化为断言.通过错误注入实验,验证了该检测方法的有效性.实验结果表明:该检测方法具备较高的检出率和较低的检测代价,为星载系统的软错误防护提供了新的解决思路. 展开更多
关键词 单粒子翻转 结果错误 错误检测 不变量
下载PDF
面向GPU的通用矩阵乘法计算的容错研究
4
作者 包冲 张善从 《微电子学与计算机》 2021年第1期22-26,32,共6页
矩阵计算是GPU最擅长的工作之一,NVIDIA公司在CUDA中提供了线性代数库cuBLAS,用于矩阵和向量相关的计算.但是GPU容易受到电磁或者宇宙射线影响,而发生"位"反转问题,从而发生静默数据损坏错误.针对这个问题,利用基于算法的容... 矩阵计算是GPU最擅长的工作之一,NVIDIA公司在CUDA中提供了线性代数库cuBLAS,用于矩阵和向量相关的计算.但是GPU容易受到电磁或者宇宙射线影响,而发生"位"反转问题,从而发生静默数据损坏错误.针对这个问题,利用基于算法的容错方法,提出了带容错的,用于通用矩阵乘法计算的方法,并以CUDA库函数的方式实现.论文讨论了算法的原理,用一种高效的方法实现了容错计算,并提出了一个低开销、高准确率的阈值计算方法用于在线的快速纠错和检错.在两款嵌入式GPU平台上对带容错功能的GEMM库函数进行了评估,其纠错和检错能力与预期一致,并且在大部分情况下,额外性能开销能够控制在50%以内,证明了该GEMM函数可以在较低的性能开销情况下,能够很好的实现GEMM计算的检错和纠错,在某些结果-关键的高性能计算中,具有一定的实用价值. 展开更多
关键词 通用矩阵乘法 基于算法的容错 静默数据损坏 浮点运算 校验和 检错与纠错
下载PDF
基于堆叠式分布式文件系统的端到端校验
5
作者 李诗逸 古亮 喻之斌 《集成技术》 2019年第5期13-25,共13页
端到端校验是一种有效的数据完整性检测手段,可为分布式存储系统提供基本的可靠性保证。Glusterfs是一种常用的堆叠式分布式文件系统,但缺乏有效的数据完整性检测机制,存在用户数据遭受破坏而无法被发现的风险,即返回错误数据给用户。... 端到端校验是一种有效的数据完整性检测手段,可为分布式存储系统提供基本的可靠性保证。Glusterfs是一种常用的堆叠式分布式文件系统,但缺乏有效的数据完整性检测机制,存在用户数据遭受破坏而无法被发现的风险,即返回错误数据给用户。这种风险在某些情况还会扩散,造成多副本或灾备、双活情况下的数据丢失。针对这一问题,该文提出了一种高性价比的基于Glusterfs的端到端校验方案(命名为Glusterfs-E2E),可以有效解决Glusterfs文件系统中存在的数据完整性风险。该方案不但可以提供全路径的保护,具备2%~8%的高性能开销,而且还可以提供软件故障的定位功能。 展开更多
关键词 静默错误 数据完整性 端到端校验 分布式文件系统
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部