摘要
介绍了设计和实现的一个分布式容错系统的实验原型。系统采用PC双机备份结构和QNX分布式实时操作系统,通过用监视器进程定时检测工作节点状态和主机和备份机相互切换的方式,实现对单节点静默失效和偶发故障的实时容错。由于系统的容错功能是采用软件方式实现,使得该系统不仅开发成本低,而且功能易于扩充和升级。
This paper describes the design and implementation of a prototypal distributed fault tolerant system, which is developed under QNX RTOS by networking two standard PCs. By using a watchdog timer for error detection, the system can be tolerant for fail silent and transient fault of a single node.
出处
《核电子学与探测技术》
CAS
CSCD
北大核心
1999年第5期347-351,共5页
Nuclear Electronics & Detection Technology