-
题名多计算机系统中的容错任务分配和再分配
被引量:1
- 1
-
-
作者
C-I亨利.陈
v.契卡斯基
孟昭珍
-
出处
《指挥控制与仿真》
1995年第3期10-22,共13页
-
文摘
在一组互连处理机(计算机)中任务分配的目的是使资源的有效使用最大化,并由此而减少作业的解题周期。本文提出的在多计算机系统中分配任务的简单而有效的方法旨在系统和设计者确定的资源限制条件下,使处理机间的通信成本最小。因为每个任务的执行时间、可用处理机数目、处理机速度和存储容量对系统或设计者来说是已知的,因此,限制可看作为是由负载平衡引起的。随着处理机数目的增加,在任何时间在系统某处出现故障的概率也随之增加。几乎没有已建立的任务分配模型考虑了可靠性性质。在多计算机系统中,我们定义系统可靠性为系统可成功地运行任务的概率。在确定(非冗余)任务调度策略以后,任务静态和冗余地再分配给处理机。这是一种时间冗余形式,在这种形式中,如果在执行期间某些处理机故障,那么所有任务可以在剩余的处理机上(但以更长的时间)完成。由于是任务的静态预分配,这种方法比众所周知的多计算机系统中的动态再配置和滚回恢复技术更简单,因此也更实际。通过把该方法应用于不同的例子和实际的通信网络多处理机系统,我们验证了硬件容错任务分配和再分配的有效性。
-
关键词
任务分配
多处理机结构
多计算机系统
处理机间通信
处理机故障
多处理机系统
容错
调度周期
系统中
冗余
-
分类号
E917
[军事]
E141.1
[军事—军队指挥学]
-