基于节点相似度的容错网格作业调度算法研究被引量：2

Research on fault-tolerant grid task scheduling algorithms based on node similarity

下载PDF

导出

摘要为提高网格作业运行的成功率,研究了提高作业调度的可靠性的方法。研究表明,现有容错的网格作业调度算法多通过作业复制来降低节点的软硬件故障造成的作业失败的概率,它们既没有考虑作业的多个副本因共处的网络环境故障造成的同时失败,也没有考虑作业的多个副本由于所在节点缺乏相同的资源而同时失败。针对这一问题,提出了节点相似度的概念和计算方法,并将其应用到容错的网格调度算法中。提出的容错的调度算法将作业的多个副本分配到具有不同相似度的节点上运行,充分利用网格环境的分布性和异构性进一步减小作业失败的概率。 The paper investigates the grid task scheduling with the aim of decreasing the failure of grid tasks and points out that task replication is the common mechanism of most existing fault-tolerant grid scheduling algorithms. Those algorithms ignore that most replicas of the same task will fail if their network environments crash or the assigned grid nodes lack the same necessary resources. To mitigate this problem, the concept of node similarity is proposed and it is applied to a faulttolerant grid task scheduling algorithm. The proposed algorithm tries to assign the replicas of the same task to grid nodes which have less similarity and makes full use of the distributed and heterogeneous nature of grids to further decrease the failure of grid tasks.

作者叶建伟方滨兴田志宏张宏莉

机构地区哈尔滨工业大学计算机科学与技术学院

出处《高技术通讯》 EI CAS CSCD 北大核心 2008年第12期1224-1230,共7页 Chinese High Technology Letters

基金 973计划(G2005CB321806)资助项目

关键词网格作业调度容错节点相似度 grid, task scheduling, fault-tolerant, node similarity

分类号 TP393.01 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献14

1Foster I, Kesselman C, Tsudik G, et al. A Security Architecture for Computational Grids. In: Proceedings of the 5th ACM Conference on Computer and Communications Security Conference, San Francisco, California, USA, 1998. 83-92
2怀进鹏,胡春明,李建欣,孙海龙,沃天宇.CROWN:面向服务的网格中间件系统与信任管理[J].中国科学（E辑）,2006,36(10):1127-1155. 被引量：6
3王怀民,唐扬斌,尹刚,李磊.互联网软件的可信机理[J].中国科学（E辑）,2006,36(10):1156-1169. 被引量：59
4Zou D Q, Jin H, Chen H H, et al. Fault-tolerant grid architecture and practice. Journal of Computer Science and Technology, 2003, 18(4) :423-433
5Azzedin F, Msheswaran M. Integrating trust into grid resource management systems. In: Proceedings of the 2002 International Conference on Parallel Processing, Vancouver, British Columbia, Canada, 2002. 47-54
6Song S, Kwok Y K, Hwang K. Trusted job scheduling in open computational grids: security-driven heuristics and a fast genetic algorithm. In: Proceedings of the 19th IEEE International Parallel & Distributed Processing Symposium, Denver, CO, USA, 2005.33-40
7Li K, He Y, Liu X. Security-driven scheduling algorithms based on eigentrust in grid. In: Proceedings of the 6th International Conference of Parallel and Distributed Computing Applications and Technologies, Denver, USA, 2005. 1068- 1072
8金海,陈刚,赵美平.容错计算网格作业调度模型的研究[J].计算机研究与发展,2004,41(8):1382-1388. 被引量：14
9王树鹏,云晓春,余翔湛.基于生存性和Makespan的多目标网格任务调度算法研究[J].通信学报,2006,27(2):42-49. 被引量：16
10Braun T D, Siegel H J, Beck N, et al. A comparison study of static mapping heuristics for a class of metatasks on heterogeneous computing systems. Journal of Parallel and Distributed Computing, 2001, 61(6) :810-837

二级参考文献116

1胡春明,怀进鹏,孙海龙.基于Web服务的网格体系结构及其支撑环境研究[J].软件学报,2004,15(7):1064-1073. 被引量：84
2林闯,彭雪海.可信网络研究[J].计算机学报,2005,28(5):751-758. 被引量：253
3闵应骅.容错计算二十五年[J].计算机学报,1995,18(12):930-943. 被引量：16
4刘云生,张传富,张童,查亚兵,黄柯棣.基于Markov链的分布式仿真系统最佳检查点间隔研究[J].国防科技大学学报,2005,27(5):73-77. 被引量：9
5李建欣,怀进鹏,李先贤.自动信任协商研究[J].软件学报,2006,17(1):124-133. 被引量：52
6I Foster, C Kesselman. The Grid: Blueprint for a Future Computing Infrastructure. San Francisco, California: Morgan Kaufmann Publishers, 1999
7K Czajkowski, I Foster, N Karonis, et al. A resource management architecture for metacomputing systems. IPPS/SPDP' 98 Workshop on Job Scheduling Strategies for Parallel Processing, Orlando, Florida, USA, 1998
8Deqing Zou, Hai Jin, Hanhua Chen, et al. Fault-tolerant grid architecture and practice. Journal of Computer Science and Technology, 2003, 18(4): 423～433
9K Geunmo, Y Hyunsoo. On submesh allocation for mesh multicomputers: A best fit allocation and a virtual submesh allocation for faulty meshes. IEEE Trans on Parallel and Distributed Systems, 1998, 9(2) : 175～ 185
10G Allen, T Dramlitsch, I Foster, et al. Supporting efficient execution in heterogeneous distributed computing environments with cactus and globus. In: Supercomputing 2001. New York:ACM Press, 2001

共引文献98

1郭晓琼,管海兵.采用贝叶斯网的信任管理模型[J].信息安全与通信保密,2008,30(2):61-62. 被引量：1
2HU Zhi-gang HU Rong GUI Wei-hua CHEN Jian-er CHEN Song-qiao.General scheduling framework in computational Grid based on Petri net[J].Journal of Central South University of Technology,2005,12(z1):232-237.
3郑鸿.适应于网格环境的资源管理器模型设计[J].硅谷,2009,2(9).
4陈海燕,刘建勋,胡蓉.可信Web服务合成研究综述[J].吉首大学学报（自然科学版）,2011,32(1):30-36. 被引量：3
5霍英,李登,陈志刚.基于信息中心策略的P2P资源管理与调度模型[J].计算机工程与应用,2006,42(19):119-122.
6程宏兵,杨庚.一种基于预测的反馈网格作业调度模型[J].计算机应用研究,2006,23(8):22-24.
7翁楚良,李明禄,陆鑫达.面向服务的网格高性能计算策略[J].小型微型计算机系统,2006,27(10):1793-1797. 被引量：2
8王玲利,黄德才.Dev_Min-Min:一种基于最小偏差的网格调度算法[J].浙江工业大学学报,2007,35(4):431-436. 被引量：1
9邓晓衡,卢锡城,王怀民.iVCE中基于可信评价的资源调度研究[J].计算机学报,2007,30(10):1750-1762. 被引量：14
10郭玉华.基于GridSim的网格调度应用研究[J].邢台职业技术学院学报,2007,24(5):69-71. 被引量：1

同被引文献4

1王树鹏,云晓春,余翔湛.基于生存性和Makespan的多目标网格任务调度算法研究[J].通信学报,2006,27(2):42-49. 被引量：16
2刘云生,张童,张传富,查亚兵.异构分布式实时仿真系统的容错调度算法[J].软件学报,2006,17(10):2040-2047. 被引量：9
3韩彪,吴众欣,栾钟治,王永剑.一种适于主-从模式网络计算的事件驱动架构[J].西安交通大学学报,2010,44(2):39-43. 被引量：6
4郝永生,卢俊文,刘冠峰,温娜.计算密集型与数据密集型混合网格作业调度算法[J].计算机工程与科学,2014,36(8):1423-1429. 被引量：6

引证文献2

1李玺,胡志刚,阎朝坤,靳艳虹.OSG环境中可靠性增强的工作流自适应调度[J].小型微型计算机系统,2013,34(4):796-800. 被引量：1
2王宁,张聪沛.网格计算中一种在线分布式容错作业调度算法[J].电子测量与仪器学报,2018,32(3):135-141. 被引量：5

二级引证文献6

1刘本进,荣帆,王欣,肖颖.基于云平台和iOS的语音交互系统研究[J].物联网技术,2018,8(10):92-93.
2钱俊兵,潘楠,潘地林,安裕强,刘海石,陈启用.两相流喷嘴雾化空间粒径分布研究[J].电子测量技术,2020,43(21):77-83. 被引量：3
3郭强,韩琦,冯小虎.新一代风云四号气象卫星任务规划研究与应用[J].电子测量技术,2020,43(23):40-45. 被引量：3
4楚志刚,陶永才.遗传优化的混合网格计算调度模型SCE部署研究[J].计算机仿真,2021,38(5):329-333.
5秦轶翚,马涛.对等网络环境下多目标任务容错调度方法研究[J].计算机仿真,2021,38(8):352-355. 被引量：4
6阮卫华.智能手机多点触控技术在OSGearth的应用[J].信息通信,2016,29(12):98-101.

1李中福,王清亮,刘玉珊,郑黎.如何提高大型企业网络的可用性[J].河南职业技术师范学院学报,2004,32(2):77-79.
2蒋从锋,王乘,刘小虎.基于动态备份的容错网格任务调度[J].计算机应用研究,2008,25(3):738-740. 被引量：1
3邱敏,桂小林.实现可靠计算的容错网格结构[J].微电子学与计算机,2005,22(7):99-102. 被引量：7
4姚建盛,刘艳玲.一种基于社会性的机会网络喷雾聚焦路由算法[J].软件,2014,35(10):37-42.
5刘长平,叶春明,唐海波.Job-Shop调度问题的量子蚁群算法求解[J].计算机应用研究,2011,28(12):4507-4509. 被引量：6
6杨波,张云,王欣.一种基于云计算的网络访问控制方法[J].软件工程,2017,20(2):50-53. 被引量：1
7赵晨阳,杨裔,刘礼,李廉.基于蚂蚁算法的网格作业调度研究[J].微电子学与计算机,2007,24(9):78-81. 被引量：5
8何典,吴敏,胡春华.物联网环境下负载均衡的低代价云存储数据副本分布[J].中南大学学报（自然科学版）,2012,43(4):1355-1361. 被引量：4
9陈磊,李三立.数据网格中一种填空式副本分配算法[J].电子学报,2006,34(11):1951-1954. 被引量：3
10张德芝.浅议农村中小学作业的处理方式[J].新课程,2015,0(19):123-123.

高技术通讯

2008年第12期

浏览历史

内容加载中请稍等...

基于节点相似度的容错网格作业调度算法研究被引量：2

参考文献14

二级参考文献116

共引文献98

同被引文献4

引证文献2

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于节点相似度的容错网格作业调度算法研究 被引量：2

参考文献14

二级参考文献116

共引文献98

同被引文献4

引证文献2

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于节点相似度的容错网格作业调度算法研究被引量：2