期刊文献+

面向机群文件系统的高可靠消息传输机制 被引量:1

High-reliable message-passing mechanism for cluster file system
原文传递
导出
摘要 针对机群文件系统的个子操作出现错误会影响数据的可用性,提出了一种高可靠的消息传输机制HR-NET.将机群文件系统的网络故障分为3类:发送错误;接收错误;请求应答错误.对于前2种错误,提出了基于冗余传输路径的网络容错机制,对消息收发故障进行恢复,同时引入消息优先级调度策略,动态地调整消息的处理次序,避免请求应答类型的错误.通过分离并单独处理网络故障,HR-NET为机群文件系统提供了高可靠的通信机制,简化了上层文件语义操作的实现.测试结果表明HR-NET高可靠性机制所带来的性能损失低于9%. 针对机群文件系统的个子操作出现错误会影响数据的可用性,提出了一种高可靠的消息传输机制HR-NET.将机群文件系统的网络故障分为3类:发送错误;接收错误;请求应答错误.对于前2种错误,提出了基于冗余传输路径的网络容错机制,对消息收发故障进行恢复,同时引入消息优先级调度策略,动态地调整消息的处理次序,避免请求应答类型的错误.通过分离并单独处理网络故障,HR-NET为机群文件系统提供了高可靠的通信机制,简化了上层文件语义操作的实现.测试结果表明HR-NET高可靠性机制所带来的性能损失低于9%.
出处 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2011年第S1期139-143,共5页 Journal of Huazhong University of Science and Technology(Natural Science Edition)
基金 国家高技术研究发展计划资助项目(2009AA01A129)
关键词 机群文件系统 消息传输机制 可靠性 网络故障 容错机制 cluster file system message passing mechanism high reliability faults of network fault tolerance
  • 相关文献

参考文献12

  • 1Okamoto T,Miura S,Boku T,et al.RI2N/UDP:high bandwidth and fault-tolerant network for a PC-cluster based on multi-link Ethernet. The Work-shop on Communication Architecture for Clusterswith IPDPS . 2007
  • 2Callaghan B,Pawlowski B,Staubach P.NFS version 3protocol specification. RFC 1813 . 1995
  • 3Shepler S,Callaghan B,Robinson D,et al.NFS version 4protocol specification. RFC3010 . 2000
  • 4LeMahieu P,Bohossian V,Bruck J.Fault-tolerantswitched local area networks. Proc of the FirstMerged Int Parallel Processing Symposium and Sym-posium on Parallel and Distributed Processing . 1998
  • 5Braam P J.Lustre networking. http:∥www.lustre.org . 2010
  • 6Myricom.INC. http:∥www.myri.com/myrinet/ . 2010
  • 7InfiniBand Trade Association.ConnectX IB-dual-port infini band adapter cards with PCI express. http:∥www.infinibandta.org/ . 2010
  • 8Paxson V,Mahdavi J,Adams A,et al.An architecture for large-scale internet measurement. IEEE Communications Magazine . 1998
  • 9M. Seltzer,G. Ganger,M. K. McKusick,K. Smith,C. Soules,and C. Stein.Journaling Versus Soft Updates: Asynchronous Meta-data Protection in File Systems. USENIX Annual Technical Conference . 2000
  • 10Sage Weil,Scott A. Brandt,Ethan L. Miller, et al.CRUSH: Controlled, Scalable, Decentralized Placement of Replicated Data. Proceedings of SC ‘06 . 2006

同被引文献6

引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部