大数据存储中的容错关键技术综述被引量：15

Fault Tolerance Technology for Big Data Storage

下载PDF

导出

摘要不断增长的海量数据需要被可靠存储,而分布式存储系统庞大的节点规模和数据规模,大大提升了发生节点失效的概率,容错技术成为大数据存储中不可忽视的关键技术。文中介绍了数据容错的两种基本策略:复制和纠删码,并分别总结了将这两种容错策略具体应用于大数据存储时所面对的问题和相关解决技术,如与基于复制的容错技术相关的副本系数设置、副本放置策略、副本一致性策略、副本修复策略和纠删码领域的再生码技术等。 The growing massive data needs to be reliably stored,but the large scale of the nodes and data of distributed storage system greatly enhance the probability of node failure.The fault tolerance technology has become the key technology which cannot be ignored in big data storage.This paper introduces two basic strategies of data fault tolerance：replication and erasure codes,and summarizes related technology using these two strategies for big data storage.Technologies include the coefficient setting of duplicates,the replica placement strategy,the replica consistency and the repair strategy related to replication technology,and regenerative code technology related to erasure codes.

作者宫婧王文君

机构地区南京邮电大学宽带无线通信与传感网技术教育部重点实验室

出处《南京邮电大学学报（自然科学版）》北大核心 2014年第4期20-25,共6页 Journal of Nanjing University of Posts and Telecommunications：Natural Science Edition

基金国家自然科学基金(60973140 61170276 61373135 ) 江苏省产学研项目(BY2013011) 江苏省科技型企业创新基金(BC2013027) 江苏省高校自然科学研究重大项目(12KJA520003)资助项目

关键词大数据存储分布式存储容错复制纠删码再生码 big data storage distributed storage fault tolerant replication erasure code regenerating code

分类号 TP302.8 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献33

1孙鹏,赵军锁,张文君.软件容错:技术与展望[J].计算机工程与科学,2007,29(8):88-93. 被引量：7
2VON NEUMANN J.Probabilistic logics and the synthesis of reliable organisms from unreliable components[J].Auromata Studies,1956,10:43-98.
3百度百科:容错技术[EB/OL].[2014-02-16].http:∥baike.baidu.com/link? url=5ArUGJpLBLQgd1Q1eOrhgK0WaIuNwEE-4FJdZylRXl1 XeM-pZr7 PSNYBFIoc5 E7_j.
4覃雄派,王会举,杜小勇,王珊.大数据分析——RDBMS与MapReduce的竞争与共生[J].软件学报,2012,23(1):32-45. 被引量：386
5GANTZ J A E R.Extracting Value from Chaos[EB/OL].[2011-06-30].http://www.emc.com/digital_universe.
6ZHANG Xiaoxue,XU Feng.Survey of research on big data storage[C]//12th International Symposium on Distributed Computing and Applications to Business,Engineering & Science(DCABES).2013:76-80.
7胡燏翀.基于网络编码的分布式存储容错机制研究[D].合肥:中国科学技术大学,2010.
8宫学庆,金澈清,王晓玲,张蓉,周傲英.数据密集型科学与工程：需求和挑战[J].计算机学报,2012,35(8):1563-1578. 被引量：79
9陈玲玲.基于副本管理的P2P存储系统模型建立[D].秦皇岛:燕山大学,2012.
10DABEK F,KAASHOEK M F.Wide-area cooperative storage with cfs[C]//SOSP.2001:202-215.

二级参考文献151

1Bhagwat D,Pollack K,Long DDE,Schwarz T,Miller EL,P-ris JF.Providing high reliability in a minimum redundancy archival storage system.In:Proc.of the 14th Int'l Symp.on Modeling,Analysis,and Simulation of Computer and Telecommunication Systems (MASCOTS 2006).Washington:IEEE Computer Society Press,2006.413-421.
2Zhu B,Li K.Avoiding the disk bottleneck in the data domain deduplication file system.In:Proc.of the 6th Usenix Conf.on File and Storage Technologies (FAST 2008).Berkeley:USENIX Association,2008.269-282.
3Bhagwat D,Eshghi K,Mehra P.Content-Based document routing and index partitioning for scalable similarity-based searches in a large corpus.In:Berkhin P,Caruana R,Wu XD,Gaffney S,eds.Proc.of the 13th ACM SIGKDD Int'l Conf.on Knowledge Discovery and Data Mining (KDD 2007).New York:ACM Press,2007.105-112.
4You LL,Pollack KT,Long DDE.Deep store:An archival storage system architecture.In:Proc.of the 21st Int'l Conf.on Data Engineering (ICDE 2005).Washington:IEEE Computer Society Press,2005.804-815.
5Quinlan S,Dorward S.Venti:A new approach to archival storage.In:Proc.of the 1st Usenix Conf.on File and Storage Technologies (FAST 2002).Berkeley:USENIX Association,2002.89-102.
6Sapuntzakis CP,Chandra R,Pfaff B,Chow J,Lam MS,Rosenblum M.Optimizing the migration of virtual computers.In:Proc.of the 5th Symp.on Operating Systems Design and Implementation (OSDI 2002).New York:ACM Press,2002.377-390.
7Rabin MO.Fingerprinting by random polynomials.Technical Report,CRCT TR-15-81,Harvard University,1981.
8Rivest R.The MD5 message-digest algorithm.1992.http://www.python.org/doc/current/lib/module-md5.html.
9U.S.National Institute of Standards and Technology (NIST).Federal Information Processing Standards (FIPS) Publication 180-1:Secure Hash Standard.1995.http://www.itl.nist.gov/fipspubs/fip180-1.htm.
10U.S.National Institute of Standards and Technology (NIST).Federal Information Processing Standards (FIPS) Publication 180-2:Secure Hash Standard.2002.http://csrc.nist.gov/publications/fips/fips180-2/fips180-2.pdf.

共引文献580

1许瑞,谷守珍,沙行勉,诸葛晴凤,石亮,高思远.面向多读/写头磁畴壁存储器的优化研究[J].软件学报,2020(9):2723-2740.
2张安珍,李建中,高宏.基于符号语义的不完整数据聚集查询处理算法[J].软件学报,2020,31(2):406-420. 被引量：7
3王海音,孙连山,祁志斌.一种可视化数据起源管理工具[J].网络安全技术与应用,2020,0(3):59-61.
4郑智泉,杨楠.智能革命下数据驱动的智慧图书馆建设分析[J].智能计算机与应用,2020(8):183-185.
5谢月锋,董现垒,陈卉,王燕,刘志成.利用网络痕迹信息即时预测儿童腹泻流行趋势[J].医学信息（医学与计算机应用）,2016,29(29):1-4.
6张砚波,刘正伟,文中领,王永海.一种高效存储解决方案的分析与研究[J].计算机研究与发展,2012,49(S1):180-184. 被引量：9
7马井玮,王克宾,赵彬,马良,王刚,刘晓光.基于重复数据删除的连续数据保护系统的快速回滚[J].计算机研究与发展,2012,49(S1):196-200.
8陆游游,敖莉,舒继武.一种基于重复数据删除的备份系统[J].计算机研究与发展,2012,49(S1):206-210. 被引量：5
9彭成,王树鹏,贾志凯.基于纠删码的数据消冗存储系统可靠性增强研究[J].计算机研究与发展,2011,48(S1):1-6. 被引量：3
10董新华,李瑞轩,周湾湾,王聪,薛正元,廖东杰.Hadoop系统性能优化与功能增强综述[J].计算机研究与发展,2013,50(S2):1-15. 被引量：69

同被引文献94

1Jingzhao WANG,Yuan LUO,Kenneth W.SHUM.Storage and repair bandwidth tradeoff for heterogeneous cluster distributed storage systems[J].Science China(Information Sciences),2020,63(2):131-145. 被引量：2
2崔杰,李陶深,兰红星.基于Hadoop的海量数据存储平台设计与开发[J].计算机研究与发展,2012,49(S1):12-18. 被引量：141
3徐文芳,刘宏伟,舒燕君,马闯.三模冗余容错系统管理板[J].清华大学学报（自然科学版）,2011,51(S1):1434-1439. 被引量：6
4周国亮,宋亚奇,王桂兰,朱永利.状态监测大数据存储及聚类划分研究[J].电工技术学报,2013,28(S2):337-344. 被引量：41
5徐奡,夏德天,郑久寿.高升力系统控制计算机容错技术研究[J].微电子学与计算机,2015,32(6):36-40. 被引量：12
6王存,曹晓英.图书馆联盟的又一范例——记天津市高校数字图书馆的建设历程[J].情报理论与实践,2006,29(4):461-464. 被引量：12
7熊庭刚,马中,袁由光.基于操作系统调用的容错计算机系统同步技术研究[J].计算机研究与发展,2006,43(11):1985-1992. 被引量：3
8BHAGWAN R,TATI K.Total recall:System support for automated availability management[C]∥NSDI.2004:337-350.
9Parakh A,Kak S.Space efficient secret sharing for implicit data security[J].Information Science s,2011,181(2):335-341.
10KALA K A, CHITHARANJAN K. Locality sensitive hashing based incremental clustering for creating affinity groups in Ha- doop- HDFS: An infrastructure extension [C]//2013 Interna- tional Conference on Circuits, Power and Computing Technolo- gies (ICCPCT). [S.I.I: IEEE, 2013: 1243-1249.

引证文献15

1陈祖琴,蒋勋,苏新宁.图书馆视角下的大数据资源共建共享[J].情报杂志,2015,34(4):165-168. 被引量：16
2蔺旭东,张孟强,陈婧,刘佳.大数据技术在生态环境保护中的应用研究[J].山东工业技术,2015(24):217-217. 被引量：15
3苗丽,彭月英.云计算环境中静态数据可信存储技术的测试研究[J].广西民族大学学报（自然科学版）,2015,21(4):67-70. 被引量：1
4邵彧.大数据云存储中的并行优化处理方法仿真[J].计算机仿真,2016,33(4):395-398. 被引量：8
5张少辉,张中军,于来行.异构Hadoop集群下自适应平衡数据存储的大数据放置策略[J].现代电子技术,2016,39(10):49-53. 被引量：3
6任柯.大数据云存储的技术优化的仿真分析[J].计算机仿真,2016,33(5):385-388. 被引量：5
7樊红珍.蚁群算法在数据库存储过程中的应用[J].电脑知识与技术,2017,13(3):6-7. 被引量：1
8杨海峰,柴霖,胡建平.基于Nand Flash的星载综合数据固态记录系统[J].电讯技术,2017,57(6):716-723. 被引量：4
9蔡玺,郭行,张智利,魏军,吴天宇.大数据信息安全的三维存储加密方法[J].电子技术与软件工程,2017(15):215-216. 被引量：5
10谢建洲.计算机系统容错技术研究[J].电脑知识与技术,2016,12(2X):250-252. 被引量：4

二级引证文献67

1孙小平.互联网+环境下民办高校图书馆馆藏建设探析[J].科技情报开发与经济,2015,28(18):77-79. 被引量：7
2党蕾.地方社科院数字化图书馆资源服务平台构建[J].今传媒,2015,23(11):103-104.
3田湘波,唐红玉.大数据背景下的廉洁政治生态建设[J].河南社会科学,2015,23(12):6-11. 被引量：7
4聂英,杨秀敏.桂中地区高校图书馆数字资源共建共享机制研究[J].广西科技师范学院学报,2016,31(2):68-71. 被引量：1
5王威,朱京海.大数据时代下辽宁环保的思考[J].环境保护与循环经济,2016,36(2):69-72. 被引量：1
6张馨文.高校图书馆信息资源共建共享的实现[J].电子世界,2016,0(18):29-29.
7李成.大数据时代高校图书馆数字资源建设研究[J].新课程研究（中旬）,2016,0(10):130-131. 被引量：3
8郑凌.依托大数据服务平台构建大数据生态[J].福建建材,2016(11):116-117.
9张霞.大数据场景下的云存储技术与应用[J].电子技术与软件工程,2017(3):173-173. 被引量：6
10李祯.大数据时代高校图书馆信息资源建设对策研究[J].大学图书情报学刊,2017,35(1):36-40. 被引量：5

1邹立达,刘方爱,马艳.基于访问量预测的教育资源网格副本放置策略[J].计算机工程与应用,2009,45(13):103-106.
2赵俊,金海.自适应的集群流媒体文件副本放置策略[J].计算机应用研究,2008,25(2):594-596. 被引量：1
3郑志刚.虚拟盘副本容错技术在云计算平台移动船舶存储网络中的应用[J].舰船科学技术,2016,38(9X):115-117.
4罗军,陈仕强.基于支持向量机的HDFS副本放置改进策略[J].计算机工程,2015,41(11):114-119. 被引量：8
5孙静,杨文国,安然,高随祥.内容分发网络中带容量和能力约束的副本放置问题研究[J].网络新媒体技术,2012,1(3):8-13.
6邢长明,杨林,刘方爱.基于教育资源网格的副本放置策略[J].计算机工程,2008,34(6):121-123. 被引量：6
7邵秀丽,王亚光,李云龙,刘一伟.Hadoop副本放置策略[J].智能系统学报,2013,8(6):489-496. 被引量：7
8蔡燕冬,刘艳,张庆磊.一种优化的Hadoop副本放置策略[J].微型机与应用,2015,34(16):21-23.
9姜浩然,刘方爱,郭磊.教育资源网格中基于节点负载的副本放置策略[J].济南大学学报（自然科学版）,2011,25(4):377-382.
10罗浩宇,陈旺虎.基于社会网络特征的云服务副本放置策略[J].计算机应用,2013,33(8):2143-2146. 被引量：3

南京邮电大学学报（自然科学版）

2014年第4期

浏览历史

内容加载中请稍等...

大数据存储中的容错关键技术综述被引量：15

参考文献33

二级参考文献151

共引文献580

同被引文献94

引证文献15

二级引证文献67

相关作者

相关机构

相关主题

浏览历史

大数据存储中的容错关键技术综述 被引量：15

参考文献33

二级参考文献151

共引文献580

同被引文献94

引证文献15

二级引证文献67

相关作者

相关机构

相关主题

浏览历史

大数据存储中的容错关键技术综述被引量：15