Hadoop云存储策略的研究与优化被引量：1

Research and Optimization of the Hadoop Cloud Storage Strategy

下载PDF

导出

摘要分布式文件系统(HDFS)是海量数据的主要存储方式。HDFS默认的存储策略中,采用固定的数据副本个数以及随机选择远端节点的策略来保证数据的本地性和安全性,但当系统发生故障需要进行数据恢复时,默认策略将会造成系统时间的损失和节点存储负载的不均衡。提出一种改进的HDFS存储策略,根据节点的失效率以及期望的数据可用性建立一种概率模型,通过模型来优化数据副本个数,并根据节点的评价系数来选择远端节点进行副本存储。实验结果表明该策略针对海量数据时提高系统的存储性能。 HDFS is the main storage method of massive data. In the default storage strategy, HDFS uses fixed data replica and randomly chooses remote node to ensure data locality and security. However, when system needs data recovery because of system fault, random strategy will cause loss of system time and imbalance of node storage load. In this case, puts forward an improved HDFS storage strategy to generate a probability model based on node failure rate and expected data availability. It can optimize the number of data replica by the model and select remote node as copy storage according to its evaluation coefficient. The experiment result shows the strategy can improve system performance aiming at massive data.

作者林穗朱岩杨有科

机构地区广东工业大学计算机学院广东讯飞启明科技发展有限公司

出处《现代计算机（中旬刊）》 2016年第1期33-37,共5页 Modern Computer

基金广州市科技项目(No.2014XYD-007)

关键词分布式文件系统存储策略数据副本评价系数 HDFS Storage Strategy Data Copy Eva]uation Coefficient

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献7

1李乔,郑啸.云计算研究现状综述[J].计算机科学,2011,38(4):32-37. 被引量：434
2TomWbite.Hadoop权威指南[M].北京:清华大学出版社,2011.
3张兴旺,李晨晖,秦晓珠.构建于廉价计算机集群上的云存储的研究与初步实现[J].情报杂志,2011,30(11):166-171. 被引量：28
4秦秀磊,张文博,魏峻,王伟,钟华,黄涛.云计算环境下分布式缓存技术的现状与挑战[J].软件学报,2013,24(1):50-66. 被引量：75
5王意洁,孙伟东,周松,裴晓强,李小勇.云计算环境下的分布存储关键技术[J].软件学报,2012,23(4):962-986. 被引量：279
6Dhruba Borthakur, Jonathan Gray, Joydeep Sen Sarma, et al. Apache Hadoop Goes Realtime at Facebook[C]. Proceedings of the 2011 International Conference on Manazement of data. 2011 : 1071-1080.
7冯登国,张敏,张妍,徐震.云计算安全研究[J].软件学报,2011,22(1):71-83. 被引量：1072

二级参考文献154

1陆蕊,魏振钢,林欣,徐伶伶,郭曙超.SAN和NAS融合构架数字档案馆信息存储管理平台[J].计算机应用,2006,26(B06):219-220. 被引量：6
2刘玉照,刘建准,岳修志.基于SAN与NAS混合模式的数字图书馆网络存储系统研究[J].图书馆工作与研究,2006(5):18-21. 被引量：11
3罗武庭.DJ—2可变矩形电子束曝光机的DMA驱动程序[J].LSI制造与测试,1989,10(4):20-26. 被引量：373
4Organization for the Advancement of Structured Information Standards (OASIS) http://www.oasis-open.org/.
5Distributed Management Task Force (DMTF) http://www.dmtf.org/home.
6Cloud Security Alliance http://www.cloudsecurityalliance.org.
7Crampton J, Martin K, Wild P. On key assignment for hierarchical access control. In: Guttan J, ed, Proc. of the 19th IEEE Computer Security Foundations Workshop--CSFW 2006. Venice: IEEE Computer Society Press, 2006. 5-7.
8Damiani E, De S, Vimercati C, Foresti S, Jajodia S, Paraboschi S, Samarati P. An experimental evaluation of multi-key strategies for data outsourcing. In: Venter HS, Eloff MM, Labuschagne L, Eloff JHP, Solms RV, eds. New Approaches for Security, Privacy and Trust in Complex Environments, Proc. of the IFIP TC-11 22nd Int'l Information Security Conf. Sandton: Springer-Verlag, 2007. 395-396.
9Bethencourt J, Sahai A, Waters B. Ciphertext-Policy attribute-based encryption. In: Shands D, ed. Proc. of the 2007 IEEE Symp. on Security and Privacy. Oakland: IEEE Computer Society, 2007. 321-334. [doi: 10.1109/SP.2007.11].
10Yu S, Ren K, Lou W, Li J. Defending against key abuse attacks in KP-ABE enabled broadcast systems. In: Bao F, ed. Proc. of the 5th Int'l Conf. on Security and Privacy in Communication Networks. Singapore: Springer-Verlag, http://www.linkpdf.com/ ebook-viewer.php?url=http://www.ualr.edu/sxyul/file/SecureCommO9_AFKP_ABE.pdf.

共引文献1825

1罗杨,沈晴霓,吴中海.一种基于元模型的访问控制策略描述语言[J].软件学报,2020,31(2):439-454. 被引量：5
2敖日格乐.关于云存储的关键技术分析[J].计算机产品与流通,2020,0(1):163-163. 被引量：1
3温海滨,裴卓雄.信息系统运维管理的安全风险分析[J].电子技术（上海）,2021,50(10):202-203. 被引量：6
4林新平.云计算中的网络信息安全技术应用[J].电子技术（上海）,2020(7):86-87.
5谢丽霞,汪子荧.一种在线集群异常作业预测方法[J].北京邮电大学学报,2019,42(5):62-68.
6宋东翔,马伽洛伦,王怡然,袁铭举.基于云原生和区块链的高校智能人事系统的研究[J].新一代信息技术,2022,5(6):67-70.
7陈龙,李俊中.支持不同粒度运算的远程数据完整性验证[J].吉林大学学报（工学版）,2012,42(S1):295-299. 被引量：2
8聂雄丁,韩德志,毕坤.云计算数据安全[J].吉林大学学报（工学版）,2012,42(S1):332-336. 被引量：7
9毕坤,韩德志.一种基于攻击图的云租户系统安全检测方法[J].华中科技大学学报（自然科学版）,2012,40(S1):30-33. 被引量：2
10王怀习,陈建熊,王晨,刘克胜.云计算中虚拟化技术的安全威胁[J].华中科技大学学报（自然科学版）,2012,40(S1):153-156. 被引量：10

同被引文献4

1饶磊,杨凡德,李新明,刘东.基于热度分析的动态副本创建算法[J].计算机应用,2014,34(A02):130-134. 被引量：5
2张松,杜庆伟,孙静,孙振.基于预测的云计算热点数据副本因子决策算法[J].计算机与现代化,2015,0(2):62-66. 被引量：6
3李功丽,赵晓焱,刘慧.一种云计算数据副本动态管理策略[J].河南师范大学学报（自然科学版）,2015,43(4):138-143. 被引量：6
4邓见光,赵跃龙,袁华强.云计算环境下的动态数据副本管理策略[J].华中科技大学学报（自然科学版）,2015,43(10):53-57. 被引量：3

引证文献1

1宗平,梁胜昔.HDFS动态副本因子的优化研究[J].计算机技术与发展,2018,28(7):68-72. 被引量：2

二级引证文献2

1刘苏英.分布式文件存储系统在电子通信大数据存储中的应用[J].九江学院学报（自然科学版）,2021,36(2):78-80. 被引量：3
2王彪,王克俭,何振学,高万豪,魏雪川.基于布谷鸟搜索优化马尔可夫的文件热度预测[J].计算机工程与设计,2021,42(11):3121-3127.

1曹旭,张云华.Hadoop平台下计算模型中调度策略的研究[J].计算机应用与软件,2013,30(9):208-210. 被引量：5
2严云洋,郭志波,杨静宇.基于特征空间划分的AdaBoost人脸检测算法[J].小型微型计算机系统,2007,28(11):2106-2109. 被引量：13
3许建潮,王红梅.改进的协同过滤算法[J].吉林大学学报（信息科学版）,2008,26(1):99-105. 被引量：7
4余小游,曹守富,陈铁军.基于Rough-Vague集与证据理论的态势估计方法[J].计算机工程与应用,2016,52(10):50-54. 被引量：3
5崔一博,谭啸宇,崔鹏,孙立峰,杨士强.视频监控中基于行人跟踪的摄像机自动标定[J].清华大学学报（自然科学版）,2009(4):586-589. 被引量：1
6陈若飞,姜文红.Hadoop作业调度本地性的研究与优化[J].软件,2015,36(2):64-68. 被引量：5
7张学武,朱小艳,石爱业,林善明,范新南.基于客观评价系数的迭代图像融合方法[J].仪器仪表学报,2010,31(9):2028-2035. 被引量：3
8陆牧,高扬,朱明.动基座下的运动目标检测[J].光学精密工程,2016,24(7):1782-1788. 被引量：2
9孙瑞琦,杨杰,高瞻,贺志强.一种提高虚拟化Hadoop系统数据本地性的资源调度方法[J].计算机研究与发展,2014,51(S2):189-198. 被引量：5
10徐群岭.IP多媒体子系统脆弱性评价技术研究[J].计算机工程与应用,2009,45(18):89-90.

现代计算机（中旬刊）

2016年第1期

浏览历史

内容加载中请稍等...

Hadoop云存储策略的研究与优化被引量：1

参考文献7

二级参考文献154

共引文献1825

同被引文献4

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

Hadoop云存储策略的研究与优化 被引量：1

参考文献7

二级参考文献154

共引文献1825

同被引文献4

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

Hadoop云存储策略的研究与优化被引量：1