题名 基于GM模型的HDFS副本放置改进策略
1
作者
刘芳
刘艳
马萌
曹清清
吴亚玲
机构
湖南开放大学信息工程学院
出处
《数字通信世界》
2023年第5期70-73,共4页
基金
湖南开放大学“HDFS默认副本放置策略的改进和优化”课题研究成果(课题编号:XDK-2022-C-5)。
文摘
HDFS分布式文件系统默认副本放置策略在放置节点的选择上具有较大的随机性,且衡量节点负载的指标单一,易导致集群负载不均衡,影响系统性能。文章提出一种基于GM模型的改进策略,该策略综合考虑节点多个负载指标,并使用GM模型对节点量化负载进行预测,同时结合节点的HDFS工作连接数,对节点性能进行综合评价,选出最合适的副本放置节点。实验表明,与HDFS默认策略相比,文中所提策略能够减少作业执行时间和数据传输时间,在系统的执行效率和读写性能方面有较大提高。
关键词
HDFS
副本放置
负载量化
负载预测
Keywords
HDFS
copy placement
load quantification
load prediction
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
题名 Hadoop副本放置策略
被引量:7
2
作者
邵秀丽
王亚光
李云龙
刘一伟
机构
南开大学信息技术科学学院
北京大学数学科学学院
出处
《智能系统学报》
CSCD
北大核心
2013年第6期489-496,共8页
基金
天津市滨海新区科技项目资助项目(12ZCDZGX46700
13ZCZDGX02500)
文摘
分布式文件系统(Hdfs)采用随机的副本放置策略使得系统在运行一段时间后会出现数据分布不均衡的情况,从而降低数据的可靠性和读取速率.为解决Hdfs默认副本放置策略存在的问题,对Hdfs副本放置策略进行改进:在副本放置选择时优先考虑存储使用率低的节点.模拟实验一测试了机架数目对于算法的影响,结果显示改进后的副本放置策略中,机架数目对集群的均衡性影响很小,显示出较好的均衡性.模拟实验二测试了随着写入数据的增加,比较了使用改进前后的副本放置策略集群中节点使用率的标准差,证实了改进后的副本放置策略在存储均衡方面较原放置策略有着更好的表现.
关键词
云存储
HDFS
副本放置
存储均衡
存储节点
Keywords
cloud storage
Hdfs
replica placement
storage equilibrium
'storage node
分类号
TP333
[自动化与计算机技术—计算机系统结构]
题名 基于教育资源网格的副本放置策略
被引量:6
3
作者
邢长明
杨林
刘方爱
机构
山东师范大学信息科学与工程学院
出处
《计算机工程》
CAS
CSCD
北大核心
2008年第6期121-123,126,共4页
基金
国家自然科学基金资助项目(60373063
90612003)
文摘
副本机制是提高网格性能,降低客户端延迟的有效手段,副本放置策略是副本机制的关键问题。该文介绍了教育资源网格的体系结构,针对教育资源网格特殊的体系结构,提出了3种动态副本放置策略,并从不同的角度对它们进行了优化,在保持副本存储空间占用的前提下,降低了客户端延迟。实验表明了策略的有效性。
关键词
网格
副本
副本放置
教育资源
Keywords
grid
replica
replica placement
education resource
分类号
TP393
[自动化与计算机技术—计算机应用技术]
题名 数据网格中QoS感知的副本放置方法
被引量:3
4
作者
付雄
王义波
朱鑫鑫
韩京宇
机构
南京邮电大学计算机学院
出处
《系统工程与电子技术》
EI
CSCD
北大核心
2014年第4期784-788,共5页
基金
国家自然科学基金(61202354)
国家高技术研究发展计划(863计划)(2007AA01Z404)
江苏省科技支撑计划(工业)项目(BE2011189)资助课题
文摘
数据复制技术广泛用于数据网格,如何合理地放置复制时产生的数据副本来更有效地提高数据访问性能成为一个值得研究的重要问题。本文针对无向连通图表示的数据网格模型,提出了一种满足各用户服务质量(quality of service,QoS)需求的副本放置算法(replica placement algorithm,RPA),通过该QoS感知的副本放置算法能够获得k个副本放置位置,并且使得整个数据网格系统的通信代价最小。最后,文章通过相应的仿真实验证明了该算法的可靠性和有效性。
关键词
数据网格
副本放置
QOS感知
动态规划
Keywords
data grid
replica placement
QoS aware
dynamic programming
分类号
TP393
[自动化与计算机技术—计算机应用技术]
题名 面向MANET环境的动态自适应副本放置算法研究
被引量:4
5
作者
郑静
卢锡城
王意洁
杨侃
机构
国防科技大学计算机学院
出处
《通信学报》
EI
CSCD
北大核心
2004年第8期1-8,共8页
基金
国家自然科学基金资助项目(69933030)
全国优秀博士学位论文作者专项资金项目(200141)
文摘
移动自组网环境给数据复制技术带来了新的挑战。本文提出了一种分布式动态自适应副本放置算法,算法以数据访问的通信开销作为目标函数,每个副本节点从其邻居节点收集读写请求的局部信息,动态地调整副本放置方案以适应访问请求和网络拓扑的变化。本文还提出了基于稳定邻居的副本放置算法以减小由于节点移动给副本放置带来的振荡。模拟实验表明,在移动自组网环境中,本文提出的算法有效地减少了数据访问的通信开销,提高了数据访问的效率。
关键词
移动自组网
副本放置
读/写模式
稳定邻居
Keywords
MANET
replica allocation
read-write pattern
stable neighbor
分类号
TP393
[自动化与计算机技术—计算机应用技术]
题名 分布式媒体服务系统中的副本放置算法
被引量:5
6
作者
李挺屹
王劲林
王玲芳
机构
中国科学院声学研究所国家网络新媒体工程技术研究中心
中国科学院研究生院
出处
《计算机工程》
CAS
CSCD
北大核心
2010年第2期9-12,共4页
基金
国家"863"计划基金资助项目(2008AA01Z147
2008AA01A317)
中国科学院知识创新工程青年人才领域前沿基金资助项目
文摘
针对分布式媒体服务系统中的副本放置问题,从优化节点间的传输代价出发,提出一种基于全局信息的启发式副本放置算法——Zero2min,与现有算法相比,节省传输代价10%~36%。根据Zero2min算法的思路,给出媒体内容逐渐增加情况下的一种动态放置方法,仿真结果表明,其代价小于Max2min。
关键词
副本放置
分布式媒体系统
启发式算法
Keywords
replica placement
distributed media system
heuristic algorithm
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
题名 基于支持向量机的HDFS副本放置改进策略
被引量:8
7
作者
罗军
陈仕强
机构
重庆大学计算机学院
出处
《计算机工程》
CAS
CSCD
北大核心
2015年第11期114-119,共6页
文摘
为实现超大规模数据的存储并提高容错性,Hadoop分布式文件系统(HDFS)采用一种机架感知的多副本放置策略。但在放置过程中没有综合考虑各节点服务器的差异性,导致集群出现负载失衡。由于放置时采用随机方式,造成节点之间的网络距离过长,使得传输数据会消耗大量时间。针对以上问题,提出一种基于SVM的副本放置策略。通过综合考虑节点负载情况、节点硬件性能、节点网络距离为副本找到最佳的放置节点。实验结果表明,与HDFS原有的副本放置策略相比,该策略能更有效地实现负载均衡。
关键词
支持向量机
云存储
副本放置 策略
分布式文件系统
负载均衡
机架感知
Keywords
Support Vector Machine (SVM)
cloud storage
replica placement policy
Distributed File System ( DFS )
load balancing
rack awareness
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
题名 一种基于认知的动态副本放置方法
被引量:4
8
作者
韩国栋
朱一戈
张帆
机构
国家数字交换系统工程技术研究中心
出处
《计算机应用与软件》
CSCD
北大核心
2013年第1期83-87,共5页
基金
国家高技术研究发展计划项目(2009AA012201)
文摘
针对内容分发网中数据传输开销巨大的问题,提出一种基于认知的副本放置方法。通过对代理服务器反馈的用户需求动态信息,对内容流行度建立基于认知的预测模型,依据此模型启发式地完成内容的分发和放置。仿真结果表明,该方法能明显降低内容分发网络的传输开销,同时满足时变用户的动态需求,具有低时延、低开销等优点。与一般的算法相比,该方法能显著提高缓存命中率和降低用户请求的平均响应时延。
关键词
内容分发网
认知
内容流行度
预测模型
副本放置
Keywords
Content distribution networks Cognition Contents popularity Predictive model Replica placement
分类号
TP393
[自动化与计算机技术—计算机应用技术]
题名 云存储环境下QoS感知的副本放置算法
被引量:3
9
作者
张鸿
刘漳辉
林兵
机构
福州大学数学与计算机科学学院
福建省网络计算与智能信息处理重点实验室
出处
《小型微型计算机系统》
CSCD
北大核心
2016年第9期1915-1919,共5页
基金
国家自然科学基金项目(61103175)资助
福建省高校杰出青年科学基金项目(JA12016)资助
+2 种基金
福建省新世纪优秀人才支持计划项目(JA13021)资助
福建省杰出青年科学基金项目(2014J06017)资助
福建省自然科学基金项目(2014J01231)资助
文摘
云计算作为一种新的商业计算模型,提供了弹性计算和存储资源等服务.云计算具有超大规模、高可扩展性、高可靠性、虚拟化、按需服务和价格低廉等特点,许多用户把应用提交到云环境下运行.随着越来越多的数据密集型应用部署到云计算环境上运行,应用会有不同的QoS要求.为了保证在放置应用数据副本时,数据副本都能满足应用的QoS要求,我们需要考虑云计算环境下QoS约束的应用数据副本放置问题,为此提出一种QoS感知的副本放置算法(QoS-Aware Replica Placement with PSO,QRPPSO),该算法首先对QoS约束集的属性进行量化,然后构建目标优化模型,最后在副本放置优化算法引入粒子群优化来决定副本放置位置.仿真实验结果表明所提策略能有效解决QoS约束的应用数据副本放置问题.
关键词
副本放置
QOS约束
粒子群算法
云计算
Keywords
replica placement
QoS constraint
particle swarm optimization algorithm
cloud computing
分类号
TP301
[自动化与计算机技术—计算机系统结构]
题名 数据网格中一种启发式副本放置算法
被引量:2
10
作者
付雄
王汝传
邓松
机构
南京邮电大学计算机学院
出处
《系统工程与电子技术》
EI
CSCD
北大核心
2010年第7期1513-1516,共4页
基金
国家自然科学基金(60573141
60773041)
+6 种基金
江苏省自然科学基金(BK2008451)
国家高科技研究发展计划(863计划)基金(2007AA01Z404
2007AA01Z478)
中国博士后科学基金(20100471353)
江苏省博士后基金(0801019C)
江苏省六大高峰人才基金(2008118)
南京邮电大学人才引进基金(NY207135)资助课题
文摘
副本技术广泛用于数据网格中来减少数据访问代价,增强容错能力,从而提高数据网格中数据访问的性能和可靠性。如何合理地放置副本来更有效地提高数据访问性能成为一个需要解决的重要问题。针对无向连通图表示的数据网格模型,在考虑通信代价和存储代价的基础上,提出了一种启发式副本放置算法(heuristicreplica placement algorithm,HRPA),通过该算法能够得到k个副本的放置位置,并且使得整个系统的代价最小。最后,通过相应的仿真实验证明了该算法的可行性和有效性。
关键词
分布式系统
数据网格
副本放置
启发式算法
Keywords
distributed systems
data grid
replica placement
heuristic algorithm
分类号
TP301
[自动化与计算机技术—计算机系统结构]
题名 VCG机制在P2P存储系统副本放置中的应用
被引量:3
11
作者
宋玮
赵跃龙
机构
广东工业大学计算机学院
华南理工大学计算机科学与工程学院
出处
《计算机应用》
CSCD
北大核心
2010年第4期860-864,共5页
基金
教育部博士点基金资助项目(200805610019)
广东工业大学校青年基金资助项目(082018)
文摘
在点对点(P2P)存储系统副本放置简化模型下引入维克瑞—克拉克—格罗夫斯机制(VCG),建立副本放置模型到VCG机制的映射,设计适当的支付函数以达到副本预放置节点的激励相容,并分析占优战略均衡的存在性,证明了该均衡在多项式时间内可达到均衡。仿真实验表明该机制能达到预放置节点的激励相容。
关键词
点对点存储系统
维克瑞—克拉克—格罗夫斯机制
副本放置 机制
激励相容
占优战略均衡
Keywords
P2P storage system
Vickrey-Clarke-Groves(VCG)mechanism
replica placement
incentive compatible mechanism
dominant strategy equilibrium
分类号
TP393
[自动化与计算机技术—计算机应用技术]
题名 云存储中动态副本放置机制研究
被引量:4
12
作者
王岩
汪晋宽
机构
东北大学信息科学与技术学院
出处
《计算机工程与科学》
CSCD
北大核心
2017年第9期1581-1587,共7页
基金
国家自然科学基金(61374097)
文摘
数据副本管理是云计算系统管理的重要组成部分,在云计算系统的海量数据处理过程中,针对目前已知的数据存放与资源调度算法存在考虑副本动态性和可靠性的不足,提出了一种动态的副本放置机制。该机制基于区域结构,考虑数据处理时其副本的数量和放置位置,以及副本的产生对于内存和带宽等系统资源的开销:首先根据云存储中的副本信息,对被访问频率高且访问平均响应时间长的数据信息进行复制,并给出副本数量的计算方法;考虑缩小副本分布的节点选择范围,提出动态的副本放置算法——DRA,将一定范围内的节点根据提出的域的划分,进行放置筛选,以存放数据副本。实验结果表明,提出的动态放置机制不仅减少了低访问率副本对系统存储空间的浪费;同时也减少了高访问率副本所需跨节点的传输延迟,有效提高了云存储系统中的数据文件的访问效率、负载的均衡水平,以及云存储系统的可靠性和可用性。
关键词
云存储
副本
副本放置
Keywords
cloud storage
replica
replica placement
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 树型数据网格环境下副本放置算法研究
被引量:2
13
作者
付雄
王汝传
机构
南京邮电大学计算机学院
出处
《南京邮电大学学报(自然科学版)》
2011年第3期72-78,共7页
基金
国家自然科学基金(60973139
61003236)
+8 种基金
江苏省科技支撑计划(工业)(BE2010197
BE2010198)
高校科研成果产业化推进工程(JH10-14)
中国博士后科学基金(20100471353)
江苏省博士后科研资助计划(1001006B)
江苏高校科技创新计划(CX10B-196Z
CX10B-197Z)
江苏省六大人才高峰(2008118)
教育部高等学校博士学科点专项科研基金(20103223120007)资助项目
文摘
副本广泛地用于数据网格环境下以减少数据访问代价,降低网络带宽需求,增强容错能力等,但是副本数目受到节点存储能力等因素的限制,副本放置成为副本管理中一个值得研究的问题。文中针对网络带宽受到限制的树型数据网格,在考虑负载均衡的基础上,提出了一种利用动态规划方法求解最优最小可行副本集,然后在此基础上利用折半查找进行k个副本放置的算法,其时间复杂度小于O(n2logn)。仿真实验结果表明,这种副本放置算法能够获得较好的负载均衡,有效地提高数据访问性能。
关键词
数据网格
副本放置
动态规划
Keywords
data grid
replica placement
dynamic programming
分类号
TP393.028
[自动化与计算机技术—计算机应用技术]
题名 一种基于时移电视系统的副本放置策略
被引量:2
14
作者
韩国栋
朱一戈
机构
国家数字交换系统工程技术研究中心
出处
《电子技术应用》
北大核心
2012年第7期116-119,共4页
基金
国家863高技术研究发展计划(2009AA012201)
文摘
针对时移电视系统中的副本放置问题,通过将流式传输的数据片副本有计划地放置在路由节点缓存空间内,以提高用户体验度,减少初始化时延和频道切换响应时延。研究了副本放置问题中的负载均衡和响应时延最小化等问题,总结了节点连接度与副本放置之间的关系,在分析网络电视数据特点的基础上,提出一种混合副本放置策略。仿真结果表明,该策略能够有效提高查询消息搜索成功率,且占用缓存空间较小。
关键词
时移网络电视
流式传输
初始化时延
频道切换响应时延
副本放置
Keywords
time-shifted IPTV
streaming
startup delay
channel zapping delay
replica placement
分类号
TP393
[自动化与计算机技术—计算机应用技术]
题名 一种数据流处理环境下的节点副本放置方法
被引量:1
15
作者
丁维龙
韩燕波
机构
北方工业大学云计算研究中心
出处
《电子与信息学报》
EI
CSCD
北大核心
2014年第7期1755-1761,共7页
基金
北京市属高等学校创新团队建设与教师职业发展计划(IDHT2013 0502)
北京市教育委员会科技计划重点项目(KZ201310009009)
北京市教育委员会科技计划面上项目(KM201310009003)资助课题
文摘
物联网环境下的许多应用表现为传感数据的连续流式处理,且系统往往通过节点的副本技术保障可用性。但是,运行时副本的备份和放置存在内存和带宽等资源开销,产生处理的延迟。该文给出一种方法,根据运行时的资源消耗以贪心方式放置节点的副本,折中了系统的可用性和开销。实际系统的仿真实验表明,在相同的条件下,该方法相比传统的随机放置,能为系统提供更稳定的可用性。
关键词
物联网
数据流
可用性保障
副本放置
贪心算法
Keywords
Internet of Things (IoT)
Data stream
Availability guarantee
Replica placement
Greedy algorithm
分类号
TP301
[自动化与计算机技术—计算机系统结构]
题名 树形数据网格中实现副本放置的一种优化算法
被引量:1
16
作者
周飞菲
机构
郑州升达经贸管理学院信息工程学院
出处
《电子测量与仪器学报》
CSCD
北大核心
2019年第2期195-202,共8页
基金
2018年度河南省科技攻关重点研发与推广项目(182102210139)资助
文摘
针对树形数据网格这种分布式分层数据网格模型,提出了一种最佳副本放置算法,其中的副本数量k可以由用户指定。算法实现由2个阶段构成.在阶段1,对二叉树的全部节点以反向广度优先顺序被访问,且基于对象i的一个副本是否被放置在一个节点上,以自底向上的方式计算出包含读取成本和存储成本的总复制成本;在阶段2,基于一个递归过程,把由在阶段1计算得到的读取成本和存储成本作为输入,采取自上而下的过程放置副本,以使总复制成本最小化。理论分析和仿真实验结果表明,最佳副本放置算法不仅有较低的时间复杂度,而且在归一化放置成本、有效网络利用和本地访问百分比性能指标方面都优于目前几种典型的副本放置算法。
关键词
树形数据网格
副本放置
复制成本
成本最小化
有效网络利用
Keywords
tree data grid
replica placement
replication cost
cost minimization
effective network usage
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
题名 一种改进的HDFS副本放置策略
被引量:2
17
作者
陈伟
机构
宿州职业技术学院计算机系
出处
《长春师范大学学报》
2018年第4期15-20,共6页
基金
安徽省高校自然科学研究重点项目"基于云平台的职业教育资源管理研究"(KJ2016A778)
安徽省高校优秀青年人才支持计划重点项目(gxyq ZD2016586)
+1 种基金
安徽省高校自然科学研究重点项目"智能算法在群体动画制作中的应用与创新研究"(KJ2016A781)
安徽省质量工程项目"基于Blackboard的高职程序设计类课程翻转课堂教学模式研究--以ASP.NET课程为例"(2016jyxm1039)
文摘
在HDFS默认放置策略中,放置副本时未考虑节点实时负载,易导致集群系统负载不均衡。由于放置副本采用随机方式,易造成存放副本节点网络距离过大,影响系统的数据传输性能。针对以上问题,本文提出一种改进的副本放置策略,该策略综合考虑节点CPU使用率、内存使用率、带宽使用率等负载指标,结合节点网络距离,对节点进行综合性能评价,最终寻找最佳副本存放节点。实验表明,与默认副本放置策略相比,该策略可提高集群数据传输效率,在负载均衡方面也有一定的改善。
关键词
HDFS
副本放置
实时负载
负载均衡
Keywords
HDFS
replica placement
real-time load
load balancing
分类号
TP393
[自动化与计算机技术—计算机应用技术]
题名 基于访问量预测的教育资源网格副本放置策略
18
作者
邹立达
刘方爱
马艳
机构
山东师范大学信息科学与工程学院
出处
《计算机工程与应用》
CSCD
北大核心
2009年第13期103-106,135,共5页
基金
国家自然科学基金No.90612003
山东省科技攻关计划No.2006GGB01101~~
文摘
副本放置策略是数据网格副本机制的关键问题。针对教育资源网格环境,提出了基于访问量预测的副本放置策略(FATBRS),并介绍了基于历史数据的访问量预测(FATTHD)和基于人工神经网络的访问量预测(FATANN)两种访问量预测方法。FATBRS策略有效降低了用户的访问延迟,仿真实验证实了该策略性能的优越性。
关键词
副本放置
教育资源网格
访问量
人工神经网络
Keywords
replica allocation
education resource grid
access traffic
artificial neural networks
分类号
TP393.01
[自动化与计算机技术—计算机应用技术]
题名 非服从性分布式系统中博弈分析法下的副本放置问题
19
作者
宋玮
凌捷
机构
广东工业大学计算机学院
出处
《桂林理工大学学报》
CAS
北大核心
2013年第1期164-173,共10页
基金
国家科技支撑计划项目(2012BAH27F05)
广东省自然科学基金博士启动项目(S2012040007439)
+3 种基金
广东省教育部产学研合作项目(2011A090200068)
广东省现代信息服务业发展专项基金项目(110394)
广东工业大学校青年基金(082018)
广东工业大学校博士启动基金(103052)
文摘
为解决非服从性分布式系统中多数据、多节点、有容量限制的副本放置问题,建立了副本放置模型以及向博弈模型的映射,分析了在无容量限制及有容量限制下纳什均衡的存在性问题以及纳什均衡的优化程度。考虑到纳什均衡获取的时间不可行,提出了无删除副本放置局面的定义,设计了该局面的获取算法并分析算法的相关性质。模拟实验显示了无删除副本放置局面获取算法下系统平均副本数和总代价随节点的容量及放置代价变化的过程,同时在小节点规模下与最优副本放置结果进行比较,结果显示纳什均衡带来的系统总代价不会与最优系统总代价有大的差别,说明在保证个体利益最大化时,全局的效益并不会有大的损害。
关键词
非服从性分布式系统
博弈理论
无删除副本放置
纳什均衡
Keywords
non-obedient distributed system
game theory
replica placement without deletion
Nash equilibrium
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
题名 内容分发网络中带容量和能力约束的副本放置问题研究
20
作者
孙静
杨文国
安然
高随祥
机构
中国科学院研究生院数学科学学院
上海文广互动电视有限公司
出处
《网络新媒体技术》
2012年第3期8-13,共6页
基金
国家高技术研究发展计划(863)资助课题(NO:2008AA01A317)
下一代网络与业务国家试验床(上海)研究与应用项目-互动高清电视研制和应用示范(NO:08DZ1500108)
+3 种基金
国家自然科学基金(NO:71171189
NO:10831006
NO:10671024)
中国科学院知识创新项目(No.kjcx-yw-s7)的资助
文摘
副本放置问题是内容分发网络中的一项关键技术,已有的副本放置模型未考虑服务器的负载能力,本文研究考虑了基于内容分发网络服务器存储容量约束与服务能力约束的副本放置问题,建立了双约束的副本放置模型,设计了贪婪算法,把两阶段的模型求解转化成求解一系列的单服务器节点的最小费用流模型,获得了副本放置策略和用户请求重定向策略,并分析了算法的复杂性。
关键词
内容分发网络
副本放置
贪婪算法
Keywords
Content Distribution Network
Greedy Algorithm
Replica Placement
分类号
TP393.09
[自动化与计算机技术—计算机应用技术]