-
题名基于磁盘I/O性能的Hadoop任务选择策略
被引量:4
- 1
-
-
作者
李强
孙震宇
雷晓凤
孙功星
-
机构
中国科学院高能物理研究所
中国科学院大学
-
出处
《计算机工程》
CAS
CSCD
北大核心
2016年第11期76-82,共7页
-
基金
国家自然科学基金(11375223
11375221)
国家自然科学基金委员会-中国科学院大科学装置联合基金(11179020)
-
文摘
最大化利用本地磁盘的I/O资源是提升计算集群性能的关键,但Hadoop系统中多数调度算法未考虑此项因素。为此,引入磁盘负载作为Map任务选择的权衡参数,任务调度时参照磁盘负载程度选择合适的任务,以保证数据节点上各磁盘的负载相对均衡,并据此设计新的任务选择模块集成到Hadoop的调度器中。同时为进一步提升Hadoop系统的性能,实现Map作业的近似完全本地化执行。实验结果表明,该任务选择策略能够充分利用数据节点本地磁盘的I/O资源,可使节点的I/O Wait平均降低5%,CPU利用率平均上升15%,作业的执行时间缩短20%。
-
关键词
Hadoop系统
调度算法
数据本地性
任务选择策略
磁盘负载
I/O性能
-
Keywords
Hadoop system
scheduling algorithm
data locality
task selection strategy
disk workload
I/O performance
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名一种智能网络磁盘(IND)存储系统结构
被引量:19
- 2
-
-
作者
赵跃龙
戴祖雄
王志刚
杨希
-
机构
华南理工大学计算机科学与工程学院
中南大学信息科学与工程学院
-
出处
《计算机学报》
EI
CSCD
北大核心
2008年第5期858-867,共10页
-
基金
国家自然科学基金(60573145)
湖南省自然科学基金(05JJ30120)
广州市科技计划项目基金(2007J1-C0401)资助
-
文摘
针对当前计算机存储系统结构中存在的若干问题,文中提出了一种新型的智能网络磁盘(Intelligent Network Disk,IND)存储系统结构.分别给出了IND内部数据的读/写控制、容错处理、负载平衡等智能控制算法,已经构建了一个IND结构的模拟原型IND存储系统.IND存储系统中各个IND都是直接与网络连接,若干个IND组成一个集群存储系统,给用户提供了一个虚拟化的海量存储系统.另外,由于各IND都具有一定的智能度,所以它是一种灵活可变的智能型网络存储器系统.
-
关键词
智能网络磁盘(IND)
IND存储系统
读/写控制
容错处理
负载平衡
-
Keywords
intelligent network disk (IND)
IND storage system
Read/Wrlte control
tolerantfault
workload balance
-
分类号
TP303
[自动化与计算机技术—计算机系统结构]
-
-
题名并发流媒体负载下磁盘阵列性能的研究
- 3
-
-
作者
李中
王刚
刘璟
-
机构
南开大学信息技术科学学院
-
出处
《计算机工程》
EI
CAS
CSCD
北大核心
2005年第19期43-45,共3页
-
基金
国家自然科学基金资助项目(60273031)
高等学校博士点专项科研基金资助项目(20020055021)
天津市科技发展计划基金资助项目(043800311)
-
文摘
通过仿真试验对磁盘阵列在并发流媒体负载下的性能进行了定量的研究,对访问请求响应时间的分布进行了统计和分析,得到了磁盘阵列为流媒体应用提供的服务质量随并发流媒体应用数量增加的变化曲线,确定了满足QoS需求的并发流媒体应用数量的阈值。
-
关键词
磁盘阵列
流媒体
负载
服务质量
-
Keywords
disk array
Stream-media
workload
Quality of service (QoS)
-
分类号
TP303
[自动化与计算机技术—计算机系统结构]
-
-
题名智能网络磁盘集群存储技术研究与实现
- 4
-
-
作者
杨希
赵跃龙
周云霞
-
机构
中南大学信息科学与工程学院
华南理工大学计算机科学与工程学院.广州
湖南师范大学数学与计算机科学学院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2011年第6期1099-1102,共4页
-
基金
国家自然科学基金项目(60573145)资助
教育部博士点基金项目(200805610019)资助
湖南省自然科学(05JJ30120)资助
-
文摘
智能网络磁盘(IND)集群是一种海量存储的新方案,为了实现其功能,组建了IND局域网平台,深入探索了实施的关键技术,采用集中管理,分散服务,备份支援,实时监控的策略,有效控制了并发,自动调整负载平衡,批量传送文件更安全更方便,保证了系统的正常运行.大量测试数据表明,智能控制是成功的,智能算法是正确的,符合设计初衷.IND集群是一种可用性好、易扩展、安全、简便、灵活、价廉的海量存储系统.
-
关键词
智能网络磁盘(IND)
IND集群
负载平衡
并发控制
实时监控
-
Keywords
intelligent network disk(IND)
IND cluster
workload balance
concurrent control
real-time monitor
-
分类号
TP333
[自动化与计算机技术—计算机系统结构]
-
-
题名一种基于I/O密集型工作负载的智能磁盘架构的研究
- 5
-
-
作者
赵颖
杨海英
-
机构
辽宁工业大学计算中心
-
出处
《辽宁工业大学学报(自然科学版)》
2011年第4期228-232,共5页
-
文摘
嵌入式处理器或智能磁盘与它们的网络接口控制器实际上被视为磁盘上的存储和二级存储的处理单元,当今较大的I/O密集型工作负载的数据大小和访问模式要求其处理与存储容量增加功率表的架构。基于这一问题,研究探讨了智能磁盘的分布式存储架构。实验结果显示,分布式智能磁盘系统具有理想的可扩展性,而且能够有效地处理I/O密集型工作负载。
-
关键词
智能磁盘
I/O密集型工作负载
嵌入式系统
-
Keywords
smart disks
I/O-intensive workloads
embedded systems
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-