期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
MapReduce在线抽样分区负载均衡研究 被引量:6
1
作者 陶永才 丁雷道 +1 位作者 石磊 卫琳 《小型微型计算机系统》 CSCD 北大核心 2017年第2期238-242,共5页
数据倾斜一直是影响MapReduce性能的关键问题之一.为缓解数据倾斜问题,提出一种基于抽样分区的MapReduce在线负载均衡机制:MR-LSP(MapReduce on-line Load balancing mechanism based on Sample Partition).MR-LSP在作业执行之前,通过... 数据倾斜一直是影响MapReduce性能的关键问题之一.为缓解数据倾斜问题,提出一种基于抽样分区的MapReduce在线负载均衡机制:MR-LSP(MapReduce on-line Load balancing mechanism based on Sample Partition).MR-LSP在作业执行之前,通过对源数据抽样分析,预测数据的分布特征,动态采取相应的负载均衡数据分区策略;在作业运行期间实时监控节点负载,进一步动态优化数据分区策略.实验结果表明:MR-LSP能够提高系统3.2%的负载均衡,降低4.3%的作业执行时间,有效缓解了MapReduce的数据倾斜问题. 展开更多
关键词 -MapReduce 数据倾斜 动态调度 抽样分区
下载PDF
异构环境下作业时间感知的MapReduce调度策略 被引量:1
2
作者 石磊 丁雷道 +1 位作者 陶永才 卫琳 《小型微型计算机系统》 CSCD 北大核心 2017年第8期1757-1761,共5页
MapReduce是一个流行的并行处理大规模数据计算模型.为提升异构环境下的MapReduce性能,提出一种异构环境下基于节点作业时间感知的动态MapReduce调度策略:DTHE(Dynamic Map Reduce scheduling based on the Time-aware of node jobs in ... MapReduce是一个流行的并行处理大规模数据计算模型.为提升异构环境下的MapReduce性能,提出一种异构环境下基于节点作业时间感知的动态MapReduce调度策略:DTHE(Dynamic Map Reduce scheduling based on the Time-aware of node jobs in Heterogeneous Environments).DTHE在作业执行前,首先标记部分任务作为节点样本任务并优先处理,在执行其他任务时分析样本任务,预测节点性能和数据分布特征,动态采取相应的调度策略;在作业运行中实时监测节点任务状态,提前拉取节点下一个任务数据到本地内存.实验结果表明:在异构环境下,DTEH能够缩短5.1%的作业执行时间并减少磁盘I/O,有效提升MapReduce性能. 展开更多
关键词 MAP REDUCE 任务调度 HADOOP 性能优化
下载PDF
浅谈数据挖掘技术及其相关问题解析 被引量:2
3
作者 许芳芳 丁雷道 《数字技术与应用》 2014年第4期141-144,共4页
数据挖掘(Data Mining,简称DM),又称数据库中的知识发现(Knowledge Discovery in Database,简称:KDD),是指从大型数据库或数据仓库中提取隐含的、未知的、特殊的及有潜在应用价值的信息或模式。本文在了解数据挖掘的定义和市场前景的基... 数据挖掘(Data Mining,简称DM),又称数据库中的知识发现(Knowledge Discovery in Database,简称:KDD),是指从大型数据库或数据仓库中提取隐含的、未知的、特殊的及有潜在应用价值的信息或模式。本文在了解数据挖掘的定义和市场前景的基础上,结合当今企业对数据挖掘技术的重视和数据挖掘技术对企业发展带来的巨大效益的现状,从众多方面提出和分析了数据挖掘技术在发展和应用过程中面临的主要问题。并且结合开放网格服务体系(OGSA)的思想,采用分层描述的方法,围绕功能、结构、调度成本和网格服务目标等,设计了一种五层的网格数据挖掘体系结构(GDMA)。该体系结构以服务为核心,通过统一的网格服务接口屏蔽资源的异构性,并针对用户的特殊需求,设计了基于工作流和Web服务的数据挖掘客户端。 展开更多
关键词 网格数据挖掘体系结构 开放网格服务体系 数据挖掘 网格计算
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部