为解决Hadoop现有调度器调度任务时不能根据任务的紧迫程度分配资源的问题,研究YARN中的资源调度机制,改进原调度器(Capacity Scheduler),提出一种基于优先级权重的Hadoop YARN(Yet Another Resource Negotiator)调度算法(Weight Schedu...为解决Hadoop现有调度器调度任务时不能根据任务的紧迫程度分配资源的问题,研究YARN中的资源调度机制,改进原调度器(Capacity Scheduler),提出一种基于优先级权重的Hadoop YARN(Yet Another Resource Negotiator)调度算法(Weight Scheduler Based on Priority)。为叶子队列设置队列优先级,结合队列资源利用率和队列优先级选择队列;将应用程序的初始权重设置为应用程序优先级的大小,通过等待时间判断是否更新权重,根据权重对队列中的应用程序进行排序,调度时优先为权重高的应用程序分配资源。实验结果表明,与原有调度算法相比,改进算法平均任务执行时间约减少141 s,平均等待时间减少34.5%,保证了用户执行任务的相对公平,提高了用户总体满意度。展开更多
大数据平台作为数据存储、处理和服务的基础平台,需支撑内部和外部多种大数据应用的开发及运行。提出一种把PaaS(platform as a service,平台即服务)技术应用到大数据平台的方案,详细描述了大数据PaaS云化平台的架构体系以及分层调度、...大数据平台作为数据存储、处理和服务的基础平台,需支撑内部和外部多种大数据应用的开发及运行。提出一种把PaaS(platform as a service,平台即服务)技术应用到大数据平台的方案,详细描述了大数据PaaS云化平台的架构体系以及分层调度、多租户管理、Hadoop任务全局调度等关键技术方案。实践证明,该平台可以显著提高大数据应用的开发效率,实现应用快速部署上线;同时,其良好的弹性伸缩能力可以有效地提高大数据应用系统资源的使用效率。展开更多
文摘为解决Hadoop现有调度器调度任务时不能根据任务的紧迫程度分配资源的问题,研究YARN中的资源调度机制,改进原调度器(Capacity Scheduler),提出一种基于优先级权重的Hadoop YARN(Yet Another Resource Negotiator)调度算法(Weight Scheduler Based on Priority)。为叶子队列设置队列优先级,结合队列资源利用率和队列优先级选择队列;将应用程序的初始权重设置为应用程序优先级的大小,通过等待时间判断是否更新权重,根据权重对队列中的应用程序进行排序,调度时优先为权重高的应用程序分配资源。实验结果表明,与原有调度算法相比,改进算法平均任务执行时间约减少141 s,平均等待时间减少34.5%,保证了用户执行任务的相对公平,提高了用户总体满意度。
文摘大数据平台作为数据存储、处理和服务的基础平台,需支撑内部和外部多种大数据应用的开发及运行。提出一种把PaaS(platform as a service,平台即服务)技术应用到大数据平台的方案,详细描述了大数据PaaS云化平台的架构体系以及分层调度、多租户管理、Hadoop任务全局调度等关键技术方案。实践证明,该平台可以显著提高大数据应用的开发效率,实现应用快速部署上线;同时,其良好的弹性伸缩能力可以有效地提高大数据应用系统资源的使用效率。