期刊文献+
共找到34篇文章
< 1 2 >
每页显示 20 50 100
Multi-Agent Deep Reinforcement Learning-Based Resource Allocation in HPC/AI Converged Cluster
1
作者 Jargalsaikhan Narantuya Jun-Sik Shin +1 位作者 Sun Park JongWon Kim 《Computers, Materials & Continua》 SCIE EI 2022年第9期4375-4395,共21页
As the complexity of deep learning(DL)networks and training data grows enormously,methods that scale with computation are becoming the future of artificial intelligence(AI)development.In this regard,the interplay betw... As the complexity of deep learning(DL)networks and training data grows enormously,methods that scale with computation are becoming the future of artificial intelligence(AI)development.In this regard,the interplay between machine learning(ML)and high-performance computing(HPC)is an innovative paradigm to speed up the efficiency of AI research and development.However,building and operating an HPC/AI converged system require broad knowledge to leverage the latest computing,networking,and storage technologies.Moreover,an HPC-based AI computing environment needs an appropriate resource allocation and monitoring strategy to efficiently utilize the system resources.In this regard,we introduce a technique for building and operating a high-performance AI-computing environment with the latest technologies.Specifically,an HPC/AI converged system is configured inside Gwangju Institute of Science and Technology(GIST),called GIST AI-X computing cluster,which is built by leveraging the latest Nvidia DGX servers,high-performance storage and networking devices,and various open source tools.Therefore,it can be a good reference for building a small or middlesized HPC/AI converged system for research and educational institutes.In addition,we propose a resource allocation method for DL jobs to efficiently utilize the computing resources with multi-agent deep reinforcement learning(mDRL).Through extensive simulations and experiments,we validate that the proposed mDRL algorithm can help the HPC/AI converged cluster to achieve both system utilization and power consumption improvement.By deploying the proposed resource allocation method to the system,total job completion time is reduced by around 20%and inefficient power consumption is reduced by around 40%. 展开更多
关键词 Deep learning hpc/AI converged cluster reinforcement learning
下载PDF
基于超算环境的面向多租户的轻量级虚拟HPC集群的设计与实现 被引量:1
2
作者 谭郁松 李荣振 +2 位作者 吴庆波 张建锋 张尧学 《通信学报》 EI CSCD 北大核心 2017年第S2期56-66,共11页
为了给用户提供按需使用的HPC服务并解决用户应用部署的软件依赖性问题,在不破坏现有超大规模高性能集群管理的前提下,基于Fat-Tree网络拓扑和虚拟集群模型,通过对部分资源进行云化管理,设计并实现了一种轻量级的HPC集群交付模式。从而... 为了给用户提供按需使用的HPC服务并解决用户应用部署的软件依赖性问题,在不破坏现有超大规模高性能集群管理的前提下,基于Fat-Tree网络拓扑和虚拟集群模型,通过对部分资源进行云化管理,设计并实现了一种轻量级的HPC集群交付模式。从而为面向租户需求的高性能应用提供一种云化的HPC租用服务,并解决了HPC应用软件栈的僵化问题,以易用的方式为更多的HPC租户提供服务。实验结果表明,该方法以近似物理节点的性能使HPC具备了云的按需使用的特性,并具有较为理想的植入效率。 展开更多
关键词 轻量级虚拟hpc 虚拟集群模型 胖树 多租户
下载PDF
广域网协议在PC集群系统HPC中的应用分析 被引量:1
3
作者 王文义 赵少林 王若雨 《郑州大学学报(工学版)》 CAS 2006年第1期67-71,共5页
鉴于绝大多数PC集群系统都使用了TCP/IP协议,着重分析了作为分布式进程间通信手段的socket通信机制在Linux中的实现以及传统通信开销中影响性能的主要因素,并针对通信瓶颈,对传统的通信协议栈进行了改进,对广域网协议在PC集群系统中应... 鉴于绝大多数PC集群系统都使用了TCP/IP协议,着重分析了作为分布式进程间通信手段的socket通信机制在Linux中的实现以及传统通信开销中影响性能的主要因素,并针对通信瓶颈,对传统的通信协议栈进行了改进,对广域网协议在PC集群系统中应用的不足之处,提出了改进集群网络性能的方法. 展开更多
关键词 集群系统 高性能计算 TCP/IP
下载PDF
MYSQL Cluster研究
4
作者 王爱宁 《电脑编程技巧与维护》 2010年第4期53-54,66,共3页
主要说明MYSQL集群的组成部分\各部分功能,随之给出了一个在MYSQL集群上创建数据库的例子,最后总结了MYSQL Cluster的优点和一些注意事项。
关键词 MYSQL 集群 网络存储设备 NDB 高可用 高性能
下载PDF
基于Microsoft HPC的Magic迭代计算软件的并行化 被引量:1
5
作者 侯佳正 张绍阳 陈博远 《应用科技》 CAS 2020年第3期100-105,共6页
Magic软件可以通过馈入参数仿真计算输出功率。为了确定最优的参数,实际工作中通过采用Magic迭代计算软件中的遗传算法迭代计算确定参数,但每代计算需要同时启动多个Magic程序,耗时长、单机计算效率低。本文提出了基于Windows环境,使用... Magic软件可以通过馈入参数仿真计算输出功率。为了确定最优的参数,实际工作中通过采用Magic迭代计算软件中的遗传算法迭代计算确定参数,但每代计算需要同时启动多个Magic程序,耗时长、单机计算效率低。本文提出了基于Windows环境,使用现有的工作站,利用Microsoft HPC工具包搭建一个并行计算集群,实现将每代启动的Magic程序放到多台计算机上进行并行计算的解决方案。首先利用HPC Pack进行集群的搭建,然后设置共享文件夹进行数据的存储与访问,最后使用Microsoft HPC Pack SDK中的API改写Magic迭代计算软件,实现将每代启动的Magic程序放到多台计算机上进行并行计算。通过测试表明加速比大约为2,能够有效提高计算速度。 展开更多
关键词 hpc集群 MAGIC软件 Magic迭代计算软件 Window环境 遗传算法 多机并行 共享存储 计算时间
下载PDF
复杂地震资料处理用HPC系统的网络集成 被引量:1
6
作者 宋柏芬 张颖 《物探装备》 2013年第2期117-120,129,共5页
随着地震资料处理中叠前时间和叠前深度偏移技术的大量应用,需要引进大规模PC Cluster(计算机集群系统)和海量存储系统,才能方便、快捷地对地震资料进行处理。本文介绍了用于进行地震资料处理的高性能计算机系统的网络集成方法,以及三... 随着地震资料处理中叠前时间和叠前深度偏移技术的大量应用,需要引进大规模PC Cluster(计算机集群系统)和海量存储系统,才能方便、快捷地对地震资料进行处理。本文介绍了用于进行地震资料处理的高性能计算机系统的网络集成方法,以及三层交换机的端口VLAN划分和网关配置。 展开更多
关键词 PC集群系统 高性能计算机 网络集成 虚拟局域网
下载PDF
Performance of the Cloud-Based Commodity Cluster
7
作者 Van-Hau Pham Duc-Cuong Nguyen Tien-Dung Nguyen 《Computer Technology and Application》 2013年第10期532-537,共6页
关键词 计算集群 性能计算 小商品 虚拟化技术 快速以太网 操作系统 计算资源 台式电脑
下载PDF
超大规模计算集群监控系统的设计与实现 被引量:1
8
作者 彭亮 牛铁 +1 位作者 魏宝亮 赵毅 《数据与计算发展前沿》 CSCD 2023年第1期97-103,共7页
【背景】传统集群监控软件在性能、灵活性、可扩展性上无法满足超过10000节点的超大规模计算集群以及多集群系统的监控管理需求。【目的】亟需设计研发新型集群监控系统,提升超大规模计算集群和多集群的运行管理能力与效率。【方法】本... 【背景】传统集群监控软件在性能、灵活性、可扩展性上无法满足超过10000节点的超大规模计算集群以及多集群系统的监控管理需求。【目的】亟需设计研发新型集群监控系统,提升超大规模计算集群和多集群的运行管理能力与效率。【方法】本文采用总分架构设计,利用消息中间件、分布式存储、REST技术实现了一种超大规模计算集群监控系统。【结果】该系统支持监控指标自定义、数据主动上发、自动告警等功能,具有良好的横向扩展能力。已部署于多套计算集群中,满足上万节点和设备的监控需求,日均采集数据逾200GB。【局限】由于监控指标繁多、监控数据量庞大,针对业务场景的数据关联分析能力有待提升。【结论】本文工作满足了超大规模计算集群及异地多集群系统的自动运管需求,采用的方法对更大规模集群甚至E级计算系统的运管工具的研发具有积极借鉴意义。 展开更多
关键词 超大规模 计算 集群 hpc 监控
下载PDF
HL-2A装置实验高性能计算系统与应用研究 被引量:3
9
作者 陈燎原 潘卫 +4 位作者 张锦华 廖敏 李永革 罗萃文 王修慧 《核聚变与等离子体物理》 EI CAS CSCD 北大核心 2007年第2期127-130,共4页
HL-2A装置实验高性能计算系统共有130个CPU,配置了多种工具软件和程序编译器;系统峰值性能为每秒7680亿次浮点运算,并且具有很好的可管理性与可扩展性。以此为基础开展了程序调优研究,HL-2A装置实验应用研究,并取得了进展。
关键词 HL-2A 高性能计算机 群集 并行计算
下载PDF
集群计算技术及其在石油工业中的应用 被引量:36
10
作者 赵改善 包红林 《石油物探》 EI CSCD 2001年第3期118-126,共9页
对于高性能计算不断增长的需求和计算技术的持续发展 ,促进了计算机集群技术的发展和应用。计算机集群系统具有系统建设、维护和升级成本低 ,可扩展性好 ,易维护 ,易升级 ,计算性能强以及通用和跨平台的并行计算软件开发环境 (PVM和MPI... 对于高性能计算不断增长的需求和计算技术的持续发展 ,促进了计算机集群技术的发展和应用。计算机集群系统具有系统建设、维护和升级成本低 ,可扩展性好 ,易维护 ,易升级 ,计算性能强以及通用和跨平台的并行计算软件开发环境 (PVM和MPI等 )等优点。本文概述了计算机集群技术的概念、技术基础、并行软件开发环境和Beowulf集群 ;论述了石油工业对高性能计算的需求 ;介绍了集群技术在石油勘探中的应用现状 ;指出了集群技术将大大降低石油勘探开发成本 ,促进新技术的应用和推广 ; 展开更多
关键词 高性能计算 集群系统 并行计算 PVM MPI 性能测试 油气勘探 地震勘探
下载PDF
多核环境下高效集合通信关键技术研究 被引量:6
11
作者 张攀勇 孟丹 霍志刚 《计算机学报》 EI CSCD 北大核心 2010年第2期317-325,共9页
随着高性能计算需求的日益增长,多核处理器在高性能计算中间得到了广泛的普及.为了保证高性能计算机系统的效率,需要保持计算和通信的平衡性,多核的广泛使用对通信系统的效率提出了更高的要求.集合通信作为通信系统中的重要组成部分,研... 随着高性能计算需求的日益增长,多核处理器在高性能计算中间得到了广泛的普及.为了保证高性能计算机系统的效率,需要保持计算和通信的平衡性,多核的广泛使用对通信系统的效率提出了更高的要求.集合通信作为通信系统中的重要组成部分,研究多核环境下的高效集合通信具有十分重要的意义.文中首先研究了多核对集合通信性能的影响,并根据多核处理器共享Cache以及内存竞争的特点,提出了层次化算法、限制并发、NUMA感知的优化方法和Cache友好的优化算法,并分别在MPI_Barrier、MPI_Bcast和MPI_Alltoall中进行了验证.实验结果表明优化方法能够有效地利用多核结构特点,降低竞争带来的影响,提高了多核环境下集合通信的性能和可扩展性. 展开更多
关键词 高性能计算 多核机群 集合通信优化 NUMA_MPI
下载PDF
基于高性能计算的水下爆炸数值仿真 被引量:2
12
作者 王树乐 宗智 +1 位作者 陈高杰 程素秋 《舰船科学技术》 北大核心 2012年第9期27-31,共5页
集群技术为水下爆炸数值仿真提供了强大的高性能计算平台。基于高性能计算集群系统和ABAQUS水下爆炸并行计算技术,对遭受水下爆炸的舰船缩比模型进行了性能测试和算例验证,给出了针对特定计算规模的并行计算优化方案。该文研究结果为舰... 集群技术为水下爆炸数值仿真提供了强大的高性能计算平台。基于高性能计算集群系统和ABAQUS水下爆炸并行计算技术,对遭受水下爆炸的舰船缩比模型进行了性能测试和算例验证,给出了针对特定计算规模的并行计算优化方案。该文研究结果为舰船水下爆炸的高精度数值仿真提供参考。 展开更多
关键词 水下爆炸 高性能计算 集群 数值仿真 并行计算
下载PDF
云及高性能计算集群环境中配置管理系统设计 被引量:7
13
作者 赵春燕 孙婧 魏敏 《计算技术与自动化》 2016年第1期111-116,共6页
比较主流的配置管理工具和代码托管服务平台的特点,分析其适用性,结合气象部门项目存在的问题,提出气象私有云平台上基于Perforce的分布式版本控制系统和基于Git的代码托管协作平台的设计,以及高性能计算集群架构上基于Subversion的版... 比较主流的配置管理工具和代码托管服务平台的特点,分析其适用性,结合气象部门项目存在的问题,提出气象私有云平台上基于Perforce的分布式版本控制系统和基于Git的代码托管协作平台的设计,以及高性能计算集群架构上基于Subversion的版本控制系统设计,并分别给出三套系统的项目配置管理实例,实践显示适用性良好。 展开更多
关键词 私有云 配置管理 hpc集群 Git SUBVERSION Perforce 代码托管
下载PDF
基于集群和GPGPU技术的三维地形数据生成方法研究 被引量:2
14
作者 李波 赵怀慈 +1 位作者 花海洋 杜梅 《微电子学与计算机》 CSCD 北大核心 2014年第10期1-4,共4页
针对三维地形数据生成时间过长的问题,提出了一种基于集群和GPGPU技术的HPC(High Performance Computing)高性能计算方法,能够有效整合集群中多台计算机的CPU和GPU的处理能力.在三维地形数据生成过程中,该方法将地形数据进行二次细化,... 针对三维地形数据生成时间过长的问题,提出了一种基于集群和GPGPU技术的HPC(High Performance Computing)高性能计算方法,能够有效整合集群中多台计算机的CPU和GPU的处理能力.在三维地形数据生成过程中,该方法将地形数据进行二次细化,分别分配给GPU的每个任务管线,大幅度提高运算吞吐量,缩短三维地形数据的生成时间. 展开更多
关键词 hpc 三维地形 集群 GPGPU
下载PDF
基于64位CPU系统的计算性能比较:Opteron vs. Xeon 被引量:1
15
作者 曾忠 龙庆会 陈景秋 《计算机工程与应用》 CSCD 北大核心 2007年第19期98-103,122,共7页
目前配置的计算机服务器大量采用64位AMD Opteron和Intel Xeon两种处理器。Opteron和Xeon处理器在时钟频率、内存控制器和I/O连接等诸多方面有所不同,这些差异导致基于这两种处理器的计算机集群系统有不同的特点,其性能与具体使用的应... 目前配置的计算机服务器大量采用64位AMD Opteron和Intel Xeon两种处理器。Opteron和Xeon处理器在时钟频率、内存控制器和I/O连接等诸多方面有所不同,这些差异导致基于这两种处理器的计算机集群系统有不同的特点,其性能与具体使用的应用程序密切相关。在构建面向高性能科学计算的集群系统时,选择基于何种64位处理器最为合理是众多用户所关心的一个重要话题,针对这个问题,对基于AMD Opteron 252(2.6GHz)和Intel Xeon 3.6GHz(L2 cache:1M)处理器的计算机集群系统进行了一系列科学计算性能的测试和比较。 展开更多
关键词 高性能计算 集群系统 64位处理器 计算流体动力学
下载PDF
中山大学高性能网格计算环境的规划与构建 被引量:1
16
作者 关伟豪 曾海标 《中山大学学报(自然科学版)》 CAS CSCD 北大核心 2005年第A02期125-128,共4页
网格的出现是为了解决Web技术存在的各种缺陷,更好地实现网络环境下的信息共享和协同工作,它代表了互联网技术未来发展的一个重要方向。建立大学高性能网格计算环境,利用网格计算技术可解决当前各个院系在科研活动中面临的计算力不足的... 网格的出现是为了解决Web技术存在的各种缺陷,更好地实现网络环境下的信息共享和协同工作,它代表了互联网技术未来发展的一个重要方向。建立大学高性能网格计算环境,利用网格计算技术可解决当前各个院系在科研活动中面临的计算力不足的问题,对提高学校的基础研究学科、应用学科的学术水平和促进新的交叉学科的形成,提高学校科研的整体创新能力,具有重要的战略意义。 展开更多
关键词 高性能计算 集群 校园网格
下载PDF
大规模地形数据生成方法研究 被引量:3
17
作者 李波 王祥凤 曹福毅 《沈阳工程学院学报(自然科学版)》 2013年第3期263-265,288,共4页
为了解决三维地形数据生成过程中的计算瓶颈问题,提出了一种基于集群和GPGPU技术的高性能计算框架,该框架能够整合多台计算机的处理能力,有效突破单台计算机的计算瓶颈,提高运算吞吐量,大幅度缩短三维地形数据的生成时间.实验表明:该应... 为了解决三维地形数据生成过程中的计算瓶颈问题,提出了一种基于集群和GPGPU技术的高性能计算框架,该框架能够整合多台计算机的处理能力,有效突破单台计算机的计算瓶颈,提高运算吞吐量,大幅度缩短三维地形数据的生成时间.实验表明:该应用程序框架切实可行,能够大幅度提高运算能力. 展开更多
关键词 高性能计算 三维地形 集群 GPGPU
下载PDF
高性能计算技术发展概述 被引量:12
18
作者 李波 曹福毅 王祥凤 《沈阳工程学院学报(自然科学版)》 2012年第3期252-254,269,共4页
随着科技发展,高性能计算技术已经成为一个国家综合实力的体现.简单介绍高性能计算技术的发展历史,指出了高性能计算技术未来发展的方向和趋势.介绍现代常见的几种高性能计算方式:集群、网格和云计算以及最新的高性能计算方式CPU+GPU技... 随着科技发展,高性能计算技术已经成为一个国家综合实力的体现.简单介绍高性能计算技术的发展历史,指出了高性能计算技术未来发展的方向和趋势.介绍现代常见的几种高性能计算方式:集群、网格和云计算以及最新的高性能计算方式CPU+GPU技术,并进行了对比. 展开更多
关键词 高性能计算 集群 网格
下载PDF
中国高性能计算机技术及标准现状分析 被引量:7
19
作者 曾宇 王洁 《信息技术与标准化》 2006年第10期9-12,共4页
分析了当前国内外高性能计算机技术发展现状及趋势,阐述了在以机群为载体的泛高性能计算时代所面临的技术及市场发展的全新机会,并从ISO、IEC、ITU标准、行业标准和企业标准三个方面,剖析了当前国内外高性能计算机标准现状。指出发展中... 分析了当前国内外高性能计算机技术发展现状及趋势,阐述了在以机群为载体的泛高性能计算时代所面临的技术及市场发展的全新机会,并从ISO、IEC、ITU标准、行业标准和企业标准三个方面,剖析了当前国内外高性能计算机标准现状。指出发展中国高性能计算机标准势在必行,且对中国高性能计算机产业的良性发展具有重要的意义。 展开更多
关键词 高性能计算机 标准 机群 刀片式服务器
下载PDF
面向空间数据处理的集群作业管理系统研究 被引量:1
20
作者 柯敏毅 靳华中 刘智华 《微计算机信息》 北大核心 2006年第07S期221-223,28,共4页
从分析目前集群的通用批处理系统出发,基于空间数据及应用特点,选用回填算法作为处理空间信息的集群作业调度算法。最后对面向空间数据处理的原型系统进行设计和实现,并验证了方法的可行性。
关键词 集群 GIS 高性能计算 作业管理系统 调度算法
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部