期刊文献+
共找到91篇文章
< 1 2 5 >
每页显示 20 50 100
相控阵天气雷达并行异构数据处理方法
1
作者 耿利宁 郭威 +1 位作者 尹燕 赵子诚 《信息技术与信息化》 2023年第9期87-92,共6页
为解决相控阵天气雷达的海量数据高效处理难点,设计研发了基于CUDA运算平台的CPU+GPU并行异构数据处理方法,显著提高了产品数据处理效率,缩短设备探测到数据可视化进程,充分发挥了相控阵天气雷达的探测优势。阐述了从基数据到产品处理... 为解决相控阵天气雷达的海量数据高效处理难点,设计研发了基于CUDA运算平台的CPU+GPU并行异构数据处理方法,显著提高了产品数据处理效率,缩短设备探测到数据可视化进程,充分发挥了相控阵天气雷达的探测优势。阐述了从基数据到产品处理过程中并行异构数据处理方法的设计,并结合典型产品详细描述实现设计和测试对比,通过对结果的对比分析,展示了该方法在性能、性价比方面的优点和潜力,为后续进一步提高相控阵天气雷达资料在气象服务中的应用水平夯实基础。 展开更多
关键词 相控阵天气雷达 并行异构 CUDA 数据处理 产品处理
下载PDF
并行异构系统中的一种高效任务调度算法 被引量:4
2
作者 蒋韵联 孙广中 许胤龙 《计算机工程》 CAS CSCD 北大核心 2007年第11期39-41,共3页
并行分布计算是当前计算机科学的热点之一。调度算法是影响分布式计算的关键因素,也是一个具有挑战性的课题。调度算法是将有通信关系的任务按顺序分配给不同的处理器。提出了一种基于区间插入和任务复制的高效启发式算法,通过对各种随... 并行分布计算是当前计算机科学的热点之一。调度算法是影响分布式计算的关键因素,也是一个具有挑战性的课题。调度算法是将有通信关系的任务按顺序分配给不同的处理器。提出了一种基于区间插入和任务复制的高效启发式算法,通过对各种随机任务图和高斯迭代任务图进行模拟,与已有算法相比,新算法的效率有很大的提高。 展开更多
关键词 异构并行系统 启发式算法 任务复制
下载PDF
基于MPI+CUDA的DSMC/PIC耦合模拟异构并行及性能优化研究
3
作者 林拥真 徐传福 +4 位作者 邱昊中 汪青松 王正华 杨富翔 李洁 《计算机科学》 CSCD 北大核心 2024年第9期31-39,共9页
DSMC/PIC耦合模拟是一类重要的高性能计算应用,大规模DSMC/PIC耦合模拟计算量巨大,需要实现高效并行计算。由于粒子动态注入、迁移等操作,基于MPI并行的DSMC/PIC耦合模拟往往通信开销较大且难以实现负载均衡。针对自主研发的DSMC/PIC耦... DSMC/PIC耦合模拟是一类重要的高性能计算应用,大规模DSMC/PIC耦合模拟计算量巨大,需要实现高效并行计算。由于粒子动态注入、迁移等操作,基于MPI并行的DSMC/PIC耦合模拟往往通信开销较大且难以实现负载均衡。针对自主研发的DSMC/PIC耦合模拟软件,在原有MPI并行优化版本上设计实现了高效的MPI+CUDA异构并行算法,结合GPU体系结构和DSMC/PIC计算特点,开展了GPU访存优化、GPU线程工作负载优化、CPU-GPU数据传输优化及DSMC/PIC数据冲突优化等一系列性能优化。在北京北龙超级云HPC系统的NVIDIA V100和A100 GPU上,针对数亿粒子规模的脉冲真空弧等离子体羽流应用,开展了大规模DSMC/PIC耦合异构并行模拟,相比原有纯MPI并行,GPU异构并行大幅缩短了模拟时间,两块GPU卡较192核的CPU加速比达到550%,同时具有更好的强可扩展性。 展开更多
关键词 DSMC/PIC耦合 粒子模拟 异构并行 MPI+CUDA
下载PDF
面向国产异构DCU平台的大规模并行矩量法研究
4
作者 贾瑞鹏 林中朝 +2 位作者 左胜 张玉 杨美红 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2024年第2期76-83,共8页
面向国产异构众核处理器超级计算机发展趋势,实现了基于CPU+DCU国产异构并行系统的大规模并行高阶矩量法。在同构并行矩量法负载均衡策略的基础上,提出了一种“MPI+openMP+DCU”的高效异构并行编程框架,解决了计算任务与计算能力不匹配... 面向国产异构众核处理器超级计算机发展趋势,实现了基于CPU+DCU国产异构并行系统的大规模并行高阶矩量法。在同构并行矩量法负载均衡策略的基础上,提出了一种“MPI+openMP+DCU”的高效异构并行编程框架,解决了计算任务与计算能力不匹配的问题,实现了矩量法异构并行计算过程的负载均衡。采用细粒度任务划分策略与异步通信技术,对深度计算处理器计算过程进行了流水线优化设计,实现了计算与通信重叠,提升了矩量法异构协同计算的效率。通过与有限元法的仿真结果对比,验证了CPU+DCU异构并行矩量法的准确性。基于国产深度计算处理器异构平台的可扩展性分析结果表明,与单纯CPU计算相比,所实现的CPU+DCU异构协同计算方法能够获得5.5~7.0倍的加速效果,且在国家超级计算西安中心能够实现全系统运行,并行规模从360节点扩展到3 600节点(共1 036 800个处理器核心),并行效率可以达到约73.5%。 展开更多
关键词 高阶矩量法 国产异构并行系统 深度计算处理器 异构协同并行计算
下载PDF
带准备时间的异构并行机调度规则自动设计方法
5
作者 钟宏扬 刘建军 +2 位作者 曾创锋 陈庆新 毛宁 《工业工程》 2024年第2期87-97,共11页
以大规模定制化的家电行业生产为背景,将家电总装产线的投产排序决策抽象成为一类带准备时间的异构并行机动态调度问题。针对人工调度规则解决动态调度问题简单高效,但场景适应性弱的特点,引入了基于遗传规划(genetic programming,GP)... 以大规模定制化的家电行业生产为背景,将家电总装产线的投产排序决策抽象成为一类带准备时间的异构并行机动态调度问题。针对人工调度规则解决动态调度问题简单高效,但场景适应性弱的特点,引入了基于遗传规划(genetic programming,GP)的规则自动设计框架。首先,通过分析家电总装产线生产特征以及优化需求,以最小化平均拖期为优化目标,建立异构并行机调度模型;随后,针对问题特征,构建线体指派-工单排序规则对协同进化的改进型GP算法,并提取线体、工单的特征属性输入GP算法框架以自动设计调度规则。最后,基于某家电企业实际案例数据设计大量算例测试集,通过对比GP算法与人工设计规则在差异化工况场景的实验结果,验证GP算法有效性,并进一步分析了GP算法构造规则受不同生产环境参数的影响。 展开更多
关键词 异构并行 动态调度 启发式规则 遗传规划
下载PDF
异构并行的高阶散射特征线方法及其在临界实验装置模拟中的应用
6
作者 邹航 陈莹 +5 位作者 张乾 曹巍 张晋超 梁亮 宋佩涛 刘杰 《原子能科学技术》 EI CSCD 北大核心 2024年第1期135-143,共9页
在临界实验装置的物理计算中,由于较厚水反射层的存在,中子各向异性散射会对计算结果有重要影响。基于P1各向异性散射特征线方法(MOC),开发了能够处理各向异性散射的特征线输运计算程序,并实现了高阶散射特征线输运计算的高性能异构并... 在临界实验装置的物理计算中,由于较厚水反射层的存在,中子各向异性散射会对计算结果有重要影响。基于P1各向异性散射特征线方法(MOC),开发了能够处理各向异性散射的特征线输运计算程序,并实现了高阶散射特征线输运计算的高性能异构并行。为确认程序对临界实验装置的物理计算精度,本文选取LCT011临界实验基准进行堆芯物理计算,并与蒙特卡罗程序进行对比验证。各向异性源使得计算量与内存消耗均有显著增加,给异构系统带来较大的显存负担,因此本文进而对高阶散射输运求解器进行性能分析。数值结果表明:在高阶散射计算条件下,程序可达到蒙特卡罗程序的同等精度,且具有较高的计算效率。 展开更多
关键词 特征线方法 高阶散射 临界实验装置 异构并行
下载PDF
基于异构系统的多级并行稀疏张量向量乘算法
7
作者 陈玥丹 肖国庆 +3 位作者 阳王东 金纪勇 龙军 李肯立 《计算机学报》 EI CSCD 北大核心 2024年第2期441-455,共15页
张量在许多实际应用中被用来表示大规模、多源、高维、多模态的数据.稀疏张量分解作为挖掘数据中隐藏信息的有效方法之一,已被广泛应用于机器学习、文本分析、生物医疗等研究领域中.稀疏张量向量乘(Sparse Tensor-VectorMultiplication,... 张量在许多实际应用中被用来表示大规模、多源、高维、多模态的数据.稀疏张量分解作为挖掘数据中隐藏信息的有效方法之一,已被广泛应用于机器学习、文本分析、生物医疗等研究领域中.稀疏张量向量乘(Sparse Tensor-VectorMultiplication,SpTV)是张量分解中最基础、耗时最多的运算之一.为加速大数据和人工智能相关应用的运行效率,本文提出了基于CPU-GPU异构结构的多级并行SpTV加速算法.首先,为了将SpTV运算映射到混合、多级并行的分布式CPU-GPU异构多/众核构架,本文设计了一种多维并行SpTV划分方法,采用面向节点级并行的N-1维张量划分和面向GPU线程级并行的矩阵划分,充分利用计算节点间和节点内的多级并行计算能力.其次,设计了一种基于稀疏张量纤维的压缩存储格式,压缩稀疏张量的内存占用,优化SpTV运算的计算和访存模式.最后,提出了基于多流并行的异构高效SpTV算法,进一步设计了稀疏张量的细粒度划分方法、多流并行运行机制和基于张量块排序的多流并行优化技术,实现了SpTV运算中通信开销和计算开销的相互重叠与隐藏.实验结果表明,与相关工作aeSpTV相比,所提出的SpTV算法在所有测试数据集上最高能够获得3.28倍的加速比. 展开更多
关键词 CPU-GPU 异构并行计算 多级并行 稀疏张量 张量运算
下载PDF
异构并行计算下高维混合型数据聚类算法研究 被引量:1
8
作者 祝鹏 《现代电子技术》 北大核心 2024年第9期139-142,共4页
高维数据维度增加,数据空间的体积呈指数增长,容易陷入“维数灾难”,导致聚类算法执行效率低,为此,提出异构并行计算下高维混合型数据聚类算法。构建高维混合型数据相异度矩阵,提取高维混合型数据的统计序列特征值,利用时间窗口进行特... 高维数据维度增加,数据空间的体积呈指数增长,容易陷入“维数灾难”,导致聚类算法执行效率低,为此,提出异构并行计算下高维混合型数据聚类算法。构建高维混合型数据相异度矩阵,提取高维混合型数据的统计序列特征值,利用时间窗口进行特征优化。采用K⁃Prototypes聚类算法提取高维混合型数据的统计序列特征,评估数据与类中心的相异性,计算数据与类中心的欧氏距离,实现高维混合型数据聚类。采用异构并行计算技术进行高维混合型数据K⁃Prototypes聚类的并行化处理,合理分配CPU与GPU工作,达到CPU与GPU的工作负载平衡,提高K⁃Prototypes的聚类效率。实验结果表明,此算法对于高维混合型数据的聚类效果好、运行时间短、性能稳定。 展开更多
关键词 异构并行计算 高维混合型数据 K⁃Prototypes聚类算法 欧氏距离 统计序列特征 负载平衡
下载PDF
基于异构并行的DAS高密度数据实时解调技术
9
作者 张健 何向阁 +2 位作者 郭莹 张敏 刘盛春 《黑龙江大学自然科学学报》 CAS 2024年第1期90-98,共9页
针对分布式光纤声波传感(Distributed optical fiber acoustic sensing,DAS)系统中高密度数据实时解调的需求,提出了基于中央处理器(Central processing unit,CPU)和图形处理器(Graphic processing unit,GPU)的异构并行计算架构,完成了... 针对分布式光纤声波传感(Distributed optical fiber acoustic sensing,DAS)系统中高密度数据实时解调的需求,提出了基于中央处理器(Central processing unit,CPU)和图形处理器(Graphic processing unit,GPU)的异构并行计算架构,完成了实时解调双通道外差型DAS系统传感数据,可满足同时对两个通道共5000个等效阵元实时解调处理需求。此系统每秒需处理的数据量高达400 MB,相较于仅使用CPU运算的225.5 s运算时间,采用异构并行计算架构的运算时间优化到了468.2 ms,运算速度提升了482倍,且该方案仍有巨大的算力冗余空间,可为后续DAS系统整体实时性能的提升提供算力支持。 展开更多
关键词 异构并行 分布式光纤声波传感 高密度数据 实时解调
下载PDF
城市洪涝模型及CPU-GPU异构并行计算技术研究进展 被引量:5
10
作者 黄国如 陈志威 曾博威 《水利学报》 EI CSCD 北大核心 2023年第6期654-665,共12页
在全球气候变暖和城市化背景下,城市洪涝问题日益严峻。为尽可能减少城市洪涝灾害造成的损失,提高城市对突发性强降雨事件的应急处理水平,开展城市洪涝数值模拟技术研究具有十分重要的意义。本文从城市洪涝精细化和高效模拟角度出发,综... 在全球气候变暖和城市化背景下,城市洪涝问题日益严峻。为尽可能减少城市洪涝灾害造成的损失,提高城市对突发性强降雨事件的应急处理水平,开展城市洪涝数值模拟技术研究具有十分重要的意义。本文从城市洪涝精细化和高效模拟角度出发,综述了城市洪涝模型、CPU-GPU异构并行计算的研究进展,系统总结了产汇流模型、一维河道管网模型、二维地表模型、耦合模型、快速城市洪涝模型的构建方法和CPU-GPU异构并行计算的关键技术。针对当前城市洪涝模型研究中的不足之处,需要开展城市洪涝过程全物理机制模拟研究,深入分析全水动力城市洪涝模型的适用性、模拟精度和计算效率;还需基于异构并行计算技术,实现城市洪涝模型一维河道管网、二维地表淹没的快速模拟,为城市暴雨洪涝精细化与高效模拟奠定基础。 展开更多
关键词 城市洪涝 产汇流模型 河道管网模型 地表模型 耦合模型 异构并行计算
下载PDF
交换突变策略改进萤火虫算法的异构并行机调度
11
作者 罗冬梅 陈玲清 +1 位作者 张瑀鑫 黄兴旺 《集美大学学报(自然科学版)》 CAS 2023年第2期177-184,共8页
序列相关设置时间的异构并行机调度问题是个NP(non-deterministic polynomial)问题,在高纬度情况下难以求解。选取任务完工时间为优化目标建立数学模型,提出一种基于交换突变策略改进的萤火虫算法,并应用该算法进行求解,以期在可接受的... 序列相关设置时间的异构并行机调度问题是个NP(non-deterministic polynomial)问题,在高纬度情况下难以求解。选取任务完工时间为优化目标建立数学模型,提出一种基于交换突变策略改进的萤火虫算法,并应用该算法进行求解,以期在可接受的时间内提供近似最优解的可行方案。实验结果表明,所提出的算法在处理异构并行机调度问题时具有较突出的全局搜索优势,收敛速度较快,搜索精度高,测算了36个算例,其中的28个取得最优平均解,并且较萤火虫算法、模拟退火算法和遗传算法分别减少了11.12%、7.36%和1.43%的平均任务完工时间。 展开更多
关键词 异构并行机调度 萤火虫算法 交换突变 任务完工时间 序相关设置时间
下载PDF
面向边缘智能计算的异构并行计算平台综述 被引量:6
12
作者 万朵 胡谋法 +1 位作者 肖山竹 张焱 《计算机工程与应用》 CSCD 北大核心 2023年第1期15-25,共11页
边缘智能计算对硬件资源的需求复杂多元,传统计算平台难以为继,异构并行计算平台成为边缘智能算法落地的关键途径之一。以深度学习算法和边缘计算为牵引,对异构并行计算平台展开研究。一方面,阐述了传统计算平台适配实现边缘智能计算的... 边缘智能计算对硬件资源的需求复杂多元,传统计算平台难以为继,异构并行计算平台成为边缘智能算法落地的关键途径之一。以深度学习算法和边缘计算为牵引,对异构并行计算平台展开研究。一方面,阐述了传统计算平台适配实现边缘智能计算的优缺点,指出边缘端应用场景中传统计算平台算力与功耗矛盾突出等局限性,并以指令模型、通讯机制和存储体系三个关键技术为线索梳理技术发展脉络。另一方面,从运算速度、功耗等角度重点对比分析了近年来典型异构平台较新的代表性产品,然后针对不同应用场景和约束条件给出了异构平台的选择建议:优先选择CPU+X组合的异构平台。功耗要求严格约束下的应用建议优先选择CPU+FPGA组合;功能迭代更新快的场景建议优先选择CPU+GPU组合;算法成熟且对实时性和功耗均具有高要求的应用优先选择ASIC计算平台。提出了异构并行计算平台在指令模型统一、通讯机制轻量化、存储体系灵活性以及开发生态完备化四个方面的问题与挑战,期望能为该领域研究人员带来一定的启发。 展开更多
关键词 异构并行架构 边缘计算 智能计算 深度学习 嵌入式设备 硬件加速
下载PDF
基于SYCL的多相流LBM模拟跨平台异构并行计算研究 被引量:1
13
作者 丁越 徐传福 +4 位作者 邱昊中 戴未希 汪青松 林拥真 王正华 《计算机科学》 CSCD 北大核心 2023年第11期32-40,共9页
异构并行体系结构是当前高性能计算的重要技术趋势。由于各种异构平台通常支持不同的编程模型,跨平台性能可移植异构并行应用开发非常困难。SYCL是一个基于C++语言的单源跨平台并行编程开放标准。目前针对SYCL的研究主要集中于与其他并... 异构并行体系结构是当前高性能计算的重要技术趋势。由于各种异构平台通常支持不同的编程模型,跨平台性能可移植异构并行应用开发非常困难。SYCL是一个基于C++语言的单源跨平台并行编程开放标准。目前针对SYCL的研究主要集中于与其他并行编程模型的性能比较,对SYCL中提供的不同并行内核实现及其性能优化研究得较少。针对这一现状,基于SYCL编程模型对开源多相流数值模拟软件openLBMmflow实现跨平台异构并行模拟,通过对比基础并行版本、细粒度调优的ND-range并行版本以及计算到工作项多对一映射方法,系统总结了SYCL并行应用的性能优化方法。测试结果表明,在Intel Xeon Platinum 9242 CPU以及NVIDIA Tesla V100 GPU上,相比优化后的OpenMP并行实现,在不需要额外调优的情况下,基础并行版本在CPU上获得了2.91的加速比,表明了SYCL的开箱即用性能具备一定优势。以基础并行版本为基准,ND-range并行版本通过改变工作组大小及形状,在CPU与GPU上分别取得了最高1.45以及2.23的加速比。通过优化计算到工作项的多对一映射改变每个工作项处理的格子数量以及形状,与基础并行版本相比,在CPU与GPU上分别取得了最高1.57以及1.34的加速比。结果表明,SYCL并行应用在CPU上更适合采用计算到工作项多对一映射的优化方法,在GPU上更适合采用ND-range并行内核,以提高性能。 展开更多
关键词 SYCL 格子玻尔兹曼方法 多相流模拟 异构并行计算 跨平台并行编程模型
下载PDF
CASC2D分布式水文模型异构并行算法研究 被引量:1
14
作者 左翔 赵杏杏 +1 位作者 丛小飞 刘修恒 《水利信息化》 2023年第5期41-47,共7页
针对CASC2D模型精细化水文模拟时面临的计算耗时长、效率低等问题,在保持产汇流算法和流域拓扑结构的基础上,采用CPU+GPU的异构并行算法对CASC2D模型程序进行重新设计和优化,模型程序中的降雨、产流、坡面汇流和河道汇流过程均优化为并... 针对CASC2D模型精细化水文模拟时面临的计算耗时长、效率低等问题,在保持产汇流算法和流域拓扑结构的基础上,采用CPU+GPU的异构并行算法对CASC2D模型程序进行重新设计和优化,模型程序中的降雨、产流、坡面汇流和河道汇流过程均优化为并行计算,以提高CASC2D模型的计算效率。将优化后的CASC2D模型应用于前毛庄流域的洪水流量过程模拟,计算结果与原CASC2D模型保持一致。在栅格分辨率为30 m,计算步长为3 s时,与原CPU串行计算方法相比,并行加速比达到34倍以上,并且栅格单元数据精度越高,加速比提升越明显。异构并行算法可在不降低模拟精度的条件下显著提升CASC2D模型的计算效率,满足实时水文预报的应用需求。 展开更多
关键词 异构并行算法 分布式水文模型 CASC2D 水文预报
下载PDF
Hough变换基于异构HPC平台的并行处理
15
作者 夏栋 朱艳慧 +1 位作者 李辉 马秀云 《中国电子科学研究院学报》 北大核心 2023年第7期618-623,共6页
Hough变换对局部信息缺失不敏感、抗干扰能力强,在航迹起始问题研究中具有广泛的应用,但是运算量巨大。文中将异构并行高性能计算技术引入到Hough变换处理中,通过线程管理充分利用GPU的计算核心数量多和存储器带宽高的优势加快运算速度... Hough变换对局部信息缺失不敏感、抗干扰能力强,在航迹起始问题研究中具有广泛的应用,但是运算量巨大。文中将异构并行高性能计算技术引入到Hough变换处理中,通过线程管理充分利用GPU的计算核心数量多和存储器带宽高的优势加快运算速度。多核PC平台下可将点迹数据分配给多个线程并行处理,但是竞态操作会导致计算错误。基于角度量化的并行处理方式能够避免竞态操作,但角度量化数有限。在异构HPC平台下,为充分利用GPU的多运算核心,文中采用数据分块与角度量化相结合的方式,每个点迹的Hough变换处理由一个Block完成,Block内部则按照角度量化的方式通过读写共享内存快速完成并行处理。仿真结果表明,相对于多核PC平台下的并行运算,基于异构HPC平台的Hough变换具有更快的运算速度和更高的加速比。 展开更多
关键词 HOUGH变换 航迹起始 异构并行高性能计算
下载PDF
基于异构并行计算的软件雷达通用硬件架构设计 被引量:1
16
作者 李德银 扈树洁 熊伟涛 《指挥控制与仿真》 2023年第4期127-131,共5页
软件雷达系统功能由软件定义是雷达未来发展的一个趋势,这对系统硬件计算性能和数据传输带宽提出了很高的要求,因此将异构并行高性能计算技术引入软件雷达领域。根据系统功能逻辑,构建了软件雷达硬件平台系统,利用先进的异构并行计算技... 软件雷达系统功能由软件定义是雷达未来发展的一个趋势,这对系统硬件计算性能和数据传输带宽提出了很高的要求,因此将异构并行高性能计算技术引入软件雷达领域。根据系统功能逻辑,构建了软件雷达硬件平台系统,利用先进的异构并行计算技术,设计了一个具体的通用硬件平台架构。该平台通过独立的高速采集卡完成回波信号的采集与A/D变换,利用FPGA刀片异构服务器完成雷达信号实时处理,通过GPU异构超级计算机完成数据处理和显控,利用InfiniBand网络和磁盘阵列完成数据的高速传输与存储。通过性能分析,该硬件平台能够满足现代雷达对计算速度和传输带宽的性能需求。 展开更多
关键词 软件雷达 硬件架构设计 高性能计算 异构并行
下载PDF
面向GPU异构并行系统的多任务流编程模型 被引量:11
17
作者 董小社 刘超 +2 位作者 王恩东 刘袁 张兴军 《计算机学报》 EI CSCD 北大核心 2014年第7期1638-1646,共9页
传统并行编程模型和框架不能有效利用和发挥GPU异构并行系统特点,应用开发难度大,性能优化困难,文中采用混合编程模型思想,建立了一种以协处理器为中心的GPU计算核心与CPU控制相融合的多任务流编程模型.模型将并行任务与CUDA流相结合,... 传统并行编程模型和框架不能有效利用和发挥GPU异构并行系统特点,应用开发难度大,性能优化困难,文中采用混合编程模型思想,建立了一种以协处理器为中心的GPU计算核心与CPU控制相融合的多任务流编程模型.模型将并行任务与CUDA流相结合,利用系统硬件并行性特点实现程序任务级和数据级并行;采用任务间消息通信和任务内数据共享通信方式,既保证对传统并行应用的继承又降低了不同存储空间给应用开发带来的复杂性和难度.基于该编程模型实现了一个运行时支持系统原型,测试结果表明可保证高效的数据通信,且能充分利用系统计算能力,提高了应用程序运行效率. 展开更多
关键词 GPU 异构并行 编程模型
下载PDF
异构并行编程模型研究与进展 被引量:13
18
作者 刘颖 吕方 +3 位作者 王蕾 陈莉 崔慧敏 冯晓兵 《软件学报》 EI CSCD 北大核心 2014年第7期1459-1475,共17页
近年来,异构系统硬件飞速发展.为了解决相应的编程和执行效率问题,异构并行编程模型已被广泛使用和研究.从异构并行编程接口与编译/运行时支持系统两个角度总结了异构并行编程模型最新的研究成果,它们为异构架构和上层应用带来的技术挑... 近年来,异构系统硬件飞速发展.为了解决相应的编程和执行效率问题,异构并行编程模型已被广泛使用和研究.从异构并行编程接口与编译/运行时支持系统两个角度总结了异构并行编程模型最新的研究成果,它们为异构架构和上层应用带来的技术挑战提供了相应的解决方案.最后,结合目前的研究现状以及异构系统的发展,提出了异构并行编程模型的未来方向. 展开更多
关键词 异构并行编程模型 异构系统 GPU 编程接口 编译 运行时系统
下载PDF
求解一类异构并行机调度问题的分布估计算法 被引量:8
19
作者 李作成 钱斌 +2 位作者 胡蓉 向凤红 车国霖 《计算机集成制造系统》 EI CSCD 北大核心 2013年第9期2202-2212,共11页
针对流程工业中广泛存在的一类复杂异构并行机调度问题,即带工件加工约束和序相关设置时间的异构并行机调度问题,提出一种分布估计算法,用于最小化最早完工时间。首先,合理借鉴了蜜蜂养殖中"双王分区春繁法"的思想,提出一种... 针对流程工业中广泛存在的一类复杂异构并行机调度问题,即带工件加工约束和序相关设置时间的异构并行机调度问题,提出一种分布估计算法,用于最小化最早完工时间。首先,合理借鉴了蜜蜂养殖中"双王分区春繁法"的思想,提出一种新的概率模型更新方式,并通过子种群概率模型的交叉融合构造采样概率模型,进而引导种群进化方向,用于提高算法全局搜索的深度;其次,设计了一种基于插入法的变异操作,用于保持分布估计算法的种群多样性水平,进而提高算法全局搜索的宽度;最后,引入基于插入法和首次改进跳出原则的局部搜索方法来增强算法的局部开发能力。仿真实验和算法比较验证了所提算法的有效性和鲁棒性。 展开更多
关键词 流程工业 分布估计算法 异构并行 全局搜索 局部开发
下载PDF
遗传-分布估计算法求解化工生产中一类带多工序的异构并行机调度问题 被引量:14
20
作者 李作成 钱斌 +2 位作者 胡蓉 罗蓉娟 张桂莲 《化工学报》 EI CAS CSCD 北大核心 2014年第3期981-992,共12页
针对化工生产中广泛存在的一类带多工序的异构并行机调度问题,即部分产品需多工序加工,同时不同产品间带序相关设置时间的异构并行机调度问题(heterogeneous parallel machine scheduling problem with multiple operations and sequenc... 针对化工生产中广泛存在的一类带多工序的异构并行机调度问题,即部分产品需多工序加工,同时不同产品间带序相关设置时间的异构并行机调度问题(heterogeneous parallel machine scheduling problem with multiple operations and sequence-dependent setup times,HPMSP_MOSST),提出了一种遗传-分布估计算法(genetic algorithm-estimation of distribution algorithm,GA-EDA),用于优化最早完工时间(makespan)。首先,提出了一种基于GA的概率模型训练机制,用来提高概率模型在算法进化初期的信息积累量,进而提高搜索的效率;其次,设计了一种有效的GA与EDA混合策略,使得算法的全局探索和局部开发能力得到合理平衡。计算机模拟验证了GA-EDA的有效性和鲁棒性。 展开更多
关键词 异构并行 多工序 遗传算法 分布估计算法 优化 概率模型 计算机模拟
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部