期刊文献+
共找到540篇文章
< 1 2 27 >
每页显示 20 50 100
Utilizing Iso-Value Field Curves in Lieu of Magnetic Field Lines Amid Infinite and Parallel Electrical Wires
1
作者 Geoffroy Auvert 《Open Journal of Applied Sciences》 2024年第1期70-84,共15页
Building on a new model proposed recently for calculating constant electro-magnetic field values, the present article explores the electro-magnetic field configuration generated by parallel electrical wires. This impo... Building on a new model proposed recently for calculating constant electro-magnetic field values, the present article explores the electro-magnetic field configuration generated by parallel electrical wires. This imposes a reevaluation of the drawing procedure for constructing field curves with a constant field values around multiple parallel electrical conducting wires. To achieve this, we employ methods akin to those used for creating contours on topographical maps, ensuring a consistent numerical field value along the entire length of the field curves. Subsequent calculations will be conducted for scenarios where wires are not parallel. 展开更多
关键词 Specific Field Value parallel Electrical Wires Magnetic Field Vector Field around parallel Wires Topographic level Map
下载PDF
Towards efficient deep neural network training by FPGA-based batch-level parallelism 被引量:4
2
作者 Cheng Luo Man-Kit Sit +3 位作者 Hongxiang Fan Shuanglong Liu Wayne Luk Ce Guo 《Journal of Semiconductors》 EI CAS CSCD 2020年第2期51-62,共12页
Training deep neural networks(DNNs)requires a significant amount of time and resources to obtain acceptable results,which severely limits its deployment in resource-limited platforms.This paper proposes DarkFPGA,a nov... Training deep neural networks(DNNs)requires a significant amount of time and resources to obtain acceptable results,which severely limits its deployment in resource-limited platforms.This paper proposes DarkFPGA,a novel customizable framework to efficiently accelerate the entire DNN training on a single FPGA platform.First,we explore batch-level parallelism to enable efficient FPGA-based DNN training.Second,we devise a novel hardware architecture optimised by a batch-oriented data pattern and tiling techniques to effectively exploit parallelism.Moreover,an analytical model is developed to determine the optimal design parameters for the DarkFPGA accelerator with respect to a specific network specification and FPGA resource constraints.Our results show that the accelerator is able to perform about 10 times faster than CPU training and about a third of the energy consumption than GPU training using 8-bit integers for training VGG-like networks on the CIFAR dataset for the Maxeler MAX5 platform. 展开更多
关键词 deep neural network TRAINING FPGA batch-level parallelism
下载PDF
A parallel two-level finite element method for the Navier-Stokes equations
3
作者 尚月强 罗振东 《Applied Mathematics and Mechanics(English Edition)》 SCIE EI 2010年第11期1429-1438,共10页
Based on domain decomposition, a parallel two-level finite element method for the stationary Navier-Stokes equations is proposed and analyzed. The basic idea of the method is first to solve the Navier-Stokes equations... Based on domain decomposition, a parallel two-level finite element method for the stationary Navier-Stokes equations is proposed and analyzed. The basic idea of the method is first to solve the Navier-Stokes equations on a coarse grid, then to solve the resulted residual equations in parallel on a fine grid. This method has low communication complexity. It can be implemented easily. By local a priori error estimate for finite element discretizations, error bounds of the approximate solution are derived. Numerical results are also given to illustrate the high efficiency of the method. 展开更多
关键词 Navier-Stokes equations finite element two-level method overlapping domain decomposition parallel algorithm
下载PDF
基于多绘制管线的大规模并行体绘制性能优化技术
4
作者 王华维 刘若妍 +1 位作者 艾志玮 曹轶 《计算机工程》 CAS CSCD 北大核心 2024年第8期207-215,共9页
针对数值模拟输出的大规模科学数据,体绘制方法为了刻画复杂物理特征,会进行高密度光线采样,但由此带来了极大的计算开销和数据增量。在国产自主CPU高性能计算机上,由于处理器单核的计算能力低于商业CPU,只能使用更多的处理器核来分担... 针对数值模拟输出的大规模科学数据,体绘制方法为了刻画复杂物理特征,会进行高密度光线采样,但由此带来了极大的计算开销和数据增量。在国产自主CPU高性能计算机上,由于处理器单核的计算能力低于商业CPU,只能使用更多的处理器核来分担体绘制任务,从而引起了采样数据并行通信的可扩展性瓶颈。为充分利用国产自主CPU高性能计算机来高效完成体绘制任务,针对大规模并行体绘制提出一种基于多绘制管线的性能优化技术,通过多管线、多进程的两级并行模式来降低单条管线的并行规模。在大规模并行体绘制中,该技术将绘制目标图像划分成多个子区域,绘制进程则相应分组,每个进程组独立执行一条绘制管线,以完成图像相应子区域的绘制,最后再收集所有的图像子区域,形成完整图像并输出。实验结果表明,优化后的体绘制算法在国产自主CPU高性能计算机上可以扩展到万核规模,并能有效完成体绘制任务。 展开更多
关键词 体绘制 多管线 两级并行 并行可扩展性 性能优化
下载PDF
具有多层级货架的自动小车存取系统排队网建模与分析
5
作者 陈炫锐 刘晓鹏 +2 位作者 陈庆新 毛宁 张惠煜 《计算机集成制造系统》 EI CSCD 北大核心 2024年第4期1335-1352,共18页
为了满足多楼层生产车间之间的物料运输需求,同时减少企业成本,自动存取系统的设计问题变得愈发重要。带有多层级货架的自动小车存取系统因其优秀的吞吐能力和柔性,具有很好的应用前景。为了分析多层车间中带有多层级货架自动小车存取... 为了满足多楼层生产车间之间的物料运输需求,同时减少企业成本,自动存取系统的设计问题变得愈发重要。带有多层级货架的自动小车存取系统因其优秀的吞吐能力和柔性,具有很好的应用前景。为了分析多层车间中带有多层级货架自动小车存取系统并行作业的性能,在分析自动导引小车(AGV)和电梯、伸缩臂作业方式的基础上,构建了半开排队网络模型,并设计了基于近似均值分析法的近似求解算法。该方法首先将半开排队网内部网络分为不同的单独网络模型,并分别重构为等效的闭排队网络模型。这些网络模型最终被聚合成一个节点,与外部的同步节点联合构建闭排队网络模型求解吞吐率。最后,针对内部网络的单独节点进行分析计算,得到其他系统性能指标。通过设计仿真实验,验证了所提方法的有效性和准确性。 展开更多
关键词 自动小车存取系统 多层级货架 并行作业 排队网络模型 性能分析
下载PDF
基于状态分解的三电平变换器交错并联技术
6
作者 李伟伟 强丹丹 +1 位作者 花国祥 张学广 《电力电子技术》 2024年第1期111-113,共3页
三电平变换器交错并联技术是满足大容量和高功率应用的重要途径,但传统交错并联难以避免环流较大的缺点。此处提出一种基于状态分解的新型交错并联技术,将两个并联三电平变换器视为一个整体进行调制,利用传统的五电平空间矢量方法计算... 三电平变换器交错并联技术是满足大容量和高功率应用的重要途径,但传统交错并联难以避免环流较大的缺点。此处提出一种基于状态分解的新型交错并联技术,将两个并联三电平变换器视为一个整体进行调制,利用传统的五电平空间矢量方法计算出相应开关状态。在此基础上,优先考虑系统环流的影响,将五电平状态灵活地分解为对应的三电平状态。相较于传统交错并联技术,所提出的方法在进一步减小输出电流谐波的同时,还能有效抑制环流幅值,并通过仿真和实验验证了新型交错并联技术的可行性与有效性。 展开更多
关键词 三电平变换器 交错并联 环流
下载PDF
基于容器化的快速射电暴搜寻GPU并行优化
7
作者 王玉明 吴开超 +1 位作者 牛晨辉 张晓丽 《数据与计算发展前沿》 CSCD 2024年第1期102-112,共11页
【应用背景】快速射电暴(Fast Radio Burst,FRB)搜寻是500米口径球面射电望远镜(FAST)的重要科学目标之一,其计算复杂度高,数据量大,当前算法GPU利用率偏低,数据处理需较多的人工介入操作。【目的】在不修改算法实现的前提下,实现进程级... 【应用背景】快速射电暴(Fast Radio Burst,FRB)搜寻是500米口径球面射电望远镜(FAST)的重要科学目标之一,其计算复杂度高,数据量大,当前算法GPU利用率偏低,数据处理需较多的人工介入操作。【目的】在不修改算法实现的前提下,实现进程级GPU并行优化,提高GPU整体资源利用率,简化算法运行调度,支持利用自动化脚本驱动计算过程。【方法】利用容器化封装FRB搜寻算法,结合GPU聚合技术实现多个FRB搜寻计算容器的多进程并行,支持GPU闲时复用。通过容器化封装屏蔽了GPU调用、依赖库管理等技术细节,减少人工介入操作。【结果】算法实验结果表明,在不修改原始算法、不增加GPU资源的前提下,将单GPU绑定6个计算进程,并行优化可实现FRB搜寻算法的加速比达到5.3,并行效率达到0.88,取得良好的并行效果。【结论】基于容器化封装及进程级GPU聚合的并行优化,可实现GPU利用率及计算效率的提升,有效支持自动化处理。该方法还具有良好的通用性,可适用于类似应用的并行优化。 展开更多
关键词 快速射电暴 容器化 进程级并行优化 GPU聚合
下载PDF
基于GPU集群的Level Set并行高精度演化 被引量:2
8
作者 袁斌 《计算物理》 CSCD 北大核心 2016年第3期253-265,共13页
设计实现基于张量积B样条的并行Level Set演化算法,张量积B样条提高了演化精度和并行度;每步演化都需要反算B样条系数.针对对角占优三对角方程组,设计实现基于精确LU分解的高精度并行追赶法,并用它反算B样条系数;采用两步通信方法,消除... 设计实现基于张量积B样条的并行Level Set演化算法,张量积B样条提高了演化精度和并行度;每步演化都需要反算B样条系数.针对对角占优三对角方程组,设计实现基于精确LU分解的高精度并行追赶法,并用它反算B样条系数;采用两步通信方法,消除通信的依赖关系,实现有效的并行通信.实验表明,本文的并行算法可以有效加速演化过程. 展开更多
关键词 B样条 level SET 混合并行 三对角方程组
下载PDF
Parallelism修辞格探微 被引量:3
9
作者 黎昌抱 《台州师专学报》 2001年第2期65-70,共6页
Parallelism意为“平行结构”,即将结构相同或相似、意义并重、语气一致的语言成分并行排列的一种修辞手法。它与汉语“排比”颇为相似,但不等同。从平行项数来看,它可以有两项,也可以有三项或三项以上,通常以二项或三项并行最为常见;... Parallelism意为“平行结构”,即将结构相同或相似、意义并重、语气一致的语言成分并行排列的一种修辞手法。它与汉语“排比”颇为相似,但不等同。从平行项数来看,它可以有两项,也可以有三项或三项以上,通常以二项或三项并行最为常见;就构成格式而言,它有单层次格式和多层次格式两种。 展开更多
关键词 修辞格 平行结构 排比 单层次格式 多层次格式
下载PDF
工件具有权重和服务等级约束的平行批在线排序算法
10
作者 王新鹏 柴幸 《南阳师范学院学报》 CAS 2024年第5期49-54,共6页
探讨两台机器上工件具有权重和服务等级约束的平行批在线排序问题。根据工件和机器的特性,有相应的等级约束。工件只能在服务等级不高于自身等级的机器上加工。工件按时在线释放,具有权重和相同的加工时间。机器可以平行批处理工件,在... 探讨两台机器上工件具有权重和服务等级约束的平行批在线排序问题。根据工件和机器的特性,有相应的等级约束。工件只能在服务等级不高于自身等级的机器上加工。工件按时在线释放,具有权重和相同的加工时间。机器可以平行批处理工件,在不超过批容量的情形下,多个工件可以用一台机器在一批中同时进行加工。目标函数是最小化所有工件的最大加权完工时间。讨论该问题的时间在线排序算法,给出了在线算法竞争比的下界,并设计了与下界√5+1/2匹配的最好可能的在线算法。 展开更多
关键词 排序 时间在线 服务等级 权重 平行批
下载PDF
56 Gbit/s低功耗分数间隔FFE PAM4 SerDes发射机设计
11
作者 王新武 张长春 +1 位作者 张翼 王静 《微电子学》 CAS 北大核心 2024年第2期235-242,共8页
采用65 nm CMOS工艺设计了一款用于高速芯片互联的四电平脉冲幅度调制(PAM4) SerDes发射机。该发射机主要由最高有效位通道和最低有效位通道、时钟产生路径、前馈均衡模块、接口驱动电路等构成。采用一种无锁存的并串转换技术,以降低功... 采用65 nm CMOS工艺设计了一款用于高速芯片互联的四电平脉冲幅度调制(PAM4) SerDes发射机。该发射机主要由最高有效位通道和最低有效位通道、时钟产生路径、前馈均衡模块、接口驱动电路等构成。采用一种无锁存的并串转换技术,以降低功耗;采用一种分数型前馈均衡技术,获得了超出奈奎斯特频率点的频率补偿峰值,从而扩展频率补偿范围,使输出信号能更好地适应信道。此外,采用带预充电结构的4∶1并串转换器,减小电荷共享效应对电路的影响。仿真结果表明,在1 V电源电压下,整体电路能实现56 Gbit/s PAM4输出信号,输出眼图清晰,且获得电平失配率为93.1%的高线性度,输出摆幅达到480 mV,功耗为75 mW。 展开更多
关键词 四电平脉冲幅度调制 无锁存并串转换 分数型前馈均衡 高线性度 SERDES
下载PDF
Level set函数重新初始化的并行快速步进法 被引量:4
12
作者 黄筱云 董国海 +1 位作者 赵利平 程永舟 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2016年第5期666-671,689,共7页
为提高level set函数重新初始化的计算效率,基于分区并行思想,提出一种快速步进法的并行策略,实现level set函数的快速并行重新初始化。通过对圆球、五叶管和圆环管等算例的level set函数重新初始化,讨论了新并行算法的准确性和效率。... 为提高level set函数重新初始化的计算效率,基于分区并行思想,提出一种快速步进法的并行策略,实现level set函数的快速并行重新初始化。通过对圆球、五叶管和圆环管等算例的level set函数重新初始化,讨论了新并行算法的准确性和效率。结果表明,与串行快速步进法相比,并行算法保留了串行算法的精度,仍基本保持在1阶左右,同时显著减少了重新初始化的计算时间,特别在8线程条件下,所获的最佳加速比能够达到5。 展开更多
关键词 level set函数 重新初始化 快速步进法 并行 分区 并行算法 加速比
下载PDF
初始含水率对三江并流区消落带含根土壤崩解性的影响
13
作者 保锐琴 段青松 +5 位作者 李建兴 黄广杰 张立芸 熊寿德 陈正发 王建文 《云南农业大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第1期175-183,共9页
【目的】研究初始含水率对三江并流区消落带含根土壤崩解性的影响,为该区域消落带土壤侵蚀防控和植被恢复提供依据。【方法】通过野外崩解试验测定不同初始含水率下狗牙根(Cynodon dactylon)、美人蕉(Canna indica)、风车草(Cyperus alt... 【目的】研究初始含水率对三江并流区消落带含根土壤崩解性的影响,为该区域消落带土壤侵蚀防控和植被恢复提供依据。【方法】通过野外崩解试验测定不同初始含水率下狗牙根(Cynodon dactylon)、美人蕉(Canna indica)、风车草(Cyperus alternifolius)、花叶芦竹(Arundo donax var.versicolor)和菖蒲(Acorus calamus)5种消落带适生植物原状含根土壤的崩解指标,用根系分析仪分析其根系特征,并分析崩解指标与根系特征的相关性。【结果】初始含水率为7.2%、11.4%、15.2%和36.7%(饱和)时,有根处理的平均崩解量分别为素土的77.0%、92.4%、112.1%和362.8%,崩解速率分别为素土的71.4%、106.6%、127.5%和400.0%。在非饱和状态,直径≤1 mm的根系具有明显的抗崩解作用,而直径>2 mm的根系具有促进崩解的作用;在饱和状态,直径≤1 mm的根系特征与崩解量和崩解速率的关系均不明显,直径>1 mm的根系具有促进崩解的作用。5种植物根系中,以狗牙根的抗崩解性最强,美人蕉最弱。【结论】初始含水率较低时,草本植物根系能抑制土壤崩解;初始含水率较大时,根系会促进土壤崩解。直径>2 mm的根系具有促进崩解的作用,在三江并流区消落带植被恢复中,在适生性的前提下应优选细根植物。 展开更多
关键词 初始含水率 三江并流区 消落带 草本植物根系 土壤崩解
下载PDF
并联三电平光伏并网逆变器中点电压控制策略
14
作者 史可鉴 代子阔 +1 位作者 李海峰 王智博 《电力电子技术》 2024年第2期68-70,114,共4页
针对光伏并网三电平逆变器并联系统的中点电位控制问题,传统的双调制波法无法保证开关周期内平均中点电流始终为零,从而无法有效消除中点电压的低频波动。为此,提出了一种基于改进双调制波法的中点电压控制策略。该策略通过对传统双调... 针对光伏并网三电平逆变器并联系统的中点电位控制问题,传统的双调制波法无法保证开关周期内平均中点电流始终为零,从而无法有效消除中点电压的低频波动。为此,提出了一种基于改进双调制波法的中点电压控制策略。该策略通过对传统双调制法重构的调制波进行修正,在不影响并联系统输出电压的前提下保证平均中点电流始终为零,不仅可以实现中点电压的平衡控制而且具有良好的动态性能。实验结果验证了所提策略的可行性和有效性。 展开更多
关键词 光伏并网三电平逆变器 并联系统 双调制波法
下载PDF
快速粒子level set方法的并行化
15
作者 黄筱云 夏波 +1 位作者 程永舟 赵利平 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2018年第9期1478-1484,共7页
为缩短快速粒子level set(FPLS)方法追踪交界面的时间,分别运用区域分解和粒子分解算法来减少欧拉计算(level set对流方程和重新初始化)和拉格朗日计算(粒子时程积分和误差校正)的开销。算法采用OpenMP技术来实现,并通过Zalesak圆盘、... 为缩短快速粒子level set(FPLS)方法追踪交界面的时间,分别运用区域分解和粒子分解算法来减少欧拉计算(level set对流方程和重新初始化)和拉格朗日计算(粒子时程积分和误差校正)的开销。算法采用OpenMP技术来实现,并通过Zalesak圆盘、单涡以及三维变形等典型算例进行验证。计算结果表明:4线程下加速比能超过2,8线程下加速比也能接近4,并行化的FPLS方法具有良好的实用性和可扩展性。 展开更多
关键词 快速粒子level SET方法 并行 区域分解 粒子分解 OPENMP Zalesak圆盘 单涡
下载PDF
基于多级并行蚁群算法的智能医疗建筑综合布线系统设计
16
作者 凌杰 《现代传输》 2024年第2期76-79,共4页
最小生成树算法(Minimum Spanning Tree,MST)是一种用于在加权连通图中找到最小生成树的算法。其目标是选择连接所有顶点并且边权重之和最小的边的子集。改进的A算法通过动态评估优先级来进行搜索。这种评估方式能够通过启发信息的引导... 最小生成树算法(Minimum Spanning Tree,MST)是一种用于在加权连通图中找到最小生成树的算法。其目标是选择连接所有顶点并且边权重之和最小的边的子集。改进的A算法通过动态评估优先级来进行搜索。这种评估方式能够通过启发信息的引导。由于智能医疗建筑综合布线系统架构复杂,导致最小树算法、改进A*算法在安全方面较差,因此,提出基于多级并行蚁群算法的智能医疗建筑综合布线系统设计。在系统的硬件设计上,设计配线架,之后进入嵌入式处理器,最后到达随机存取存储器。在系统的软件设计上,构建医疗建筑综合布线路径的目标函数,根据目标函数,建立布线规划约束条件,完成基于多级并行蚁群算法的最优建筑预埋布线方案求解。对该系统进行性能测试,结果表明,该系统在耗时方面表现较为稳定,满足实际应用需求。 展开更多
关键词 多级并行蚁群算法 智能医疗 建筑综合布线 系统设计
下载PDF
Level set函数快速步进重构并行算法的改进 被引量:4
17
作者 黄筱云 董国海 +1 位作者 常佳夫 蒋学炼 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2017年第6期836-842,共7页
为提高level set函数快速步进重构过程的并行计算效率,本文提出一种改进的分区并行重构算法。与原有分区并行算法相比,优化了子区域间的同步方案,缩短了level set函数并行重构的计算时间。运用OpenMP多线程技术,建立了相应的并行计算模... 为提高level set函数快速步进重构过程的并行计算效率,本文提出一种改进的分区并行重构算法。与原有分区并行算法相比,优化了子区域间的同步方案,缩短了level set函数并行重构的计算时间。运用OpenMP多线程技术,建立了相应的并行计算模型,实现了圆球、圆环管和哑铃等值面并行重构。并行重构数值结果表明:只要子区域均分初始表面边界,level set函数全局或局部并行重构均具有良好加速比,8线程的最大加速比可接近6。 展开更多
关键词 level set函数 快速步进法 重构 并行算法 多线程技术 OpenMP多线程技术
下载PDF
Level set函数快速步进并行重构的分区优化 被引量:1
18
作者 夏波 黄筱云 +2 位作者 陈同庆 程永舟 江诗群 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2019年第9期1601-1607,共7页
为进一步提升Level set函数重构的分区并行重构效率,本文采用均分交界面方式进行分区,并保证生成内边界重构节点数量最少。通过运用基于共享存储并行编程(OpenMP)多线程技术的并行计算模型,实现圆球、Zalesak球和哑铃等值面的并行重构... 为进一步提升Level set函数重构的分区并行重构效率,本文采用均分交界面方式进行分区,并保证生成内边界重构节点数量最少。通过运用基于共享存储并行编程(OpenMP)多线程技术的并行计算模型,实现圆球、Zalesak球和哑铃等值面的并行重构。计算结果表明:新分区方法能平衡子区域间计算荷载,减少子区域间信息传递次数和节点回滚次数,与均分区域方法相比,新分区方法能够获得更高计算速度,具有更好的实用性和可扩展性。 展开更多
关键词 level set函数 快速步进法 并行重构 分区优化 交界面 共享存储并行编程 多线程技术 加速比
下载PDF
上海建筑光伏电气设计思考
19
作者 黄晓波 《建筑电气》 2024年第3期39-42,4,共5页
从上海建筑光伏的地方政策入手,分析上海建筑光伏安装面积的确定方法;介绍在上海地方标准《民用建筑电气防火设计规程》修订版的研编过程中,提出的光伏直流电弧的防护方法、消防救援时组件级快速关断系统的设计,以及建筑光伏材质和安装... 从上海建筑光伏的地方政策入手,分析上海建筑光伏安装面积的确定方法;介绍在上海地方标准《民用建筑电气防火设计规程》修订版的研编过程中,提出的光伏直流电弧的防护方法、消防救援时组件级快速关断系统的设计,以及建筑光伏材质和安装位置的选择、最大电压限值的要求等技术措施。 展开更多
关键词 可再生能源 常规能源 初始发电效率 直流电弧 串联电弧 并联电弧 对地电弧 组件级快速关断
下载PDF
申威众核处理器访存与通信融合编译优化
20
作者 方燕飞 李雁冰 +2 位作者 董恩铭 王云飞 刘齐 《软件学报》 EI CSCD 北大核心 2024年第6期2648-2667,共20页
申威众核片上多级存储层次是缓解众核“访存墙”的重要结构.完全由软件管理的SPM结构和片上RMA通信机制给应用性能提升带来很多机会,但也给应用程序开发优化与移植提出了很大挑战.为充分挖掘片上存储层次特点提升应用程序性能,同时减轻... 申威众核片上多级存储层次是缓解众核“访存墙”的重要结构.完全由软件管理的SPM结构和片上RMA通信机制给应用性能提升带来很多机会,但也给应用程序开发优化与移植提出了很大挑战.为充分挖掘片上存储层次特点提升应用程序性能,同时减轻用户编程优化负担,提出一种多级存储层次访存与通信融合的编译优化方法.该方法首先设计融合编译指示,将程序高层信息传递给编译器.其次构建编译优化收益模型并设计启发式循环优化方案迭代求解框架,并由编译器完成循环优化方案的求解和优化代码的变换.通过编译生成的DMA和RMA批量数据传输操作,将较低存储层次空间中高访问延迟的核心数据批量缓冲进低访问延迟的更高存储层次空间中.在3个典型测试用例上进行优化实验测试与分析,结果表明所提出的优化在性能上与手工优化相当,较未优化版程序性能有显著提升. 展开更多
关键词 申威众核处理器 多级存储层次 RMA通信 并行语言 编译优化
下载PDF
上一页 1 2 27 下一页 到第
使用帮助 返回顶部