期刊文献+
共找到547篇文章
< 1 2 28 >
每页显示 20 50 100
Towards efficient deep neural network training by FPGA-based batch-level parallelism 被引量:4
1
作者 Cheng Luo Man-Kit Sit +3 位作者 Hongxiang Fan Shuanglong Liu Wayne Luk Ce Guo 《Journal of Semiconductors》 EI CAS CSCD 2020年第2期51-62,共12页
Training deep neural networks(DNNs)requires a significant amount of time and resources to obtain acceptable results,which severely limits its deployment in resource-limited platforms.This paper proposes DarkFPGA,a nov... Training deep neural networks(DNNs)requires a significant amount of time and resources to obtain acceptable results,which severely limits its deployment in resource-limited platforms.This paper proposes DarkFPGA,a novel customizable framework to efficiently accelerate the entire DNN training on a single FPGA platform.First,we explore batch-level parallelism to enable efficient FPGA-based DNN training.Second,we devise a novel hardware architecture optimised by a batch-oriented data pattern and tiling techniques to effectively exploit parallelism.Moreover,an analytical model is developed to determine the optimal design parameters for the DarkFPGA accelerator with respect to a specific network specification and FPGA resource constraints.Our results show that the accelerator is able to perform about 10 times faster than CPU training and about a third of the energy consumption than GPU training using 8-bit integers for training VGG-like networks on the CIFAR dataset for the Maxeler MAX5 platform. 展开更多
关键词 deep neural network TRAINING FPGA batch-level parallelism
下载PDF
A parallel two-level finite element method for the Navier-Stokes equations
2
作者 尚月强 罗振东 《Applied Mathematics and Mechanics(English Edition)》 SCIE EI 2010年第11期1429-1438,共10页
Based on domain decomposition, a parallel two-level finite element method for the stationary Navier-Stokes equations is proposed and analyzed. The basic idea of the method is first to solve the Navier-Stokes equations... Based on domain decomposition, a parallel two-level finite element method for the stationary Navier-Stokes equations is proposed and analyzed. The basic idea of the method is first to solve the Navier-Stokes equations on a coarse grid, then to solve the resulted residual equations in parallel on a fine grid. This method has low communication complexity. It can be implemented easily. By local a priori error estimate for finite element discretizations, error bounds of the approximate solution are derived. Numerical results are also given to illustrate the high efficiency of the method. 展开更多
关键词 Navier-Stokes equations finite element two-level method overlapping domain decomposition parallel algorithm
下载PDF
Utilizing Iso-Value Field Curves in Lieu of Magnetic Field Lines Amid Infinite and Parallel Electrical Wires
3
作者 Geoffroy Auvert 《Open Journal of Applied Sciences》 2024年第1期70-84,共15页
Building on a new model proposed recently for calculating constant electro-magnetic field values, the present article explores the electro-magnetic field configuration generated by parallel electrical wires. This impo... Building on a new model proposed recently for calculating constant electro-magnetic field values, the present article explores the electro-magnetic field configuration generated by parallel electrical wires. This imposes a reevaluation of the drawing procedure for constructing field curves with a constant field values around multiple parallel electrical conducting wires. To achieve this, we employ methods akin to those used for creating contours on topographical maps, ensuring a consistent numerical field value along the entire length of the field curves. Subsequent calculations will be conducted for scenarios where wires are not parallel. 展开更多
关键词 Specific Field Value parallel Electrical Wires Magnetic Field Vector Field around parallel Wires Topographic level Map
下载PDF
基于GPU集群的Level Set并行高精度演化 被引量:2
4
作者 袁斌 《计算物理》 CSCD 北大核心 2016年第3期253-265,共13页
设计实现基于张量积B样条的并行Level Set演化算法,张量积B样条提高了演化精度和并行度;每步演化都需要反算B样条系数.针对对角占优三对角方程组,设计实现基于精确LU分解的高精度并行追赶法,并用它反算B样条系数;采用两步通信方法,消除... 设计实现基于张量积B样条的并行Level Set演化算法,张量积B样条提高了演化精度和并行度;每步演化都需要反算B样条系数.针对对角占优三对角方程组,设计实现基于精确LU分解的高精度并行追赶法,并用它反算B样条系数;采用两步通信方法,消除通信的依赖关系,实现有效的并行通信.实验表明,本文的并行算法可以有效加速演化过程. 展开更多
关键词 B样条 level SET 混合并行 三对角方程组
下载PDF
Parallelism修辞格探微 被引量:3
5
作者 黎昌抱 《台州师专学报》 2001年第2期65-70,共6页
Parallelism意为“平行结构”,即将结构相同或相似、意义并重、语气一致的语言成分并行排列的一种修辞手法。它与汉语“排比”颇为相似,但不等同。从平行项数来看,它可以有两项,也可以有三项或三项以上,通常以二项或三项并行最为常见;... Parallelism意为“平行结构”,即将结构相同或相似、意义并重、语气一致的语言成分并行排列的一种修辞手法。它与汉语“排比”颇为相似,但不等同。从平行项数来看,它可以有两项,也可以有三项或三项以上,通常以二项或三项并行最为常见;就构成格式而言,它有单层次格式和多层次格式两种。 展开更多
关键词 修辞格 平行结构 排比 单层次格式 多层次格式
下载PDF
Level set函数重新初始化的并行快速步进法 被引量:4
6
作者 黄筱云 董国海 +1 位作者 赵利平 程永舟 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2016年第5期666-671,689,共7页
为提高level set函数重新初始化的计算效率,基于分区并行思想,提出一种快速步进法的并行策略,实现level set函数的快速并行重新初始化。通过对圆球、五叶管和圆环管等算例的level set函数重新初始化,讨论了新并行算法的准确性和效率。... 为提高level set函数重新初始化的计算效率,基于分区并行思想,提出一种快速步进法的并行策略,实现level set函数的快速并行重新初始化。通过对圆球、五叶管和圆环管等算例的level set函数重新初始化,讨论了新并行算法的准确性和效率。结果表明,与串行快速步进法相比,并行算法保留了串行算法的精度,仍基本保持在1阶左右,同时显著减少了重新初始化的计算时间,特别在8线程条件下,所获的最佳加速比能够达到5。 展开更多
关键词 level set函数 重新初始化 快速步进法 并行 分区 并行算法 加速比
下载PDF
快速粒子level set方法的并行化
7
作者 黄筱云 夏波 +1 位作者 程永舟 赵利平 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2018年第9期1478-1484,共7页
为缩短快速粒子level set(FPLS)方法追踪交界面的时间,分别运用区域分解和粒子分解算法来减少欧拉计算(level set对流方程和重新初始化)和拉格朗日计算(粒子时程积分和误差校正)的开销。算法采用OpenMP技术来实现,并通过Zalesak圆盘、... 为缩短快速粒子level set(FPLS)方法追踪交界面的时间,分别运用区域分解和粒子分解算法来减少欧拉计算(level set对流方程和重新初始化)和拉格朗日计算(粒子时程积分和误差校正)的开销。算法采用OpenMP技术来实现,并通过Zalesak圆盘、单涡以及三维变形等典型算例进行验证。计算结果表明:4线程下加速比能超过2,8线程下加速比也能接近4,并行化的FPLS方法具有良好的实用性和可扩展性。 展开更多
关键词 快速粒子level SET方法 并行 区域分解 粒子分解 OPENMP Zalesak圆盘 单涡
下载PDF
Level set函数快速步进重构并行算法的改进 被引量:4
8
作者 黄筱云 董国海 +1 位作者 常佳夫 蒋学炼 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2017年第6期836-842,共7页
为提高level set函数快速步进重构过程的并行计算效率,本文提出一种改进的分区并行重构算法。与原有分区并行算法相比,优化了子区域间的同步方案,缩短了level set函数并行重构的计算时间。运用OpenMP多线程技术,建立了相应的并行计算模... 为提高level set函数快速步进重构过程的并行计算效率,本文提出一种改进的分区并行重构算法。与原有分区并行算法相比,优化了子区域间的同步方案,缩短了level set函数并行重构的计算时间。运用OpenMP多线程技术,建立了相应的并行计算模型,实现了圆球、圆环管和哑铃等值面并行重构。并行重构数值结果表明:只要子区域均分初始表面边界,level set函数全局或局部并行重构均具有良好加速比,8线程的最大加速比可接近6。 展开更多
关键词 level set函数 快速步进法 重构 并行算法 多线程技术 OpenMP多线程技术
下载PDF
Level set函数快速步进并行重构的分区优化 被引量:1
9
作者 夏波 黄筱云 +2 位作者 陈同庆 程永舟 江诗群 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2019年第9期1601-1607,共7页
为进一步提升Level set函数重构的分区并行重构效率,本文采用均分交界面方式进行分区,并保证生成内边界重构节点数量最少。通过运用基于共享存储并行编程(OpenMP)多线程技术的并行计算模型,实现圆球、Zalesak球和哑铃等值面的并行重构... 为进一步提升Level set函数重构的分区并行重构效率,本文采用均分交界面方式进行分区,并保证生成内边界重构节点数量最少。通过运用基于共享存储并行编程(OpenMP)多线程技术的并行计算模型,实现圆球、Zalesak球和哑铃等值面的并行重构。计算结果表明:新分区方法能平衡子区域间计算荷载,减少子区域间信息传递次数和节点回滚次数,与均分区域方法相比,新分区方法能够获得更高计算速度,具有更好的实用性和可扩展性。 展开更多
关键词 level set函数 快速步进法 并行重构 分区优化 交界面 共享存储并行编程 多线程技术 加速比
下载PDF
Level set函数快速步进重构的隐式分区并行
10
作者 黄筱云 夏波 +1 位作者 程永舟 江诗群 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2020年第3期441-447,共7页
为进一步提高共享内存架构下level set函数重构并行效率,本文提出一种隐式分区并行重构方法,该方法无需提前进行区域分解,只需预先分割交界面,便可实现快速步进并行重构,且区域分解也同步进行。根据圆球、Zalesak球和哑铃等值面快速步... 为进一步提高共享内存架构下level set函数重构并行效率,本文提出一种隐式分区并行重构方法,该方法无需提前进行区域分解,只需预先分割交界面,便可实现快速步进并行重构,且区域分解也同步进行。根据圆球、Zalesak球和哑铃等值面快速步进并行重构结果表明:隐式分区算法的计算耗时小于显式分区算法;相同线程数量下隐式并行算法带来的加速比与显式算法接近,8线程下隐式分区并行算法的加速比达到4;隐式分区算法中节点重演次数少于显式分区算法节点回滚次数。 展开更多
关键词 level set函数 快速步进 重构 并行 隐式分区 共享内存 区域分解 加速比
下载PDF
Zero-sequence Circulating Current Reduction for Three-phase Three-level Modular Photovoltaic Grid-connected Systems 被引量:16
11
作者 ZHANG Xing SHAO Zhangping WANG Fusheng LIU Ping REN Kangle 《中国电机工程学报》 EI CSCD 北大核心 2013年第9期I0003-I0003,共1页
针对共享正、负母线和交流母线的三相三电平模块化光伏并网系统的零序环流问题,建立三电平模块化系统零序环流的等效模型,并根据激励源的不同将零序环流分成3类,提出一种共享正、负母线和中线的并联方案来抑制I类零序环流,及一种基于改... 针对共享正、负母线和交流母线的三相三电平模块化光伏并网系统的零序环流问题,建立三电平模块化系统零序环流的等效模型,并根据激励源的不同将零序环流分成3类,提出一种共享正、负母线和中线的并联方案来抑制I类零序环流,及一种基于改进型LCL滤波器的并联方案来抑制II、III类零序环流的高频分量,和采用零序环流控制器来抑制II、III类零序环流的低频分量。最后,通过10 kW的三相三电平模块化光伏并网系统的仿真和实验,证明了零序环流模型分析和抑制方法的正确性。 展开更多
关键词 光伏系统 光伏并网 循环电流 模块化 三相 零序 逆变器并联 闭合回路
下载PDF
PARALLEL ADAPTIVE SIMULATION OF A PLUNGING LIQUID JET 被引量:2
12
作者 Azat Yu.Galimov Onkar Sahni +3 位作者 Richard T.Lahey Jr. Mark S.Shephard Donald A.Drew Kenneth E.Jansen 《Acta Mathematica Scientia》 SCIE CSCD 2010年第2期522-538,共17页
This paper is concerned with three-dimensional numerical simulation of a plunging liquid jet. The transient processes of forming an air cavity around the jet, capturing an initially large air bubble, and the break-up ... This paper is concerned with three-dimensional numerical simulation of a plunging liquid jet. The transient processes of forming an air cavity around the jet, capturing an initially large air bubble, and the break-up of this large toroidal-shaped bubble into smaller bubbles were analyzed. A stabilized finite element method (FEM) was employed under parallel numerical simulations based on adaptive, unstructured grid and coupled with a level-set method to track the interface between air and liquid. These simulations show that the inertia of the liquid jet initially depresses the pool's surface, forming an annular air cavity which surrounds the liquid jet. A toroidal liquid eddy which is subse- quently formed in the liquid pool results in air cavity collapse, and in turn entrains air into the liquid pool from the unstable annular air gap region around the liquid jet. 展开更多
关键词 plunging liquid jet air entrainment two-phase flows level set method parallel adaptive simulation
下载PDF
Parallel spatial-temporal mode
13
作者 ZHU Ding-ju 《通讯和计算机(中英文版)》 2009年第4期42-46,共5页
关键词 空间时间模型 平行 数据流水线 计算机技术
下载PDF
基于多绘制管线的大规模并行体绘制性能优化技术
14
作者 王华维 刘若妍 +1 位作者 艾志玮 曹轶 《计算机工程》 CAS CSCD 北大核心 2024年第8期207-215,共9页
针对数值模拟输出的大规模科学数据,体绘制方法为了刻画复杂物理特征,会进行高密度光线采样,但由此带来了极大的计算开销和数据增量。在国产自主CPU高性能计算机上,由于处理器单核的计算能力低于商业CPU,只能使用更多的处理器核来分担... 针对数值模拟输出的大规模科学数据,体绘制方法为了刻画复杂物理特征,会进行高密度光线采样,但由此带来了极大的计算开销和数据增量。在国产自主CPU高性能计算机上,由于处理器单核的计算能力低于商业CPU,只能使用更多的处理器核来分担体绘制任务,从而引起了采样数据并行通信的可扩展性瓶颈。为充分利用国产自主CPU高性能计算机来高效完成体绘制任务,针对大规模并行体绘制提出一种基于多绘制管线的性能优化技术,通过多管线、多进程的两级并行模式来降低单条管线的并行规模。在大规模并行体绘制中,该技术将绘制目标图像划分成多个子区域,绘制进程则相应分组,每个进程组独立执行一条绘制管线,以完成图像相应子区域的绘制,最后再收集所有的图像子区域,形成完整图像并输出。实验结果表明,优化后的体绘制算法在国产自主CPU高性能计算机上可以扩展到万核规模,并能有效完成体绘制任务。 展开更多
关键词 体绘制 多管线 两级并行 并行可扩展性 性能优化
下载PDF
High Performance Motion Estimation Operator Using Multimedia Oriented Subword Parallelism
15
作者 Shafqat Khan Emmanuel Casseau 《通讯和计算机(中英文版)》 2012年第1期1-14,共14页
关键词 多媒体应用 并行处理 计算单位 运动估计 性能 资源利用率 经营单位 SWP
下载PDF
一种适用三电平并联系统的虚拟矢量调制策略
16
作者 杜燕 杨世友 +2 位作者 胡军龙 杨向真 苏建徽 《中国电机工程学报》 EI CSCD 北大核心 2024年第21期8629-8641,I0025,共14页
直流侧中点电位平衡和零序环流抑制是保证三电平逆变器并联系统正常运行的重要问题,然而基于冗余小矢量对调节的环流抑制方案进一步增加空间矢量脉宽调制(space vector pulse width modulation,SVPWM)中点电流无法对称消除的场景,加剧... 直流侧中点电位平衡和零序环流抑制是保证三电平逆变器并联系统正常运行的重要问题,然而基于冗余小矢量对调节的环流抑制方案进一步增加空间矢量脉宽调制(space vector pulse width modulation,SVPWM)中点电流无法对称消除的场景,加剧双机系统中点电位不平衡程度。该文基于虚拟矢量合成思路,提出一种满足零序环流抑制和中点电位平衡需求的双机虚拟矢量调制方法。该方法重新定义虚拟中矢量,通过缩短中矢量作用时间和增加参与合成的对称冗余小矢量以减少中点电流不平衡场景;分析不同扇区不同控制目标下虚拟矢量合成规则,利用相占空比法优化虚拟矢量的作用顺序,减少矢量合成过程中的开关次数。与传统SVPWM策略下中点电压变化量的对比分析表明,所提方法能够削弱环流抑制和中点电位平衡的耦合关系。最后,利用Starsim平台实验验证该策略的有效性。 展开更多
关键词 三电平并联系统 虚拟矢量 零序环流 中点电位平衡 相占空比法 开关次数
下载PDF
城市物流无人机平行航线横向间隔研究
17
作者 张健 赵嶷飞 +2 位作者 卢飞 罗鑫悦 黎宗孝 《交通信息与安全》 CSCD 北大核心 2024年第4期118-124,共7页
面向未来城市物流无人机高密飞行下安全运行需求,选取空域利用率高的平行航线,聚焦平行航线运行中碰撞风险,研究同时考虑冲突频率和碰撞概率的间隔模型,提出符合安全要求的平行航线横向间隔。借鉴有人机管制经验,确定安全目标水平,并以... 面向未来城市物流无人机高密飞行下安全运行需求,选取空域利用率高的平行航线,聚焦平行航线运行中碰撞风险,研究同时考虑冲突频率和碰撞概率的间隔模型,提出符合安全要求的平行航线横向间隔。借鉴有人机管制经验,确定安全目标水平,并以平行航线上相邻无人机纵向距离小于纵向间隔视为冲突评判标准,再根据实际运行数据,计算区域无人机冲突实际发生频率。综合考虑无人机参数、飞行流量、空域性能、偏离概率及角度、冲突探测与解脱机制等因素,构建多参数、多约束的平行航线城市物流无人机运行场景模拟平台。引入蒙特卡洛方法,给定冲突发生频率和意外偏离概率,假设无人机以一定概率因随机意外偏离而引发无人机之间飞行冲突,模拟冲突下无人机的运行结果,记录违反测试标准的事件。设定1~51 m多个横向间隔待选值,实施510万次仿真实验并统计实验结果,结果发现:①发生违反测试标准事件共计50302起;②事故发生的概率密度与横向间隔服从负指数分布;③可采用施加合适的横向间隔策略,实现安全目标水平。基于拟合的概率密度函数,通过计算剩余风险,对比安全目标水平,确定城市物流无人机平行航线横向间隔为33米。 展开更多
关键词 城市物流无人机 平行航线 碰撞风险 安全目标水平 蒙特卡洛
下载PDF
融合语义信息与物体级几何特征的实时动态激光SLAM算法
18
作者 兰凤崇 田小强 +2 位作者 陈吉清 车宇翔 周云郊 《汽车工程》 EI CSCD 北大核心 2024年第11期2028-2038,共11页
针对现有的激光SLAM算法在动态场景下鲁棒性差、定位与建图精度易受动态物体干扰的问题,提出了一种融合语义信息与物体级几何特征的实时动态激光SLAM算法Object-SuMa。首先通过地面滤波、物体分割、方向包围盒解算等过程,生成物体级几... 针对现有的激光SLAM算法在动态场景下鲁棒性差、定位与建图精度易受动态物体干扰的问题,提出了一种融合语义信息与物体级几何特征的实时动态激光SLAM算法Object-SuMa。首先通过地面滤波、物体分割、方向包围盒解算等过程,生成物体级几何特征并表示为纹理,用于并行计算和修正物体内部错误的语义分割结果;然后在配准过程中分解计算方向包围盒间的IOU,并基于包围盒IOU和语义分割结果引入物体级几何加权和语义加权,减少误匹配和动态点匹配;借助图形渲染管线构建并行计算过程,进行地面点配准和非地面点配准两步优化,降低计算复杂度和耗时;最后在KITTI里程计数据集测试表明,Object-SuMa算法相比SuMa++算法的相对位姿估计精度提升15%,ICP平均耗时下降17%,改善了动态场景下的激光SLAM定位精度和鲁棒性。 展开更多
关键词 激光SLAM 动态场景 物体级几何特征 语义信息 并行计算
下载PDF
大规模协同虚拟环境下并行层次兴趣匹配算法
19
作者 郦丽华 《齐齐哈尔大学学报(自然科学版)》 2024年第2期51-55,83,共6页
大规模协同虚拟环境运行过程中易产生大量冗余通信数据,影响虚拟现实技术性能的发挥。为了提升虚拟环境运行效率,提出并行层次兴趣匹配算法。创建协同虚拟环境概念模型,分解处理订阅区域信息,引入树结构理论搭建兴趣管理树,将订阅区域... 大规模协同虚拟环境运行过程中易产生大量冗余通信数据,影响虚拟现实技术性能的发挥。为了提升虚拟环境运行效率,提出并行层次兴趣匹配算法。创建协同虚拟环境概念模型,分解处理订阅区域信息,引入树结构理论搭建兴趣管理树,将订阅区域映射到兴趣管理树节点上,形成层次化结构,结合LSQR并行算法,实现更新区域与订阅区域的快速匹配。实验结果表明,提出算法获得的兴趣匹配消耗时间最小值为0.36 s,兴趣匹配成功指数最大值为0.94,充分证实了提出算法兴趣匹配性能较好。 展开更多
关键词 协同虚拟环境 兴趣匹配 多层次并行 大规模 并行算法 仿真场景
下载PDF
具有多层级货架的自动小车存取系统排队网建模与分析 被引量:1
20
作者 陈炫锐 刘晓鹏 +2 位作者 陈庆新 毛宁 张惠煜 《计算机集成制造系统》 EI CSCD 北大核心 2024年第4期1335-1352,共18页
为了满足多楼层生产车间之间的物料运输需求,同时减少企业成本,自动存取系统的设计问题变得愈发重要。带有多层级货架的自动小车存取系统因其优秀的吞吐能力和柔性,具有很好的应用前景。为了分析多层车间中带有多层级货架自动小车存取... 为了满足多楼层生产车间之间的物料运输需求,同时减少企业成本,自动存取系统的设计问题变得愈发重要。带有多层级货架的自动小车存取系统因其优秀的吞吐能力和柔性,具有很好的应用前景。为了分析多层车间中带有多层级货架自动小车存取系统并行作业的性能,在分析自动导引小车(AGV)和电梯、伸缩臂作业方式的基础上,构建了半开排队网络模型,并设计了基于近似均值分析法的近似求解算法。该方法首先将半开排队网内部网络分为不同的单独网络模型,并分别重构为等效的闭排队网络模型。这些网络模型最终被聚合成一个节点,与外部的同步节点联合构建闭排队网络模型求解吞吐率。最后,针对内部网络的单独节点进行分析计算,得到其他系统性能指标。通过设计仿真实验,验证了所提方法的有效性和准确性。 展开更多
关键词 自动小车存取系统 多层级货架 并行作业 排队网络模型 性能分析
下载PDF
上一页 1 2 28 下一页 到第
使用帮助 返回顶部