期刊文献+
共找到31篇文章
< 1 2 >
每页显示 20 50 100
基于异构系统的多级并行稀疏张量向量乘算法
1
作者 陈玥丹 肖国庆 +3 位作者 阳王东 金纪勇 龙军 李肯立 《计算机学报》 EI CSCD 北大核心 2024年第2期441-455,共15页
张量在许多实际应用中被用来表示大规模、多源、高维、多模态的数据.稀疏张量分解作为挖掘数据中隐藏信息的有效方法之一,已被广泛应用于机器学习、文本分析、生物医疗等研究领域中.稀疏张量向量乘(Sparse Tensor-VectorMultiplication,... 张量在许多实际应用中被用来表示大规模、多源、高维、多模态的数据.稀疏张量分解作为挖掘数据中隐藏信息的有效方法之一,已被广泛应用于机器学习、文本分析、生物医疗等研究领域中.稀疏张量向量乘(Sparse Tensor-VectorMultiplication,SpTV)是张量分解中最基础、耗时最多的运算之一.为加速大数据和人工智能相关应用的运行效率,本文提出了基于CPU-GPU异构结构的多级并行SpTV加速算法.首先,为了将SpTV运算映射到混合、多级并行的分布式CPU-GPU异构多/众核构架,本文设计了一种多维并行SpTV划分方法,采用面向节点级并行的N-1维张量划分和面向GPU线程级并行的矩阵划分,充分利用计算节点间和节点内的多级并行计算能力.其次,设计了一种基于稀疏张量纤维的压缩存储格式,压缩稀疏张量的内存占用,优化SpTV运算的计算和访存模式.最后,提出了基于多流并行的异构高效SpTV算法,进一步设计了稀疏张量的细粒度划分方法、多流并行运行机制和基于张量块排序的多流并行优化技术,实现了SpTV运算中通信开销和计算开销的相互重叠与隐藏.实验结果表明,与相关工作aeSpTV相比,所提出的SpTV算法在所有测试数据集上最高能够获得3.28倍的加速比. 展开更多
关键词 CPU-GPU 异构并行计算 多级并行 稀疏张量 张量运算
下载PDF
基于多级并行蚁群算法的智能医疗建筑综合布线系统设计
2
作者 凌杰 《现代传输》 2024年第2期76-79,共4页
最小生成树算法(Minimum Spanning Tree,MST)是一种用于在加权连通图中找到最小生成树的算法。其目标是选择连接所有顶点并且边权重之和最小的边的子集。改进的A算法通过动态评估优先级来进行搜索。这种评估方式能够通过启发信息的引导... 最小生成树算法(Minimum Spanning Tree,MST)是一种用于在加权连通图中找到最小生成树的算法。其目标是选择连接所有顶点并且边权重之和最小的边的子集。改进的A算法通过动态评估优先级来进行搜索。这种评估方式能够通过启发信息的引导。由于智能医疗建筑综合布线系统架构复杂,导致最小树算法、改进A*算法在安全方面较差,因此,提出基于多级并行蚁群算法的智能医疗建筑综合布线系统设计。在系统的硬件设计上,设计配线架,之后进入嵌入式处理器,最后到达随机存取存储器。在系统的软件设计上,构建医疗建筑综合布线路径的目标函数,根据目标函数,建立布线规划约束条件,完成基于多级并行蚁群算法的最优建筑预埋布线方案求解。对该系统进行性能测试,结果表明,该系统在耗时方面表现较为稳定,满足实际应用需求。 展开更多
关键词 多级并行蚁群算法 智能医疗 建筑综合布线 系统设计
下载PDF
THAFTS-Acoustic软件全流程多级并行与容错设计
3
作者 吕小敬 邹明松 +2 位作者 刘钊 徐金秀 冷文浩 《船舶力学》 EI CSCD 北大核心 2023年第11期1729-1736,共8页
经过多年的技术发展,三维水弹性计算软件声学分析模块THAFTS-Acoustic已成为船海领域声固耦合分析的重要工具。随着计算量的不断增加,高性能计算能力成为制约该软件实现工程应用的关键因素之一。本文首先对软件核心求解模块的计算特征... 经过多年的技术发展,三维水弹性计算软件声学分析模块THAFTS-Acoustic已成为船海领域声固耦合分析的重要工具。随着计算量的不断增加,高性能计算能力成为制约该软件实现工程应用的关键因素之一。本文首先对软件核心求解模块的计算特征进行详细分析,发现软件在不同计算阶段计算密集度相差悬殊,数据间计算耦合方式不规则,单一并行模式无法保障所有核心段的高效并行。然后基于神威太湖之光超级计算系统设计实现混合异构多级并行算法和容错功能,提高软件的计算效率,并规避软硬件故障风险。最后,通过大规模并行算例测试全流程多级并行版本的加速性能。结果表明,以5万核心测试为基准,软件在百万核心运行时并行效率超过了38.3%。 展开更多
关键词 三维水弹性 神威太湖之光 多级并行 容错
下载PDF
基于多级并行处理的R-D方法的ISAR实时成像 被引量:3
4
作者 杨剑 杜琳琳 +1 位作者 辛玉林 陈曾平 《宇航学报》 EI CAS CSCD 北大核心 2010年第5期1427-1432,共6页
论文对ISAR成像中R-D成像算法进行了介绍,在通用信号处理单元上合理地分配任务和映射算法,设计了多级并行处理的信号处理机结构,实现了R-D方法的ISAR实时成像处理。应用DMA方式实现数据的高速交互,利用二维DMA实现矩阵转置运算,并对程... 论文对ISAR成像中R-D成像算法进行了介绍,在通用信号处理单元上合理地分配任务和映射算法,设计了多级并行处理的信号处理机结构,实现了R-D方法的ISAR实时成像处理。应用DMA方式实现数据的高速交互,利用二维DMA实现矩阵转置运算,并对程序进行优化设计,有效提高了算法执行效率。最后对处理结果和性能进行了分析,经过对PC机和实时信号处理机的成像结果对比,证明算法的实现是成功的。 展开更多
关键词 多级并行 实时成像 ISAR 信号处理
下载PDF
基于OpenACC编程模型的逆时偏移多级并行的设计与优化 被引量:8
5
作者 赵虎 武泗海 +2 位作者 尹成 唐泽凯 贾鹏 《石油地球物理勘探》 EI CSCD 北大核心 2018年第6期1307-1313,1325,I0008,I0009,共10页
OpenCL和CUDA等GPU并行编程模型在波场数值模拟、偏移成像等领域已经得到广泛应用,但二者都破坏原有的串行代码而重新设计并行算法,会增加并行实现的难度和工作量。本文将一种新的GPU并行编程模型OpenACC应用于逆时偏移计算,通过添加编... OpenCL和CUDA等GPU并行编程模型在波场数值模拟、偏移成像等领域已经得到广泛应用,但二者都破坏原有的串行代码而重新设计并行算法,会增加并行实现的难度和工作量。本文将一种新的GPU并行编程模型OpenACC应用于逆时偏移计算,通过添加编译指令实现节点间/节点内的进程/线程级的多级并行方案,是一种更便捷、高效的异构并行技术。对多级并行的数据通信进行优化,实现了叠前偏移成像的多级异构并行加速。数值实验结果表明文中多级并行方案可以有效地解决逆时偏移计算量大和存储量大的问题;经过数据通信的优化后,可以显著提高逆时偏移的计算效率。 展开更多
关键词 GPU编程 OpenACC 逆时偏移 多级并行
下载PDF
超宽带发射参考系统中的多级并行检测
6
作者 廖学文 朱世华 曾二林 《电波科学学报》 EI CSCD 北大核心 2007年第6期995-1001,共7页
针对超宽带技术中块发送结构下的发射参考技术,提出了一种新的多级并行检测算法。该方法利用少量参考帧与块内接收数据帧对理想接收波形进行多级联合估计,通过软判决逐级逼近理想接收波形,最大限度地利用了数据帧本身包含的脉冲接收波... 针对超宽带技术中块发送结构下的发射参考技术,提出了一种新的多级并行检测算法。该方法利用少量参考帧与块内接收数据帧对理想接收波形进行多级联合估计,通过软判决逐级逼近理想接收波形,最大限度地利用了数据帧本身包含的脉冲接收波形信息,提高了误码性能。利用随机向量二次型的矩生成函数及其积分,推导了该检测算法在任意给定块结构时的性能下界。采用IEEE802.15.3a的室内多径信道模型仿真表明,与传统发射参考接收机和其他块发送结构下的检测方案相比,该检测算法具有更好的误码性能,并由仿真性能和分析下界得到了关于块结构和不同块长对性能影响的一系列结论。 展开更多
关键词 超宽带 发射参考 广义似然比检测 多级并行检测 矩生成函数
下载PDF
多级并行部分干扰抵消算法的CDMA系统性能
7
作者 韦惠民 李白萍 《长安大学学报(自然科学版)》 EI CAS CSCD 北大核心 2002年第6期99-102,共4页
分析了多级并行部分干扰抵消算法应用于 CDMA系统的性能。建立了系统信号模型 ,给出计算误码率的公式。对多级并行完全干扰抵消算法与多级并行部分干扰抵消算法进行了比较 ,认为部分干扰抵消算法比完全干扰抵消算法性能优越。
关键词 算法 系统性能 CDMA 多级并行干扰抵消 完全干扰抵消 部分干扰抵消 系统信号模型 码分多址移动通信系统
下载PDF
采用多级并行干扰抵消算法的CDMA系统抗多径性能分析
8
作者 韦惠民 梁双春 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2002年第2期241-244,共4页
采用RAKE接收机和横向滤波器的多级并行干扰抵消算法 ,应用于存在多径衰落时码分多址系统 .建立了系统信号模型 ,采用改进的误码率计算公式 ,给出计算机仿真结果 .
关键词 码分多址系统 多级并行干扰抵消算法 信号模型 抗多径性能分析
下载PDF
多级并行结构的NAND Flash存储盘设计
9
作者 刘作龙 王乐 刘帅 《航空计算技术》 2014年第3期113-117,共5页
针对Flash长操作延时等特点,为提升吞吐率,采用多级并行架构,通过通道级、芯片级、逻辑阵列级和面级并行操作,并配以簇映射机制,设计了多级并行的NAND Flash存储盘,通过实际验证,基于多级并行结构的存储盘的读写性能取得一定提升。
关键词 存储盘 多级并行 NAND闪存 簇映射机制
下载PDF
针对特普利茨线性系统的多级并行算法
10
作者 张哲 《计算机工程》 CAS CSCD 北大核心 2011年第1期36-38,共3页
利用并行体系结构中不同层次级别的内存和计算单元,提出一种求解对称结构化特普利茨线性系统的多级并行算法。通过数学推导将特普利茨线性系统转换成柯西式线性系统,利用消息传递接口和开放多平台共享内存并行程序设计工具实现该算法,... 利用并行体系结构中不同层次级别的内存和计算单元,提出一种求解对称结构化特普利茨线性系统的多级并行算法。通过数学推导将特普利茨线性系统转换成柯西式线性系统,利用消息传递接口和开放多平台共享内存并行程序设计工具实现该算法,并通过实验验证其可行性。 展开更多
关键词 特普利茨矩阵 柯西式矩阵 多级并行程序设计 消息传递接口 开放多平台共享内存并行程序设计
下载PDF
IXP2400的网络测试系统的多级并行处理技术 被引量:1
11
作者 刘瑞东 吴素琴 +1 位作者 安克 魏帅 《小型微型计算机系统》 CSCD 北大核心 2008年第6期1126-1129,共4页
多级并行处理问题一直是计算机及其网络设计、应用的一个重要问题.本文针对IXP2400这一多核可编程芯片的多处理器并行化问题进行应用研究,提出一种兼顾处理能力与开发灵活性的多级并行技术.以"基于网络处理器的网络测试系统"... 多级并行处理问题一直是计算机及其网络设计、应用的一个重要问题.本文针对IXP2400这一多核可编程芯片的多处理器并行化问题进行应用研究,提出一种兼顾处理能力与开发灵活性的多级并行技术.以"基于网络处理器的网络测试系统"为应用实例,重点分析微引擎并行方案及线程级静态调度算法,并通过WorkBench仿真及七种以太帧平均最大发送速率实测结果对方案、算法进行验证.最后总结并展望了本文提出技术的前景. 展开更多
关键词 网络处理器 多级并行 线程并行 基准测试 仿真测试
下载PDF
遥感卫星图像系统几何校正多级并行算法 被引量:1
12
作者 李雨航 李景山 赵仕美 《遥感信息》 CSCD 北大核心 2016年第3期51-55,共5页
针对遥感卫星图像数据量大、系统几何校正计算复杂的问题,提出了基于SMP机群的系统几何校正多级并行算法。该算法利用MPI+OpenMP并行编程技术,节点间实现进程级粗粒度的并行,节点内实现线程级细粒度的并行。采用基于冗余存储的数据划分... 针对遥感卫星图像数据量大、系统几何校正计算复杂的问题,提出了基于SMP机群的系统几何校正多级并行算法。该算法利用MPI+OpenMP并行编程技术,节点间实现进程级粗粒度的并行,节点内实现线程级细粒度的并行。采用基于冗余存储的数据划分方式,保证了各个节点的负载均衡,减少了数据定位的复杂度;利用并行文件系统进行数据分配,避免了节点间的数据搬移,实现了数据并行读写,节点内部的并行,进一步细化了算法的并行粒度。在SMP机群系统上对资源三号卫星正视相机图像进行算法验证。结果表明,该算法充分利用了SMP机群的计算资源,具有良好的并行性能。 展开更多
关键词 SMP机群 系统几何校正 多级并行 MPI OPENMP 加速比
下载PDF
多级并行流水FIR数字滤波器的设计与验证 被引量:5
13
作者 郭广浩 刘志哲 +1 位作者 孟庆龙 马承光 《现代电子技术》 北大核心 2015年第1期69-72,共4页
在雷达接收、语音图像处理、模式识别、无线通信等领域,数字滤波器已经成为重要组成部分。通过分析和研究FIR数字滤波器的结构特点,结合实际的工程实践需求,设计了一种多级并行流水FIR数字滤波器,并提出了一种精确而又简便的冲击响应系... 在雷达接收、语音图像处理、模式识别、无线通信等领域,数字滤波器已经成为重要组成部分。通过分析和研究FIR数字滤波器的结构特点,结合实际的工程实践需求,设计了一种多级并行流水FIR数字滤波器,并提出了一种精确而又简便的冲击响应系数的量化方法,即基于最小冲击响应系数按等比例量化的方法。这种方法不仅可以根据具体的设计要求随意更改设计位宽,还能保障设计的精度。通过编写Verilog HDL进行了设计实现,Modelsim仿真与Matlab仿真对比结果表明,各项参数均满足设计要求。 展开更多
关键词 FIR数字滤波器 多级并行流水 等比例量化 设计与验证
下载PDF
多级并行干扰抵消算法的CDMA系统性能分析
14
作者 梁双春 韦惠民 《西安科技学院学报》 北大核心 2001年第1期81-84,88,共5页
分析了多级并行完全干扰抵消算法和多级并行部分干扰抵消算法应用于存在定时误差的CDMA系统中的性能。建立了系统信号模型 ,给出计算误码率的公式。作了在有远近效应情况下的性能比较。得出多级并行干扰抵消算法比传统的单用户检测性能... 分析了多级并行完全干扰抵消算法和多级并行部分干扰抵消算法应用于存在定时误差的CDMA系统中的性能。建立了系统信号模型 ,给出计算误码率的公式。作了在有远近效应情况下的性能比较。得出多级并行干扰抵消算法比传统的单用户检测性能优越 ,部分干扰抵消算法比完全干扰抵消算法性能优越的结论。 展开更多
关键词 CDMA 多级并行干扰抵消 完全干扰抵消 部分干扰抵消
下载PDF
基于多级并行策略的复杂产品多学科设计优化 被引量:2
15
作者 王丹丹 梁浩 +2 位作者 宋蕾 方立桥 赖宇阳 《计算机辅助工程》 2018年第3期39-43,共5页
针对复杂产品设计需要进行多学科协作设计和优化的问题,结合计算机应用技术提出基于多级并行策略的多学科优化方法。该方法基于过程建模的层次化优化思想,实现复杂产品设计过程的自动化和优化。减速器标准多学科优化算例说明该方法可实... 针对复杂产品设计需要进行多学科协作设计和优化的问题,结合计算机应用技术提出基于多级并行策略的多学科优化方法。该方法基于过程建模的层次化优化思想,实现复杂产品设计过程的自动化和优化。减速器标准多学科优化算例说明该方法可实现不同学科的层次化并行优化。将该方法与其他传统的多学科优化方法进行比较,验证该方法的高效性和最优设计的准确性。 展开更多
关键词 多学科优化 多级并行 试验设计 近似模型 系统级 子系统级
下载PDF
一种基于CUDA的K-Means多级并行优化方法 被引量:1
16
作者 方玉玲 那丽春 《小型微型计算机系统》 CSCD 北大核心 2021年第7期1547-1553,共7页
K-Means聚类算法是data mining领域中最常用的算法之一.在进行海量数据分析时,K-Means均值聚类的计算时间与其要处理的计算量成正比.因此,数据量越大计算开销也越长.为了提升算法的运算性能,本文设计了一种基于CUDA模型的多级并行的K-Me... K-Means聚类算法是data mining领域中最常用的算法之一.在进行海量数据分析时,K-Means均值聚类的计算时间与其要处理的计算量成正比.因此,数据量越大计算开销也越长.为了提升算法的运算性能,本文设计了一种基于CUDA模型的多级并行的K-Means算法优化方法.将K-Means串行算法并行化,并对并行计算部分进行包括线程块级,线程级,指令级,比特级在内的多级性能优化.首先,在计算样本点与聚类中心距离的核函数中,采用矩阵乘的思想对主要步骤进行并行处理,初步提升算法性能;然后,对核函数的线程块,块中线程数,每线程执行的指令数及比特数进行逐级分析和优化.在合理利用计算资源和存储资源的同时提升算法计算性能,使聚类效果达到最优;最后,通过多项实验对本文方法进行仿真和验证,检验其可行性.结果表明,在保证实验结果准确性的情况下,与其它优化并行算法相比,本文方法最高加速比达到了39.7%,平均加速比达到了22.3%,同时降低了GPU资源占用率. 展开更多
关键词 K-MEANS 并行计算 CUDA 多级并行优化
下载PDF
面向水文模拟的大规模多级并行参数率定框架
17
作者 全婷 李强 +1 位作者 聂宁明 田在荣 《青岛大学学报(自然科学版)》 CAS 2021年第3期14-21,共8页
为了实现大尺度水文模拟中的参数率定,提出一种基于优化算法的大规模多级并行参数率定框架。首先利用MPI划分子通信域的技术,实现了多级并行处理框架,其次设计了基于对等模式的整体架构,以充分利用处理器资源,最后使用大量非阻塞式通信... 为了实现大尺度水文模拟中的参数率定,提出一种基于优化算法的大规模多级并行参数率定框架。首先利用MPI划分子通信域的技术,实现了多级并行处理框架,其次设计了基于对等模式的整体架构,以充分利用处理器资源,最后使用大量非阻塞式通信的方式优化了计算效率,减少了进程间等待。将该框架应用于HIMS水文模型的参数率定,试验结果表明,对等多级并行框架相对于主从并行框架具有更好的寻优效果,利用非阻塞式通信,在寻优效率上有所提升。该框架能够高效地利用大规模处理器且有效地缩短运行时间,提升了参数优化的整体效率,具有良好的扩展性。 展开更多
关键词 水文模拟 大规模参数率定 对等式多级并行框架 非阻塞式通信 优化算法
下载PDF
大型PLC多级并行冗余系统的设计技巧 被引量:3
18
作者 张彤 《微计算机信息》 2002年第6期4-5,14,共3页
在大型工业电气自动化控制系统设计的时候,经常会遇到一些可靠性要求较高的设计内容,需要双机热备份。在一台系统出现故障之后,另外一台系统自动切换到备用的设备上。设计并行系统切换,甚至多级这样的并行部件串接在在一起,需要用户考... 在大型工业电气自动化控制系统设计的时候,经常会遇到一些可靠性要求较高的设计内容,需要双机热备份。在一台系统出现故障之后,另外一台系统自动切换到备用的设备上。设计并行系统切换,甚至多级这样的并行部件串接在在一起,需要用户考虑的问题千头万绪,往往不容易理出头绪或者很清晰地进行系统设计。本文给出通用的程序设计方法。 展开更多
关键词 可编程序控制器 大型 PLC 多级并行冗余系统 设计
下载PDF
结构模态多级分层并行计算方法
19
作者 喻高远 楼云锋 +1 位作者 李俊杰 金先龙 《振动与冲击》 EI CSCD 北大核心 2023年第16期19-25,共7页
基于稀疏存储技术和传统并行模态综合法提出了一种有限元结构模态分析多级分层并行计算方法。该方法在两级分区4次变换策略的基础上不仅实现了大量数据的分布式稀疏存储,提高了数据的内存访问效率,而且实现了系统整体缩减后的广义特征... 基于稀疏存储技术和传统并行模态综合法提出了一种有限元结构模态分析多级分层并行计算方法。该方法在两级分区4次变换策略的基础上不仅实现了大量数据的分布式稀疏存储,提高了数据的内存访问效率,而且实现了系统整体缩减后的广义特征方程规模的有效降低,大幅度减少了广义特征方程的求解时间。此外,它还利用计算任务和异构众核集群硬件体系结构映射实现了计算过程的多级并行,不仅有效改善了不同层级的负载均衡,而且通过通信分离有效提高了通信效率。因此,它能够充分利用异构众核分布式存储并行计算机的体系结构特点提升大规模有限元模态并行计算效率。数值算例表明,相比于传统的并行模态综合法,稀疏存储格式模态多级分层并行方法能够大幅度节省内存空间和提高计算效率。 展开更多
关键词 异构众核 多级分层并行 负载均衡 稀疏存储 大规模模态分析
下载PDF
大型PLC多级并行冗余系统的设计技巧
20
作者 张彤 《电力建设》 北大核心 2002年第7期24-25,34,共3页
在大型工业电气自动化控制系统设计的时候 ,经常会遇到一些可靠性要求较高的设备需要双机热备份。在 1台设备出现故障之后 ,控制系统自动切换到另 1台备用的设备上。但是 ,当实际接触到并行系统切换的设计 ,尤其是多级并行部件串接在一... 在大型工业电气自动化控制系统设计的时候 ,经常会遇到一些可靠性要求较高的设备需要双机热备份。在 1台设备出现故障之后 ,控制系统自动切换到另 1台备用的设备上。但是 ,当实际接触到并行系统切换的设计 ,尤其是多级并行部件串接在一起的多级并行系统切换的设计时 ,需要用户考虑的问题千头万绪 ,往往不容易理出头绪或者很清晰地进行系统设计。因此 ,需要给出通用的程序设计方法 。 展开更多
关键词 PLC程序 多级并行 冗余 STEP7 设计
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部