期刊文献+
共找到241篇文章
< 1 2 13 >
每页显示 20 50 100
基于国产DCU异构平台的图匹配算法移植与优化
1
作者 郝萌 田雪洋 +3 位作者 鲁刚钊 刘义 张伟哲 何慧 《计算机科学》 CSCD 北大核心 2024年第4期67-77,共11页
子图匹配是一种基础的图算法,被广泛应用于社交网络、图神经网络等众多领域。随着图数据规模的增长,人们迫切需要高效的子图匹配算法。GENEVA是一种基于GPU的并行子图匹配算法,其利用区间索引的图存储结构和并行匹配优化方法,能够大幅... 子图匹配是一种基础的图算法,被广泛应用于社交网络、图神经网络等众多领域。随着图数据规模的增长,人们迫切需要高效的子图匹配算法。GENEVA是一种基于GPU的并行子图匹配算法,其利用区间索引的图存储结构和并行匹配优化方法,能够大幅度减少存储开销,提升子图匹配性能。但由于平台底层硬件架构和编译环境的不同,GENEVA无法直接应用到国产DCU异构平台。为了解决该问题,提出了GENEVA面向国产DCU的移植和优化方案。IO时间开销是GENEVA算法主要的性能瓶颈,文中采用锁页内存、预加载、调度器3种优化策略来突破该瓶颈。其中,锁页内存技术避免了从可分页内存到临时锁页内存的额外数据传输,在DCU平台上大幅度减少了IO传输的时间开销;预加载技术将IO数据传输与DCU核函数计算重叠,掩盖了IO时间开销;调度器在满足预加载需求的同时,减少了冗余数据的传输。在3个不同规模的真实数据集上进行实验,结果表明,采用优化策略后算法性能显著提高。在92.6%的测试用例上,经过优化的GENEVA-HIP算法在国产DCU平台的执行时间比移植前的GENEVA算法在GPU服务器的执行时间短。在较大规模的数据集上,优化的GENEVA-HIP算法在DCU平台上的执行时间相比移植前的GENEVA算法在GPU服务器的执行时间减少了52.73%。 展开更多
关键词 子图匹配 DCU 异构平台 HIP 移植和优化
下载PDF
基于异构平台的卷积神经网络加速系统设计
2
作者 秦文强 吴仲城 +1 位作者 张俊 李芳 《计算机工程与科学》 CSCD 北大核心 2024年第1期12-20,共9页
在计算和存储资源受限的嵌入式设备上部署卷积神经网络,存在执行速度慢、计算效率低、功耗高的问题。提出了一种基于异构平台的新型卷积神经网络加速架构,设计并实现了基于MobileNet的轻量化卷积神经网络加速系统。首先,为降低硬件资源... 在计算和存储资源受限的嵌入式设备上部署卷积神经网络,存在执行速度慢、计算效率低、功耗高的问题。提出了一种基于异构平台的新型卷积神经网络加速架构,设计并实现了基于MobileNet的轻量化卷积神经网络加速系统。首先,为降低硬件资源消耗以及数据传输成本,采用动态定点数量化和批标准化融合的设计方法,对网络模型进行了优化,并降低了加速系统的硬件设计复杂度;其次,通过实现卷积分块、并行卷积计算、数据流优化,有效提高了卷积运算效率和系统吞吐率。在PYNQ-Z2平台上的实验结果表明,此加速系统实现的MobileNet网络推理加速方案对单幅图像的识别时间为0.18 s,系统功耗为2.62 W,相较于ARM单核处理器加速效果提升了128倍。 展开更多
关键词 现场可编程门阵列(FPGA) Vivado高层次综合 卷积神经网络 异构平台 硬件加速
下载PDF
基于鲲鹏和昇腾异构平台的单节点HPL-AI设计与优化
3
作者 吴昊天 任长青 +2 位作者 陆璐 徐鹏翔 杨凯 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第2期13-22,共10页
鉴于低精度浮点运算拥有更快的运算速度,越来越多的高性能应用采用混合精度方案进行加速,而同样采用该方案来加速的AI(人工智能)大模型也受到广泛关注。最近,HPL-AI(High Performance LINPACK for Accelerator Introspection)基准测试... 鉴于低精度浮点运算拥有更快的运算速度,越来越多的高性能应用采用混合精度方案进行加速,而同样采用该方案来加速的AI(人工智能)大模型也受到广泛关注。最近,HPL-AI(High Performance LINPACK for Accelerator Introspection)基准测试被提出,用于评估高性能系统的混合精度运算性能。针对该基准测试,本研究在鲲鹏和昇腾异构平台上设计并优化了单节点HPL-AI基准测试的实现。其主要通过循环任务分配的策略将任务均匀地分配给AI处理器以平衡AI处理器的负载;通过带间隔值的任务分配策略提高数据传输的连续性来减少CPU和AI处理器之间的数据传输时间;在不影响计算精度的情况下,通过取消数据缩放的策略来减少CPU侧的计算量。最终实验结果表明:当间隔值为8时,HPL-AI基准测试的混合精度浮点运算速度最快;同时,取消数据缩放不会对HPL-AI基准测试的结果精度产生影响;在鲲鹏和昇腾异构平台上,与非优化的HPL-AI基准测试方法相比,本研究提出的优化策略使混合精度浮点运算速度提升了29%左右,为单节点HPL-AI基准测试的进一步优化和部署多节点HPL-AI基准测试奠定了坚实的基础。 展开更多
关键词 鲲鹏 昇腾 异构平台 基准测试 高性能计算 混合精度
下载PDF
基于改进蚁群的异构平台负载均衡调度算法
4
作者 李宇东 马金全 +2 位作者 胡泽明 岳春生 谢宗甫 《信息工程大学学报》 2024年第1期30-38,共9页
针对目前异构平台中信号处理任务的调度算法单一、处理器资源浪费等问题,提出了一种面向异构系统的Q学习改进蚁群算法的负载均衡调度算法。算法针对计算密集型和通信密集型任务的不同需求,设计了分流排序法进行任务优先级排序;通过场景... 针对目前异构平台中信号处理任务的调度算法单一、处理器资源浪费等问题,提出了一种面向异构系统的Q学习改进蚁群算法的负载均衡调度算法。算法针对计算密集型和通信密集型任务的不同需求,设计了分流排序法进行任务优先级排序;通过场景适配将Q学习和蚁群算法,与异构平台中的任务调度进行映射。通过奖励函数计算Q-Table,作为蚁群算法的初始信息素,加快了蚁群的收敛速度;根据处理器的实时负载,设计负载矩阵,实现了动态调整系统负载均衡;利用伪随机比例规则选择处理器,通过任务之间的约束关系形成调度列表来完成任务的分配。最后,通过随机生成的有向无环图进行仿真实验,结果表明算法在减小最大完工时间(调度长度)和提高处理器利用率方面均有明显的改进。 展开更多
关键词 任务调度 异构信号处理平台 Q学习 蚁群算法
下载PDF
基于ARM + DSP的异构平台优化加速算法
5
作者 宋奇伟 晋高成 李丕丁 《建模与仿真》 2023年第3期2318-2329,共12页
OpenCL编程模型应用于ARM + DSP异构多核平台存在核心利用率低、开发效率低等问题。本文基于AM5728异构开发平台,对OpenCL异构编程模型进行研究,提出了异构多核计算动态优化加速算法。分析了动态优化加速算法中的最优分配比例算法和数... OpenCL编程模型应用于ARM + DSP异构多核平台存在核心利用率低、开发效率低等问题。本文基于AM5728异构开发平台,对OpenCL异构编程模型进行研究,提出了异构多核计算动态优化加速算法。分析了动态优化加速算法中的最优分配比例算法和数据划分原则,动态算法会根据运行情况动态调整相应参数。完成了测试系统的设计,对异构计算加速算法的相关参数进行测量,展示了Sobel算法、奇异值分解算法(SVD)分别采用计算加速驱动的结果和OpenCL异构编程模型的结果,分析两种不同方式下算法完成时间情况。测试结果表明优化加速算法使得Sobel算法执行时间降低至原执行时间的72.2%,SVD算法执行时间降低至原执行时间的80.2%。 展开更多
关键词 加速算法 异构平台 SVD算法 数据划分 异构计算 奇异值分解算法 编程模型 计算加速
下载PDF
多云异构平台统一管理关键技术研究
6
作者 黎俊杰 王立晨 +1 位作者 王绍飞 凌帆 《信息与电脑》 2023年第16期235-237,共3页
云计算逐步从概念转化成实际产物,并且成为为信息系统提供运行环境的主流基础架构之一。如今各种公有云、私有云、混合云等不同资源的形式出现在企业的信息技术(Information Technology,IT)基础架构环境中,导致企业需要在复杂的环境中... 云计算逐步从概念转化成实际产物,并且成为为信息系统提供运行环境的主流基础架构之一。如今各种公有云、私有云、混合云等不同资源的形式出现在企业的信息技术(Information Technology,IT)基础架构环境中,导致企业需要在复杂的环境中找到合适统一的运营管理方式。文章对多云异构平台的统一运营和要点技术开展深入研究,分析适合的运营方式与管理技术。 展开更多
关键词 多云异构平台 平台 云计算技术
下载PDF
基于CPU/GPU异构平台的全波形反演及其实用化分析 被引量:12
7
作者 张猛 王华忠 +3 位作者 任浩然 冯波 隋志强 王延光 《石油物探》 EI CSCD 北大核心 2014年第4期461-467,共7页
全波形反演(Full Waveform Inversion,FWI)在理论上是当前精度最高的速度估计方法。通过分析FWI的计算特点,使用图形处理器(Graphic Processing Unit,简称GPU)进行算法加速,形成了基于CPU/GPU异构平台的时空域声波方程全波形反演算法实... 全波形反演(Full Waveform Inversion,FWI)在理论上是当前精度最高的速度估计方法。通过分析FWI的计算特点,使用图形处理器(Graphic Processing Unit,简称GPU)进行算法加速,形成了基于CPU/GPU异构平台的时空域声波方程全波形反演算法实现流程。理论模型测试结果表明,该算法不仅对速度模型具有高精度刻画能力,而且计算效率比基于CPU集群的FWI算法大幅提升。对胜利探区某陆上区块实际地震资料进行全波形速度反演试处理,取得了初步的应用效果。在此基础上,讨论了FWI对实际地震资料质量的要求,就FWI在陆上地震资料的生产性应用提出了相应的策略。 展开更多
关键词 地震反问题 全波形反演 速度估计 CPU GPU异构平台 陆上地震资料
下载PDF
异构平台网络标准件库的设计与实现 被引量:6
8
作者 张毅澜 莫蓉 +1 位作者 张军波 常智勇 《机械科学与技术》 CSCD 北大核心 2005年第3期261-264,共4页
提出了异构CAD平台通过网络共享同一数据库资源,利用参数驱动的方式生成标准件的方法。成功开发出了一套免编程的建库工具,并在UG、Pro/E、SolidWorks平台上实现了三维标准件库系统。
关键词 标准件库 异构平台 网络 数据库
下载PDF
基于Java技术解决数字图书馆异构平台数据库访问 被引量:13
9
作者 刘科 郑巧英 徐汝兴 《现代图书情报技术》 CSSCI 北大核心 2002年第3期10-13,共4页
文章简要介绍和分析了几种基于Web的数据库访问技术及其局限性。详细论述了JSP/Serlet和JDBC技术原理在数据库访问中的实现过程和实现机制。论述了基于Java技术的Browser—Server多层体系架构模型的图书馆异构平台数据源访问系统解决方案。
关键词 异构平台数据库访问 JSP/SERVLET JDBC 应用服务器 数字图书馆 JAVA技术 Web
下载PDF
基于PCIE非透明桥的嵌入式异构平台设计 被引量:5
10
作者 徐健 张建泉 张健 《微电子学与计算机》 CSCD 北大核心 2018年第1期26-30,共5页
PCI Express(PCIE)总线因其具有传输带宽高、全新的点点互连架构和对PCI总线高度兼容等优点已在计算机平台中获得广泛应用.在通过PCIE桥接两个以上处理器系统的场合,PCIE非透明桥(NTB)有效地隔离的桥两端系统的PCIE总线域,防止桥两端寻... PCI Express(PCIE)总线因其具有传输带宽高、全新的点点互连架构和对PCI总线高度兼容等优点已在计算机平台中获得广泛应用.在通过PCIE桥接两个以上处理器系统的场合,PCIE非透明桥(NTB)有效地隔离的桥两端系统的PCIE总线域,防止桥两端寻址冲突.本文使用PCIE交换芯片(PCIE Switch)以非透明桥的方式连接CPU和双GPU,搭建高性能嵌入式异构计算平台.在软件层设计上,本文基于Linux操作系统,完成了PCIE总线驱动和PCIE Switch的驱动设计,实现了多个Root之间的高速通信. 展开更多
关键词 PCIE 非透明桥 交换芯片 嵌入式 异构平台
下载PDF
基于多核CPU-GPU异构平台的并行Agent仿真 被引量:4
11
作者 余文广 王维平 +1 位作者 侯洪涛 李群 《系统工程与电子技术》 EI CSCD 北大核心 2012年第8期1716-1722,共7页
多核中央处理器(central processing units,CPU)-图形处理器(graphics processing units,GPU)异构平台为提高并行Agent仿真(parallel Agent-based simulation,PABS)在单机上的运行性能提供了一个更高效的硬件基础,但在当前相关研究中,... 多核中央处理器(central processing units,CPU)-图形处理器(graphics processing units,GPU)异构平台为提高并行Agent仿真(parallel Agent-based simulation,PABS)在单机上的运行性能提供了一个更高效的硬件基础,但在当前相关研究中,还缺乏一般性的理论方法来指导并行Agent仿真将多核CPU和GPU的计算资源充分利用起来。通过分析多核CPU-GPU异构并行架构的特点,在方法论层面上建立了并行Agent仿真在多核CPU-GPU异构平台下的多层负载分配模型,并根据基于Agent的仿真的执行结构,提出了对基于Agent的仿真的计算结构、数据结构进行重构的方法,以适应异构的硬件架构。最后对基于多核CPU-GPU的并行Agent仿真性能进行了实验分析。 展开更多
关键词 并行Agent仿真 多核中央处理器 图形处理器 异构平台
下载PDF
异构平台实时任务的可用性提升容错调度算法 被引量:3
12
作者 孙健 张兴军 董小社 《计算机研究与发展》 EI CSCD 北大核心 2015年第12期2669-2683,共15页
随着互联网+、云计算以及大数据等领域的迅速发展,异构平台成为部署科学计算、工业控制、云存储等关键应用的重要平台.由于平台内处理机性能及软硬件体系结构的异构性,异构平台表现出良好的可扩展性与高性价比.但是平台规模扩大和系统... 随着互联网+、云计算以及大数据等领域的迅速发展,异构平台成为部署科学计算、工业控制、云存储等关键应用的重要平台.由于平台内处理机性能及软硬件体系结构的异构性,异构平台表现出良好的可扩展性与高性价比.但是平台规模扩大和系统应用日趋复杂导致异构平台上实时任务的可调度性变差,系统可用性降低.针对此问题,提出了一种异构平台实时任务的可用性提升容错调度算法(availability improving fault-tolerant scheduling algorithm,AIFSAL).以处理器利用率和可用性成本为依据设计任务调度整体框架结构、处理机、任务以及调度模型;结合可用性成本设计算法并通过主副版本备份(primary/backup copy,PB)方法实现容错,任务副版本根据处理器利用率不同选择被动或重叠方式执行以减少系统冗余开销,提高可调度性,调度中无论任务主、副版本均优先选择可用性成本低的处理机以提高系统可用性;对任务分配情况和可调度性进行理论分析以证明AIFSAL的可行性.仿真实验与比较分析表明,AIFSAL较可用性约束(availability approached task scheduling algorithm,AATSAL)算法、单调速率扩展(task partition based fault-tolerant rate-monotonic,TPFTRM)算法以及最早完成时间(MinMin)算法在不降低可调度性的基础上有效地提升了系统可用性,减少了系统综合开销,综合性能提高显著. 展开更多
关键词 异构平台 任务调度 可用性 容错 主副版本
下载PDF
异构平台中并行矩量法的加速技术 被引量:1
13
作者 陈岩 张光辉 +2 位作者 林中朝 张玉 赵勋旺 《微波学报》 CSCD 北大核心 2014年第S1期51-54,共4页
本文主要研究了在CPU/GPU异构集群上的并行矩量法的加速技术。本文设计出一种MPI/CUDA软件编程架构,解决了CPU/GPU异构集群上并行LU分解跨节点计算的难题。此架构基于矩阵分块二维循环分布的数据分配策略,利用MPI实现计算节点之间的通信... 本文主要研究了在CPU/GPU异构集群上的并行矩量法的加速技术。本文设计出一种MPI/CUDA软件编程架构,解决了CPU/GPU异构集群上并行LU分解跨节点计算的难题。此架构基于矩阵分块二维循环分布的数据分配策略,利用MPI实现计算节点之间的通信,同时利用GPU加速矩阵更新过程。为了突破GPU显存对LU分解的矩阵规模的限制,本文进一步研究了"显存—内存"核外算法。为了优化算法性能,本文提出了基于"CUDA流"技术和"异步通信"技术的设计方案,实现了GPU通信与计算的重叠,有效隐藏了GPU通信时间,获到了明显的加速效果。 展开更多
关键词 矩量法 异构平台 GPU加速 并行 核外 隐藏通信
下载PDF
异构平台下格子Boltzmann方法实现及性能分析 被引量:1
14
作者 张丹丹 徐莹 徐磊 《计算机科学》 CSCD 北大核心 2012年第4期296-298,303,共4页
对CPU+GPU异构平台下的多种并行编程模式进行了研究,并针对格子Boltzmann方法实现了CUDA,MPI+CUDA,MPI+OpenMP+CUDA多级并行算法。结果表明,算法具有较好的加速性能;提出的根据计算量比例参数调节CPU和GPU之间负载均衡的方法,对于在异... 对CPU+GPU异构平台下的多种并行编程模式进行了研究,并针对格子Boltzmann方法实现了CUDA,MPI+CUDA,MPI+OpenMP+CUDA多级并行算法。结果表明,算法具有较好的加速性能;提出的根据计算量比例参数调节CPU和GPU之间负载均衡的方法,对于在异构平台上实现多级并行处理及资源的有效利用具有一定的参考和应用价值。 展开更多
关键词 异构平台 GPU 格子BOLTZMANN 并行
下载PDF
面向异构平台的敏捷供应链管理系统解决方案 被引量:1
15
作者 林枬 常会友 衣扬 《计算机集成制造系统》 EI CSCD 北大核心 2005年第3期381-385,共5页
如何在企业原有系统上快速、有效地建立敏捷供应链管理系统,是敏捷供应链研究中的一个重要课题。介绍了Web服务及其相关技术,在不改变企业内部系统底层架构的基础上,提出了面向异构平台的信息集成方案,开发了一个实际系统,验证分析了该... 如何在企业原有系统上快速、有效地建立敏捷供应链管理系统,是敏捷供应链研究中的一个重要课题。介绍了Web服务及其相关技术,在不改变企业内部系统底层架构的基础上,提出了面向异构平台的信息集成方案,开发了一个实际系统,验证分析了该方案应用于敏捷供应链的优越性,为企业实现异构平台的信息共享和交互提供了新思路,并指出了进一步的研究方向。 展开更多
关键词 敏捷供应链 异构平台 体系结构
下载PDF
基于异构平台的入侵容忍COTS服务器设计与实现 被引量:1
16
作者 王慧强 戎檄 《计算机工程》 CAS CSCD 北大核心 2006年第3期177-179,182,共4页
提出了利用异构平台搭建的可以透明支持COTS产品的入侵容忍服务器方案――ITHP,并通过分析和试验系统测试两种方式,证明了ITHP方案可以屏蔽大多数的未知漏洞。
关键词 入侵容忍 COTS 异构平台 ITHP
下载PDF
基于USV与AUV异构平台协同海洋探测系统研究综述 被引量:8
17
作者 徐会希 姜成林 《中国科学院大学学报(中英文)》 CSCD 北大核心 2021年第2期145-159,共15页
对基于无人水面艇(USV)和多自主水下机器人(AUVs)组成的异构协同海洋探测系统进行综述。首先介绍不同的USV与多AUVs组成的异构海洋探测系统的最新进展和应用成果,从系统设计概念和技术特点对这些异构系统进行分析和比较;其次对多水下机... 对基于无人水面艇(USV)和多自主水下机器人(AUVs)组成的异构协同海洋探测系统进行综述。首先介绍不同的USV与多AUVs组成的异构海洋探测系统的最新进展和应用成果,从系统设计概念和技术特点对这些异构系统进行分析和比较;其次对多水下机器人异构系统研究中的协同关键技术进行综述,重点分析协同问题中异构协同、系统任务分配、路径规划和编队控制等问题;而后从环境和硬件的外界约束以及海洋探测系统辅助技术两个方面分析海洋探测系统所面临的技术难点与问题;最后通过分析当前取得的进展和实际需求对多水下机器人异构海洋探测系统的发展前景进行展望。 展开更多
关键词 自主水下机器人 无人水面艇 协同作业 海洋探测系统 异构平台
下载PDF
三维Navier-Stokes方程分步法的并行算法在异构平台上实现初探 被引量:1
18
作者 徐莹 徐磊 姜恺 《计算机工程与科学》 CSCD 北大核心 2012年第9期33-39,共7页
本文选取了三维不可压缩流动方程的分步法(fractional-step method),其中动量方程使用BiCGSTAB算法进行迭代求解,而压力泊松方程使用Fourier变换法进行直接求解。本文研究该算法在集群平台上的并行算法,从区域分解入手,分析一维、两维... 本文选取了三维不可压缩流动方程的分步法(fractional-step method),其中动量方程使用BiCGSTAB算法进行迭代求解,而压力泊松方程使用Fourier变换法进行直接求解。本文研究该算法在集群平台上的并行算法,从区域分解入手,分析一维、两维、三维区域划分三种情况下,各并行处理器上的计算量与通讯量,根据分析结果使用两维区域分解。分析BiCGSTAB算法和泊松Fourier变换法在GPGPU异构平台上的移植方法。最后,本文分析了BiCGSTAB和泊松方程Fourier变换法两种算法在CPU集群和GPGPU异构平台上的并行性能结果。 展开更多
关键词 异构平台 GPGPU 并行算法 不可压缩Navier—Stokes方程 分步法
下载PDF
基于异构平台的并行最大最小蚁群算法 被引量:4
19
作者 黄震华 赵振岐 +1 位作者 林培裕 梅建华 《同济大学学报(自然科学版)》 EI CAS CSCD 北大核心 2016年第12期1949-1955,共7页
最大最小蚂蚁系统(Max-min Ant System,MMAS)是一种性能优良的启发式算法,常用于解决组合优化问题.当解决的目标问题规模较大、迭代轮次较多时,最大最小蚁群算法存在运行时间长的缺点.试验以开源串行包ACOTSP为基准,利用GPU多线程并发... 最大最小蚂蚁系统(Max-min Ant System,MMAS)是一种性能优良的启发式算法,常用于解决组合优化问题.当解决的目标问题规模较大、迭代轮次较多时,最大最小蚁群算法存在运行时间长的缺点.试验以开源串行包ACOTSP为基准,利用GPU多线程并发的优势,采用并行蚂蚁策略将MMAS在CPU-GPU协同异构计算平台上并发实现.算法在GPU上运行时的影响因素,如数据传输、内存层次、库函数调用等,也得到有效分析,并作出针对性优化.试验最终取得了高达13倍的加速,表明并行MMAS策略具有高效性和实用性. 展开更多
关键词 并行计算 异构平台 最大最小蚁群系统 加速比
下载PDF
面向分布式异构平台的信息资源整合方法研究 被引量:3
20
作者 赵云华 《图书馆界》 2016年第4期81-84,共4页
介绍了分布式异构信息资源整合方法,分析了面向分布式异构平台的信息资源整合技术,最后给出了面向分布式异构平台的信息资源整合设计与实现,重点探讨了平台的体系结构、开发模式和实现方法等。
关键词 分布式 异构平台 信息资源整合
下载PDF
上一页 1 2 13 下一页 到第
使用帮助 返回顶部