期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
CPU-OpenMP和GPU-CUDA并行计算技术对矩阵乘法运算的加速效果分析 被引量:1
1
作者 张岩 《科技视界》 2017年第26期45-47,共3页
本文对比了CPU-OpenMP和GPU-CUDA并行计算技术对不同阶矩阵乘法运算相对于CPU单线程计算的加速效果。结果表明,CPU-OpenMP并行的计算加速比与矩阵阶数无关,且低于所采用的线程数目。GPU-CUDA并行的计算加速比随矩阵阶数的增加显著增加,... 本文对比了CPU-OpenMP和GPU-CUDA并行计算技术对不同阶矩阵乘法运算相对于CPU单线程计算的加速效果。结果表明,CPU-OpenMP并行的计算加速比与矩阵阶数无关,且低于所采用的线程数目。GPU-CUDA并行的计算加速比随矩阵阶数的增加显著增加,最大计算加速比可达570倍以上。相对于CPU单线程计算结果,CPU-OpenMP并行计算未产生误差,而GPU-CUDA并行计算会产生误差。结果表明,GPUCUDA并行适合高阶数矩阵乘法的加速计算,而CPU-OpenMP并行适合低阶数矩阵乘法的加速计算。 展开更多
关键词 矩阵乘法 并行计算 cpu-openmp GPU-CUDA
下载PDF
多核CPU环境下的并行遗传算法的研究 被引量:7
2
作者 唐天兵 谢祥宏 +2 位作者 申文杰 韦凌云 严毅 《广西大学学报(自然科学版)》 CAS CSCD 北大核心 2009年第4期546-550,共5页
多核CPU已经成为当前CPU市场上的主流产品,设计适应多核CPU环境的算法与软件势在必行。遗传算法是一种具有很强通用性的全局搜索方法,也是一种计算量大、极耗计算资源的算法,其传统的串行计算形式并不能充分利用多核的计算资源,将其设... 多核CPU已经成为当前CPU市场上的主流产品,设计适应多核CPU环境的算法与软件势在必行。遗传算法是一种具有很强通用性的全局搜索方法,也是一种计算量大、极耗计算资源的算法,其传统的串行计算形式并不能充分利用多核的计算资源,将其设计为适应多核CPU环境的并行计算形式,具有重要的现实意义。将遗传算法的基本操作设计成并行执行形式,并利用OpenMP将其线程化,从而对不同规模的TSP问题的求解结果来看,加速比与计算效率随着规模的增大而提高。 展开更多
关键词 多核CPU OPENMP 线程化 遗传算法
下载PDF
基于OpenMP的分子动力学并行算法的性能分析与优化 被引量:10
3
作者 白明泽 程丽 +1 位作者 豆育升 孙世新 《计算机应用》 CSCD 北大核心 2012年第1期163-166,共4页
为提高分子动力学模拟在共享内存式服务器上的计算速度,对基于OpenMP的分子动力学并行算法(Critical方法)进行了性能分析与优化。通过在多核服务器上的测试,以及加速比和并行效率的计算分析了Critical方法的并行性能,进而提出优化的三... 为提高分子动力学模拟在共享内存式服务器上的计算速度,对基于OpenMP的分子动力学并行算法(Critical方法)进行了性能分析与优化。通过在多核服务器上的测试,以及加速比和并行效率的计算分析了Critical方法的并行性能,进而提出优化的三角形方法。所提方法中每个线程所计算的粒子数固定,且粒子数目呈阶梯状上升,使得各线程能够错时到达临界区。从而使程序在临界区的闲置时间比Critical方法减半,加速比明显提高。 展开更多
关键词 分子动力学 并行计算 多核中央处理器 OPENMP 临界区
下载PDF
CPU-GPU异构计算环境下的并行T近邻谱聚类算法 被引量:3
4
作者 张帅 李涛 +2 位作者 焦晓帆 王艺峰 杨愚鲁 《计算机研究与发展》 EI CSCD 北大核心 2015年第11期2555-2567,共13页
谱聚类是数据挖掘领域最常用的聚类算法之一,但对于如何利用多核CPU与资源有限的众核加速器设计并实现一个在异构单节点上能够处理大规模数据集的高效谱聚类算法,目前尚无理想的解决方案.PSCH(parallel spectral clustering for hybrid... 谱聚类是数据挖掘领域最常用的聚类算法之一,但对于如何利用多核CPU与资源有限的众核加速器设计并实现一个在异构单节点上能够处理大规模数据集的高效谱聚类算法,目前尚无理想的解决方案.PSCH(parallel spectral clustering for hybrids)算法是专为CPU-GPU异构计算环境设计的并行T近邻(T-nearest-neighbors,TNN)谱聚类算法,通过分块计算相似性矩阵打破了GPU设备内存的限制,所能处理的数据集规模仅受限于CPU主存的容量.PSCH算法中使用CUDA设计实现双缓冲轮转4段流水机制,通过重叠计算与传输在打破存储瓶颈的同时保证了高计算性能.PSCH算法采用隐式重启动Lanczos方法(implicitly restarted Lanczos method,IRIM)在异构硬件上计算稀疏特征矩阵的特征分解,减轻了特征分解步骤的计算瓶颈.PSCH算法在配有一块GTX 480GPU的单节点上能够对百万以上规模的数据集进行聚类,并对实验中的4个数据集取得了相对于使用16进程的MPI并行谱聚类PSC算法2.0~4.5倍的性能. 展开更多
关键词 谱聚类 T近邻 CPU-GPU异构计算 计算统一设备架构 OpenMP
下载PDF
Vega平台下三维并行A*算法的设计与实现 被引量:2
5
作者 高晔 邢毅 《计算机工程与应用》 CSCD 2012年第7期231-234,共4页
采用一种并行的A*算法实现了复杂地理环境下低空飞行器的三维路径规划。该算法将A*算法的基本操作设计成并行执行形式,并利用OpenMP将其线程化,结合约束条件,最终完成在三维空间中避开障碍物的路径搜索过程。使用建模工具Cre-ator和开... 采用一种并行的A*算法实现了复杂地理环境下低空飞行器的三维路径规划。该算法将A*算法的基本操作设计成并行执行形式,并利用OpenMP将其线程化,结合约束条件,最终完成在三维空间中避开障碍物的路径搜索过程。使用建模工具Cre-ator和开发工具Vega为仿真平台,完成对复杂地形地貌场景的设计,在此基础上对上述算法进行了验证。仿真结果表明该并行方式较之串行方式能获得更快的寻优速度,加速比也随着规模的增大而提高。 展开更多
关键词 多核CPU 并行A*算法 OPENMP 线程化
下载PDF
多核CPU上快速傅里叶变换并行算法的优化 被引量:1
6
作者 房爱东 《长沙大学学报》 2013年第2期41-45,共5页
快速傅里叶变换在数字信号处理和通信领域具有广泛的应用.多核CPU日益普遍,根据FFT算法自身的并行性,灵活分解蝶形运算,通过探究并行块的分配和嵌套关系对算法加以优化,合理地分配线程实现多核CPU的并行计算,可以提高FFT的计算效率.
关键词 FFT 多核CPU OPENMP 并行计算
下载PDF
基于CPU/GPU异构模式的高光谱遥感影像数据处理研究与实现 被引量:6
7
作者 汤媛媛 周海芳 +1 位作者 方民权 申小龙 《计算机科学》 CSCD 北大核心 2016年第2期47-50,77,共5页
近年来,基于GPU的新型异构高性能计算模式的蓬勃发展为众多领域应用提供了良好的发展机遇,国内外遥感专家开始引入高性能异构计算来解决高光谱遥感影像高维空间特点所带来的数据计算量大、实时处理难等问题。在此简要介绍了高光谱遥感和... 近年来,基于GPU的新型异构高性能计算模式的蓬勃发展为众多领域应用提供了良好的发展机遇,国内外遥感专家开始引入高性能异构计算来解决高光谱遥感影像高维空间特点所带来的数据计算量大、实时处理难等问题。在此简要介绍了高光谱遥感和CPU/GPU异构计算模式,总结了近几年国内外基于CPU/GPU异构模式的高光谱遥感数据处理研究现状和问题;并面向共享存储型小型桌面超级计算机,基于CPU/GPU异构模式实现了高光谱遥感影像MNF降维的并行化,通过与串行程序和共享存储的OpenMP同构模式对比,验证了异构模式在高光谱遥感处理领域的发展潜力。 展开更多
关键词 高光谱遥感 CPU/GPU OPENMP MNF
下载PDF
基于CPU-GPU混合加速的SPH流体仿真方法 被引量:3
8
作者 胡鹏飞 袁志勇 +2 位作者 廖祥云 郑奇 陈二虎 《计算机工程与科学》 CSCD 北大核心 2014年第7期1231-1237,共7页
基于光滑粒子流体力学SPH的流体仿真是虚拟现实技术的重要研究内容,但SPH流体仿真需要大量的计算资源,采用一般计算方法难以实现流体仿真的实时性。流体仿真通常由物理计算、碰撞检测和渲染等部分组成,借助GPU并行加速粒子的物理属性计... 基于光滑粒子流体力学SPH的流体仿真是虚拟现实技术的重要研究内容,但SPH流体仿真需要大量的计算资源,采用一般计算方法难以实现流体仿真的实时性。流体仿真通常由物理计算、碰撞检测和渲染等部分组成,借助GPU并行加速粒子的物理属性计算和碰撞过程使SPH方法的实时流体仿真成为可能。为了满足流体仿真应用中的真实性和实时性需求,提出一种基于CPU-GPU混合加速的SPH流体仿真方法,流体计算部分采用GPU并行加速,流体渲染部分采用基于CPU的OpenMP加速。实验结果表明,基于CPU-GPU混合加速的SPH流体仿真方法与CPU实现相比,能显著地减少流体仿真单帧计算时间且能更快速地完成渲染任务。 展开更多
关键词 流体仿真 SPH 实时模拟 OPENMP CPU—GPU混合加速
下载PDF
基于X86架构CPU的雷达信号处理算法研究 被引量:4
9
作者 魏梦瑶 《电子科技》 2017年第5期55-57,61,共4页
介绍了利用X86架构通用CPU完成强实时的雷达信号处理任务的优化方法。在ICC与FFTW程序优化的基础上,采用多线程编程技术(OpenMP)进行并行优化设计,通过内存拷贝和改变恒虚警率(CFAR)程序结构的方式进一步提高算法的处理速率。程序运行... 介绍了利用X86架构通用CPU完成强实时的雷达信号处理任务的优化方法。在ICC与FFTW程序优化的基础上,采用多线程编程技术(OpenMP)进行并行优化设计,通过内存拷贝和改变恒虚警率(CFAR)程序结构的方式进一步提高算法的处理速率。程序运行时间表明,优化后实时处理时间能够控制在一个雷达处理周期2.16ms内,满足雷达信号处理实时性的要求。 展开更多
关键词 CPU 信号处理 OPENMP 内存拷贝
下载PDF
基于OpenMP的并行粒子群优化算法研究 被引量:1
10
作者 康军广 段国林 +1 位作者 王金敏 田永军 《河北工业大学学报》 CAS 2015年第2期34-37,共4页
针对现有粒子群优化算法多采用串行方式执行且运行效率较低的问题,提出一种基于Open MP技术的并行粒子群优化算法.该算法以多核硬件平台为基础,利用粒子群算法搜索速度快,易于并行等特点,引入Open MP技术,通过将该并行算法应用于布局问... 针对现有粒子群优化算法多采用串行方式执行且运行效率较低的问题,提出一种基于Open MP技术的并行粒子群优化算法.该算法以多核硬件平台为基础,利用粒子群算法搜索速度快,易于并行等特点,引入Open MP技术,通过将该并行算法应用于布局问题求解并与串行算法相比较,测试结果表明,该并行算法与串行算法结果一致,能够充分利用多核CPU的计算资源,运行效率得到明显提高. 展开更多
关键词 OPENMP 并行 粒子群 多核CPU
下载PDF
运用OpenMP和CUDA优化蒙特卡洛算法
11
作者 张钦 张鹏程 《安阳师范学院学报》 2012年第2期41-45,共5页
本文采用OpenMP和CUDA技术,对蒙特卡洛算法进行并行化改进,以充分利用多核处理器和GPU的计算能力,通过对比算法改进前后的性能表现,可以看到采用OpenMP和CUDA技术,能够极大提高计算性能。借鉴该方法,我们可以在个人计算机上改进相关软... 本文采用OpenMP和CUDA技术,对蒙特卡洛算法进行并行化改进,以充分利用多核处理器和GPU的计算能力,通过对比算法改进前后的性能表现,可以看到采用OpenMP和CUDA技术,能够极大提高计算性能。借鉴该方法,我们可以在个人计算机上改进相关软件计算性能。 展开更多
关键词 并行计算 OPENMP CUDA CPU GPU 蒙特卡洛
下载PDF
点云无损压缩并行算法研究 被引量:1
12
作者 刘振亮 孙煜东 闫华 《小型微型计算机系统》 CSCD 北大核心 2018年第9期2039-2043,共5页
为了提高三维场景建模效率,保证场景数据变化实时更新,对大场景点云数据的压缩、存储及传输问题进行研究.针对LASzip串行算法处理速度慢、CPU利用率低下的问题提出基于单机多核CPU环境,设计实现多核架构下基于OpenMP的并行算法OMP-LASz... 为了提高三维场景建模效率,保证场景数据变化实时更新,对大场景点云数据的压缩、存储及传输问题进行研究.针对LASzip串行算法处理速度慢、CPU利用率低下的问题提出基于单机多核CPU环境,设计实现多核架构下基于OpenMP的并行算法OMP-LASzip,充分利用多核处理器的计算能力,多线程分块并行压缩点云数据.实验结果表明,与原串行算法相比,并行算法在压缩率损失约1%的前提下,取得较好的加速比,负载均衡.同时随着核数增加,加速比也在增加,验证了其可行性、有效性和可扩展性,基本满足了点云数据无损压缩实时传输的需求. 展开更多
关键词 LASzip算法 OPENMP 单机多核CPU环境
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部