期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于GPU的并行协同过滤算法 被引量:1
1
作者 许建 林泳 +1 位作者 秦勇 黄翰 《计算机应用研究》 CSCD 北大核心 2013年第9期2656-2659,共4页
为提高协同过滤算法的可伸缩性,加快其运行速度,提出了一种基于GPU(graphic processing unit)的并行协同过滤算法来实现高速并行处理。GPU的运算模式采用单指令多数据流,适用于逻辑性弱、数据量巨大的运算,而这正是协同过滤算法所具有... 为提高协同过滤算法的可伸缩性,加快其运行速度,提出了一种基于GPU(graphic processing unit)的并行协同过滤算法来实现高速并行处理。GPU的运算模式采用单指令多数据流,适用于逻辑性弱、数据量巨大的运算,而这正是协同过滤算法所具有的特点。使用统一计算设备框架(compute unified device architecture,CUDA)实现了此协同过滤算法。实验表明,在中低端的GPU上该算法与在高端的四核CPU上的协同过滤算法相比,其加速比达到40倍以上,显著地提高了算法的可伸缩性,而算法在准确率方面也有优秀的表现。 展开更多
关键词 协同过滤 图形处理器 统一计算设备框架
下载PDF
一种跨平台的并行编程框架设计与实现 被引量:1
2
作者 李婷 徐云 +1 位作者 聂鹏宇 潘玮华 《计算机工程》 CAS CSCD 2014年第8期43-47,共5页
并行程序设计的复杂性及并行计算平台的多样性导致程序可移植性较差。为此,设计并实现一种跨平台、分层次的并行编程框架OpenCH。该框架通过两层并行函数库和层次化的API设计,对上层应用程序隐藏并行化细节,为基于不同计算平台的库函数... 并行程序设计的复杂性及并行计算平台的多样性导致程序可移植性较差。为此,设计并实现一种跨平台、分层次的并行编程框架OpenCH。该框架通过两层并行函数库和层次化的API设计,对上层应用程序隐藏并行化细节,为基于不同计算平台的库函数设计了统一的函数接口,使底层平台的变化对上层应用程序透明。根据底层函数库的开发,给出一种填充式的编程方法和任务调度系统。将OpenCH应用于遥感影像分类,实验结果证明,基于该框架开发的并行程序可运行于多种并行计算平台,并具有较高的并行加速比,编程框架本身造成的时间开销低于15%。 展开更多
关键词 并行计算 并行编程框架 跨平台 OpenMP编程 MPI编程 cuda编程
下载PDF
基于GPU并行射线跟踪的电波预测算法研究 被引量:1
3
作者 谭南 陈辉 《微计算机信息》 2011年第11期104-106,共3页
针对利用射线跟踪算法进行小区电波预测的计算量非常大,运行时间较长,在实际工程中难以应用等的问题,本文在研究已有并行射线跟踪算法,即主从模式和对等模式并行射线跟踪的基础上,采用图形处理器(GPU)作为计算平台,结合GPU高并行处理能... 针对利用射线跟踪算法进行小区电波预测的计算量非常大,运行时间较长,在实际工程中难以应用等的问题,本文在研究已有并行射线跟踪算法,即主从模式和对等模式并行射线跟踪的基础上,采用图形处理器(GPU)作为计算平台,结合GPU高并行处理能力,运用CUDA的编程框架,并在NVIDIA公司出厂的GEFORCE 9800GT上,实现了对城市小区的简单模型环境的电波预测。实验结果表明,基于GPU并行射线跟踪算法适用于城市小区的电波预测研究,该算法能大大节省通信时间,缩短计算时间,更方便更实用。 展开更多
关键词 电波传播预测 射线跟踪 并行算法 GPU cuda编程框架
下载PDF
二维动画人物的特征提取与三维重建 被引量:2
4
作者 单祖辉 《沈阳大学学报(自然科学版)》 CAS 2018年第2期136-141,共6页
为了解决快速提取二维动画人物特征,完成立体动画人物形象构建的问题,提出了二维动画人物的特征提取与三维重建方法.通过分析二维动画人物特征提取,具体分析了二维动画人物Harris算子的确定、二维动画人物对极几何关系的确定、基于Harri... 为了解决快速提取二维动画人物特征,完成立体动画人物形象构建的问题,提出了二维动画人物的特征提取与三维重建方法.通过分析二维动画人物特征提取,具体分析了二维动画人物Harris算子的确定、二维动画人物对极几何关系的确定、基于Harris算子和对极几何角度的特征提纯;分析了基于二维动画人物特征的三维重建方法,主要包括基于二维动画人物特征的三维重建流程、三维重建方法的哈希排序和利用CUDA框架实现三维重建方法.实验可知,所提方法的二维动画人物提取速度最大值为0.401mm/s,而传统二维动画人物提取速度最大值为0.589mm/s.动画人物形象三维构建准确性的对比中,在特殊检测方法中,本文方法对称性更好,准确性也更高.应用对比实验的方法证明,应用新型重建方法后,二维动画人物特征提取速度明显加快,动画人物形象三维构建准确性也大大提升. 展开更多
关键词 二维动画人物 特征提取 HARRIS算子 对极几何关系 哈希排序 cuda框架 三维重建
下载PDF
基于GPU的异构并行编程模型分析与研究
5
作者 包达尔罕 高文炜 +2 位作者 郑欣 冯路 杨金颖 《内蒙古民族大学学报(自然科学版)》 2020年第1期42-46,共5页
近年来,异构系统硬件飞速发展.为了解决相应的编程和执行效率问题,异构并行编程模型已经被广泛使用和研究.从异构并行编程模型与编程框架两个角度总结了异构并行编程模型的最新研究成果.异构并行编程为异构系统与上层应用之间搭建桥梁,... 近年来,异构系统硬件飞速发展.为了解决相应的编程和执行效率问题,异构并行编程模型已经被广泛使用和研究.从异构并行编程模型与编程框架两个角度总结了异构并行编程模型的最新研究成果.异构并行编程为异构系统与上层应用之间搭建桥梁,为当前高速发展的并行计算提供了技术方案支持.在主流的并行编程模型中,CUDA与OpenCL是广泛被人们所青睐的两种方案,并且它们能够提供成熟且稳定的技术支持.文章以CUDA和OpenCL的特征为出发点,研究了异构并行编程模型的核心技术. 展开更多
关键词 cuda OPENCL 编程模型 编程框架
下载PDF
启发式优化算法的GPU并行加速框架
6
作者 王东杰 温思歆 +1 位作者 孟万植 吴迪 《系统仿真学报》 CAS 2024年第8期1929-1943,共15页
为解决启发式优化算法计算量大、耗时长的缺点,使用图形处理单元(GPU)以及统一计算架构(compute unified device architecture,CUDA)对启发式优化算法进行并行化。提出了一种针对启发式优化算法的GPU并行框架,设计了具有并行逻辑结构的... 为解决启发式优化算法计算量大、耗时长的缺点,使用图形处理单元(GPU)以及统一计算架构(compute unified device architecture,CUDA)对启发式优化算法进行并行化。提出了一种针对启发式优化算法的GPU并行框架,设计了具有并行逻辑结构的信息交互框架、算法并行优化策略,解决了信息交互的逻辑结构在串、并行中的相异性问题,该框架可并行化各类启发式优化算法,具有一般性与高效性。为验证该框架的有效性,利用并行框架对5种常见启发式优化算法进行并行化,给出了多个测试函数下GPU并行计算与CPU串行计算的对比结果,其中差分进化算法、哈里斯鹰优化算法、灰狼优化算法、鲸鱼优化算法在种群维度为5000时,分别加速高达179.1、178.6、74.3、358.2倍,同时保证了结果的准确性,表明所设计并行框架的高效性与实用性。 展开更多
关键词 启发式优化算法 GPU并行 cuda模型 并行框架 信息交互
下载PDF
从图形处理器到基于GPU的通用计算 被引量:7
7
作者 刘金硕 刘天晓 +3 位作者 吴慧 曾秋梅 任梦菲 顾宜淳 《武汉大学学报(理学版)》 CAS CSCD 北大核心 2013年第2期198-206,共9页
对GPU(graphic process unit)、基于GPU的通用计算(general purpose GPU,GPGPU)、基于GPU的编程模型与环境进行了界定;将GPU的发展分为4个阶段,阐述了GPU的架构由非统一的渲染架构到统一的渲染架构,再到新一代的费米架构的变化;通过对基... 对GPU(graphic process unit)、基于GPU的通用计算(general purpose GPU,GPGPU)、基于GPU的编程模型与环境进行了界定;将GPU的发展分为4个阶段,阐述了GPU的架构由非统一的渲染架构到统一的渲染架构,再到新一代的费米架构的变化;通过对基于GPU的通用计算的架构与多核CPU架构、分布式集群架构进行了软硬件的对比.分析表明:当进行中粒度的线程级数据密集型并行运算时,采用多核多线程并行;当进行粗粒度的网络密集型并行运算时,采用集群并行;当进行细粒度的计算密集型并行运算时,采用GPU通用计算并行.最后本文展示了未来的GPGPU的研究热点和发展方向——GPGPU自动并行化、CUDA对多种语言的支持、CUDA的性能优化,并介绍了GPGPU的一些典型应用. 展开更多
关键词 GPGPU cuda架构 并行计算
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部