期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
非线性图像扩散LB模型的CUDA算法设计与实现 被引量:1
1
作者 周明 严壮志 黄彬 《应用科学学报》 CAS CSCD 北大核心 2014年第1期85-92,共8页
为提高基于格子波尔兹曼(Lattice Boltzmann,LB)模型图像去噪方法的性能,研究了非线性图像扩散LB模型的CUDA算法,即分别利用纹理内存、共享内存以及直接使用全局内存来实现非线性图像扩散LB模型中的迁移过程.利用合成图像和真实图像的... 为提高基于格子波尔兹曼(Lattice Boltzmann,LB)模型图像去噪方法的性能,研究了非线性图像扩散LB模型的CUDA算法,即分别利用纹理内存、共享内存以及直接使用全局内存来实现非线性图像扩散LB模型中的迁移过程.利用合成图像和真实图像的去噪实验表明,针对非线性图像扩散LB模型,GPU相对CPU的加速比可达90倍以上;而且加速比的提高与GPU流处理器的数目成正比. 展开更多
关键词 图像去噪 非线性图像扩散 LB模型 cuda算法
下载PDF
基于CUDA的边遍历算法 被引量:1
2
作者 陆扬 郑津津 +1 位作者 周洪军 沈连婠 《计算机工程》 CAS CSCD 北大核心 2011年第4期270-271,274,共3页
基于几何着色器的边遍历算法效率主要受色器硬件规格的影响。为此,提出一种基于CUDA的边遍历算法,使用CUDA模拟实现顶点着色器与几何着色器功能,避免硬件限制。同时针对CUDA内存高效读取的合并访问要求,提出二步骤的三角形网格顶点分块... 基于几何着色器的边遍历算法效率主要受色器硬件规格的影响。为此,提出一种基于CUDA的边遍历算法,使用CUDA模拟实现顶点着色器与几何着色器功能,避免硬件限制。同时针对CUDA内存高效读取的合并访问要求,提出二步骤的三角形网格顶点分块、重排序算法,优化几何着色器模拟时顶点数据的读取。实验结果证明,与现有最优算法相比,该算法可获得更高的速度提升。 展开更多
关键词 边遍历 cuda并行算法 着色器模拟
下载PDF
求解加权MTSP问题的CUDA并行群智能方法 被引量:2
3
作者 苏守宝 赵威 李智 《郑州大学学报(工学版)》 CAS 北大核心 2021年第6期34-41,共8页
针对混合迭代算法执行时间长的问题,根据粒子群优化(PSO)算法和蚁群优化(ACO)算法的并行特点,结合其在GPU上并行化实现技术和编程优化技巧,提出一种基于CUDA的粒子群聚类蚁群的并行群智能混合方法GPSO-AC。该算法利用GPU的多个流处理器(... 针对混合迭代算法执行时间长的问题,根据粒子群优化(PSO)算法和蚁群优化(ACO)算法的并行特点,结合其在GPU上并行化实现技术和编程优化技巧,提出一种基于CUDA的粒子群聚类蚁群的并行群智能混合方法GPSO-AC。该算法利用GPU的多个流处理器(SM)和单指令多线程(SIMT)的指令架构,将GPSO-AC算法在运行中的独立个体的搜索过程同时并行执行,在保证算法精度的基础上,加快混合迭代法的执行速度。考虑到实际场景中旅行商在每个路段上各项开销不同,可以抽象为每段路程区间上都有一个与之对应的代价,将路程代价考虑到MTSP问题中。采用TSPLIB库中6个测试数据集,将GPSO-AC与PSO-AC、TPHA、K-means-AC等算法进行比较,并进一步探讨了加入代价均衡约束后对加权MTSP问题最优解收敛性能的影响。使用chn31数据集上不同旅行商数时,GPSO-AC在不考虑代价均衡、代价均衡约束、加权代价均衡的情况下的代价标准差分别为1165.26、54.97、6.74。结果表明:在求解一般MTSP问题及其衍生加权、代价均衡MSTP问题上,GPSO-AC在执行速度和收敛精度上均优于CPU串行算法,且随着模型规模增加,其速度优势更加明显。 展开更多
关键词 多旅行商问题 cuda并行算法 代价均衡 粒子群聚类 蚁群算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部