期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
基于TBB和Cilk++的并行蚁群算法在路径寻优中的应用 被引量:7
1
作者 王磊 曹菡 《计算机应用》 CSCD 北大核心 2010年第10期2781-2784,共4页
针对实际道路路网的一类路径寻优问题,提出了带回退机制的蚁群搜索算法,求解在实际道路路网中完成遍历所有规定节点的一条较优路径。为解决大规模实际道路路网数据量大、蚁群算法收敛速度慢的问题,分别采用Intel Threading Building Blo... 针对实际道路路网的一类路径寻优问题,提出了带回退机制的蚁群搜索算法,求解在实际道路路网中完成遍历所有规定节点的一条较优路径。为解决大规模实际道路路网数据量大、蚁群算法收敛速度慢的问题,分别采用Intel Threading Building Blocks(TBB)和Cilk++并行编程模型实现了并行蚁群搜索。与基于WinAPI函数的多线程蚁群算法相比,这两种模型均避免了手动启动线程及识别临界区资源等复杂操作,开发难度降低;在运行效率方面,基于TBB的并行蚁群算法和基于WinAPI的并行蚁群算法效率接近,而基于Cilk++的并行蚁群算法在双核环境下,运行效率和加速比都超过了基于WinAPI的并行蚁群算法。 展开更多
关键词 tbb Cilk++ 并行蚁群算法 多核
下载PDF
MPI+TBB混合并行编程模型在分子动力学中的应用 被引量:2
2
作者 白明泽 赵文辉 +2 位作者 豆育升 孙世新 温迪 《计算机应用研究》 CSCD 北大核心 2012年第5期1772-1774,1794,共4页
为了提高分子动力学模拟在对称多处理(SMP)集群上的计算速度,在分子动力学并行方法中引入MPI+TBB的混合并行编程模型。基于该模型,在分子动力学软件LAMMPS中设计并实现混合并行算法,在节点间采用MPI及空间分解技术实施进程级并行,节点... 为了提高分子动力学模拟在对称多处理(SMP)集群上的计算速度,在分子动力学并行方法中引入MPI+TBB的混合并行编程模型。基于该模型,在分子动力学软件LAMMPS中设计并实现混合并行算法,在节点间采用MPI及空间分解技术实施进程级并行,节点内采用TBB及临界区技术实施线程级并行。在SMP集群中的测试表明,该方法在体系较大以及节点数较多时可以明显减少通信时间,使加速比在纯MPI模型上提高45%。结果表明,MPI+TBB混合并行编程模型可促进分子动力学并行模拟且效率明显提升。 展开更多
关键词 分子动力学 混合并行编程模型 SMP集群 MPI 线程构建块
下载PDF
分形计算的并行设计及TBB实现 被引量:1
3
作者 陈荣鑫 陈维斌 廖湖声 《计算机应用》 CSCD 北大核心 2011年第3期839-842,共4页
线程构建模块(TBB)基于模板的特点简化了并行化设计,适合高效地实现多核并行设计。针对分形计算具有计算密集和高耗时的特点,结合TBB并行化设计,以充分利用多核计算资源。对影响并行性能的计算负载不平衡问题,提出了基于采样估算的平衡... 线程构建模块(TBB)基于模板的特点简化了并行化设计,适合高效地实现多核并行设计。针对分形计算具有计算密集和高耗时的特点,结合TBB并行化设计,以充分利用多核计算资源。对影响并行性能的计算负载不平衡问题,提出了基于采样估算的平衡优化方法,通过采样执行时间来估算工作负载,据此进行均衡的任务划分,利用TBB任务调度实现并行处理。实验结果表明,采样估算精度高,耗时比率低,能有效实现负载均衡;基于TBB的实现可获得较好加速比。 展开更多
关键词 分形计算 多核并行 线程构建模块 负载平衡
下载PDF
基于TBB的傅里叶变换多核并行化实现 被引量:5
4
作者 杨川 杨斌 《计算机工程》 CAS CSCD 北大核心 2010年第16期288-290,共3页
通过对传统傅里叶变换的分析,发现其运行的瓶颈主要是循环体的运算效率低下,并且程序执行时只会被分配到一个硬件核上,并没有充分利用多核。针对上述问题,通过对英特尔线程构建模块(TBB)的研究与应用,使得循环体内的运算被划分为各个相... 通过对传统傅里叶变换的分析,发现其运行的瓶颈主要是循环体的运算效率低下,并且程序执行时只会被分配到一个硬件核上,并没有充分利用多核。针对上述问题,通过对英特尔线程构建模块(TBB)的研究与应用,使得循环体内的运算被划分为各个相互独立的空间,并把这些空间的运算尽可能分配到多核上,实现了对传统傅里叶变换的并行化改造,并取得较好的效果。 展开更多
关键词 傅里叶变换 英特尔软件开发套件 英特尔线程构建模块 并行化
下载PDF
TBB多核编程及其混合编程模型的研究 被引量:17
5
作者 胡斌 袁道华 《计算机技术与发展》 2009年第2期98-101,104,共5页
多核处理器越来越普及,如何通过软件技术最大提升CPU每个核心的使用率,成为热点问题。引入多核并行编程模型Threading Building Blocks,并与raw threads、Open MP进行各方面详细比较,分析了其优劣。并研究了TBB结合MPI在SMP集群系统上... 多核处理器越来越普及,如何通过软件技术最大提升CPU每个核心的使用率,成为热点问题。引入多核并行编程模型Threading Building Blocks,并与raw threads、Open MP进行各方面详细比较,分析了其优劣。并研究了TBB结合MPI在SMP集群系统上实现高效的混合并行计算应用的方法。最终发现TBB在多核编程方面有显著的优势。TTB和MPI的结合,又为多核处理器结点集群提供了并行层次化结构,大大优化集群的性能。 展开更多
关键词 tbb 多核处理器 多核并行编程 RAW threadS OPENMP 对称多处理器集群 MPI
下载PDF
基于TBB的并行Canny算法
6
作者 刘向娇 刘广亮 +1 位作者 赵学武 郭金良 《南阳理工学院学报》 2014年第3期47-50,共4页
在诸多图像边缘检测的算法中,Canny算法具有边缘检测性能良好、不易受噪声的影响、可以在噪声和边缘检测间获得很好的平衡等优点,不足之处是计算量大、实时性差。针对Canny算法存在的计算量大和实时性差等问题,提出了一种并行实现策略,... 在诸多图像边缘检测的算法中,Canny算法具有边缘检测性能良好、不易受噪声的影响、可以在噪声和边缘检测间获得很好的平衡等优点,不足之处是计算量大、实时性差。针对Canny算法存在的计算量大和实时性差等问题,提出了一种并行实现策略,即基于Threading Building Block(TBB)工具和C++语言的并行Canny算法,可以有效的缓解上述问题。通过串、并行算法执行时间的比较,证明了并行算法的优越性。 展开更多
关键词 CANNY算法 tbb 并行算法
下载PDF
基于TBB的二维DCT并行化设计
7
作者 陈荣鑫 杨岳斌 《微计算机应用》 2011年第11期53-57,共5页
线程构造块(TBB)能简化并行化设计,支持高效地实现多核并行功能。给出面向多核计算的二维DCT的并行化方法,并利用TBB平台实现;针对高耗时的余弦计算,利用查表和分块计算措施进行优化,并探讨粒度设置方法。在多核环境中的实验结果表明,... 线程构造块(TBB)能简化并行化设计,支持高效地实现多核并行功能。给出面向多核计算的二维DCT的并行化方法,并利用TBB平台实现;针对高耗时的余弦计算,利用查表和分块计算措施进行优化,并探讨粒度设置方法。在多核环境中的实验结果表明,优化后的并行化方法能有效改善执行性能,获得较好的加速比,且具备可扩展性。 展开更多
关键词 线程构造块 并行化 二维DCT 多核计算
下载PDF
三层并行遗传算法及装箱问题中的应用 被引量:1
8
作者 张丽岩 马健 孙焰 《微型机与应用》 2011年第17期67-70,73,共5页
提出了一个新的基于线程构建模块(TBB)的三层并行遗传算法(TPGA)。与传统遗传算法相比,在保证了算法正确性的前提下提高了运行效率,并将遗传算法的数据编码、任务处理和数据解码分别进行并行化,提高了收敛速度。TBB是Intel提供的能够完... 提出了一个新的基于线程构建模块(TBB)的三层并行遗传算法(TPGA)。与传统遗传算法相比,在保证了算法正确性的前提下提高了运行效率,并将遗传算法的数据编码、任务处理和数据解码分别进行并行化,提高了收敛速度。TBB是Intel提供的能够完整表现并行性的代码库。采用C++语言实现了基于TBB的TPGA和串行遗传算法(SGA),通过大量实验证明,TPGA同SGA相比,不但提高了收敛速度,而且能够取得一致的最优解。 展开更多
关键词 多线程 三层并行遗传算法 线程构建模块 装箱问题
下载PDF
基于Parallel studio的视频编解码并行化优化
9
作者 杨川 杨斌 +1 位作者 李刚 李杰 《微计算机应用》 2010年第3期42-46,共5页
随着计算机技术的不断发展,人们对多媒体技术的实时性有了更高的要求,特别是视频编解码的时间效率。另外,随着多核CPU及相关技术的不断普及,使得原有非并行化程序的性能的不足显现了出来,因此对传统程序的并行化迫在眉睫。本文以目前较... 随着计算机技术的不断发展,人们对多媒体技术的实时性有了更高的要求,特别是视频编解码的时间效率。另外,随着多核CPU及相关技术的不断普及,使得原有非并行化程序的性能的不足显现了出来,因此对传统程序的并行化迫在眉睫。本文以目前较流行的视频编解码算法h.263为例,通过一个具体的视频会议系统,分析传统串行编解码算法的性能,通过英特尔Parallel studio并行化分析工具,找到算法的运行瓶颈,然后用英特尔线程构建模块对编解码算法进行并行化优化,取得了良好的效果。 展开更多
关键词 并行化 英特尔线程构建模块 英特尔并行化分析工具
下载PDF
Mean Shift图像分割算法的并行化 被引量:11
10
作者 李宏益 吴素萍 《中国图象图形学报》 CSCD 北大核心 2013年第12期1610-1619,共10页
图像分割作为高性能并行计算的一个主要应用领域,其算法本身的时间复杂度和实时性需求要求不断改进计算机硬件技术和并行处理的算法。Mean Shift算法是图像分割领域一个比较经典的算法,在图像分割过程中,不需要任何先验知识,是一种无监... 图像分割作为高性能并行计算的一个主要应用领域,其算法本身的时间复杂度和实时性需求要求不断改进计算机硬件技术和并行处理的算法。Mean Shift算法是图像分割领域一个比较经典的算法,在图像分割过程中,不需要任何先验知识,是一种无监督的分割过程,在图像分割的具体实现中应用广泛。利用TBB(threading building block)工具和CUDA(compute unified device architecture)对Mean Shift算法进行多核和GPU(graphic processing unit)并行化改造。首先分析Mean Shift分割过程中最耗时的部分Mean Shift聚类,然后利用TBB和CUDA对Mean Shift聚类进行了并行化改造,并对两种并行方法进行了对比分析。实验结果表明,两种并行方法都取得了较好的加速效果,加速比都随着图像增大和带宽参数的增加而增大,基于TBB的加速比稳定趋于核数。 展开更多
关键词 Mean SHIFT 并行计算 tbb CUDA 图像分割
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部