期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于TBB和Cilk++的并行蚁群算法在路径寻优中的应用 被引量:7
1
作者 王磊 曹菡 《计算机应用》 CSCD 北大核心 2010年第10期2781-2784,共4页
针对实际道路路网的一类路径寻优问题,提出了带回退机制的蚁群搜索算法,求解在实际道路路网中完成遍历所有规定节点的一条较优路径。为解决大规模实际道路路网数据量大、蚁群算法收敛速度慢的问题,分别采用Intel Threading Building Blo... 针对实际道路路网的一类路径寻优问题,提出了带回退机制的蚁群搜索算法,求解在实际道路路网中完成遍历所有规定节点的一条较优路径。为解决大规模实际道路路网数据量大、蚁群算法收敛速度慢的问题,分别采用Intel Threading Building Blocks(TBB)和Cilk++并行编程模型实现了并行蚁群搜索。与基于WinAPI函数的多线程蚁群算法相比,这两种模型均避免了手动启动线程及识别临界区资源等复杂操作,开发难度降低;在运行效率方面,基于TBB的并行蚁群算法和基于WinAPI的并行蚁群算法效率接近,而基于Cilk++的并行蚁群算法在双核环境下,运行效率和加速比都超过了基于WinAPI的并行蚁群算法。 展开更多
关键词 TBB cilk++ 并行蚁群算法 多核
下载PDF
基于Cilk的不确定机械手主控LM算法并行化研究
2
作者 李旺 潘谜 王巍 《集美大学学报(自然科学版)》 CAS 2017年第3期55-59,共5页
由于不确定机械手本身的非线性、复杂的特性,普通主控算法无法实现有效控制。提出了基于Cilk的主控LM算法,旨在通过多核并行处理,提高系统的响应能力。建立了基于LM的核心算法,并针对3种拟合函数作并行化处理,研究Cilk并行化对算法性能... 由于不确定机械手本身的非线性、复杂的特性,普通主控算法无法实现有效控制。提出了基于Cilk的主控LM算法,旨在通过多核并行处理,提高系统的响应能力。建立了基于LM的核心算法,并针对3种拟合函数作并行化处理,研究Cilk并行化对算法性能的影响。实验表明,Cilk能够有效提升LM算法性能,从而提升主控系统的响应能力。 展开更多
关键词 并行处理 LM算法 cilk
下载PDF
基于Cilk++的遗传算法并行化改造实现
3
作者 杨川 杨斌 《网络新媒体技术》 2012年第5期54-60,共7页
遗传算法是模拟生物进化过程的一种计算模型,在同一代种群间进行基因的选择、交叉和变异时,具有良好的并行性。遗传算法在实际的应用中,选取的种群数目往往比较大,处理的数据量巨大,因此算法性能比较低。目前,处理器已经进入多核时代,... 遗传算法是模拟生物进化过程的一种计算模型,在同一代种群间进行基因的选择、交叉和变异时,具有良好的并行性。遗传算法在实际的应用中,选取的种群数目往往比较大,处理的数据量巨大,因此算法性能比较低。目前,处理器已经进入多核时代,但传统的程序还是基于单核编写,程序性能并没有随着处理器数目增加而增加。因此,通过对遗传算法进行并行化改造,使得算法能够充分利用多核处理器资源,算法的性能大大提升。并行遗传算法的实现,符合未来多核程序设计的发展方向,有利于遗传算法更广泛的运用。 展开更多
关键词 遗传算法 cilk 并行化
下载PDF
Cilk++与OpenMP并行模型性能比较
4
作者 王磊 《现代电子技术》 2012年第12期110-113,共4页
构造了两种并行蚁群算法模型,在单机多核下实现了Cilk++并行蚁群算法及OpenMP并行蚁群算法,并应用于真实路网车辆路径问题(Vehicle Routing Problem,VRP)对两者进行了实验对比。实验结果表明,OpenMP模型的并行性能与问题规模有较大关系,... 构造了两种并行蚁群算法模型,在单机多核下实现了Cilk++并行蚁群算法及OpenMP并行蚁群算法,并应用于真实路网车辆路径问题(Vehicle Routing Problem,VRP)对两者进行了实验对比。实验结果表明,OpenMP模型的并行性能与问题规模有较大关系,OpenMP并行蚁群算法与基于winapi多线程的并行蚁群算法相比效率相近。Cilk++模型在双核下性能优于OpenMP模型,四核下不及OpenMP模型。 展开更多
关键词 蚁群算法 TBB cilk++ OPENMP
下载PDF
众核体系结构对Cilk语言的硬件支持及评测研究 被引量:7
5
作者 龙国平 张军超 范东睿 《计算机学报》 EI CSCD 北大核心 2008年第11期1975-1985,共11页
如何编程众核体系结构是当前一个亟待解决的问题.研究可扩展的硬件机制支持Cilk编程模型的目的是在良好的编程性和可扩展硬件实现之间达到平衡.Cilk语言是C的精简扩展,程序员编写Cilk程序时和串行编程近似,且不需关心调度、负载均衡和... 如何编程众核体系结构是当前一个亟待解决的问题.研究可扩展的硬件机制支持Cilk编程模型的目的是在良好的编程性和可扩展硬件实现之间达到平衡.Cilk语言是C的精简扩展,程序员编写Cilk程序时和串行编程近似,且不需关心调度、负载均衡和局部性等系统底层相关的问题.文中以域一致性存储模型为基础,主要工作包括两方面:首先针对域一致性模型编程性不好的缺点提出一种以数据为中心维护高速缓存一致性的方法;其次提出实现DAG Consistency的缓存一致性协议,并在此基础上支持Cilk编程模型.实验结果表明,当处理器核数目较少(<16)时所有测试程序都能获得比较好的性能加速,并且指出了众核情况下(>16)难以获得理想加速效果的两个根本原因:静态路由导致片上网络带宽利用不均衡以及有限的访存带宽. 展开更多
关键词 众核体系结构 cilk 域一致性 编程模型 存储模型
下载PDF
基于分治法求解对称三对角矩阵特征问题的MPI/Cilk混合并行算法 被引量:3
6
作者 朱京乔 赵永华 《郑州大学学报(理学版)》 CAS 北大核心 2020年第1期33-38,共6页
对称稠密矩阵特征问题的求解通常转化为三对角矩阵特征问题的求解,基于对称三对角矩阵特征求解的分而治之方法,提出了一种基于消息传递接口(message passing interface,MPI)+Cilk多任务并行模型的混合求解算法,采用进程间数据并行和进... 对称稠密矩阵特征问题的求解通常转化为三对角矩阵特征问题的求解,基于对称三对角矩阵特征求解的分而治之方法,提出了一种基于消息传递接口(message passing interface,MPI)+Cilk多任务并行模型的混合求解算法,采用进程间数据并行和进程内多线程任务并行的方法,实现了对分而治之算法中分治阶段和合并阶段的多任务划分和动态调度。进程内利用Cilk任务执行的有向无环图模型,解决了线程级并行的数据依赖和饥饿等待等问题,提高了程序的并行性;进程间通过粗粒度计算任务的划分,优化了MPI部分的数据通信流程和负载均衡问题。数值实验表明,混合并行算法在计算性能和可扩展性方面都要优于纯MPI并行算法。 展开更多
关键词 三对角矩阵 对称特征问题 并行计算 分治算法 cilk MPI
下载PDF
基于分治法求解对称三对角矩阵特征问题的混合并行实现
7
作者 朱京乔 赵永华 《计算机系统应用》 2019年第9期246-250,共5页
基于对称三对角矩阵特征求解的分而治之方法,提出了一种改进的使用MPI/Cilk模型求解的混合并行实现,结合节点间数据并行和节点内多任务并行,实现了对分治算法中分治阶段和合并阶段的多任务划分和动态调度.节点内利用Cilk任务并行模型解... 基于对称三对角矩阵特征求解的分而治之方法,提出了一种改进的使用MPI/Cilk模型求解的混合并行实现,结合节点间数据并行和节点内多任务并行,实现了对分治算法中分治阶段和合并阶段的多任务划分和动态调度.节点内利用Cilk任务并行模型解决了线程级并行的数据依赖和饥饿等待等问题,提高了并行性;节点间通过改进合并过程中的通信流程,使组内进程间只进行互补的数据交换,降低了通信开销.数值实验体现了该混合并行算法在计算效率和扩展性方面的优势. 展开更多
关键词 并行计算 对称特征问题 分治算法 cilk
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部