期刊文献+
共找到96篇文章
< 1 2 5 >
每页显示 20 50 100
PARALLEL IMPLEMENTATION AND OPTIMIZATION OF THE SEBVHOS ALGORITHM 被引量:2
1
作者 Li Wen Guo Li Yuan Hongxing Wei Yifang Guan Hua 《Journal of Electronics(China)》 2011年第3期277-283,共7页
In this paper, a parallel Surface Extraction from Binary Volumes with Higher-Order Smoothness (SEBVHOS) algorithm is proposed to accelerate the SEBVHOS execution. The original SEBVHOS algorithm is parallelized first, ... In this paper, a parallel Surface Extraction from Binary Volumes with Higher-Order Smoothness (SEBVHOS) algorithm is proposed to accelerate the SEBVHOS execution. The original SEBVHOS algorithm is parallelized first, and then several performance optimization techniques which are loop optimization, cache optimization, false sharing optimization, synchronization overhead op-timization, and thread affinity optimization, are used to improve the implementation's performance on multi-core systems. The performance of the parallel SEBVHOS algorithm is analyzed on a dual-core system. The experimental results show that the parallel SEBVHOS algorithm achieves an average of 1.86x speedup. More importantly, our method does not come with additional aliasing artifacts, com-paring to the original SEBVHOS algorithm. 展开更多
关键词 multi-core parallel algorithm Performance optimization 3D reconstruction
下载PDF
多核处理器公平共享并行总线的方法
2
作者 邵龙 《现代电子技术》 北大核心 2024年第3期25-28,共4页
针对综合化电子系统中多个功能运行于同一多核处理器的不同核同时访问同一并行总线的冲突避免以及实时性问题,提出一种基于最小访问颗粒度的多核处理器公平共享并行总线的方法,并详细介绍了该方法的设计实现及验证。该方法不仅通过为每... 针对综合化电子系统中多个功能运行于同一多核处理器的不同核同时访问同一并行总线的冲突避免以及实时性问题,提出一种基于最小访问颗粒度的多核处理器公平共享并行总线的方法,并详细介绍了该方法的设计实现及验证。该方法不仅通过为每核分配一个总线操作缓冲队列保障了同一核的总线操作先到先服务,而且通过单个读写操作周期的公平队列算法保障了每核总线操作的实时性。工程实践表明,该方法是一种多核处理器公平共享并行总线的有效方法。 展开更多
关键词 综合化电子系统 多核处理器 共享并行总线 冲突 公平队列算法 缓冲队列
下载PDF
多核数字信号处理卷积算法并行优化
3
作者 许金伟 王庆林 +4 位作者 李娅琳 姜晶菲 高蕾 李荣春 李东升 《国防科技大学学报》 EI CAS CSCD 北大核心 2024年第1期103-112,共10页
针对国防科技大学自主研发的异构多核数字信号处理(digital signal processing, DSP)芯片的特征以及卷积算法自身特点,提出了一种面向多核DSP架构的高性能多核并行卷积实现方案。针对1×1卷积提出了特征图级多核并行方案;针对卷积... 针对国防科技大学自主研发的异构多核数字信号处理(digital signal processing, DSP)芯片的特征以及卷积算法自身特点,提出了一种面向多核DSP架构的高性能多核并行卷积实现方案。针对1×1卷积提出了特征图级多核并行方案;针对卷积核大于1的卷积提出了窗口级多核并行优化设计,同时提出了逐元素向量化计算的核内并行优化实现。实验结果表明,所提并行优化方法实现单核计算效率最高能达到64.95%,在带宽受限情况下,多核并行扩展效率可达到48.36%~88.52%,在典型网络ResNet50上的执行性能与E5-2640 CPU相比,获得了5.39倍性能加速。 展开更多
关键词 多核DSP 卷积神经网络 卷积算法 并行优化
下载PDF
Revisiting Multiple Pattern Matching Algorithms for Multi-Core Architecture 被引量:2
4
作者 谭光明 刘萍 +1 位作者 卜东波 刘燕兵 《Journal of Computer Science & Technology》 SCIE EI CSCD 2011年第5期866-874,共9页
Due to the huge size of patterns to be searched,multiple pattern searching remains a challenge to several newly-arising applications like network intrusion detection.In this paper,we present an attempt to design effic... Due to the huge size of patterns to be searched,multiple pattern searching remains a challenge to several newly-arising applications like network intrusion detection.In this paper,we present an attempt to design efficient multiple pattern searching algorithms on multi-core architectures.We observe an important feature which indicates that the multiple pattern matching time mainly depends on the number and minimal length of patterns.The multi-core algorithm proposed in this paper leverages this feature to decompose pattern set so that the parallel execution time is minimized.We formulate the problem as an optimal decomposition and scheduling of a pattern set,then propose a heuristic algorithm,which takes advantage of dynamic programming and greedy algorithmic techniques,to solve the optimization problem.Experimental results suggest that our decomposition approach can increase the searching speed by more than 200% on a 4-core AMD Barcelona system. 展开更多
关键词 parallel algorithm multi-core multiple pattern matching
原文传递
多核处理器大规模并行系统中的任务分配问题及算法 被引量:15
5
作者 刘轶 张昕 +1 位作者 李鹤 钱德沛 《小型微型计算机系统》 CSCD 北大核心 2008年第5期972-975,共4页
对基于多核处理器的大规模并行系统中的任务分配问题进行了分析讨论,在此基础上建立了任务分配模型,并提出一种基于迭代的任务分配算法,该算法分为两轮操作,分别完成进程到处理节点和进程内线程到处理器核的分配,每轮操作经过带回溯的... 对基于多核处理器的大规模并行系统中的任务分配问题进行了分析讨论,在此基础上建立了任务分配模型,并提出一种基于迭代的任务分配算法,该算法分为两轮操作,分别完成进程到处理节点和进程内线程到处理器核的分配,每轮操作经过带回溯的多次迭代处理,最终得到任务关系图的划分.实验数据表明该算法能在较短时间内求得近优解,并且当线程个数增大时,算法的求解时间远小于遗传算法. 展开更多
关键词 任务分配 多核处理器 并行计算 启发式算法
下载PDF
多核CPU的海量点云并行kNN算法 被引量:10
6
作者 王宗跃 马洪超 +2 位作者 徐宏根 张建伟 彭检贵 《测绘科学技术学报》 北大核心 2010年第1期46-49,共4页
提出基于多核CPU的海量点云k最近邻(kNN)快速搜索算法。该算法先将点云数据按格网方式进行组织存储于外存;在搜索kNN点时,从搜索点所在的块向外扩张搜索;在多核CPU环境下采用多线程模式进行数据的内外存调度和kNN点搜索。当内存达到设... 提出基于多核CPU的海量点云k最近邻(kNN)快速搜索算法。该算法先将点云数据按格网方式进行组织存储于外存;在搜索kNN点时,从搜索点所在的块向外扩张搜索;在多核CPU环境下采用多线程模式进行数据的内外存调度和kNN点搜索。当内存达到设定上限时,采用距离搜索点最远策略释放内存,降低内外存数据交换的频率。将该方法应用于基于kNN的滤波和格网化方法中,处理速度显著提高。 展开更多
关键词 机载激光雷达 海量点云 k最近邻 多核CPU 并行算法
下载PDF
基于多核处理器的多任务并行处理技术研究 被引量:6
7
作者 汪前进 高勇 李存华 《计算机应用与软件》 CSCD 北大核心 2012年第7期141-143,153,共4页
目前,多核处理器已经越来越普及,但是现有算法并不能有效地并行处理数据,造成硬件资源的浪费。为了提高多核处理器的数据处理能力,针对求两个字符串的公共子串算法,提出一种改进方法,在VS.NET环境使用TPL(任务并行库),调度改进的算法处... 目前,多核处理器已经越来越普及,但是现有算法并不能有效地并行处理数据,造成硬件资源的浪费。为了提高多核处理器的数据处理能力,针对求两个字符串的公共子串算法,提出一种改进方法,在VS.NET环境使用TPL(任务并行库),调度改进的算法处理数据。实验结果表明,改进后的算法可以充分利用多核处理器并行处理数据的特点,提高并行加速比,大大提高数据处理效率。 展开更多
关键词 多核 多任务 并行算法 任务并行库 VS.NET
下载PDF
基于多核平台并行K-Medoids算法研究 被引量:9
8
作者 李静滨 杨柳 华蓓 《计算机应用研究》 CSCD 北大核心 2011年第2期498-500,共3页
分析K-Medoids算法的内在并行性,设计一个适合多核平台的并行算法,并利用OpenMP进行实验。实验结果表明,并行算法对多核环境有很好的适应性,在双核及四核计算机上均获得了较好的加速比与运行效率。
关键词 多核 K-Medoids算法 并行算法 OPENMP
下载PDF
多核技术在数据结构课程中的引入与探讨 被引量:2
9
作者 高云 魏振钢 +3 位作者 洪峰 王小华 杨妍妍 孙喜洲 《计算机教育》 2010年第14期84-86,90,共4页
多核技术是当前计算机学科发展的热门方向,针对将多核技术融入到操作系统、编译原理等课程中出现的学生对基础算法并行化了解甚少的问题,文章提出将多核技术引入到前导课程数据结构中的实施方案,包括课堂教学内容的扩展,多核技术实践大... 多核技术是当前计算机学科发展的热门方向,针对将多核技术融入到操作系统、编译原理等课程中出现的学生对基础算法并行化了解甚少的问题,文章提出将多核技术引入到前导课程数据结构中的实施方案,包括课堂教学内容的扩展,多核技术实践大纲及实例,并引入基于多核的课程设计。实践证明,新的教学方法增进了学生对多核技术和并行算法的了解。 展开更多
关键词 数据结构 多核技术 并行算法
下载PDF
完全拓扑关系结构D-TIN多核并行构建 被引量:3
10
作者 刘德儿 熊证 +2 位作者 沈敬伟 朱晓璠 徐昕 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2016年第6期950-959,共10页
为了充分利用普通PC机多核CPU计算资源实现大数据量离散点集矢量地形快速构建,提出具有完全拓扑关系结构D-TIN的多核并行生成算法.首先基于四方边缘结构设计具有完全拓扑关系的D-TIN数据结构及系列函数接口,用于操作该数据结构;然后顾... 为了充分利用普通PC机多核CPU计算资源实现大数据量离散点集矢量地形快速构建,提出具有完全拓扑关系结构D-TIN的多核并行生成算法.首先基于四方边缘结构设计具有完全拓扑关系的D-TIN数据结构及系列函数接口,用于操作该数据结构;然后顾及线程间数据负载平衡和空间均质性,采用坐标排序法对离散点集进行均等虚拟划分;再基于离散点集凸包"生成—消融—生成"周期性特征和分治算法思想设计D-TIN串行构建算法;最后以其作为D-TIN并行构建算法的内核,Open MP作为多核并行编程模型,实现了单机多核环境下的D-TIN并行构建.实验结果表明,当数据量较大时,该算法效率明显高于串行算法,且两者的计算结果具有完全一致性;同时,参与计算线程数与总耗时呈负相关. 展开更多
关键词 Delaunay不规则三角网 多核并行 分治算法 四方边缘结构 OPENMP
下载PDF
基于并行技术的大规模矢量地图可视化方法 被引量:6
11
作者 张立强 徐翔 谭继强 《地理与地理信息科学》 CSCD 北大核心 2013年第4期9-12,共4页
随着测绘、遥感及相关技术的发展,矢量地图的数据规模和细节层次迅速增加,它们含有大量复杂地理空间要素,且要素间存在复杂的拓扑几何关系,使得大规模矢量地图的快速可视化对于高性能并行计算的需求十分迫切。为了实现大数据量矢量地图... 随着测绘、遥感及相关技术的发展,矢量地图的数据规模和细节层次迅速增加,它们含有大量复杂地理空间要素,且要素间存在复杂的拓扑几何关系,使得大规模矢量地图的快速可视化对于高性能并行计算的需求十分迫切。为了实现大数据量矢量地图实时可视化,提出了基于多核CPU和GPU的矢量地图快速可视化的方法。在GPU进行并行计算的同时,利用多核CPU创建多线程进行数据读写,隐藏数据I/O时间,提高显示的实时性。实验表明,与串行方法相比,该文的并行方法在大数据量矢量地图简化和可视化效率上有了极大提高。 展开更多
关键词 矢量地图 并行算法 多核处理器 GPU
下载PDF
近红外光谱多核并行谱区选择任务调度策略研究 被引量:1
12
作者 黄华 朱洁 +2 位作者 刘广昊 吴习宇 祝诗平 《农业机械学报》 EI CAS CSCD 北大核心 2018年第10期270-274,283,共6页
在近红外光谱的谱区选择算法中,滑动窗口偏最小二乘法具有较高的预测精度,但是其程序运行时间很长。在不改变算法预测精度的前提下,首先以分段间隔偏最小二乘法为基础研究了顺序分配法、等间距法和排序法等3种任务调度策略对并行算法性... 在近红外光谱的谱区选择算法中,滑动窗口偏最小二乘法具有较高的预测精度,但是其程序运行时间很长。在不改变算法预测精度的前提下,首先以分段间隔偏最小二乘法为基础研究了顺序分配法、等间距法和排序法等3种任务调度策略对并行算法性能的影响。在这3种任务调度策略中,排序法具有较好的负载均衡性和较高的并行效率。然后在16核云计算平台下将排序法分配策略分别应用于组合分段偏最小二乘法、反向分段偏最小二乘法和滑动窗口偏最小二乘法等谱区的并行选择算法中。经实验测试,在单核串行算法下反向分段偏最小二乘法和滑动窗口偏最小二乘法的程序运行时间分别为9.22 h和55.51 h,在排序法分配策略下采用2核并行算法时其程序运行时间分别缩短为4.98 h和29.03 h,分别节省了45.99%和47.70%的程序运行时间。实验结果表明:当考虑并行效率和计算成本时,在1~16核的并行算法中,选用2核并行执行以上4种谱区选择算法都具有最高的并行效率和性价比。 展开更多
关键词 近红外光谱 谱区选择 多核并行算法 任务调度策略
下载PDF
三次插值样条曲线拟合多核并行算法 被引量:5
13
作者 苗莎 郑晓薇 《计算机应用》 CSCD 北大核心 2010年第A12期3194-3196,共3页
充分利用多核技术提升多核处理器的资源利用率,缩短执行时间,发挥多核系统的优异性能。在多核计算机上设计了解三对角方程组的奇偶约化多线程并行程序,实现了三次样条曲线拟合的快速计算。通过实验结果的加速比对比,可以看出并行后缩短... 充分利用多核技术提升多核处理器的资源利用率,缩短执行时间,发挥多核系统的优异性能。在多核计算机上设计了解三对角方程组的奇偶约化多线程并行程序,实现了三次样条曲线拟合的快速计算。通过实验结果的加速比对比,可以看出并行后缩短了求解方程组的时间,多核资源得到充分利用。结果表明,奇偶约化多核并行算法在三次样条曲线拟合中的应用是有效及可行的。 展开更多
关键词 多核 三对角方程组 并行算法 样条曲线 加速比
下载PDF
多核图像处理并行设计范式的研究与应用 被引量:8
14
作者 王成良 谢克家 刘昕 《计算机工程》 CAS CSCD 北大核心 2011年第14期220-222,225,共4页
多核计算环境下采用图像处理并行算法可提高图像处理的速度,但已有的并行设计只针对边缘检测、图像投影等特定算法进行,没有形成通用的并行算法设计范式。为此,在研究图像处理算法可并行处理机制和多核架构特点的基础上,提出分析、建模... 多核计算环境下采用图像处理并行算法可提高图像处理的速度,但已有的并行设计只针对边缘检测、图像投影等特定算法进行,没有形成通用的并行算法设计范式。为此,在研究图像处理算法可并行处理机制和多核架构特点的基础上,提出分析、建模、映射、调试和性能评价及测试发布等5个设计步骤的基于多核计算环境的图像处理算法并行设计范式,以图像傅里叶变换并行算法设计为例在单核、双核、四核、八核计算环境下验证了该并行范式的有效性。实验结果表明,该范式在图像处理并行设计方面可扩展图像处理的应用空间。 展开更多
关键词 并行算法 并行设计范式 图像处理 多核计算环境 可扩展性
下载PDF
多种数据划分方法下D8算法的多核并行化实验对比 被引量:3
15
作者 高琪 范俊甫 +2 位作者 何惠馨 孔维华 周玉科 《地理与地理信息科学》 CSCD 北大核心 2017年第2期63-68,共6页
对地观测技术的快速发展使空间数据规模迅速增大,海量高分辨率DEM数据使得GIS数字地形分析算法面临日益严重的效率瓶颈,多核并行计算技术是在PC端解决上述问题的潜在途径,而并行任务调度策略、数据划分方法是影响并行算法计算效率的重... 对地观测技术的快速发展使空间数据规模迅速增大,海量高分辨率DEM数据使得GIS数字地形分析算法面临日益严重的效率瓶颈,多核并行计算技术是在PC端解决上述问题的潜在途径,而并行任务调度策略、数据划分方法是影响并行算法计算效率的重要因素。该文以河网提取中流向算法D8算法为例,基于OpenMP多核并行编程模型,在最佳任务调度策略下研究按行、列、块进行任务分解对该算法计算效率的影响。实验结果表明,不同数据划分方法对计算效率的影响存在差异。结合dynamic任务调度策略,对该算法采用行划分方法,并调用计算机最大可用线程个数16时并行加速效果最佳,加速比峰值达到13.88;划分块数为16时,运行加速比最高为13.46;按列划分加速比峰值达到12.829;而划分成9块和4块最高加速比仅为7.97和3.83。 展开更多
关键词 DEM 数据划分 D8算法 多核并行优化
下载PDF
基于OpenMP的文件压缩与解压的并行设计模型 被引量:2
16
作者 胡荣 邹承明 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2014年第8期2684-2690,共7页
在多核环境下,对文件压缩与解压并行算法进行研究,提出一种基于OpenMP的文件压缩处理并行设计模型。该模型由查找热点代码、并行化分析、并行建模、实现、调试等步骤组成。以动态哈夫曼算法为研究算法,将多核压缩处理并行设计模型应用... 在多核环境下,对文件压缩与解压并行算法进行研究,提出一种基于OpenMP的文件压缩处理并行设计模型。该模型由查找热点代码、并行化分析、并行建模、实现、调试等步骤组成。以动态哈夫曼算法为研究算法,将多核压缩处理并行设计模型应用到文件压缩与解压中。并在文件并行处理过程中,与数据分解法相结合对数据文件进行分割,将分解后的数据由主线程分给多个处理器上的多个子线程来并行处理,以此提高多核处理器的利用率并提高文件压缩效率。最后通过实验模拟验证模型以及算法性能。研究结果表明:在八核处理器下通过对文本文件、图像文件和音频文件等多种不同类型文件进行压缩解压试验,验证了动态Huffman并行算法与串行算法相比其加速比可以达到1.5~8.0倍,性能也得到很大提高。 展开更多
关键词 OPENMP 并行设计模型 多核多线程 Huffman并行算法
下载PDF
基于通用多核处理器平台的并行基因表达式编程算法 被引量:1
17
作者 吴江 唐常杰 +3 位作者 李太勇 姜玥 李自力 刘洋洋 《计算机科学》 CSCD 北大核心 2011年第11期296-302,共7页
基因表达式编程(Gene Expression Programming,GEP)是一种计算量大且通用性强的新型进化算法,其传统计算形式不能充分利用目前主流的多核处理器。为提高算法效率,提出了基于通用多核处理器平台的并行基因表达式编程算法(Parallel Gene E... 基因表达式编程(Gene Expression Programming,GEP)是一种计算量大且通用性强的新型进化算法,其传统计算形式不能充分利用目前主流的多核处理器。为提高算法效率,提出了基于通用多核处理器平台的并行基因表达式编程算法(Parallel Gene Expression Programming Based on General Multi-core Processor,PGEP-MP)。主要工作包括:(1)分析通用多核处理器平台下并行基因表达式编程算法的机理;(2)利用MPI和OpenMP混合编程模型设计基于通用多核处理器平台的基因表达式编程算法的粗粒度与细粒度相结合的并行模型;(3)提出改进PGEP-MP算法效率的进化策略;(4)通过对函数挖掘和分类的实验证明,PGEP-MP算法提高了函数挖掘和分类的效率,在并行双核处理器数为4的情况下,PGEP-MP的平均并行加速比分别是传统GEP算法的4.22倍和4.06倍。 展开更多
关键词 基因表达式编程 多核处理器 并行 进化算法
下载PDF
基于多核微机的微粒群并行算法 被引量:3
18
作者 陈华 范宜仁 +1 位作者 邓少贵 李智强 《计算机工程与应用》 CSCD 北大核心 2010年第13期34-36,共3页
提出了一种基于Logistic模型的惯性权重非线性调整策略,采用OpenMP多线程编程,在微机上实现了微粒群算法的多核并行计算。通过对BenchMark测试函数集中的5个函数进行测试,试验结果表明,采用基于Logistic模型的惯性权重非线性调整策略在... 提出了一种基于Logistic模型的惯性权重非线性调整策略,采用OpenMP多线程编程,在微机上实现了微粒群算法的多核并行计算。通过对BenchMark测试函数集中的5个函数进行测试,试验结果表明,采用基于Logistic模型的惯性权重非线性调整策略在算法成功率和收敛代数都优于线性调整策略,而基于OpenMP的微粒群多核并行计算使得计算速度得到提高。 展开更多
关键词 OPENMP 微粒群优化算法 多核并行计算
下载PDF
基于Gram-Schmidt正交法的矩阵并行QR分解算法 被引量:4
19
作者 黄丽嫦 黄润 《佛山科学技术学院学报(自然科学版)》 CAS 2013年第3期44-47,共4页
分析了线性无关向量组的Gram-Schmidt正交化过程以及矩阵的QR分解原理。在多核架构的微机中,设计实现了一种基于Gram-Schmidt正交法的矩阵QR多核并行分解算法。新算法易于计算机编程实现,数值实验也验证了算法具有良好的并行性。
关键词 Gram—Schmidt正交法 QR分解 多核并行计算
下载PDF
多核处理器上的并行联机分析处理算法研究 被引量:1
20
作者 周国亮 王桂兰 朱永利 《计算机科学与探索》 CSCD 2013年第2期180-190,共11页
近年来,计算机硬件技术获得了很大发展,尤其是大内存和多核,但算法效率并没有随着硬件技术的发展而提高,根本原因是没有充分利用CPU缓存以及单线程程序设计的局限性。在联机分析处理领域,数据方体计算是一个重要而又耗时的操作,因此如... 近年来,计算机硬件技术获得了很大发展,尤其是大内存和多核,但算法效率并没有随着硬件技术的发展而提高,根本原因是没有充分利用CPU缓存以及单线程程序设计的局限性。在联机分析处理领域,数据方体计算是一个重要而又耗时的操作,因此如何提高数据方体的计算效率是该领域的一个研究难点。探讨了基于多核CPU特征的并行立方体算法,提出了MT-Multi-Way(multi-threading multi-way)和MT-BUC(multi-threading bottom-up computation)算法。该算法通过有效的数据划分和多线程协作,避免了Cache竞争,并确保了负载均衡,获得了近似线性加速比。以上述算法为基础,提出了处理立方体算法的多核框架,包括数据划分策略及递归算法的多核处理,指导立方体算法的并行化。 展开更多
关键词 多核处理器 并行算法 立方体计算 框架
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部