期刊文献+
共找到492篇文章
< 1 2 25 >
每页显示 20 50 100
基于OpenMP的Multi-Critical分子动力学并行算法优化 被引量:4
1
作者 段振华 白明泽 豆育升 《计算机应用研究》 CSCD 北大核心 2012年第7期2432-2434,共3页
为提高分子动力学模拟在多核共享内存式服务器上的运算速度,在现有的分子动力学并行算法基础上提出了Multi-Critical算法。该算法使用手动划分力矩阵的方法,使多个线程进入不同名的临界区,并使用分块叠加的方法优化了并行算法,提高了并... 为提高分子动力学模拟在多核共享内存式服务器上的运算速度,在现有的分子动力学并行算法基础上提出了Multi-Critical算法。该算法使用手动划分力矩阵的方法,使多个线程进入不同名的临界区,并使用分块叠加的方法优化了并行算法,提高了并行效率。实验结果表明,对比之前的Critical算法,该算法的加速比和并行效率均有较大幅度的提高。 展开更多
关键词 分子动力学 并行计算 多核处理器 开放式多处理 临界区
下载PDF
基于多核平台并行K-Medoids算法研究 被引量:9
2
作者 李静滨 杨柳 华蓓 《计算机应用研究》 CSCD 北大核心 2011年第2期498-500,共3页
分析K-Medoids算法的内在并行性,设计一个适合多核平台的并行算法,并利用OpenMP进行实验。实验结果表明,并行算法对多核环境有很好的适应性,在双核及四核计算机上均获得了较好的加速比与运行效率。
关键词 多核 K-Medoids算法 并行算法 OPENMP
下载PDF
完全拓扑关系结构D-TIN多核并行构建 被引量:3
3
作者 刘德儿 熊证 +2 位作者 沈敬伟 朱晓璠 徐昕 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2016年第6期950-959,共10页
为了充分利用普通PC机多核CPU计算资源实现大数据量离散点集矢量地形快速构建,提出具有完全拓扑关系结构D-TIN的多核并行生成算法.首先基于四方边缘结构设计具有完全拓扑关系的D-TIN数据结构及系列函数接口,用于操作该数据结构;然后顾... 为了充分利用普通PC机多核CPU计算资源实现大数据量离散点集矢量地形快速构建,提出具有完全拓扑关系结构D-TIN的多核并行生成算法.首先基于四方边缘结构设计具有完全拓扑关系的D-TIN数据结构及系列函数接口,用于操作该数据结构;然后顾及线程间数据负载平衡和空间均质性,采用坐标排序法对离散点集进行均等虚拟划分;再基于离散点集凸包"生成—消融—生成"周期性特征和分治算法思想设计D-TIN串行构建算法;最后以其作为D-TIN并行构建算法的内核,Open MP作为多核并行编程模型,实现了单机多核环境下的D-TIN并行构建.实验结果表明,当数据量较大时,该算法效率明显高于串行算法,且两者的计算结果具有完全一致性;同时,参与计算线程数与总耗时呈负相关. 展开更多
关键词 Delaunay不规则三角网 多核并行 分治算法 四方边缘结构 OPENMP
下载PDF
libpcap-MT:一种多线程的通用数据包捕获库 被引量:8
4
作者 温曙光 谢高岗 《计算机研究与发展》 EI CSCD 北大核心 2011年第5期756-764,共9页
libpcap数据包捕获函数库提供数据包捕获、过滤等上层API,目前广泛被网络协议分析、入侵检测等数据包处理系统使用.多核、多CPU通用计算平台为数据包的高速处理提供可能,但libpcap提供的单线程机制难以充分利用多核、多CPU平台的并行计... libpcap数据包捕获函数库提供数据包捕获、过滤等上层API,目前广泛被网络协议分析、入侵检测等数据包处理系统使用.多核、多CPU通用计算平台为数据包的高速处理提供可能,但libpcap提供的单线程机制难以充分利用多核、多CPU平台的并行计算能力.设计并实现了一种支持多线程的libpcap:libpcap-MT.libpcap-MT在内核态进行高效的数据包分发,采用无锁的多缓存队列允许多线程同时读取数据包,提供灵活的数据包分发策略,接口与libpcap保持兼容.实验结果表明,使用libpcap-MT能够快速地将现有的系统多线程化,并且具有更好的性能和可扩展性. 展开更多
关键词 数据包捕获 多线程程序模型 多核 并行优化 应用编程接口
下载PDF
大整数乘法Sch?nhage-Strassen算法的多核并行化研究 被引量:2
5
作者 赵玉文 刘芳芳 +1 位作者 蒋丽娟 杨超 《软件学报》 EI CSCD 北大核心 2018年第12期3604-3613,共10页
基于数论转换的Sch?nhage-Strassen算法(简称SSA)是目前实际应用中使用较多、速度较快的大整数乘法算法之一.首先对SSA算法原理进行了详细分析,然后从细粒度的角度对SSA算法在多核平台进行比较细致的并行优化.基于大整数运算开源库GMP... 基于数论转换的Sch?nhage-Strassen算法(简称SSA)是目前实际应用中使用较多、速度较快的大整数乘法算法之一.首先对SSA算法原理进行了详细分析,然后从细粒度的角度对SSA算法在多核平台进行比较细致的并行优化.基于大整数运算开源库GMP实现了SSA算法并行化方案,并在Intel X86平台进行了验证和测试.经测试,8线程时的最大加速比可达到6.59,平均加速比6.41.在浪潮TS850服务器对并行方案的扩展性进行测试,实验结果表明:SSA算法并行方案具有良好的扩展性,最大加速比可达21.42. 展开更多
关键词 大整数乘法 Schonhage-Strassen算法(SSA) 傅里叶变换 FFT 多核并行
下载PDF
一种面向多核处理器的高效并行PCA-SIFT算法 被引量:7
6
作者 刘仲 邢彬朝 陈跃跃 《国防科技大学学报》 EI CAS CSCD 北大核心 2012年第4期103-107,共5页
提出一种面向多核处理器的并行PCA-SIFT算法,采用数据级并行方法实现并行的特征提取和特征点匹配,将计算任务分配到各个DSP核并行处理,充分开发多核处理器的多级并行性。实验结果表明,并行PCA-SIFT算法对各种不同图像形变的图像具有良... 提出一种面向多核处理器的并行PCA-SIFT算法,采用数据级并行方法实现并行的特征提取和特征点匹配,将计算任务分配到各个DSP核并行处理,充分开发多核处理器的多级并行性。实验结果表明,并行PCA-SIFT算法对各种不同图像形变的图像具有良好的适应性,具有接近串行PCA-SIFT算法的图像匹配能力,平均加速比达3.12。 展开更多
关键词 并行 PCA-SIFT 图像匹配 多核处理器
下载PDF
基于多核CPU-GPU异构平台的并行Agent仿真 被引量:4
7
作者 余文广 王维平 +1 位作者 侯洪涛 李群 《系统工程与电子技术》 EI CSCD 北大核心 2012年第8期1716-1722,共7页
多核中央处理器(central processing units,CPU)-图形处理器(graphics processing units,GPU)异构平台为提高并行Agent仿真(parallel Agent-based simulation,PABS)在单机上的运行性能提供了一个更高效的硬件基础,但在当前相关研究中,... 多核中央处理器(central processing units,CPU)-图形处理器(graphics processing units,GPU)异构平台为提高并行Agent仿真(parallel Agent-based simulation,PABS)在单机上的运行性能提供了一个更高效的硬件基础,但在当前相关研究中,还缺乏一般性的理论方法来指导并行Agent仿真将多核CPU和GPU的计算资源充分利用起来。通过分析多核CPU-GPU异构并行架构的特点,在方法论层面上建立了并行Agent仿真在多核CPU-GPU异构平台下的多层负载分配模型,并根据基于Agent的仿真的执行结构,提出了对基于Agent的仿真的计算结构、数据结构进行重构的方法,以适应异构的硬件架构。最后对基于多核CPU-GPU的并行Agent仿真性能进行了实验分析。 展开更多
关键词 并行Agent仿真 多核中央处理器 图形处理器 异构平台
下载PDF
多核CPU-GPU异构平台下并行Agent仿真负载均衡方法 被引量:3
8
作者 王维平 余文广 +1 位作者 侯洪涛 李群 《系统工程与电子技术》 EI CSCD 北大核心 2012年第11期2366-2373,共8页
多核中央处理器(central processing unit,CPU)-图形处理器(graphic processing unit,GPU)异构平台为并行Agent仿真提供了一个新的硬件执行平台,而负载均衡方法是充分利用硬件计算资源、提高并行仿真运行性能的一个有效途径。针对多核CP... 多核中央处理器(central processing unit,CPU)-图形处理器(graphic processing unit,GPU)异构平台为并行Agent仿真提供了一个新的硬件执行平台,而负载均衡方法是充分利用硬件计算资源、提高并行仿真运行性能的一个有效途径。针对多核CPU-GPU异构平台下并行Agent仿真的负载均衡问题,建立了面向多核CPU-GPU的并行Agent仿真多层负载分配模型,提出了基于带约束的k-means空间聚类算法的并行Agent仿真静态负载划分方法和动态负载均衡策略,并给出了划分子集间的可交互性判定,以过滤掉大量不会发生交互关系的Agent之间的交互判定计算。最后通过实验验证了本文提出方法的有效性。 展开更多
关键词 并行Agent仿真 多核中央处理器 图形处理器 负载均衡
下载PDF
基于Gram-Schmidt正交法的矩阵并行QR分解算法 被引量:4
9
作者 黄丽嫦 黄润 《佛山科学技术学院学报(自然科学版)》 CAS 2013年第3期44-47,共4页
分析了线性无关向量组的Gram-Schmidt正交化过程以及矩阵的QR分解原理。在多核架构的微机中,设计实现了一种基于Gram-Schmidt正交法的矩阵QR多核并行分解算法。新算法易于计算机编程实现,数值实验也验证了算法具有良好的并行性。
关键词 Gram—Schmidt正交法 QR分解 多核并行计算
下载PDF
多核CPU-GPU协同的并行深度优先算法 被引量:2
10
作者 余莹 李肯立 《计算机应用研究》 CSCD 北大核心 2014年第10期2982-2985,共4页
针对多核CPU和GPU环境下图的深度优先搜索问题,提出多核CPU中实现并行DFS的新算法,通过有效利用内存带宽来提高性能,且当图增大时优势越明显。在此基础上提出一种混合方法,为DFS每一分支动态地选择最佳的实现:顺序执行;两种不同算法的... 针对多核CPU和GPU环境下图的深度优先搜索问题,提出多核CPU中实现并行DFS的新算法,通过有效利用内存带宽来提高性能,且当图增大时优势越明显。在此基础上提出一种混合方法,为DFS每一分支动态地选择最佳的实现:顺序执行;两种不同算法的多核执行;GPU执行。混合算法为每种大小的图提供相对更好的性能,且能避免高直径图上的最坏情况。通过比较多CPU和GPU系统,分析底层架构对DFS性能的影响。实验结果表明,一个高端single-socket GPU系统的DFS执行性能相当于一个高端4-socket CPU系统。 展开更多
关键词 多核CPU GPU 深度优先搜索 并行 异构
下载PDF
基于YHFT-QDSP的并行图像匹配算法 被引量:1
11
作者 刘仲 邢彬朝 扈啸 《计算机工程与科学》 CSCD 北大核心 2012年第4期47-51,共5页
提出一种基于YHFT-QDSP的并行图像匹配算法,采用数据级并行方法实现并行的特征提取和特征点匹配,充分开发了多核处理器的多级并行性。实现和评测了SIFT、SURF、PCA-SIFT的并行算法。实验结果表明,并行图像匹配算法对各种不同图像形变具... 提出一种基于YHFT-QDSP的并行图像匹配算法,采用数据级并行方法实现并行的特征提取和特征点匹配,充分开发了多核处理器的多级并行性。实现和评测了SIFT、SURF、PCA-SIFT的并行算法。实验结果表明,并行图像匹配算法对各种不同图像形变具有良好的适应性,具有接近串行算法的图像匹配能力,平均加速比达3.2。 展开更多
关键词 并行 SIFT 图像匹配 多核处理器
下载PDF
并行蚁群算法求解加权MAX-SAT 被引量:4
12
作者 孙如祥 唐天兵 李炳慧 《计算机应用研究》 CSCD 北大核心 2012年第1期49-51,共3页
为了使得算法对蚁群进化的控制更加直接、算法更加高效,针对加权MAX-SAT的特点,以重离散化方式简化蚁群算法模型,提出取值概率的概念,并以之替换传统蚁群算法中信息素,最后对该算法作并行化改进。实验结果表明,得到的基于改进后并行化... 为了使得算法对蚁群进化的控制更加直接、算法更加高效,针对加权MAX-SAT的特点,以重离散化方式简化蚁群算法模型,提出取值概率的概念,并以之替换传统蚁群算法中信息素,最后对该算法作并行化改进。实验结果表明,得到的基于改进后并行化的蚁群算法更具有效性,搜索时间明显降低,取得了较好的加速比和效率。 展开更多
关键词 蚁群算法 加速比 并行 最大化可满足性问题(MAX-SAT) 加权MAX-SAT 多核
下载PDF
基于Erlang的多核并行计算N-皇后问题
13
作者 孙黎明 桑军 向宏 《计算机工程与应用》 CSCD 2012年第17期72-75,118,共5页
为了充分利用多核CPU的资源,利用并行计算来处理问题已逐渐成为主流。利用Erlang中的并行机制计算N-皇后问题,设计并实现了并行计算N-皇后问题的算法。实验结果表明,该算法有效地提升了多核计算机资源的利用率,提高了求解问题的效率。此... 为了充分利用多核CPU的资源,利用并行计算来处理问题已逐渐成为主流。利用Erlang中的并行机制计算N-皇后问题,设计并实现了并行计算N-皇后问题的算法。实验结果表明,该算法有效地提升了多核计算机资源的利用率,提高了求解问题的效率。此外,由于Erlang本身具有数据处理上限只受硬件处理能力限制的特性,算法可扩展性也比较强。 展开更多
关键词 ERLANG 多核 并行计算 N-皇后问题
下载PDF
基于多核处理器的高清实时MPEG-2——H.264转码器设计 被引量:2
14
作者 叶朝敏 陈颖琪 高志勇 《电视技术》 北大核心 2012年第21期15-19,共5页
基于多核处理器的并行计算为实时实现高清MPEG-2至H.264转码器提供了1种可行的实现方案。提出了1种多颗粒度的MPEG-2—H.264全解全编并行转码器设计方案,其中MPEG-2解码器采用了帧内与数据级两级并行,H.264编码器采用了帧间、帧内与数... 基于多核处理器的并行计算为实时实现高清MPEG-2至H.264转码器提供了1种可行的实现方案。提出了1种多颗粒度的MPEG-2—H.264全解全编并行转码器设计方案,其中MPEG-2解码器采用了帧内与数据级两级并行,H.264编码器采用了帧间、帧内与数据级三级并行。实验结果表明本设计不仅具有良好的并行加速比,而且可以在使用1/4的TilePro64处理器核资源的条件下完成1路实时高清转码。 展开更多
关键词 MPEG-H.264转码器 Tilera多核处理器 多粒度并行计算
下载PDF
基于多核CPU的DVB-RCS2并行Turbo译码方法 被引量:1
15
作者 翟绪论 张永光 +2 位作者 靳安钊 强薇 李梦冰 《计算机科学》 CSCD 北大核心 2023年第6期22-28,共7页
DVB-RCS2在卫星广播、海事卫星通信、军事卫星通信等领域有着广泛应用,而无论是通信还是军事侦察都需要大吞吐量高速译码。多核CPU算力不断提升以及软件无线电SDR平台的广泛应用,使得基于多核CPU的并行译码成为一种灵活高效的应用方式... DVB-RCS2在卫星广播、海事卫星通信、军事卫星通信等领域有着广泛应用,而无论是通信还是军事侦察都需要大吞吐量高速译码。多核CPU算力不断提升以及软件无线电SDR平台的广泛应用,使得基于多核CPU的并行译码成为一种灵活高效的应用方式。为了满足其中双二元Turbo码大吞吐量软件译码的需求,提出了一种基于多核CPU的高速并行软件译码方案。首先对比分析了双二元Turbo码与传统二进制Turbo码的计算复杂度;然后重点对并行计算过程中的内存占用和采用8比特位宽整型数据时的输入量化方法进行了分析和优化,设计了基于多核CPU并行译码的实现方案;最后在Intel 12核CPU上使用SSE并行指令集实现了大于169 Mbps的译码吞吐率,且纠错性能较浮点运算损失小于0.1 dB。通过与现有GPU译码方案对比,说明了所提方案在译码效率和能耗方面的优势,其在高速卫星接收机中具有极高的应用价值。 展开更多
关键词 DVB-RCS2 双二元Turbo码 多核CPU SIMD并行计算 高速译码
下载PDF
PARALLEL IMPLEMENTATION AND OPTIMIZATION OF THE SEBVHOS ALGORITHM 被引量:2
16
作者 Li Wen Guo Li Yuan Hongxing Wei Yifang Guan Hua 《Journal of Electronics(China)》 2011年第3期277-283,共7页
In this paper, a parallel Surface Extraction from Binary Volumes with Higher-Order Smoothness (SEBVHOS) algorithm is proposed to accelerate the SEBVHOS execution. The original SEBVHOS algorithm is parallelized first, ... In this paper, a parallel Surface Extraction from Binary Volumes with Higher-Order Smoothness (SEBVHOS) algorithm is proposed to accelerate the SEBVHOS execution. The original SEBVHOS algorithm is parallelized first, and then several performance optimization techniques which are loop optimization, cache optimization, false sharing optimization, synchronization overhead op-timization, and thread affinity optimization, are used to improve the implementation's performance on multi-core systems. The performance of the parallel SEBVHOS algorithm is analyzed on a dual-core system. The experimental results show that the parallel SEBVHOS algorithm achieves an average of 1.86x speedup. More importantly, our method does not come with additional aliasing artifacts, com-paring to the original SEBVHOS algorithm. 展开更多
关键词 multi-core parallel algorithm Performance optimization 3D reconstruction
下载PDF
基于FT-X DSP的二维FFT并行实现与优化研究
17
作者 詹逸梦 扈啸 郭阳 《微电子学与计算机》 2023年第2期71-78,共8页
二维FFT是图像处理的典型算法,广泛应用于图像滤波、快速卷积、目标跟踪等领域.为满足高分辨率图像的实时处理需求,基于自主研制的FT-X众核DSP处理器,提出了一种二维FFT算法的多核并行实现方法.基于众核编程模型,通过多核任务部署、地... 二维FFT是图像处理的典型算法,广泛应用于图像滤波、快速卷积、目标跟踪等领域.为满足高分辨率图像的实时处理需求,基于自主研制的FT-X众核DSP处理器,提出了一种二维FFT算法的多核并行实现方法.基于众核编程模型,通过多核任务部署、地址空间重映射等方式完成了任务初始化,实现了24核数据并行处理,加速比达到19.8倍.在此基础上,提出了基于DMA跨步传输的隐式转置方案,通过矩阵地址分配的方式,解决了大型矩阵跨步传输步长受限的问题.实验结果表明,在8 K×8 K的数据规模下,相对于直接转置和指令隐式转置分别节省了91%和65%的转置时间,同时识别并解决了某特殊情况下的多核负载不均衡的问题,将各核的用时差距从64%下降到了12%,整体用时下降了26%. 展开更多
关键词 二维FFT 多核并行 转置 DMA跨步传输 负载均衡
下载PDF
Parallel Image Processing Technology of Surface Detection System 被引量:2
18
作者 LI Chang-le CHENG Wan-sheng FAN Ji-zhuang ZHAO Jie 《Semiconductor Photonics and Technology》 CAS 2008年第4期217-223,243,共8页
To improve image processing speed and detection precision of a surface detection system on a strip surface,based on the analysis of the characteristics of image data and image processing in detection system on the str... To improve image processing speed and detection precision of a surface detection system on a strip surface,based on the analysis of the characteristics of image data and image processing in detection system on the strip surface,the design of parallel image processing system and the methods of algorithm implementation have been studied. By using field programmable gate array(FPGA) as hardware platform of implementation and considering the characteristic of detection system on the strip surface,a parallel image processing system implemented by using multi IP kernel is designed. According to different computing tasks and the load balancing capability of parallel processing system,the system could set different calculating numbers of nodes to meet the system's demand and save the hardware cost. 展开更多
关键词 parallel image processing parallel algorithm surface defect FPGA multi IP core
下载PDF
Parallel computing of discrete element method on multi-core processors 被引量:6
19
作者 Yusuke Shigeto Mikio Sakai 《Particuology》 SCIE EI CAS CSCD 2011年第4期398-405,共8页
This paper describes parallel simulation techniques for the discrete element method (DEM) on multi-core processors. Recently, multi-core CPU and GPU processors have attracted much attention in accelerating computer ... This paper describes parallel simulation techniques for the discrete element method (DEM) on multi-core processors. Recently, multi-core CPU and GPU processors have attracted much attention in accelerating computer simulations in various fields. We propose a new algorithm for multi-thread parallel computation of DEM, which makes effective use of the available memory and accelerates the computation. This study shows that memory usage is drastically reduced by using this algorithm. To show the practical use of DEM in industry, a large-scale powder system is simulated with a complicated drive unit. We compared the performance of the simulation between the latest GPU and CPU processors with optimized programs for each processor. The results show that the difference in performance is not substantial when using either GPUs or CPUs with a multi-thread parallel algorithm. In addition, DEM algorithm is shown to have high scalabilitv in a multi-thread parallel computation on a CPU. 展开更多
关键词 Discrete element method parallel computing multi-core processor GPGPU
原文传递
基于申威众核处理器的NSGA-Ⅱ并行和优化方法 被引量:2
20
作者 刘垚 郑琳 +2 位作者 郑凯 王肃 廖启丹 《计算机应用研究》 CSCD 北大核心 2020年第1期96-101,共6页
由申威众核处理器组成的"神威·太湖之光"是我国当前性能最高的超级计算机,可为大规模NSGA-Ⅱ求解提供硬件平台。基于硬件架构特点,设计了分岛/主从增强混合并行NSGA-Ⅱ。在主从模式基础上,利用从核间寄存器通信,实现核... 由申威众核处理器组成的"神威·太湖之光"是我国当前性能最高的超级计算机,可为大规模NSGA-Ⅱ求解提供硬件平台。基于硬件架构特点,设计了分岛/主从增强混合并行NSGA-Ⅱ。在主从模式基础上,利用从核间寄存器通信,实现核组内从核局部数据存储的共享。优化流程,实现更多算法模块在从核上的并行。运用DMA传输、向量化、双缓冲、存储优化等方法显著提高加速比。实验表明,优化的并行NSGA-Ⅱ在申威众核处理器上具有良好的加速比和扩展性。 展开更多
关键词 申威众核处理器 NSGA- 并行遗传算法 多目标 并行优化
下载PDF
上一页 1 2 25 下一页 到第
使用帮助 返回顶部