期刊文献+
共找到19篇文章
< 1 >
每页显示 20 50 100
Realistic Efficiency Evaluations for Parallel Computations under Workstation Cluster
1
作者 Mo Zeyao Li Xiaomei(Dept. of Computer, Changsha institute of Technology Changsha, China, 410073) 《Wuhan University Journal of Natural Sciences》 CAS 1996年第Z1期329-336,共8页
In recent years, high performance scientific computing under workstation cluster connected by local area network is becoming a hot point. Owing to both the longer latency and the higher overhead for protocol processin... In recent years, high performance scientific computing under workstation cluster connected by local area network is becoming a hot point. Owing to both the longer latency and the higher overhead for protocol processing compared with the powerful single workstation capacity, it is becoming severe important to keep balance not only for numerical load but also for communication load, and to overlap communications with computations while parallel computing. Hence,our efficiency evaluation rules must discover these capacities of a given parallel algorithm in order to optimize the existed algorithm to attain its highest parallel efficiency. The traditional efficiency evaluation rules can not succeed in this work any more. Fortunately, thanks to Culler's detail discuss in LogP model about interconnection networks for MPP systems, we present a system of efficiency evaluation rules for parallel computations under workstation cluster with PVM3.0 parallel software framework in this paper. These rules can satisfy above acquirements successfully. At last, two typical synchronous,and asynchronous applications are designed to verify the validity of these rules under 4 SGIs workstations cluster connected by Ethernet. 展开更多
关键词 parallel efficiency evaluation workstation cluster PVM. network parallel computations.
下载PDF
CLUSTER OF WORKSTATIONS BASED ON DYNAMIC LOAD BALANCING FOR PARALLEL TREE COMPUTATION DEPTH-FIRST-SEARCH
2
作者 加力 陆鑫达 张健 《Journal of Shanghai Jiaotong university(Science)》 EI 2002年第1期26-31,共6页
The real problem in cluster of workstations is the changes in workstation power or number of workstations or dynmaic changes in the run time behavior of the application hamper the efficient use of resources. Dynamic l... The real problem in cluster of workstations is the changes in workstation power or number of workstations or dynmaic changes in the run time behavior of the application hamper the efficient use of resources. Dynamic load balancing is a technique for the parallel implementation of problems, which generate unpredictable workloads by migration work units from heavily loaded processor to lightly loaded processors at run time. This paper proposed an efficient load balancing method in which parallel tree computations depth first search (DFS) generates unpredictable, highly imbalance workloads and moves through different phases detectable at run time, where dynamic load balancing strategy is applicable in each phase running under the MPI(message passing interface) and Unix operating system on cluster of workstations parallel platform computing. 展开更多
关键词 cluster of WORKSTATIONS parallel TREE COMPUTATION DFS task migration dynamic load balancing strategy and TERMINATION detection algorithm
下载PDF
一种面向同构集群系统的并行任务节能调度优化方法 被引量:21
3
作者 李新 贾智平 +2 位作者 鞠雷 赵衍恒 宗子良 《计算机学报》 EI CSCD 北大核心 2012年第3期591-602,共12页
节能调度算法设计是高性能计算领域中的一个研究热点.复制调度算法能够减少后继任务等待延时,缩短任务总体调度时间,但是耗费了更多的能量.为此,作者提出一种启发式处理器合并优化方法 PRO.该方法按照任务最早开始时间和最早结束时间查... 节能调度算法设计是高性能计算领域中的一个研究热点.复制调度算法能够减少后继任务等待延时,缩短任务总体调度时间,但是耗费了更多的能量.为此,作者提出一种启发式处理器合并优化方法 PRO.该方法按照任务最早开始时间和最早结束时间查找处理器时间空隙,将轻负载处理器上的任务重新分配到其它处理器上,从而减少使用的处理器数目,降低系统总体能耗.实验结果表明,和已有的复制任务调度算法TDS、EAD和PEBD相比,优化后的调度算法在不增加调度时间的条件下,能够明显减少使用的处理器数和系统总体能耗,从而更好地实现性能和能耗之间的平衡. 展开更多
关键词 绿色网络 集群 并行 同构 前驱约束 节能调度 绿色计算
下载PDF
基于MPI+OpenMP混合编程的水声探测系统效能并行计算方法 被引量:1
4
作者 范培勤 笪良龙 +1 位作者 李玉阳 周艳霞 《计算机应用与软件》 CSCD 北大核心 2013年第12期117-119,123,共4页
针对水声探测系统效能计算对实时性的要求,建立一种水声探测系统探测效能计算模型。结合高性能计算平台,研究基于MPI+OpenMP混合编程水声探测系统效能并行计算方法。计算结果表明,并行后的程序较好地满足了水声探测系统效能计算对时效... 针对水声探测系统效能计算对实时性的要求,建立一种水声探测系统探测效能计算模型。结合高性能计算平台,研究基于MPI+OpenMP混合编程水声探测系统效能并行计算方法。计算结果表明,并行后的程序较好地满足了水声探测系统效能计算对时效性的要求。 展开更多
关键词 声纳 探测效能 机群 并行计算
下载PDF
基于Linpack的高性能计算机集群的并行性能测试 被引量:8
5
作者 余江洪 肖燕成 +2 位作者 朱宗柏 蔡永华 肖金生 《船电技术》 2009年第5期56-60,共5页
基于计算机集群的高性能并行计算,已成为广大工程与科学计算的有效手段。本文以DELL HPCC高性能计算机集群为硬件平台,以Linpack为并行性能测试软件,测试了不同计算机节点数或处理器数、最高Gflops值的矩阵规模N、求解矩阵的分块大小NB... 基于计算机集群的高性能并行计算,已成为广大工程与科学计算的有效手段。本文以DELL HPCC高性能计算机集群为硬件平台,以Linpack为并行性能测试软件,测试了不同计算机节点数或处理器数、最高Gflops值的矩阵规模N、求解矩阵的分块大小NB、处理器网格中水平方向处理器个数P、处理器网格中垂直方向处理器个数Q的并行性能。通过测试和分析来研究高性能计算机集群的并行性能及其优化策略。 展开更多
关键词 计算机集群 高性能计算 并行效率 计算流体动力学Linpack
下载PDF
中小型规模高性能计算集群的搭建与维护 被引量:4
6
作者 文洮 金能智 +1 位作者 马尧 赵志威 《现代信息科技》 2019年第5期20-24,共5页
高性能计算在近几年得到了充分的发展,越来越多的高校、科研院所开始搭建适合自己需求的高性能计算集群,搭建的过程除了硬件、软件、运行环境这些必要的条件以外,后期的维护也是需要重点关注的领域。本文分析了高性能计算集群的特征、... 高性能计算在近几年得到了充分的发展,越来越多的高校、科研院所开始搭建适合自己需求的高性能计算集群,搭建的过程除了硬件、软件、运行环境这些必要的条件以外,后期的维护也是需要重点关注的领域。本文分析了高性能计算集群的特征、搭建需求、整体思路以及后期维护需要注意的问题,并且通过实用的算例测试了集群并行效率,希望为该领域的科研用户以及管理人员提供借鉴。 展开更多
关键词 高性能计算 集群 搭建 维护 并行效率
下载PDF
基于循环平稳检测算法SSCA的FFT模块设计 被引量:2
7
作者 邓正宏 徐继伟 +1 位作者 周岩 乔洪海 《西北工业大学学报》 EI CAS CSCD 北大核心 2013年第5期706-709,共4页
通过对循环平稳检测算法的分析,对基于SSCA算法的FFT模块进行设计并验证时序。首先,对循环平稳检测算法进行了研究与仿真,比较了现存的几种循环平稳检测方法的复杂度。其次,选择SSCA算法,提出了一种流水线工作方式的定常构形FFT模块的... 通过对循环平稳检测算法的分析,对基于SSCA算法的FFT模块进行设计并验证时序。首先,对循环平稳检测算法进行了研究与仿真,比较了现存的几种循环平稳检测方法的复杂度。其次,选择SSCA算法,提出了一种流水线工作方式的定常构形FFT模块的设计方案。最后,在开发环境QuartusⅡ进行模块的构建,在仿真软件ModelSim环境下进行时序验证,从而实现了算法硬件化。 展开更多
关键词 循环平稳检测算法 SSCA FFT模块 算法硬件化
下载PDF
一种并行的加速k-均值聚类方法 被引量:2
8
作者 王秀华 《电脑知识与技术》 2013年第6X期4299-4302,共4页
针对传统k-均值聚类方法不能有效处理海量数据聚类的问题,该文提出一种基于并行计算的加速k-均值聚类(K-means clustering based on parallel computing,Pk-means)方法。该方法首先将海量的聚类样本随机划分为多个独立同分布的聚类工作... 针对传统k-均值聚类方法不能有效处理海量数据聚类的问题,该文提出一种基于并行计算的加速k-均值聚类(K-means clustering based on parallel computing,Pk-means)方法。该方法首先将海量的聚类样本随机划分为多个独立同分布的聚类工作集,并在每个工作集上并行进行传统k-均值聚类,并得到相应的聚类中心和半径,通过衡量不同子集聚类结果的关系,对每个工作集中聚类得到的子类进行合并,并对特殊数据进行二次归并以校正聚类结果,从而有效处理海量数据的聚类问题。实验结果表明,Pk_means方法在大规模数据集上在保持聚类效果的同时大幅度提高了聚类效率。 展开更多
关键词 K-均值聚类 并行计算 并行k-均值聚类 工作集 效率
下载PDF
声纳并行处理系统设计
9
作者 艾锐峰 蔡志明 +1 位作者 张文成 朱岩 《湖南工程学院学报(自然科学版)》 2008年第4期9-14,共6页
易维护、可复用、可移植以及良好的开放性是现代海占对声纳系统的要求.讨论了采用COTS硬件技术和现代软件工程技术构建声纳系统的方法.硬件平台采用集群机,软件系统控件化,并对处理任务和算法进行并行化设计,使之成为一个可移植、可扩... 易维护、可复用、可移植以及良好的开放性是现代海占对声纳系统的要求.讨论了采用COTS硬件技术和现代软件工程技术构建声纳系统的方法.硬件平台采用集群机,软件系统控件化,并对处理任务和算法进行并行化设计,使之成为一个可移植、可扩展、可重构的开放式系统.结果显示此种技术路径能够满足声纳系统的要求. 展开更多
关键词 声纳 集群计算 并行处理
下载PDF
铁路路基状态检测中探地雷达数据并行处理 被引量:11
10
作者 梁胤程 杜翠 +2 位作者 刘杰 杨超宇 杨峰 《中国铁道科学》 EI CAS CSCD 北大核心 2017年第2期11-18,共8页
为快速处理探地雷达检测铁路路基状态所产生的大量检测数据,缩短检测报告的生成周期,采用并行计算技术设计并构建适用于探地雷达数据解析的并行处理平台,利用计算机集群处理解析探地雷达数据;基于服务器计算能力的动态探地雷达数据任务... 为快速处理探地雷达检测铁路路基状态所产生的大量检测数据,缩短检测报告的生成周期,采用并行计算技术设计并构建适用于探地雷达数据解析的并行处理平台,利用计算机集群处理解析探地雷达数据;基于服务器计算能力的动态探地雷达数据任务负载均衡算法,对用户提交的探地雷达数据解析任务统一调度分发。采用实际的铁路路基状态检测雷达数据对构建的并行处理平台进行实验,分析雷达数据并行处理的准确性、时间消耗、并行化加速比和系统可扩展性等指标。结果表明:在8个节点的集群并行处理平台上进行探地雷达数据的处理效率比用单机版软件提高553%,处理时间比基于Hadoop的探地雷达数据并行处理方法缩短50%以上。 展开更多
关键词 铁路路基 状态检测 探地雷达 数据处理 负载均衡 并行计算技术 计算机集群处理
下载PDF
面向大规模数据的在线新事件检测 被引量:1
11
作者 蔡偃武 高大启 +1 位作者 阮彤 蒋锐权 《计算机工程》 CAS CSCD 2014年第10期37-42,共6页
通过分析基于新闻要素的在线新事件检测算法的时间消耗,提出一种面向大规模数据环境的在线新事件检测算法。该算法利用基于倒排索引的高效相似报道搜索机制,有效减少单路径聚类算法中的相似度比较次数。通过对报道预处理、报道与事件比... 通过分析基于新闻要素的在线新事件检测算法的时间消耗,提出一种面向大规模数据环境的在线新事件检测算法。该算法利用基于倒排索引的高效相似报道搜索机制,有效减少单路径聚类算法中的相似度比较次数。通过对报道预处理、报道与事件比较以及索引搜索这3个过程的并行化,提高算法在多机环境下的运行效率和可伸缩性。实验结果表明,该算法在不影响漏检率和误检率的基础上,提高了新事件检测的速度,并且在千万到亿级别的报道规模下,其吞吐量达到150条/s^200条/s。 展开更多
关键词 新事件检测 单路径聚类 大规模数据 并行计算 倒排索引 MapReduce架构
下载PDF
并行离群点检测在异常电话检测中的应用 被引量:1
12
作者 廖凡迪 《软件》 2012年第12期151-155,共5页
随着电信行业间的竞争加剧,运营商更加应该专注于服务的质量。以非法回拨电话为代表的非法行为会扰乱用户的正常生活。如何快速准确地检测出非法回拨异常用户的问题亟待解决。而且高速发展的信息科技积累的海量数据集将带来更大的挑战... 随着电信行业间的竞争加剧,运营商更加应该专注于服务的质量。以非法回拨电话为代表的非法行为会扰乱用户的正常生活。如何快速准确地检测出非法回拨异常用户的问题亟待解决。而且高速发展的信息科技积累的海量数据集将带来更大的挑战。然而,传统的非法行为检测方法准确率并不高,这些方法在面对海量数据处理的时候将会变得低效甚至无效。本文中引入了基于mapreduce的并行离群点检测方法来定位有离群点特征的非法用户的行为。此外,为了获得较高的准确率,本文结合了聚类系数来进行离群点检测。大量的实验表明改进的方法在提高效率和准确率方面有很好的效果。 展开更多
关键词 计算机应用 并行计算 离群点检测 聚类系数
下载PDF
基于MPI的弹道仿真的并行计算研究
13
作者 钟新玉 王恂 张学军 《航天控制》 CSCD 北大核心 2015年第3期63-67,共5页
介绍了MPI的基本概念,列举了提高并行计算效率的一些措施,并实现了基于MPI消息传递机制的弹道仿真计算模型的并行编程,最后对并行计算和串行计算的结果进行了比较。研究结果表明,将并行计算技术应用于弹道仿真中是可行的,并获得了较高... 介绍了MPI的基本概念,列举了提高并行计算效率的一些措施,并实现了基于MPI消息传递机制的弹道仿真计算模型的并行编程,最后对并行计算和串行计算的结果进行了比较。研究结果表明,将并行计算技术应用于弹道仿真中是可行的,并获得了较高的加速比和计算效率;与单机运行相比,计算机机群可以大大缩短计算时间,提高计算效率,而且可以扩大计算规模,系统适应性和延展性较好。 展开更多
关键词 弹道仿真 并行计算MPI 计算机机群 加速比 并行计算效率
下载PDF
SMP集群系统的可扩放性分析
14
作者 田青 祝永志 《计算机技术与发展》 2017年第6期95-98,105,共5页
随着并行计算技术的快速发展和SMP集群的普及,可扩放性已经成为并行应用程序设计和实现方面最重要的性能之一。但传统的可扩放性评价准则不能对SMP集群的可扩放性进行较精准的评价。为此,在分析SMP集群中处理器集合的特性和传统等效率... 随着并行计算技术的快速发展和SMP集群的普及,可扩放性已经成为并行应用程序设计和实现方面最重要的性能之一。但传统的可扩放性评价准则不能对SMP集群的可扩放性进行较精准的评价。为此,在分析SMP集群中处理器集合的特性和传统等效率模型并掌握其优缺点以及分析并行计算速度的基础上,给出了一种适合SMP集群系统效率的定义,并基于该定义提出了一种新的可扩放性评价准则(改进的等效率可扩放性评价准则)。该新准则可用来评价并行算法和SMP集群相结合的可扩放性。为验证所提出评价准则的有效性,在集群平台上运行矩阵乘法程序进行了相关的扩放性实验。实验结果表明,所提出的新评价准则对算法和并行机的最优匹配有指导作用,同时有助于对并行算法的设计和改进。 展开更多
关键词 并行计算 SMP集群 可扩放性 等效率
下载PDF
基于机群计算的导热反问题并行遗传算法 被引量:1
15
作者 韩光明 《廊坊师范学院学报(自然科学版)》 2008年第6期26-27,共2页
遗传算法具有天然的易并行性,因此,当问题比较复杂或者初始种群规模比较大的时候,通常会将遗传算法并行化。但是并行机的代价高,普及面狭窄,因而选择机群系统作为并行计算的主体,是一个简单有效的办法。通过导热反问题的并行遗传算法研... 遗传算法具有天然的易并行性,因此,当问题比较复杂或者初始种群规模比较大的时候,通常会将遗传算法并行化。但是并行机的代价高,普及面狭窄,因而选择机群系统作为并行计算的主体,是一个简单有效的办法。通过导热反问题的并行遗传算法研究了机群计算的并行效率和加速比。 展开更多
关键词 机群计算 并行遗传算法 并行效率 并行加速比
下载PDF
海量GPR检测数据负载均衡并行处理技术 被引量:3
16
作者 杜翠 程远水 张千里 《铁道建筑》 北大核心 2022年第8期140-143,共4页
探地雷达单机处理软件性能较低,难以满足较长里程或周期性检测的海量数据处理场景需求。针对这一问题,本文在集群模式下基于Hadoop平台的MapReduce并行计算框架,采用HDFS和MySQL的混合存储方法,对数据流进行细粒度切片,建立主从节点架... 探地雷达单机处理软件性能较低,难以满足较长里程或周期性检测的海量数据处理场景需求。针对这一问题,本文在集群模式下基于Hadoop平台的MapReduce并行计算框架,采用HDFS和MySQL的混合存储方法,对数据流进行细粒度切片,建立主从节点架构的动态调度模式,实现海量检测数据的负载均衡并行处理。在Linux系统搭建了1主+8从的Hadoop集群环境并对其进行了测试试验。结果表明:动态调度可使迭代算法达到负载均衡,高复杂度算法适用于并行处理,性能可提升100倍左右,加速比接近物理核数。 展开更多
关键词 探地雷达 铁路检测 并行计算 负载均衡 动态调度 集群模式 并行颗粒度
下载PDF
基于动态双子种群的差分进化K中心点聚类算法 被引量:2
17
作者 邓斌涛 徐胜超 《计算机与现代化》 2021年第7期54-59,70,共7页
随着海量大数据的出现,聚类算法需要新型计算模式来提高计算速度与运行效率。本文提出一种基于动态双子种群的差分进化K中心点聚类算法DGP-DE-K-mediods(Dynamic Gemini Population based DE-K-mediods)。DGP-DE-K-mediods利用动态双子... 随着海量大数据的出现,聚类算法需要新型计算模式来提高计算速度与运行效率。本文提出一种基于动态双子种群的差分进化K中心点聚类算法DGP-DE-K-mediods(Dynamic Gemini Population based DE-K-mediods)。DGP-DE-K-mediods利用动态双子种群方法,解决聚类算法在维持种群密度的时候避免陷入局部最优的问题;采用差分进化(Differential Evolution,DE)算法来提高全局最优能力的强健性;基于Hadoop云平台来并行处理DGP-DE-K-mediods,加快算法的运行速度和效率;描述基于MapReduce的并行聚类算法的编程过程;DGP-DE-K-mediods利用UIC的大数据分类的案例数据和网络入侵检测这种大数据应用来仿真算法的效果。实验结果表明,与已有的聚类算法相比,DGP-DE-K-mediods在检测精度、运行时间上有明显的优势。 展开更多
关键词 云计算 并行处理 K中心点聚类 差分进化 入侵检测系统
下载PDF
基于帧间相似性的目标检测FPGA加速器设计
18
作者 李晟召 王琴 《计算机工程与设计》 北大核心 2023年第6期1885-1892,共8页
为解决视频目标检测应用上的神经网络硬件加速问题,提出一种基于视频应用中连续输入之间高度相似性的YOLO卷积网络FPGA加速器。提出增量计算与快速卷积算法结合的优化方法,使用增量计算以跳过连续输入间相似部分的卷积运算;使用快速卷... 为解决视频目标检测应用上的神经网络硬件加速问题,提出一种基于视频应用中连续输入之间高度相似性的YOLO卷积网络FPGA加速器。提出增量计算与快速卷积算法结合的优化方法,使用增量计算以跳过连续输入间相似部分的卷积运算;使用快速卷积算法增加并行计算资源的利用效率。实验结果表明,加速器算力约为238 GOP/s,增量计算以及快速卷积算法为加速器分别提供1.31倍与2.11倍的加速比,相较于同类网络加速器,DSP效率上有1.90倍到5.43倍的提升。 展开更多
关键词 卷积网络加速器 视频目标检测 连续输入相似性 并行计算 增量计算 快速卷积算法 高计算资源效率
下载PDF
MPI并行计算性能的研究 被引量:3
19
作者 李久楷 朱俊 +1 位作者 宁交贤 Jiu-Kai Jiao-Xian 《四川大学学报(自然科学版)》 CAS CSCD 北大核心 2009年第6期1659-1662,共4页
探索了一种基于Windows系统平台的、用于实现高性能计算的MPI并行环境.采用MPI最新版本MPICH2-1.0.6作为并行计算的支撑环境,通过编制的三个具有代表性的MPI并行计算程序,并在以100M bps交换式局域网作为互连的机群上和具有双核处理器... 探索了一种基于Windows系统平台的、用于实现高性能计算的MPI并行环境.采用MPI最新版本MPICH2-1.0.6作为并行计算的支撑环境,通过编制的三个具有代表性的MPI并行计算程序,并在以100M bps交换式局域网作为互连的机群上和具有双核处理器的PC机上分别进行了并行效率的实际测试,得到了预期结果,并做了相应分析. 展开更多
关键词 MPI并行计算 高性能计算 parallel computing high performance computing parallel efficiency Windows系统 交换式局域网 MPICH2 双核处理器 PC cluster Interface 支撑环境 实际测试 并行效率 并行环境 software expected Ethernet version results
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部