期刊文献+
共找到16篇文章
< 1 >
每页显示 20 50 100
Performance Characterization of Parallel Game-tree Search Application Crafty
1
作者 谭膺 罗克露 +1 位作者 陈玉荣 张益民 《Journal of Electronic Science and Technology of China》 2006年第2期155-160,共6页
Game-tree search plays an important role in the field of Artificial Intelligence (AI). In this paper, we characterize one parallel game-tree search workload in chess: the latest version of Crafty, a state of art pr... Game-tree search plays an important role in the field of Artificial Intelligence (AI). In this paper, we characterize one parallel game-tree search workload in chess: the latest version of Crafty, a state of art program, on two Intel Xeon shared-memory multiprocessor systems. Our analysis shows that Crafty is latency-sensitive and the hash-table and dynamic tree splitting used in Crafty cause large scalability penalties. They consume 35%-50% of the running time on the 4-way system. Furthermore, Crafty is not bandwidth-limited. 展开更多
关键词 performance characterization workload analysis parallel game-tree search computer chess crafty
下载PDF
一种并行XML数据库分片策略 被引量:7
2
作者 王国仁 汤南 +2 位作者 于亚新 孙冰 于戈 《软件学报》 EI CSCD 北大核心 2006年第4期770-781,共12页
主要研究XML文档的并行数据分片策略,以便能够并行处理XML查询.为了描述XML数据分片,提出了媒介节点的概念.一组媒介节点的集合可以将一棵XML数据树分割成一棵根树和一组子树的集合:根树将在所有站点中复制;而子树集合则可以根据用户查... 主要研究XML文档的并行数据分片策略,以便能够并行处理XML查询.为了描述XML数据分片,提出了媒介节点的概念.一组媒介节点的集合可以将一棵XML数据树分割成一棵根树和一组子树的集合:根树将在所有站点中复制;而子树集合则可以根据用户查询的工作负载被均匀地分片到各个站点中.对于同一棵XML数据树,会有很多种媒介节点的集合;而不同的媒介节点集合会产生不同的数据分片结果.然后,依据各个数据分片中的用户查询工作量是否均衡,来衡量一个分片的好坏.选择一组最佳的媒介节点集合是一个NP-hard问题.为了解决此问题,设计了一组启发式优化规则.基于这一思想,提出并实现了一种基于媒介节点的XML数据分片算法WIN(workload-awareintermediarynodesdataplacementstrategy).大量实验结果证明:WIN算法的性能要优于以往的并行XML数据分片策略. 展开更多
关键词 并行数据库 XML文档 工作负载 数据分片 媒介节点
下载PDF
一种有效的并行数据库动态负载平衡连接算法 被引量:3
3
作者 关心 欧增桂 王玲 《计算机工程与应用》 CSCD 北大核心 2007年第12期150-154,共5页
在基于Shared-nothing结构的并行数据库中,负载平衡一直是影响查询处理性能的重要因素。在数据库中频繁使用的连接操作会因为各种因素导致的负载倾斜和额外的通讯开销而降低数据库的整体性能。提出了一种基于RCMD分布方法的动态负载平... 在基于Shared-nothing结构的并行数据库中,负载平衡一直是影响查询处理性能的重要因素。在数据库中频繁使用的连接操作会因为各种因素导致的负载倾斜和额外的通讯开销而降低数据库的整体性能。提出了一种基于RCMD分布方法的动态负载平衡连接算法,能够在连接操作的执行过程中动态调整各个结点的负载。理论分析和实验结果证明提出的算法能够有效地平衡负载,提高并行数据库的执行效率。 展开更多
关键词 并行数据库 动态负载平衡 RCMD 连接
下载PDF
任意可分负载的多轮调度算法 被引量:6
4
作者 康雨 闫相国 +1 位作者 郑崇勋 申广杰 《西安交通大学学报》 EI CAS CSCD 北大核心 2009年第8期125-129,共5页
为了提高并行计算中具有负载任意可分特性的大规模应用的任务响应速度,提出了一种针对带传输和计算延迟的三阶段多轮调度模型求解近似最优调度轮数的算法(DCMR).通过对特定的调度时序分析,得出闭合式方程组,然后利用二分法快速搜索并结... 为了提高并行计算中具有负载任意可分特性的大规模应用的任务响应速度,提出了一种针对带传输和计算延迟的三阶段多轮调度模型求解近似最优调度轮数的算法(DCMR).通过对特定的调度时序分析,得出闭合式方程组,然后利用二分法快速搜索并结合回溯调整法求解近似最优调度轮数,使计算时间尽可能多地与传输时间重叠,从而缩短了整个应用的执行时间.算法经仿真表明:在多种参数变化的情况下,可以求解出近似最优的调度方案;与经典的FIFO和LIFO算法相比具有更强的自适应能力;在计算时间明显大于传输时间的情况下,能够稳定地保持任务响应时间为理想时间的1.1倍左右. 展开更多
关键词 任意可分负载 多轮调度 并行计算
下载PDF
分形计算的并行设计及TBB实现 被引量:1
5
作者 陈荣鑫 陈维斌 廖湖声 《计算机应用》 CSCD 北大核心 2011年第3期839-842,共4页
线程构建模块(TBB)基于模板的特点简化了并行化设计,适合高效地实现多核并行设计。针对分形计算具有计算密集和高耗时的特点,结合TBB并行化设计,以充分利用多核计算资源。对影响并行性能的计算负载不平衡问题,提出了基于采样估算的平衡... 线程构建模块(TBB)基于模板的特点简化了并行化设计,适合高效地实现多核并行设计。针对分形计算具有计算密集和高耗时的特点,结合TBB并行化设计,以充分利用多核计算资源。对影响并行性能的计算负载不平衡问题,提出了基于采样估算的平衡优化方法,通过采样执行时间来估算工作负载,据此进行均衡的任务划分,利用TBB任务调度实现并行处理。实验结果表明,采样估算精度高,耗时比率低,能有效实现负载均衡;基于TBB的实现可获得较好加速比。 展开更多
关键词 分形计算 多核并行 线程构建模块 负载平衡
下载PDF
基于方差检验的并行负载抖动检测
6
作者 陈永然 窦文华 齐星云 《通讯和计算机(中英文版)》 2006年第4期18-25,共8页
负载抖动是影响负载模型准确性和代表性的关键因素。本文通过两个负载抖动例子给出负载抖动的定义,研究了抖动日志对负载模型的影响情况,提出了一种通过分析总资源向量和最大资源向量的方差检测负载抖动的算法,研究时间刻度参数△t... 负载抖动是影响负载模型准确性和代表性的关键因素。本文通过两个负载抖动例子给出负载抖动的定义,研究了抖动日志对负载模型的影响情况,提出了一种通过分析总资源向量和最大资源向量的方差检测负载抖动的算法,研究时间刻度参数△t对算法的影响情况,并给出了其较合理的取值范围。 展开更多
关键词 并行负载 负载模型 负载抖动 资源向量 方差
下载PDF
一种改进型指导式动态自调度方法
7
作者 国林 杨永田 《哈尔滨工程大学学报》 EI CAS CSCD 2002年第6期92-96,共5页
多处理机调度问题是影响并行处理速度与效率的因素之一.通过对多处理机的调度环境、调度对象和任务模型的详细分析,在阐述了通过编译实现指导式自调度GSS算法基础上,提出了调度迭代块容量小于N/P(N是循环限值,P是处理机数),同步次数少... 多处理机调度问题是影响并行处理速度与效率的因素之一.通过对多处理机的调度环境、调度对象和任务模型的详细分析,在阐述了通过编译实现指导式自调度GSS算法基础上,提出了调度迭代块容量小于N/P(N是循环限值,P是处理机数),同步次数少于或等于GSS情况的改进算法RGSS,以求提高并行处理的速度和效率.本文提出的改进算法RGSS,克服了GSS算法极端分配调度块的现象,在大多数情况下减少了调度迭代块的子数,获得了负载平衡和减少系统开销的两个目标.最后文中给出了RGSS算法的数学证明与仿真结果. 展开更多
关键词 并行循环 负载平衡 指导式动态自调度 系统开销
下载PDF
基于数据预取的多核处理器末级缓存优化方法 被引量:4
8
作者 单书畅 胡瑜 李晓维 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2012年第9期1241-1248,共8页
末级缓存的性能已成为影响多核处理器整体性能的关键因素.基于多核处理器在处理并行程序时各处理器核访存行为的相似性,提出一种降低访存缺失率的数据预取方法.首先记录各处理器核的访存缺失历史;然后通过分析历史信息预测各处理器核之... 末级缓存的性能已成为影响多核处理器整体性能的关键因素.基于多核处理器在处理并行程序时各处理器核访存行为的相似性,提出一种降低访存缺失率的数据预取方法.首先记录各处理器核的访存缺失历史;然后通过分析历史信息预测各处理器核之间末级缓存缺失的关联关系,采用数据预取的方式,在处理器核出现读缺失之前为其末级缓存提供数据块.实验结果表明,对于4核和16核处理器系统,该方法可以分别降低末级缓存缺失率9.8%和18.4%,提高性能4.0%与12.4%. 展开更多
关键词 多核处理器 末级缓存 并行程序 数据预取
下载PDF
基于相关性分析的障碍同步消除算法
9
作者 郭克榕 唐新春 《计算机学报》 EI CSCD 北大核心 1998年第S1期207-212,共6页
同步控制是并行执行中的主要开销源之一.本文以Fortran77串行程序自动转换为MPPFortran并行程序为背景,提出了一种减少数据并行程序中障碍同步开销的优化算法.根据数据并行程序中显式的数据分布与工作划分,处理机间的相关性分析可... 同步控制是并行执行中的主要开销源之一.本文以Fortran77串行程序自动转换为MPPFortran并行程序为背景,提出了一种减少数据并行程序中障碍同步开销的优化算法.根据数据并行程序中显式的数据分布与工作划分,处理机间的相关性分析可用于消除程序中不必要的障碍同步,改善程序的并行性能.我们使用一组标准测试程序对算法的有效性进行了测试,测试结果表明平均26%的障碍同步可消除.算法的基本思想同样适用于其它数据并行语言程序的障碍同步优化. 展开更多
关键词 数据并行 障碍同步 相关性分析 数据分布 工作划分
下载PDF
基于任务量划分的紧嵌套循环自动并行化方法
10
作者 闫昭 刘磊 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2010年第4期631-635,共5页
采用计算任务量大小的方法,解决了在紧嵌套循环自动并行化过程中存在循环并行化的并行粒度确定问题以及循环自动并行化中数据划分的数据访问局部性问题,在多核系统中实现了紧嵌套循环自动并行化时的数据访问局部性方案和并行化方法,从... 采用计算任务量大小的方法,解决了在紧嵌套循环自动并行化过程中存在循环并行化的并行粒度确定问题以及循环自动并行化中数据划分的数据访问局部性问题,在多核系统中实现了紧嵌套循环自动并行化时的数据访问局部性方案和并行化方法,从而构造了一个基于任务量划分的循环自动并行化模型,降低了程序自动并行化中小任务量并行带来的开销. 展开更多
关键词 计算划分 任务量 数据划分 数据访问局部性 循环并行化
下载PDF
基于负载均衡的并行FP-Growth算法 被引量:7
11
作者 高权 万晓冬 《计算机工程》 CAS CSCD 北大核心 2019年第3期32-35,40,共5页
针对FP-Growth算法查找操作时间复杂度较高的问题,提出一种新的算法LBPFP。在PFP算法基础上,将哈希表加入链头表以实现项地址的快速访问,并设计基于前缀长度的计算量模型,优化并行流程,提升算法的执行效率。在webdocs.dat数据库上进行... 针对FP-Growth算法查找操作时间复杂度较高的问题,提出一种新的算法LBPFP。在PFP算法基础上,将哈希表加入链头表以实现项地址的快速访问,并设计基于前缀长度的计算量模型,优化并行流程,提升算法的执行效率。在webdocs.dat数据库上进行对比实验,结果表明,LBPFP算法比PFP、HPFP、DPFP算法具有更高的频繁项集挖掘效率。 展开更多
关键词 Spark平台 频繁模式增长 并行 负载均衡 链头表 计算量模型
下载PDF
一种面向结点的加速比模型
12
作者 刘炜 郑纬民 郑晓薇 《计算机工程与设计》 CSCD 北大核心 2000年第5期16-21,共6页
SMP机群系统是一种新型的系统结构。由于依赖于处理器的传统加速比模型不再适用于SMP机群系统,文中提出了面向结点的加速比模型,它将传统的串行与并行的对比关系扩展为个体与整体之间的对比关系。通过对基于处理器的传统加速比概念的... SMP机群系统是一种新型的系统结构。由于依赖于处理器的传统加速比模型不再适用于SMP机群系统,文中提出了面向结点的加速比模型,它将传统的串行与并行的对比关系扩展为个体与整体之间的对比关系。通过对基于处理器的传统加速比概念的研究,推导出了基于SMP机群系统的面向结点加速比的计算公式。面向结点加速比模型充分考虑了实际运行时间的可测性,反映出了系统在使用了多个结点之后性能的改变。事实上,传统的加速比模型是面向结点加速比模型的一个特例。 展开更多
关键词 SMP机群系统 结点 工作负载 加速比模型
下载PDF
面向CPU-GPU异构系统的数据分析负载均衡策略 被引量:12
13
作者 孙婷婷 黄皓 +1 位作者 王嘉伦 翁楚良 《计算机工程与科学》 CSCD 北大核心 2019年第3期417-423,共7页
应用于高性能计算领域的通用GPU拥有强大的并行计算能力,以通用GPU作为主处理器的数据分析系统相较于传统数据库能够提供更好的性能。在大数据场景下,如何根据CPU和GPU的资源在处理器之间合理分配工作负载是亟待解决的问题。提出了一种C... 应用于高性能计算领域的通用GPU拥有强大的并行计算能力,以通用GPU作为主处理器的数据分析系统相较于传统数据库能够提供更好的性能。在大数据场景下,如何根据CPU和GPU的资源在处理器之间合理分配工作负载是亟待解决的问题。提出了一种CPU-GPU异构数据分析系统上的负载均衡处理策略。该策略采用流水线模型将工作负载分解,基于流水线设计了负载均衡模型,将工作负载合理分配至异构处理器,减少系统总执行时间开销,实现了性能提升。实验结果表明,提出的基于流水线的负载均衡模型能适应不同查询请求下的不同数据量场景,具有良好的性能。 展开更多
关键词 GPU 异构负载均衡 流水线并行 数据分析处理
下载PDF
具有负载依赖型维护时长的平行机调度问题
14
作者 周菊 程贞敏 《数学理论与应用》 2022年第4期105-114,共10页
本文考虑具有工具更换的平行机调度问题,机器的维护时长依赖于维护前的负载,目标为最小化时间表长.首先,基于维护时长函数为单调不减函数得到最优调度方案应有的两个性质——单台机器加工的工件个数最多相差一个;每台机器在最后一个维... 本文考虑具有工具更换的平行机调度问题,机器的维护时长依赖于维护前的负载,目标为最小化时间表长.首先,基于维护时长函数为单调不减函数得到最优调度方案应有的两个性质——单台机器加工的工件个数最多相差一个;每台机器在最后一个维护间隔应尽可能多地加工工件.其次,对维护时长函数为凹函数、凸函数和线性函数的情况分别给出算法MNJF, SJF和SLE.最后,证明算法MNJF, SJF以及SLE均为对应情况的最优算法,且算法MNJF对于维护时长函数为线性函数的情况也是一种最优算法. 展开更多
关键词 工具更换 平行机调度 负载依赖 时间表长
下载PDF
An Efficient Parallel Solution Framework for the Linear Solution of Large Systems on PC Clusters
15
作者 Ozgur Kurc Semih Ozmen 《Tsinghua Science and Technology》 SCIE EI CAS 2008年第S1期65-70,共6页
In this paper, a parallel solution framework for the linear static analysis of large structures on PC clusters is presented. The framework consists of two main steps: data preparation and parallel solution. The parall... In this paper, a parallel solution framework for the linear static analysis of large structures on PC clusters is presented. The framework consists of two main steps: data preparation and parallel solution. The parallel solution is performed by a substructure based method with direct solvers. The aim of the data preparation step is to create the best possible substructures so that the parallel solution time is minimized. An actual structural model was solved utilizing both homogeneous and heterogeneous PC clusters to illustrate the performance and applicability of the presented framework. 展开更多
关键词 SUBSTRUCTURE parallel solution heterogeneous clusters homogeneous clusters workload bal-ancing partitioning repartitioning
原文传递
基于密度的线数据分组算法研究
16
作者 魏海涛 杜云艳 +4 位作者 许开辉 吴笛 易嘉伟 莫洋 刘张 《地球信息科学学报》 CSCD 北大核心 2015年第5期538-546,共9页
目前,地理空间数据面临着由于数据量膨胀和计算量高速增长而引起算法效率低的问题,采用"分而治之"的数据分组策略提高运算效率已成为研究的热点。面向分布不均匀的线数据,本文提出了基于密度的线数据分组算法(简称LGAD)。首先... 目前,地理空间数据面临着由于数据量膨胀和计算量高速增长而引起算法效率低的问题,采用"分而治之"的数据分组策略提高运算效率已成为研究的热点。面向分布不均匀的线数据,本文提出了基于密度的线数据分组算法(简称LGAD)。首先,算法通过查找高密度区提取样本线段,保证了分组算法的起点落到高密区;其次,考虑线空间拓扑关系的复杂性,引用水平、垂直和夹角距离度量线段间距离,创建样本线段与其他线段的距离矩阵;最后,以距离矩阵和最优选择方法实现数据负载均衡分组。实验结果显示,对数据分组和分组后数据进行线段聚类的2个过程中,该算法体现了较好的时间优势,与串行计算相比,在分组数为2-12时,平均比率达4.3,提高了应用的响应速度,具有较好的实际意义。 展开更多
关键词 分而治之 并行计算 分布不均匀 线数据分组 负载均衡
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部