期刊文献+
共找到31篇文章
< 1 2 >
每页显示 20 50 100
基于性能预测的推测多线程循环选择方法 被引量:7
1
作者 刘斌 赵银亮 +4 位作者 韩博 李玉祥 吉烁 冯博琴 武万杰 《电子与信息学报》 EI CSCD 北大核心 2014年第11期2768-2774,共7页
线程级推测(Thread-Level Speculation,TLS)是多核上一种加速串行程序的线程级自动并行化技术。循环具有规则的结构并在运行时占有大量的执行时间,因此循环是挖掘并行性的理想对象。然而,选择哪些循环并行才能提高程序的加速比是一个很... 线程级推测(Thread-Level Speculation,TLS)是多核上一种加速串行程序的线程级自动并行化技术。循环具有规则的结构并在运行时占有大量的执行时间,因此循环是挖掘并行性的理想对象。然而,选择哪些循环并行才能提高程序的加速比是一个很难决定的问题。为了解决该问题,该文提出一种基于性能预测的循环选择方法。基于输入训练集获取程序预执行的剖析信息,同时结合各种推测因素,构建了循环结构的性能预测模型。预测结果定量评估了循环推测并行的加速比并决定该循环在运行时是否适合并行。实验结果表明,该文提出的方法能有效地预测循环并行时所蕴含的并行性,并依据预测结果准确地选择具有并行收益的循环推测并行,最终Olden基准测试集加速比性能平均提升了12.34%。 展开更多
关键词 并行处理 线程级推测 循环选择 性能预测
下载PDF
基于模糊聚类的推测多线程划分算法 被引量:19
2
作者 李远成 阴培培 赵银亮 《计算机学报》 EI CSCD 北大核心 2014年第3期580-592,共13页
推测多线程(Speculative Multithreading,SpMT)技术是一种实现非规则程序自动并行化的有效途径.然而,如何有效评估由诸如控制、数据依赖等因素导致的多种并行开销并实现最优线程划分一直是制约加速比性能提升的关键问题.基于启发式规则... 推测多线程(Speculative Multithreading,SpMT)技术是一种实现非规则程序自动并行化的有效途径.然而,如何有效评估由诸如控制、数据依赖等因素导致的多种并行开销并实现最优线程划分一直是制约加速比性能提升的关键问题.基于启发式规则的传统划分方法虽然可以取得一定的加速效果,但由于启发式规则只能对多种并行开销进行定性评估,因而导致只能得到经验上较优的线程划分.针对传统划分方法的局限性,文中首次提出并实现了一种基于模糊聚类的线程划分方法.在该方法中,作者首先提出一种评估模型来定量评估各种并行开销,然后通过深入分析各种并行开销来确定最佳的线程解搜索空间,最终利用聚类方法实现有效线程解空间搜索以求取更优的线程划分.基于Olden程序集的测试结果表明,文中提出的线程划分方法可以有效地对非规则程序进行划分,其平均加速比可达到1.85. 展开更多
关键词 推测多线程 线程划分 模糊聚类 自动并行化 代价评估中图法
下载PDF
推断与推测技术在现代高性能微处理器设计中的应用研究 被引量:5
3
作者 单睿 洪缨 侯朝焕 《计算机学报》 EI CSCD 北大核心 2003年第11期1575-1580,共6页
在现代高性能微处理器设计中 ,推断和推测成为开发指令级并行性ILP(InstructionLevelPara llelism)的两种重要技术途径 .推断的目的是打破程序间固有的控制流程 ,将控制相关转变为数据相关 ,使指令级并行性识别从一个基本块扩大为一个超... 在现代高性能微处理器设计中 ,推断和推测成为开发指令级并行性ILP(InstructionLevelPara llelism)的两种重要技术途径 .推断的目的是打破程序间固有的控制流程 ,将控制相关转变为数据相关 ,使指令级并行性识别从一个基本块扩大为一个超块 .推测执行是为打破分支或访存引起的相关问题而进行的操作 ,进一步分为控制推测和数据推测 .控制推测的目的是打破分支和其他操作间的相关性 ,进而由编译器在一个超块内识别并行性 ,减小控制相关的高度 .数据推测则是消去访存相关 ,提高指令级并行度 .该文首先对推断和推测本身进行分析 ,然后在此基础上进一步将推断、推测技术相结合 ,并应用于高性能媒体处理器的设计中 .性能评价和比较结果显示 ,两种技术相结合将比任何一种技术都更加行之有效 . 展开更多
关键词 微处理器 设计 推断技术 推测技术 超标量处理器
下载PDF
针对子程序结构的线程级推测并行性分析 被引量:6
4
作者 梁博 安虹 +1 位作者 王莉 王耀彬 《小型微型计算机系统》 CSCD 北大核心 2009年第2期230-235,共6页
线程级推测技术为开发更多的线程级并行性,充分利用多核加速传统上难以手工或自动并行化的串行程序提供可行的技术途径.然而,这种技术的性能严重地依赖于线程划分方案.有研究表明,仅推测执行循环所产生的并行性是不够的,但推测执行子程... 线程级推测技术为开发更多的线程级并行性,充分利用多核加速传统上难以手工或自动并行化的串行程序提供可行的技术途径.然而,这种技术的性能严重地依赖于线程划分方案.有研究表明,仅推测执行循环所产生的并行性是不够的,但推测执行子程序结构比循环结构要难.本文提出寻找适于推测并行执行的子程序结构的基本判定依据;通过运行由Simplescalar工具集改造得到的动态剖析工具ProRV、ProFun和SPEC CPU2000基准测试程序,我们对子程序结构线程化推测执行的适合性进行详细分析,给出具有指导意义的实验分析方法和实验数据.我们发现:1无返回值的子程序结构占据程序整体执行时间的大约40%;返回稀疏整型的子程序结构占据了程序整体执行时间的大约10%,对其返回值的预测成功率在70%左右.对于其他返回值类型的子程序结构,由于对其返回值的预测成功率过低,我们认为不适合作为线程划分的对象.2简单的last-value的值预测方案对于返回值的预测是简单而且足够有效的.3访存数据依赖普遍存在于子程序与其后继代码之间,显式同步机制对于针对子程序结构的线程级推测是必要的. 展开更多
关键词 线程级推测 串行程序自动并行化 子程序结构 动态剖析 数据依赖分析
下载PDF
一种基于路径优化的推测多线程划分算法 被引量:1
5
作者 李远成 赵银亮 +1 位作者 李美蓉 杜延宁 《软件学报》 EI CSCD 北大核心 2012年第8期1950-1964,共15页
推测多线程(speculative multithreading,简称SpMT)技术是一种实现非规则程序自动并行化的有效途径.然而,基于控制流图和分支预测技术的线程划分方法,不可避免地会受到划分路径上所存在的控制依赖和数据依赖的制约.目前,在传统的线程划... 推测多线程(speculative multithreading,简称SpMT)技术是一种实现非规则程序自动并行化的有效途径.然而,基于控制流图和分支预测技术的线程划分方法,不可避免地会受到划分路径上所存在的控制依赖和数据依赖的制约.目前,在传统的线程划分算法中存在的一个重要问题是,在对划分路径进行选取时只考虑了控制依赖影响却不能有效地综合考虑数据依赖的影响,进而导致不能选取最佳的划分路径.因此,针对传统方法中这种依赖评估方法效率低下的问题,设计并实现了一种基于路径优化的线程划分算法.该算法通过引入基于程序切片技术的预计算方法,建立一种路径评估方法来评估程序间的控制和数据依赖.同时,引入控制线程体大小的启发式规则,以便有效地解决负载不平衡的问题.基于Olden测试集的测试结果表明,所提出的算法可以有效地对非规则程序进行划分,其平均加速比可以达到1.83. 展开更多
关键词 推测多线程 线程级并行 线程划分 路径优化 自动并行化
下载PDF
基于交互信息的投机并行化方法 被引量:1
6
作者 李莹 孙煦雪 +1 位作者 袁新宇 徐印成 《计算机应用研究》 CSCD 北大核心 2010年第6期2123-2126,2139,共5页
针对投机并行化中如何权衡策略并确定合适的执行模型来获取理想性能的问题,提出了一种基于交互信息的投机并行化方法,利用交互信息来确定投机并行化的执行模型,建立相关评价模型,并着重从线程抽取创建角度提出了相应的策略及对应的性能... 针对投机并行化中如何权衡策略并确定合适的执行模型来获取理想性能的问题,提出了一种基于交互信息的投机并行化方法,利用交互信息来确定投机并行化的执行模型,建立相关评价模型,并着重从线程抽取创建角度提出了相应的策略及对应的性能评价。通过实验表明,基于交互信息进行"按需"并行化,可以达到所需的性能要求。 展开更多
关键词 投机多线程 线程抽取创建 执行模型 并行化
下载PDF
基于事务性执行的投机并行多线程软件模拟 被引量:1
7
作者 姚震 郑启龙 +1 位作者 陈国良 杨晓奇 《小型微型计算机系统》 CSCD 北大核心 2008年第3期437-443,共7页
基于事务性执行的投机并行多线程是一种适合未来多核微处理器架构的新型并行程序设计和编译技术.但在此基础上的并行程序执行过程更为复杂,程序执行过程的模拟成为关键问题之一.本文提出利用二进制代码级动态插桩技术对投机并行多线程... 基于事务性执行的投机并行多线程是一种适合未来多核微处理器架构的新型并行程序设计和编译技术.但在此基础上的并行程序执行过程更为复杂,程序执行过程的模拟成为关键问题之一.本文提出利用二进制代码级动态插桩技术对投机并行多线程程序进行功能性模拟,设计并实现了完整的软件平台,可精确地模拟和监控并行程序的线程级投机执行过程,检测访存冲突,从而实现投机并行多线程的语义.该软件平台同时可以作为进一步研究投机多线程并行程序真实执行过程的基础,并有效支持投机并行多线程编译器的设计和分析. 展开更多
关键词 投机并行多线程 事务性内存 软件模拟 动态插桩
下载PDF
面向线程级前瞻的线程划分方法浅析 被引量:1
8
作者 鲁建壮 王志英 张春元 《计算机科学》 CSCD 北大核心 2006年第5期270-272,281,共4页
正确合理的线程划分方法是提取线程级并行性的必要前提,线程级前瞻技术是简化线程划分复杂度提高系统性能的重要手段。本文讨论了几种支持线程级前瞻的典型线程划分方法,在此基础上提出了线程级划分需要解决的关键问题,并结合一典型自... 正确合理的线程划分方法是提取线程级并行性的必要前提,线程级前瞻技术是简化线程划分复杂度提高系统性能的重要手段。本文讨论了几种支持线程级前瞻的典型线程划分方法,在此基础上提出了线程级划分需要解决的关键问题,并结合一典型自动线程划分算法进行了具体分析,提出了线程划分需要进一步研究的问题。 展开更多
关键词 线程级并行性 线程划分 线程级前瞻
下载PDF
选择性循环的并行方法 被引量:1
9
作者 吴悦 雷超付 杨洪斌 《计算机工程》 CAS CSCD 北大核心 2010年第9期35-37,40,共4页
针对含有大量循环的串行程序存在的问题,提出一种基于线程级前瞻技术的循环选择方案。该方案对循环进行最优选择后建立一个可并行运行的循环集。对于该集合中的循环,选择并行效率高的代码段作并行处理,以加快串行程序运行速度。实验表明... 针对含有大量循环的串行程序存在的问题,提出一种基于线程级前瞻技术的循环选择方案。该方案对循环进行最优选择后建立一个可并行运行的循环集。对于该集合中的循环,选择并行效率高的代码段作并行处理,以加快串行程序运行速度。实验表明,相对于一般的简单内部循环或外部循环并行方法,该方案使9种基准代码的加速比平均上升23.8%,从而提高串行程序并行运行的效率。 展开更多
关键词 线程级前瞻 循环选择 并行运行 单片多核处理器
下载PDF
非规则串行程序隐式线程级推测并行发展综述 被引量:2
10
作者 李远成 刘斌 《西安邮电大学学报》 2017年第1期99-105,共7页
基于片上多核处理器体系结构,概述在非规则串行程序自动并行化领域中,隐式线程级推测并行技术的特点、研究现状、以及所面临的挑战。从程序特征分析、多线程划分、软硬件协同加速方法和性能功耗评估等4个方面,探讨线程级推测技术未来的... 基于片上多核处理器体系结构,概述在非规则串行程序自动并行化领域中,隐式线程级推测并行技术的特点、研究现状、以及所面临的挑战。从程序特征分析、多线程划分、软硬件协同加速方法和性能功耗评估等4个方面,探讨线程级推测技术未来的发展趋势和研究方向。 展开更多
关键词 线程级推测 自动化并行 片上多核处理器 软硬件协同设计 非规则程序
下载PDF
基于进程投机并行的运行时系统设计与优化
11
作者 刘雷 李晶 +1 位作者 陈莉 冯晓兵 《计算机工程》 CAS CSCD 2014年第3期99-102,112,共5页
投机并行化是解决遗留串行代码并行化的重要技术,但以往投机并行化运行时系统面临着诸多的性能问题,如任务分配不均衡、通信频繁、冲突代价高,以及进程启动,结柬频繁而导致开销过高等。为此,提出一种基于进程实现的投机并行化运行时系... 投机并行化是解决遗留串行代码并行化的重要技术,但以往投机并行化运行时系统面临着诸多的性能问题,如任务分配不均衡、通信频繁、冲突代价高,以及进程启动,结柬频繁而导致开销过高等。为此,提出一种基于进程实现的投机并行化运行时系统。采用隐式单程序多数据的并行任务划分和执行模式。通过实现重甩进程的投机任务调度策略和委托正确性检查技术,降低投机进程启动/结束和通信的开销,提高投机进程的利用率,同时利用守护进程与投机进程协同执行的方式,确保在投机进程出现异常情况时程序也能正确执行。实验结果表明,该基于进程实现的投机运行时系统比同类型系统的性能提高231%。 展开更多
关键词 软件投机并行 基于进程投机并行 运行时并行 委托正确性检查 并行任务划分
下载PDF
基于MapReduce模型的推测执行优化算法
12
作者 黄中平 白光伟 +2 位作者 沈航 承骁 华志翔 《计算机科学》 CSCD 北大核心 2017年第4期193-196,212,共5页
作为数据中心大规模处理框架,MapReduce集群包含成百上千个节点,多采用推测执行的方法来有效解决并行计算中的掉队任务。针对集群中实时性需求较高并且任务量较小的目标作业,提出基于MapReduce模型的推测执行优化算法,其目的是在满足实... 作为数据中心大规模处理框架,MapReduce集群包含成百上千个节点,多采用推测执行的方法来有效解决并行计算中的掉队任务。针对集群中实时性需求较高并且任务量较小的目标作业,提出基于MapReduce模型的推测执行优化算法,其目的是在满足实时性需求的基础上尽量减少目标作业的完成时间。首先通过分析任务模型和时间模型,引入数学0-1规划模型,求得整体作业的完成时间最小;然后设计可以在多项式复杂度内完成的启发式算法,目的是在可用资源允许的范围内尽量逼近最优值;最后通过大量实验模拟验证算法的执行效果。 展开更多
关键词 MAPREDUCE 并行计算 推测执行 实时性
下载PDF
The SPAD test:循环级投机并行化方法
13
作者 周静 曾国荪 《小型微型计算机系统》 CSCD 北大核心 2007年第11期1932-1936,共5页
传统的并行编译技术能够在编译期间进行相关性分析,有效地并行化循环程序,但是对于程序运行时潜在的并行性却无能为力.因此,并行编译技术必须使用实时依赖分析技术,尽可能挖掘循环级并行性.本文提出仿射依赖关系,消除了循环迭代依赖;基... 传统的并行编译技术能够在编译期间进行相关性分析,有效地并行化循环程序,但是对于程序运行时潜在的并行性却无能为力.因此,并行编译技术必须使用实时依赖分析技术,尽可能挖掘循环级并行性.本文提出仿射依赖关系,消除了循环迭代依赖;基于投机并行思想,提出了SPAD方法.实例分析表明,SPAD是有效的.与LRPD和SPNT方法相比较,SPAD做了重要的改进,因此是更通用的投机并行化方案. 展开更多
关键词 并行编译 投机并行 循环级并行 依赖分析
下载PDF
基于分散内存式多处理器系统的延迟判断式投机执行并行处理方式的提案 被引量:1
14
作者 陈煜 殷凤华 《南京工业职业技术学院学报》 2007年第4期33-35,43,共4页
针对并行计算机进行并行处理时条件分支会影响程序并行性的问题,提出了一种基于分散内存系统的延迟判断式投机执行并行处理方式。这种并行处理方式有处理时间(overhead)短,对硬件依赖性小等优点。
关键词 并行计算 早期评价 投机执行 编译器 多处理器
下载PDF
条件推测性十进制加法器的优化设计
15
作者 崔晓平 王书敏 +1 位作者 刘伟强 董文雯 《电子与信息学报》 EI CSCD 北大核心 2016年第10期2689-2694,共6页
随着商业计算和金融分析等高精度计算应用领域的高速发展,提供硬件支持十进制算术运算变得越来越重要,新的IEEE 754-2008浮点运算标准也添加了十进制算术运算规范。该文采用目前最佳的条件推测性算法设计十进制加法电路,给出了基于并行... 随着商业计算和金融分析等高精度计算应用领域的高速发展,提供硬件支持十进制算术运算变得越来越重要,新的IEEE 754-2008浮点运算标准也添加了十进制算术运算规范。该文采用目前最佳的条件推测性算法设计十进制加法电路,给出了基于并行前缀/进位选择结构的条件推测性十进制加法器的设计过程,并通过并行前缀单元对十进制进位选择加法器进行优化设计。采用Verilog HDL对32 bit,64 bit和128 bit十进制加法器进行描述并在Model Sim平台上进行了仿真验证,在Nangate Open Cell 45nm标准工艺库下,通过Synopsys公司综合工具Design Compiler进行了综合。与现有的条件推测性十进制加法器相比较,综合结果显示该文所提出的十进制加法器可以提升12.3%的速度性能。 展开更多
关键词 十进制加法 条件推测十进制加法 并行前缀 进位选择加法器
下载PDF
五种执行机制下的指令级并行性
16
作者 程旭 《电子器件》 CAS 1997年第1期423-428,共6页
指令级并行性是保证处理器性能不断改进的重要途径.我们利用研制的S&S模拟系统,针对不同执行机制对八个基准程序中潜在指令级并行性存在、开发情况的影响,在多方面进行了定量分析,结果表明推测式执行和多控制流并行是充分挖掘出程... 指令级并行性是保证处理器性能不断改进的重要途径.我们利用研制的S&S模拟系统,针对不同执行机制对八个基准程序中潜在指令级并行性存在、开发情况的影响,在多方面进行了定量分析,结果表明推测式执行和多控制流并行是充分挖掘出程序中潜在并行性的关键。 展开更多
关键词 指令级并行 执行机制 控制相关 计算机 处理器
下载PDF
延迟判断型投机执行并行处理方式的评价
17
作者 陈煜 《南京工业职业技术学院学报》 2009年第4期32-33,共2页
对多处理器的延迟判断式投机执行并行计算方式进行了评价,将该方式适用于实际程序时,通过模拟得到了执行时间最大可以缩减33%的结果。
关键词 并行计算 投机执行 编译器 多处理器
下载PDF
支持推测多线程的扩展多核模拟器Prophet+ 被引量:3
18
作者 宋少龙 赵银亮 +3 位作者 冯博琴 韦远科 王旭昊 赵恒星 《西安交通大学学报》 EI CAS CSCD 北大核心 2010年第10期13-17,35,共6页
推测多线程技术是软硬件协同开发非规则应用程序的线程级并行性的有效方法.通过体系结构对推测并行执行模式的支持,编译器产生推测多线程目标代码实现自动并行化加速.文中针对硬件平台如何有效支持程序运行过程的分析及测试,提出了一种... 推测多线程技术是软硬件协同开发非规则应用程序的线程级并行性的有效方法.通过体系结构对推测并行执行模式的支持,编译器产生推测多线程目标代码实现自动并行化加速.文中针对硬件平台如何有效支持程序运行过程的分析及测试,提出了一种支持推测并行执行模式的超标量流水线结构和一种基于独立栈的运行时内存空间管理方法.通过对Prophet模拟器扩展实现,并经Olden基准程序测试表明,扩展后的Prophet+在保持Prophet模拟器性能的前提下,提高了模拟器的精度和灵活性. 展开更多
关键词 线程级并行 推测多线程 片上多处理器 流水线 模拟器
下载PDF
一种数据结构制导的线程划分方法与执行模型 被引量:2
19
作者 杜延宁 赵银亮 +1 位作者 韩博 李远成 《软件学报》 EI CSCD 北大核心 2013年第10期2432-2459,共28页
在对程序进行并行化时,为了保证结果的正确性,并行编译器只能采取一种保守的策略,也就是,如果它不能确定两段代码在并行执行时是否会发生冲突,它就不允许这两段代码并行执行.虽然这种做法保证了正确性,但同时也限制了对并行性的开发.在... 在对程序进行并行化时,为了保证结果的正确性,并行编译器只能采取一种保守的策略,也就是,如果它不能确定两段代码在并行执行时是否会发生冲突,它就不允许这两段代码并行执行.虽然这种做法保证了正确性,但同时也限制了对并行性的开发.在这种背景下,许多推测多线程方法被提了出来,这些方法通过允许可能冲突的代码段并行执行来把握更多的并行机会,同时,通过从冲突中恢复来保证结果的正确性.然而,传统推测多线程方法所使用的"沿控制流将串行程序划分为多个线程"的做法并不适合不同数据结构上的操作在控制流中相互交错的情况,因为如果沿控制流将程序线性地划分为多个线程,则同一个数据结构上的操作将被分到不同的线程中,从而非常容易发生冲突.为了有效地对这些程序进行并行化,提出了一种基于数据结构的线程划分方法与执行模型.在这种方法中,程序中的对象被划分成多个组,同一组中对象上的操作被分派到同一个线程中去执行,从而降低了在同一个数据结构上发生冲突的可能性. 展开更多
关键词 推测多线程 并行化 数据结构 划分方法 执行模型
下载PDF
Prophet推测多线程系统设计与实现 被引量:2
20
作者 李钟 赵银亮 杜延宁 《计算机科学》 CSCD 北大核心 2011年第2期296-301,共6页
推测多线程技术通过推测执行的方式开发应用程序的线程级并行性,以提高程序执行性能。该技术一般通过执行模型来检测运行时可能的线程推测错误情况,并采取合适的机制恢复程序正确运行。描述的Prophet是一种基于硬件实现的推测多线程执... 推测多线程技术通过推测执行的方式开发应用程序的线程级并行性,以提高程序执行性能。该技术一般通过执行模型来检测运行时可能的线程推测错误情况,并采取合适的机制恢复程序正确运行。描述的Prophet是一种基于硬件实现的推测多线程执行模型。重点描述了Prophet执行模型针对执行模型设计的关键问题的解决方案,包括Prophet的线程状态控制和多版本的Cache系统,Prophet的多版本Cache系统提供了推测数据缓存功能,并使用基于总线监听的Cache协议实现了数据依赖违规检测。还给出了使用Olden基准程序对Prophet执行模型进行功能和性能测试的结果,并分析说明了Prophet系统可以有效地开发应用程序的线程级并行性。 展开更多
关键词 推测多线程 线程级并行 推测多线程执行模型 推测多线程体系结构
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部