期刊文献+
共找到64篇文章
< 1 2 4 >
每页显示 20 50 100
libpcap-MT:一种多线程的通用数据包捕获库 被引量:8
1
作者 温曙光 谢高岗 《计算机研究与发展》 EI CSCD 北大核心 2011年第5期756-764,共9页
libpcap数据包捕获函数库提供数据包捕获、过滤等上层API,目前广泛被网络协议分析、入侵检测等数据包处理系统使用.多核、多CPU通用计算平台为数据包的高速处理提供可能,但libpcap提供的单线程机制难以充分利用多核、多CPU平台的并行计... libpcap数据包捕获函数库提供数据包捕获、过滤等上层API,目前广泛被网络协议分析、入侵检测等数据包处理系统使用.多核、多CPU通用计算平台为数据包的高速处理提供可能,但libpcap提供的单线程机制难以充分利用多核、多CPU平台的并行计算能力.设计并实现了一种支持多线程的libpcap:libpcap-MT.libpcap-MT在内核态进行高效的数据包分发,采用无锁的多缓存队列允许多线程同时读取数据包,提供灵活的数据包分发策略,接口与libpcap保持兼容.实验结果表明,使用libpcap-MT能够快速地将现有的系统多线程化,并且具有更好的性能和可扩展性. 展开更多
关键词 数据包捕获 多线程程序模型 多核 并行优化 应用编程接口
下载PDF
新型电力系统电磁暂态加速仿真技术 被引量:1
2
作者 聂春芳 郝正航 +1 位作者 陈卓 何朴想 《电子科技》 2024年第3期18-25,共8页
为解决新型电力系统电磁暂态仿真时由于系统拓扑结构复杂、电力电子开关器件较多以及仿真机单核计算能力不足导致的仿真效率低下、仿真难度大等问题,文中采用理想变压器模型分割算法将大规模新型电力系统模型分割成若干子系统,实现了大... 为解决新型电力系统电磁暂态仿真时由于系统拓扑结构复杂、电力电子开关器件较多以及仿真机单核计算能力不足导致的仿真效率低下、仿真难度大等问题,文中采用理想变压器模型分割算法将大规模新型电力系统模型分割成若干子系统,实现了大系统的解耦和降阶,有效减少了仿真时整个系统作为一个状态空间系统矩阵的运算量。为进一步减轻单个处理器的计算负担,利用CPU(Central Processing Unit)多核并行技术设计一款在裸机环境下高效并行运算的加速仿真平台UREP300。将分割后的模型载入UREP300进行加速仿真实验,同时与基于MATLAB/Simulink的原模型离线仿真进行对比。实验结果表明,融合理想变压器模型分割与多核并行运行的加速仿真技术能够在保障仿真精度的同时将仿真速度提升至原来的586倍,可显著提高仿真效率,适用于大规模新型电力系统的仿真工作。 展开更多
关键词 新型电力系统 电磁暂态 加速仿真 模型分割 理想变压器模型法 裸机编程 多核并行 多核调度
下载PDF
VERTAF/Multi-Core:A SysML-Based Application Framework for Multi-Core Embedded Software Development 被引量:1
3
作者 林朝圣 吕俊贤 +2 位作者 林尚威 陈盈如 熊博安 《Journal of Computer Science & Technology》 SCIE EI CSCD 2011年第3期448-462,共15页
Multi-core processors are becoming prevalent rapidly in personal computing and embedded systems. Nevertheless, the programming environment for multi-core processor-based systems is still quite immature and lacks effic... Multi-core processors are becoming prevalent rapidly in personal computing and embedded systems. Nevertheless, the programming environment for multi-core processor-based systems is still quite immature and lacks efficient tools. In this work, we present a new VERTAF/Multi-Core framework and show how software code can be automatically generated from SysML models of multi-core embedded systems. We illustrate how model-driven design based on SysML can be seamlessly integrated with Intel's threading building blocks (TBB) and the quantum framework (QF) middleware. We use a digital video recording system to illustrate the benefits of the framework. Our experiments show how SysML/QF/TBB help in making multi-core embedded system programming model-driven, easy, and efficient. 展开更多
关键词 multi-core model-driven parallel programming FRAMEWORK SYSML design pattern
原文传递
YHFT-QDSP:High-Performance Heterogeneous Multi-Core DSP
4
作者 陈书明 万江华 +8 位作者 鲁建壮 刘仲 孙海燕 孙永节 刘衡竹 刘祥远 李振涛 徐毅 陈小文 《Journal of Computer Science & Technology》 SCIE EI CSCD 2010年第2期214-224,共11页
Multi-core architectures are widely used to in time-to-market and power consumption of the chips enhance the microprocessor performance within a limited increase Toward the application of high-density data signal pro... Multi-core architectures are widely used to in time-to-market and power consumption of the chips enhance the microprocessor performance within a limited increase Toward the application of high-density data signal processing, this paper presents a novel heterogeneous multi-core architecture digital signal processor (DSP), YHFT-QDSP, with one RISC CPU core and 4 VLIW DSP cores. By three kinds of interconnection, YHFT-QDSP provides high efficiency message communication for inner-chip RISC core and DSP cores, inner-chip and inter-chip DSP cores. A parallel programming platform is specifically developed for the heterogeneous nmlti-core architecture of YHFT-QDSP. This parallel programming environment provides a parallel support library and a friendly interface between high level application softwares and multi- core DSP. The 130 nm CMOS custom chip design results benchmarks show that the interconnection structure of in a high speed and moderate power design. The results of typical YHFT-QDSP is much better than other related structures and achieves better speedup when using the interconnection facilities in combing methods. YHFT-QDSP has been signed off and manufactured presently. The future applications of the multi-core chip could be found in 3G wireless base station, high performance radar, industrial applications, and so on. 展开更多
关键词 digital signal processor (DSP) multi-core ARCHITECTURE parallel programming custom design
原文传递
A High Performance Multifrontal Code for Linear Solution of Structures Using Multi-Core Microprocessors
5
作者 Efe Guney Kenneth Will 《Tsinghua Science and Technology》 SCIE EI CAS 2008年第S1期34-39,共6页
A multifrontal code is introduced for the efficient solution of the linear system of equations arising from the analysis of structures. The factorization phase is reduced into a series of interleaved element assembly ... A multifrontal code is introduced for the efficient solution of the linear system of equations arising from the analysis of structures. The factorization phase is reduced into a series of interleaved element assembly and dense matrix operations for which the BLAS3 kernels are used. A similar approach is generalized for the forward and back substitution phases for the efficient solution of structures having multiple load conditions. The program performs all assembly and solution steps in parallel. Examples are presented which demonstrate the code’s performance on single and dual core processor computers. 展开更多
关键词 multifrontal method Cholesky decomposition high performance computing finite element method multi-core programming BLAS3 parallel computing
原文传递
有限元单元计算子程序的OpenMP并行化 被引量:11
6
作者 宋刚 蒋孟奇 +1 位作者 张云泉 李玉成 《计算机工程》 CAS CSCD 北大核心 2008年第6期80-81,84,共3页
Intel和AMD双核乃至4核处理器的推出,使得并行计算已经普及到PC机。为了充分利用多核,需要对原有程序进行多线程改造,使其充分利用多核处理带来的性能提升。该文利用共享存储编程的工业标准OpenMP对有限元方法涉及的单元计算子程序进行... Intel和AMD双核乃至4核处理器的推出,使得并行计算已经普及到PC机。为了充分利用多核,需要对原有程序进行多线程改造,使其充分利用多核处理带来的性能提升。该文利用共享存储编程的工业标准OpenMP对有限元方法涉及的单元计算子程序进行了并行化实现。在机群的一个双CPU的SMP节点上的测试表明,共享并行化使得该单元子程序的性能提高了一倍。 展开更多
关键词 并行编程 多线程 多核 有限元
下载PDF
梯级水电站长期优化调度的细粒度并行离散微分动态规划方法 被引量:38
7
作者 程春田 郜晓亚 +1 位作者 武新宇 高上上 《中国电机工程学报》 EI CSCD 北大核心 2011年第10期26-32,共7页
伴随水电规模的扩大,水电站群优化调度的计算量不断增加,需要探求新的方法。在分析离散微分动态规划(discrete differentiation and dynamic programming,DDDP)算法的基础上,提出了基于分治模式的梯级水电站长期优化调度的细粒度并行离... 伴随水电规模的扩大,水电站群优化调度的计算量不断增加,需要探求新的方法。在分析离散微分动态规划(discrete differentiation and dynamic programming,DDDP)算法的基础上,提出了基于分治模式的梯级水电站长期优化调度的细粒度并行离散微分动态规划(parallel discrete differentiation and dynamic programming,PDDDP)方法,并以澜沧江梯级的6个电站系统长期优化调度问题为应用实例,在多核计算环境下进行验证。结果表明,多核环境下的PDDDP方法简便易行,能充分利用闲置计算资源、大幅度提高优化调度的计算效率,是解决大规模复杂水电系统调度的高效和实用方法。 展开更多
关键词 电力系统 并行 离散微分动态规划 梯级水电站 长期优化调度 多核
下载PDF
数值天气预报业务模式现状与展望 被引量:138
8
作者 陈德辉 薛纪善 《气象学报》 CAS CSCD 北大核心 2004年第5期623-633,共11页
20 0 4年是数值天气预报理论提出 10 0周年 ,同时也是数值天气预报业务化应用 5 0周年。经过百年的发展历程 ,数值天气预报学科有了飞跃的发展。特别是最近 10多年来 ,大气科学以及地球科学的研究进展 ,高速度、大容量的巨型计算机及网... 20 0 4年是数值天气预报理论提出 10 0周年 ,同时也是数值天气预报业务化应用 5 0周年。经过百年的发展历程 ,数值天气预报学科有了飞跃的发展。特别是最近 10多年来 ,大气科学以及地球科学的研究进展 ,高速度、大容量的巨型计算机及网络系统的快速发展 ,更加快了数值天气预报的发展步伐。文中从模式动力框架、物理过程参数化、模式程序软件等方面对数值天气预报业务模式现状进行了简要综述 ,对存在的问题进行了探讨 ,并对数值天气预报业务模式的未来发展作了展望。当前数值天气预报业务模式发展的特点有 :(1) 2 0世纪 90年代中期以来 ,各国的全球和区域模式水平和垂直分辨率都有明显提高 ,且模式物理过程也同步进行改进 ;数值预报业务模式已进入了大规模并行计算的阶段 ;(2 )主要发达国家和中国都正在致力于研发各自的新业务数值预报模式———非静力 (多尺度 )一体化模式或非静力中尺度模式 ,部分国家的新一代天气 气候一体化数值模式已业务运行 ;(3)业务数值预报模式正在朝着不断完善的方向发展。随着模式分辨率的提高 ,云物理过程、陆面过程和湍流过程、考虑坡度 -坡向因子的辐射过程等在模式中的参数化方案 ,以及模式垂直坐标的选择越来越受重视 。 展开更多
关键词 数值天气预报 数值模式 数值预报模式 参数化方案 业务化 云物理过程 大气科学 域模式 巨型计算机 并行计算
下载PDF
一种支持多种访存技术的CBEA片上多核MPI并行编程模型 被引量:6
9
作者 冯国富 董小社 +2 位作者 胡冰 王旭昊 王恩东 《计算机学报》 EI CSCD 北大核心 2008年第11期1965-1974,共10页
现有的CBEA(Cell Broadband Engine Architecture)编程模型多侧重于支持类似于流处理的“批量访存”(Bulk Data Transfer)应用,传统非规则访存应用性能较低.文中基于Cell架构提出了一种同时支持“批量访存”与非规则访存应用的MPI... 现有的CBEA(Cell Broadband Engine Architecture)编程模型多侧重于支持类似于流处理的“批量访存”(Bulk Data Transfer)应用,传统非规则访存应用性能较低.文中基于Cell架构提出了一种同时支持“批量访存”与非规则访存应用的MPI并行编程模型,将通信分解在PPE(PowerPC Processing Element)上,拓宽模型的适用范围;在统一访存接口下,通过运行时访存剖分信息指导选择和优化访存以提高计算效率.实验结果表明,文中提出的编程模型支持多种访存模式并具有很好的并行加速比,可获得较同类相关技术30%-50%左右的性能提升. 展开更多
关键词 异构多核 CBE架构 并行编程模型 MPI 访存技术 剖分优化
下载PDF
多核处理器并行编程模型的研究与设计 被引量:17
10
作者 曹折波 李青 《计算机工程与设计》 CSCD 北大核心 2010年第13期2999-3002,3056,共5页
为了在多核处理器上充分利用多核资源以提升程序性能,研究了多核处理器的体系结构和多核环境下可能影响并行程序性能的因素,实现了基于任务的并行编程模型。该模型提供了单任务数据并行和多任务并行两种并行处理方式,其中单任务数据并... 为了在多核处理器上充分利用多核资源以提升程序性能,研究了多核处理器的体系结构和多核环境下可能影响并行程序性能的因素,实现了基于任务的并行编程模型。该模型提供了单任务数据并行和多任务并行两种并行处理方式,其中单任务数据并行使用cache块技术划分数据集,多任务并行使用任务密取的任务调度策略。用该模型实现了计算斐波那契数列的递归算法,实验结果表明,使用该模型编写多核并行程序可以达到较高的相对于串行计算的加速比。 展开更多
关键词 多核处理器 并行程序 并行编程模型 cache块技术 任务密取
下载PDF
多核处理器并行程序的确定性重放研究 被引量:10
11
作者 高岚 王锐 钱德沛 《软件学报》 EI CSCD 北大核心 2013年第6期1390-1402,共13页
多核处理器并行程序的确定性重放是实现并行程序调试的有效手段,对并行编程有重要意义.但由于多核架构下存在共享访存不同步问题,并行程序确定性重放的研究依然面临多方面的挑战,给并行程序的调试带来很大困难,严重影响了多核架构下并... 多核处理器并行程序的确定性重放是实现并行程序调试的有效手段,对并行编程有重要意义.但由于多核架构下存在共享访存不同步问题,并行程序确定性重放的研究依然面临多方面的挑战,给并行程序的调试带来很大困难,严重影响了多核架构下并行程序的普及和发展.分析了多核处理器造成并行程序确定性重放难以实现的关键因素,总结了确定性重放的评价指标,综述了近年来学术界对并行程序确定性重放的研究.根据总结的评价指标,从纯软件方式和硬件支持方式对目前的确定性重放方法进行了分析与对比,并在此基础上对多核架构下并行程序的确定性重放未来的研究趋势和应用前景进行了展望. 展开更多
关键词 多核处理器 并行程序 确定性重放 多线程程序 数据竞争 调试
下载PDF
一种面向数据流程序的软件流水并行化方法 被引量:5
12
作者 魏海涛 于俊清 +1 位作者 余华飞 秦明康 《计算机学报》 EI CSCD 北大核心 2011年第5期889-898,共10页
数据流编程被广泛应用于多媒体、图像处理和信号处理等领域.多核处理器为数据流程序提供了强大并行计算资源,如何利用多核处理器的并行性以提高数据流程序性能,对满足媒体处理等实时性需求具有重要意义.基于多核处理器提出了一种面向数... 数据流编程被广泛应用于多媒体、图像处理和信号处理等领域.多核处理器为数据流程序提供了强大并行计算资源,如何利用多核处理器的并行性以提高数据流程序性能,对满足媒体处理等实时性需求具有重要意义.基于多核处理器提出了一种面向数据流程序的软件流水并行化方法,利用整数线性规划理论对软件流水中的计算、通信资源和流水线执行阶段等进行统一的形式化建模,在最大化流水线计算速率的同时最小化通信开销;同时对存储资源进行了形式化建模,提高存储访问的性能.通过设计数据流编程语言DFBrook,在Cell处理器实现了上述方法.实验结果表明,该软件流水并行方法比其它方法在提高数据流程序性能的同时,降低了通信开销. 展开更多
关键词 数据流程序 多核处理器 软件流水 并行
下载PDF
事务存储系统 被引量:8
13
作者 彭林 谢伦国 张小强 《计算机研究与发展》 EI CSCD 北大核心 2009年第8期1386-1398,共13页
多核处理器性能的发挥依靠程序的并行,共享存储并行编程模型为大多数多核处理器所采用,而有效同步多个线程对共享变量的访问是其关键、也是难题.借鉴数据库中事务的思想,人们提出事务存储(transactional memory),旨在提供一种编程简单,... 多核处理器性能的发挥依靠程序的并行,共享存储并行编程模型为大多数多核处理器所采用,而有效同步多个线程对共享变量的访问是其关键、也是难题.借鉴数据库中事务的思想,人们提出事务存储(transactional memory),旨在提供一种编程简单,对程序正确性推理容易的同步手段.简介了事务存储的起源,诠释了事务存储系统的概念.论述了事务存储的编程接口和执行模型.讨论了事务存储系统所涉及的主要内容,对各种方法和策略进行了比较.对事务存储中有待解决的问题进行了探讨.最后介绍了几个开源的事务存储研究平台. 展开更多
关键词 事务存储 多核处理器 共享存储 并行编程 同步
下载PDF
面向多核的并行编程和优化研究 被引量:11
14
作者 戴晨 陈鹏 +1 位作者 杨冬蕾 张为华 《计算机应用与软件》 CSCD 北大核心 2013年第12期198-202,279,共6页
随着多核乃至众核平台的普及,面向多核的并行编程和优化已成为计算机领域研究的热点。然而,绝大多数程序员还依然延续着传统的串行编程习惯,而且目前的主流算法仍以串行为主。因此,如何有效地将串行程序并行化和如何高效地编写多核程序... 随着多核乃至众核平台的普及,面向多核的并行编程和优化已成为计算机领域研究的热点。然而,绝大多数程序员还依然延续着传统的串行编程习惯,而且目前的主流算法仍以串行为主。因此,如何有效地将串行程序并行化和如何高效地编写多核程序成为多核编程领域亟待解决的问题。对多核编程和优化技术的现状进行全面的研究和分析,在论述如何将串行程序并行化的同时,分析现今主流的一些多核并行编程工具和模型。在此基础上,进一步讨论了在多核编程过程中影响程序性能的因素,并阐述了软硬件领域针对多核编程所做的优化。在对各个研究项目进行分析和评价的基础上,也对面向多核的并行编程和优化技术可能的发展方向进行了展望。 展开更多
关键词 并行编程 多核 并行工具 并行模型
下载PDF
并行程序设计语言中局部性机制的研究 被引量:4
15
作者 袁良 张云泉 +1 位作者 白雪瑞 张广婷 《计算机科学》 CSCD 北大核心 2020年第1期7-16,共10页
大规模并行应用程序的性能优化和并行化的关键瓶颈之一在于多核CPU中越来越深和越来越复杂的存储层次。文中系统地分析和总结了当前主要多核CPU和并行程序设计语言中的局部性设计方法,提出了两种局部性,即横向局部性和纵向局部性,从这... 大规模并行应用程序的性能优化和并行化的关键瓶颈之一在于多核CPU中越来越深和越来越复杂的存储层次。文中系统地分析和总结了当前主要多核CPU和并行程序设计语言中的局部性设计方法,提出了两种局部性,即横向局部性和纵向局部性,从这两种局部性的视角深入分析了当前的主要并行程序设计语言的局部性设计机制,进一步总结对比了其优缺点,并指出了新一代并行程序设计语言应具有的特点,重点提出了新语言应同时综合考虑两种局部性支持的设计机制的研究观点。 展开更多
关键词 并行程序设计语言 并行程序设计模型 局部性 并行性 多核
下载PDF
多核并行编程技术在中文分词程序优化中的应用 被引量:2
16
作者 董丽丽 刘明生 袁香菊 《计算机工程与设计》 CSCD 北大核心 2010年第24期5231-5235,共5页
为了充分利用多核处理器的硬件资源和计算能力,提出了多核并行编程技术在中文分词程序中的优化方案。根据中文分词最大正向匹配算法的特点,由传统的串行程序,改为并行程序。利用多核并行编程模式的思想,设计了一个混合并行编程模式。通... 为了充分利用多核处理器的硬件资源和计算能力,提出了多核并行编程技术在中文分词程序中的优化方案。根据中文分词最大正向匹配算法的特点,由传统的串行程序,改为并行程序。利用多核并行编程模式的思想,设计了一个混合并行编程模式。通过Intel的性能分析工具,找出了该算法的热点和瓶颈,对其进行优化。实验结果表明,优化过后的执行时间较原来串行程序的执行时间缩短了50%~60%,同时提高了程序的加速性能,取得了良好的效果。 展开更多
关键词 多核并行 并行编程模式 程序优化 OPENMP 中文分词
下载PDF
TBB多核编程及其混合编程模型的研究 被引量:17
17
作者 胡斌 袁道华 《计算机技术与发展》 2009年第2期98-101,104,共5页
多核处理器越来越普及,如何通过软件技术最大提升CPU每个核心的使用率,成为热点问题。引入多核并行编程模型Threading Building Blocks,并与raw threads、Open MP进行各方面详细比较,分析了其优劣。并研究了TBB结合MPI在SMP集群系统上... 多核处理器越来越普及,如何通过软件技术最大提升CPU每个核心的使用率,成为热点问题。引入多核并行编程模型Threading Building Blocks,并与raw threads、Open MP进行各方面详细比较,分析了其优劣。并研究了TBB结合MPI在SMP集群系统上实现高效的混合并行计算应用的方法。最终发现TBB在多核编程方面有显著的优势。TTB和MPI的结合,又为多核处理器结点集群提供了并行层次化结构,大大优化集群的性能。 展开更多
关键词 TBB 多核处理器 多核并行编程 RAW THREADS OPENMP 对称多处理器集群 MPI
下载PDF
支持多核并行程序确定性重放的高效访存冲突记录方法 被引量:5
18
作者 刘磊 黄河 唐志敏 《计算机研究与发展》 EI CSCD 北大核心 2012年第1期64-75,共12页
多核系统中并行程序执行过程的不确定性给程序调试带来了很大的困难.准确记录初始执行中冲突访存的次序是并行程序确定性重放的基础.提出了通过建立精确happens-before关系记录访存冲突的方法.此方法利用简洁高效的地址冲突检测机制确... 多核系统中并行程序执行过程的不确定性给程序调试带来了很大的困难.准确记录初始执行中冲突访存的次序是并行程序确定性重放的基础.提出了通过建立精确happens-before关系记录访存冲突的方法.此方法利用简洁高效的地址冲突检测机制确定冲突访存操作在执行中所处happens-before序关系的位置,可以抑制部分记录信息的产生,从而有效减少记录信息.与其他方式方法相比,可以进一步压缩17%的记录条数.采用逻辑向量时钟描述冲突访存操作间的happens-before关系,与采用标量时钟相比,可以避免happens-before关系的误识,降低重放执行时并行度的损失. 展开更多
关键词 确定性重放 缓存一致性协议 访存冲突 多核 并行程序
下载PDF
采用数据驱动机制的多核处理器 被引量:2
19
作者 毕卓 徐云川 王镇 《上海交通大学学报》 EI CAS CSCD 北大核心 2013年第1期81-85,共5页
针对当前工艺条件下多核处理器存在程序并行性不足的问题,设计了一种采用数据驱动机制、支持函数语言风格编程的多核处理器,包括通用处理器核、数据驱动模块和片内路由器.其中:通用处理器核用于执行常规程序;数据驱动模块用于检测数据... 针对当前工艺条件下多核处理器存在程序并行性不足的问题,设计了一种采用数据驱动机制、支持函数语言风格编程的多核处理器,包括通用处理器核、数据驱动模块和片内路由器.其中:通用处理器核用于执行常规程序;数据驱动模块用于检测数据的完备性;片内路由器则可提供处理器核之间及簇之间的通信.实验结果表明,所设计的多核处理器能够支持C语言"函数式语言"风格的编程模板.每个C代码段执行纯函数的操作,消除了函数间的共享变量,使得并行编程的复杂度有所降低.同时,所采用的数据驱动机制没有执行顺序的严格限制,充分挖掘了算法潜在的并行性.经测试,数据驱动多核处理器的加速比随着计算资源的增加而增大,从而验证了数据流计算机的加速倍数随处理器数目增加而线性增长的结论. 展开更多
关键词 数据驱动 并行编程模型 数据流机 多核处理器
下载PDF
基于全局同步逻辑时间的访存依赖约减方法 被引量:1
20
作者 唐士斌 宋风龙 +2 位作者 张帅 范东睿 刘志勇 《计算机学报》 EI CSCD 北大核心 2014年第7期1487-1499,共13页
并发执行的并行多线程程序执行过程中,不同的访存顺序会得到不同的执行结果.由于再次执行时,难以重现首次执行时的错误,导致并行程序的调试非常困难.确定性重放是解决该问题的一种方法,目的是通过记录并行程序执行过程中的不确定性事件... 并发执行的并行多线程程序执行过程中,不同的访存顺序会得到不同的执行结果.由于再次执行时,难以重现首次执行时的错误,导致并行程序的调试非常困难.确定性重放是解决该问题的一种方法,目的是通过记录并行程序执行过程中的不确定性事件,然后利用记录的事件重现出程序的原始执行.然而,已有的确定性重放方法会产生大量的记录日志,如何减小记录日志是确定性重放领域的研究热点,在实际应用中也是非常具有挑战性的问题.为了减小记录日志的开销,文中提出了一种基于逻辑时间的访存依赖约减方法,并在支持松弛存储一致性模型的处理器上提出具体的实现技术,该方法利用了访存依赖对应的逻辑时间之间的序关系进行约减.通过模拟评估所提出方法的性能和可扩展性.其中,在8核模拟平台上,通过Splash2测试程序进行评估,结果显示所提出的记录方法平均日志开销为0.11Bytes/Kilo-Instruction,与目前最好的访存依赖约减方法Timetraveler相比提高了75%;通过4核、8核和16核平台的评估结果,表明所提出约减方法具有较好的可扩展性. 展开更多
关键词 多核 并行程序 确定性重放 访存冲突
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部