期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
C/C^(++)程序的运行时优化研究 被引量:1
1
作者 朱晓珺 李冬梅 《软件导刊》 2009年第4期60-62,共3页
由于受限于编译时所见的信息和缺乏精确的输入数据集和目标机信息,编译器为了保持程序正确性和避免性能降级必须做出保守的假设,往往得不到最佳性能。为了克服静态优化的不足,在研究java虚拟机中运行时优化技术的基础上,结合LLVM编译器... 由于受限于编译时所见的信息和缺乏精确的输入数据集和目标机信息,编译器为了保持程序正确性和避免性能降级必须做出保守的假设,往往得不到最佳性能。为了克服静态优化的不足,在研究java虚拟机中运行时优化技术的基础上,结合LLVM编译器架构,阐述了面向C/C++程序的运行时优化技术。 展开更多
关键词 运行时优化 LLVM JAVA虚拟机
下载PDF
基于值-剖面的OpenMP运行时优化系统
2
作者 黄春 杨学军 《计算机工程与科学》 CSCD 2006年第12期124-128,共5页
本文设计并实现了一个基于值-剖面的Open MP运行时优化系统CCRG OpenMP。它能够根据常见的值的组合优化并行区域,并且在运行时只有并行区代码需要重编译和管理。CCRG OpenMP基于动态重编译技术,避免了目前静态多版本技术的不足。同时,值... 本文设计并实现了一个基于值-剖面的Open MP运行时优化系统CCRG OpenMP。它能够根据常见的值的组合优化并行区域,并且在运行时只有并行区代码需要重编译和管理。CCRG OpenMP基于动态重编译技术,避免了目前静态多版本技术的不足。同时,值-剖面的收集和分析由独立的动态优化器线程完成,降低了动态重编译引入的开销。SPEC OMP2001基准测试表明,我们基于值-剖面的Open MP优化系统能够较大地提高程序性能。 展开更多
关键词 OPENMP 值-剖面 运行时优化
下载PDF
数据流Java并行程序设计模型的设计、实现及运行时优化 被引量:6
3
作者 刘弢 范彬 +1 位作者 吴承勇 张兆庆 《软件学报》 EI CSCD 北大核心 2008年第9期2181-2190,共10页
提出了一种具有数据流特征的Java并行程序设计模型,并针对该模型提出了一种基于运行时信息反馈的自适应优化算法,使得运行时系统可以利用数据流程序所暴露出的数据并行性,加速程序的运行.此外,在该模型中加入了数据流多态的概念,扩展了... 提出了一种具有数据流特征的Java并行程序设计模型,并针对该模型提出了一种基于运行时信息反馈的自适应优化算法,使得运行时系统可以利用数据流程序所暴露出的数据并行性,加速程序的运行.此外,在该模型中加入了数据流多态的概念,扩展了该模型的面向对象特性.在一个实际的开放源码Java虚拟机中实现了上述程序设计模型及优化方法.在实际多核多线程机器上的实验结果表明,所提出的程序设计模型及优化能够充分利用硬件的并行处理能力,显著地提高了程序的性能. 展开更多
关键词 数据流 并行程序设计模型 可管理运行环境 运行时优化
下载PDF
减小运行时优化开销的方法 被引量:1
4
作者 郭振宇 刘利 +1 位作者 陈彧 汤志忠 《计算机工程》 EI CAS CSCD 北大核心 2006年第24期63-65,120,共4页
运行时优化在程序运行期间,根据采集到的相关信息,确定程序的热点并进行优化,从而加速程序的执行。然而,运行时优化本身有一定的开销,有时候会抵消甚至超出优化得到的效果。该文设计和实现了一个基于SMP/IPF(英特尔安腾系列)/Linux架构... 运行时优化在程序运行期间,根据采集到的相关信息,确定程序的热点并进行优化,从而加速程序的执行。然而,运行时优化本身有一定的开销,有时候会抵消甚至超出优化得到的效果。该文设计和实现了一个基于SMP/IPF(英特尔安腾系列)/Linux架构的自适应二进制代码优化/编译框架,其中包含了运行时优化。分析了运行时优化的阶段和开销,并介绍了在设计和实现该框架的过程中,为减小这种开销所提出的思路和采用的方法。 展开更多
关键词 运行时优化 优化开销 持续优化
下载PDF
多核机群下基于神经网络的MPI运行时参数优化 被引量:3
5
作者 王洁 曾宇 张建林 《计算机科学》 CSCD 北大核心 2010年第6期229-232,共4页
多核处理器的新特性给MPI应用带来了新的优化空间,其中调优MPI运行时参数被证明是优化MPI应用的有效方法。然而最优的运行时参数不仅与多核机群的体系结构有关,也决定于MPI应用的程序特征。提出并分析了一种在给定多核机群下基于人工神... 多核处理器的新特性给MPI应用带来了新的优化空间,其中调优MPI运行时参数被证明是优化MPI应用的有效方法。然而最优的运行时参数不仅与多核机群的体系结构有关,也决定于MPI应用的程序特征。提出并分析了一种在给定多核机群下基于人工神经网络的优化模型,用于自动为未知的MPI程序预测接近最优的运行时参数。两个不同基准的实验证明了本方法的有效性。实验证明,基于本方法得到的运行时参数所产生的加速比平均达到了实际最大加速比的95%以上。 展开更多
关键词 多核机群 MPI 运行参数优化 神经网络
下载PDF
CUDA程序到Cell平台的源代码移植
6
作者 岳峰 庞建民 +1 位作者 张一弛 余勇 《计算机工程》 CAS CSCD 2012年第24期279-282,共4页
相对于传统的串行程序移植,并行系统间的代码移植因体系结构间的巨大差异而变得极为复杂。为此,针对统一计算设备架构(CUDA)程序向其他异构多核平台的移植,提出CUDA架构到Cell的映射方案。通过模型映射、并行粒度提升、共享变量清除和... 相对于传统的串行程序移植,并行系统间的代码移植因体系结构间的巨大差异而变得极为复杂。为此,针对统一计算设备架构(CUDA)程序向其他异构多核平台的移植,提出CUDA架构到Cell的映射方案。通过模型映射、并行粒度提升、共享变量清除和运行时优化,使CUDA程序的大规模并行线程可以在Cell平台上正确执行。实验结果证明,翻译后的程序在Cell的执行效率可达到Cell平台上手动编写程序的72%。 展开更多
关键词 源代码移植 异构多核 模型映射 共享变量清除 运行时优化
下载PDF
面向E级计算的功耗管理技术 被引量:3
7
作者 高剑刚 龚道永 +5 位作者 吴伟 郑岩 朱琪 王飞 郑方 金利峰 《计算机学报》 EI CAS CSCD 北大核心 2022年第7期1373-1383,共11页
E级计算机的构建面临严峻的“功耗墙”问题.为了应对功耗挑战,本文面向神威E级系统提出了一套低功耗管理体系.该体系采用软硬件协同的多层次低功耗管理机制,主要技术包括高能效基础设施设计、低功耗编译优化和细粒度功耗运行时管理,在... E级计算机的构建面临严峻的“功耗墙”问题.为了应对功耗挑战,本文面向神威E级系统提出了一套低功耗管理体系.该体系采用软硬件协同的多层次低功耗管理机制,主要技术包括高能效基础设施设计、低功耗编译优化和细粒度功耗运行时管理,在系统功耗量化监测技术支撑下实现软硬件协同能耗控制集成,具有功能层次多、覆盖面广、节能效果明显的特点.本文基于神威E级原型超级计算机进行了系统验证,实验结果证明本文提出的低功耗管理体系能够显著降低系统功耗,并且可扩展性良好,在大规模系统中具有广泛的适应性,能够支撑E级计算机绿色运行. 展开更多
关键词 E级计算机 异构众核处理器 功耗管理 编译优化 运行时优化
下载PDF
Research on virtual node placement optimization strategy of cloud platform for information acquisition
8
作者 帅愉燕 Wei Gaofeng +1 位作者 Zhang Zhaoxin Zhang Lizhe 《High Technology Letters》 EI CAS 2018年第3期279-286,共8页
A virtual node placement strategy based on service-aware is proposed for an information acquisition platform. The performance preferences and types of services in the information acquisition platform are analyzed as w... A virtual node placement strategy based on service-aware is proposed for an information acquisition platform. The performance preferences and types of services in the information acquisition platform are analyzed as well as a comparison of the running time of services both in virtual node centralized and decentralized placing. All physical hosts are divided into different sub-clusters by using the analytic hierarchy process( AHP),in order to fit service of different performance preferences. In the sub-cluster,both load balance and quality of service are taken into account. Comparing with the heuristic algorithm,the experiment results show that the proposed placement strategy is running for a shorter time. And comparing with the virtual node placement strategy provided by OpenStack,the experiment results show that the proposed placement strategy can improve the execution speed of service in the information acquisition platform,and also can balance the load which improves resources utilization. 展开更多
关键词 virtual node placement service-aware performance preference analytic hierarchy process (AHP) load balance
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部