期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
功耗受限情况下多核处理器能效优化方案
被引量:
3
1
作者
邱晓杰
安虹
+2 位作者
陈俊仕
迟孟贤
金旭
《计算机工程》
CAS
CSCD
北大核心
2017年第4期39-45,共7页
将处理器功耗控制在预算以下有助于降低散热成本和提升系统稳定性,但现有功耗优化方案大多依赖线下分析得到的先验知识,影响实用性,而集中式搜索最优策略的算法也存在复杂度过高的问题。为此,提出功耗优化方案PPCM。利用动态电压频率调...
将处理器功耗控制在预算以下有助于降低散热成本和提升系统稳定性,但现有功耗优化方案大多依赖线下分析得到的先验知识,影响实用性,而集中式搜索最优策略的算法也存在复杂度过高的问题。为此,提出功耗优化方案PPCM。利用动态电压频率调整(DVFS)技术控制CPU功耗在预算内以提高处理器能效。同时,将功耗控制和功耗分配解耦合以提高灵活性。采用动态调整的线性模型估计功耗,通过反馈控制技术对其进行调节。以计算访存比为指标在应用间分配功耗,并考虑多线程应用特征进行线程间功耗分配。实验结果表明,PPCM比Priority算法速度平均提高10.7%,能耗平均降低5.1%,能量-延迟积平均降低14.3%。与PCM CA算法相比,其速度平均提高4.5%,能量-延迟积平均降低5.0%。
展开更多
关键词
功耗控制
功耗分配
能效优化
动态电压频率调整
计算访存比
线程关键度
下载PDF
职称材料
Intel Cascade Lake架构CPU SPEC CPU2017评测
被引量:
3
2
作者
杜琦
黄卉
+2 位作者
龚盛
刘新娃
黄春
《计算机工程与科学》
CSCD
北大核心
2021年第1期49-57,共9页
SPEC CPU2017基准包中包含SPEC的下一代行业标准,是目前CPU性能评测的客观和可信的基准程序之一。采用SPEC CPU2017对Intel Cascade Lake架构的Intel Xeon Gold 6252N型号CPU做了不同内存频率、不同副本数、打开/关闭Turbo的组合测试,...
SPEC CPU2017基准包中包含SPEC的下一代行业标准,是目前CPU性能评测的客观和可信的基准程序之一。采用SPEC CPU2017对Intel Cascade Lake架构的Intel Xeon Gold 6252N型号CPU做了不同内存频率、不同副本数、打开/关闭Turbo的组合测试,总结了不同应用程序在不同配置组合中的性能表现。同时,还对比测试了Intel Ivy Bridge架构的Intel Xeon E5-2692 v2型号CPU和Intel Haswell架构的Intel Xeon E5-2620 v3型号CPU,通过引入计算访存跑分比PBR的概念,分析了3种架构的硬件功能部件的增加对应用程序的性能影响。
展开更多
关键词
SPEC
CPU2017
Intel
Cascade
Lake
Intel
Ivy
Bridge
Intel
Haswell
计算
访
存
跑分比
下载PDF
职称材料
帮助线程预取性能的分析与优化
3
作者
黄艳
古志民
《电子科技大学学报》
EI
CAS
CSCD
北大核心
2012年第1期85-91,共7页
针对访存延迟对现代处理器性能的影响,基于片上多处理器分析与测试了访存密集型应用程序的帮助线程数据预取性能。结果表明热点区计算/访存延迟比率对帮助线程预取性能有重大影响。依据热点区计算/访存延迟比率合理安排帮助线程与主线...
针对访存延迟对现代处理器性能的影响,基于片上多处理器分析与测试了访存密集型应用程序的帮助线程数据预取性能。结果表明热点区计算/访存延迟比率对帮助线程预取性能有重大影响。依据热点区计算/访存延迟比率合理安排帮助线程与主线程的访存任务比例时,能达到对帮助线程性能的优化,使帮助线程预取获得更好的性能收益。基准测试程序的测试实验结果表明当热点区计算量很小可以忽略不计时,帮助线程与主线程的访存任务比接近1时,帮助线程预取获得最好的性能收益。
展开更多
关键词
片上多处理器
计算
/
访
存
延迟比率
热点区
性能分析
预取线程
下载PDF
职称材料
流处理器上基于参数模型的长流分段技术
被引量:
2
4
作者
杜静
敖富江
+1 位作者
唐滔
杨学军
《软件学报》
EI
CSCD
北大核心
2009年第9期2320-2331,共12页
长流分段是提高流处理器上流寄存器文件(stream register file,简称SRF)带宽利用率的重要途径之一.其中,量化受段大小影响的程序运行时间是获得最优分段的关键.为此提出了一种基于参数模型的长流分段技术,旨在获得理论上的最优分段以最...
长流分段是提高流处理器上流寄存器文件(stream register file,简称SRF)带宽利用率的重要途径之一.其中,量化受段大小影响的程序运行时间是获得最优分段的关键.为此提出了一种基于参数模型的长流分段技术,旨在获得理论上的最优分段以最小化程序运行时间.首先,建立了一个预取和重用优化指导的参数模型,以反映段大小对流处理器上程序性能的影响.然后,基于该模型分析,分别研究了计算密集型程序和访存密集型程序的最优分段策略.最后提出一种面向任意程序的最优分段技术.实验结果表明,该长流分段技术能够有效地避免和隐藏片外访存延迟,从而充分开发流处理器强大的计算能力.
展开更多
关键词
分段
IMAGINE
最优段大小
SRF局部性
访
存
和
计算
的重叠
下载PDF
职称材料
题名
功耗受限情况下多核处理器能效优化方案
被引量:
3
1
作者
邱晓杰
安虹
陈俊仕
迟孟贤
金旭
机构
中国科学技术大学计算机科学与技术学院
出处
《计算机工程》
CAS
CSCD
北大核心
2017年第4期39-45,共7页
基金
国家"863"计划项目(2012AA010901)
文摘
将处理器功耗控制在预算以下有助于降低散热成本和提升系统稳定性,但现有功耗优化方案大多依赖线下分析得到的先验知识,影响实用性,而集中式搜索最优策略的算法也存在复杂度过高的问题。为此,提出功耗优化方案PPCM。利用动态电压频率调整(DVFS)技术控制CPU功耗在预算内以提高处理器能效。同时,将功耗控制和功耗分配解耦合以提高灵活性。采用动态调整的线性模型估计功耗,通过反馈控制技术对其进行调节。以计算访存比为指标在应用间分配功耗,并考虑多线程应用特征进行线程间功耗分配。实验结果表明,PPCM比Priority算法速度平均提高10.7%,能耗平均降低5.1%,能量-延迟积平均降低14.3%。与PCM CA算法相比,其速度平均提高4.5%,能量-延迟积平均降低5.0%。
关键词
功耗控制
功耗分配
能效优化
动态电压频率调整
计算访存比
线程关键度
Keywords
power consumption control
power consumption allocation
energy efficiency optimization
DynamicVoltage and Frequency Scaling (DVFS)
ratio of computation to memory access
thread criticality
分类号
TP332 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
Intel Cascade Lake架构CPU SPEC CPU2017评测
被引量:
3
2
作者
杜琦
黄卉
龚盛
刘新娃
黄春
机构
国防科技大学计算机学院
中南林业科技大学环境科学与工程学院
出处
《计算机工程与科学》
CSCD
北大核心
2021年第1期49-57,共9页
基金
国家重点研发计划(2018YFB0204301)。
文摘
SPEC CPU2017基准包中包含SPEC的下一代行业标准,是目前CPU性能评测的客观和可信的基准程序之一。采用SPEC CPU2017对Intel Cascade Lake架构的Intel Xeon Gold 6252N型号CPU做了不同内存频率、不同副本数、打开/关闭Turbo的组合测试,总结了不同应用程序在不同配置组合中的性能表现。同时,还对比测试了Intel Ivy Bridge架构的Intel Xeon E5-2692 v2型号CPU和Intel Haswell架构的Intel Xeon E5-2620 v3型号CPU,通过引入计算访存跑分比PBR的概念,分析了3种架构的硬件功能部件的增加对应用程序的性能影响。
关键词
SPEC
CPU2017
Intel
Cascade
Lake
Intel
Ivy
Bridge
Intel
Haswell
计算
访
存
跑分比
Keywords
SPEC CPU2017
Intel Cascade Lake
Intel Ivy Bridge
Intel Haswell
performance bandwidth ratio(PBR)
分类号
TP302 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
帮助线程预取性能的分析与优化
3
作者
黄艳
古志民
机构
北京理工大学计算机学院
郑州轻工业学院软件学院
出处
《电子科技大学学报》
EI
CAS
CSCD
北大核心
2012年第1期85-91,共7页
基金
教育部-英特尔信息技术专项科研基金(MOE-INTEL-08-10)
北京市重点学科建设项目
文摘
针对访存延迟对现代处理器性能的影响,基于片上多处理器分析与测试了访存密集型应用程序的帮助线程数据预取性能。结果表明热点区计算/访存延迟比率对帮助线程预取性能有重大影响。依据热点区计算/访存延迟比率合理安排帮助线程与主线程的访存任务比例时,能达到对帮助线程性能的优化,使帮助线程预取获得更好的性能收益。基准测试程序的测试实验结果表明当热点区计算量很小可以忽略不计时,帮助线程与主线程的访存任务比接近1时,帮助线程预取获得最好的性能收益。
关键词
片上多处理器
计算
/
访
存
延迟比率
热点区
性能分析
预取线程
Keywords
CMP
computation/access latency ratio(CALR)
hotspot
performance analysis
prefetching thread
分类号
TP302 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
流处理器上基于参数模型的长流分段技术
被引量:
2
4
作者
杜静
敖富江
唐滔
杨学军
机构
[
国防科学技术大学计算机学院
出处
《软件学报》
EI
CSCD
北大核心
2009年第9期2320-2331,共12页
基金
国家自然科学基金Nos.60621003
60633050~~
文摘
长流分段是提高流处理器上流寄存器文件(stream register file,简称SRF)带宽利用率的重要途径之一.其中,量化受段大小影响的程序运行时间是获得最优分段的关键.为此提出了一种基于参数模型的长流分段技术,旨在获得理论上的最优分段以最小化程序运行时间.首先,建立了一个预取和重用优化指导的参数模型,以反映段大小对流处理器上程序性能的影响.然后,基于该模型分析,分别研究了计算密集型程序和访存密集型程序的最优分段策略.最后提出一种面向任意程序的最优分段技术.实验结果表明,该长流分段技术能够有效地避免和隐藏片外访存延迟,从而充分开发流处理器强大的计算能力.
关键词
分段
IMAGINE
最优段大小
SRF局部性
访
存
和
计算
的重叠
Keywords
strip-mining
imagine
optimal strip size
SRF locality
overlap between memory access and computation
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
功耗受限情况下多核处理器能效优化方案
邱晓杰
安虹
陈俊仕
迟孟贤
金旭
《计算机工程》
CAS
CSCD
北大核心
2017
3
下载PDF
职称材料
2
Intel Cascade Lake架构CPU SPEC CPU2017评测
杜琦
黄卉
龚盛
刘新娃
黄春
《计算机工程与科学》
CSCD
北大核心
2021
3
下载PDF
职称材料
3
帮助线程预取性能的分析与优化
黄艳
古志民
《电子科技大学学报》
EI
CAS
CSCD
北大核心
2012
0
下载PDF
职称材料
4
流处理器上基于参数模型的长流分段技术
杜静
敖富江
唐滔
杨学军
《软件学报》
EI
CSCD
北大核心
2009
2
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部