期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
YHFT-DX高性能DSP中Cache失效流水设计
被引量:
2
1
作者
郭阳
傅祎晖
+1 位作者
刘胜
李勇
《国防科技大学学报》
EI
CAS
CSCD
北大核心
2009年第6期6-11,共6页
YHFT-DX是国防科技大学自主研制的一款高性能DSP。以提升YHFT-DX的Cache性能为目标,研究了降低Cache失效延迟的优化策略,设计并实现了一种针对高频高性能DSP的一级数据Cache优化策略——失效流水。与传统优化策略相比,该策略将连续访问C...
YHFT-DX是国防科技大学自主研制的一款高性能DSP。以提升YHFT-DX的Cache性能为目标,研究了降低Cache失效延迟的优化策略,设计并实现了一种针对高频高性能DSP的一级数据Cache优化策略——失效流水。与传统优化策略相比,该策略将连续访问Cache的失效请求并进行流水化处理,使多个Cache失效延迟重叠,从而达到降低平均Cache失效代价的目的。将该策略应用到YHFT-DX芯片的一级数据Cache控制器的设计与优化中,使访问Cache失效引起的流水线停顿从8拍降为2拍,显著提升了系统性能。
展开更多
关键词
DSP
失效流水
非阻塞cache
数据预取
下载PDF
职称材料
龙芯2F上的访存优化
被引量:
7
2
作者
苏波
李凯
+1 位作者
徐志广
何颂颂
《计算机系统应用》
2010年第1期171-175,共5页
一般的数据处理程序中,计算时间在其中往往只起次要作用,因此访存方式是否有效对程序的性能影响很大。在基于龙芯2F处理器研制的高性能计算机系统KD-50-I上安装ATLAS,经测试其性能只达到龙芯2F理论峰值的30%。通过循环展开减少函数存储...
一般的数据处理程序中,计算时间在其中往往只起次要作用,因此访存方式是否有效对程序的性能影响很大。在基于龙芯2F处理器研制的高性能计算机系统KD-50-I上安装ATLAS,经测试其性能只达到龙芯2F理论峰值的30%。通过循环展开减少函数存储访问次数,增大计算访存比;采用数据分块、部分拷贝以增强访存局部性,减少cache失效;利用非阻塞cache加快内存访问速度等访存优化技术,将ATLAS性能提高50%以上。
展开更多
关键词
ATLAS
KD-50-I
cache
失效
非阻塞cache
下载PDF
职称材料
龙芯2号处理器设计和性能分析
被引量:
37
3
作者
胡伟武
张福新
李祖松
《计算机研究与发展》
EI
CSCD
北大核心
2006年第6期959-966,共8页
介绍龙芯2号处理器设计及其性能测试结果.龙芯2号采用四发射超标量超流水结构。片内一级指令和数据高速缓存各64KB,片外二级高速缓存最多可达8MB.为了充分发挥流水线的效率,龙芯2号实现了先进的转移猜测、寄存器重命名、动态调度等...
介绍龙芯2号处理器设计及其性能测试结果.龙芯2号采用四发射超标量超流水结构。片内一级指令和数据高速缓存各64KB,片外二级高速缓存最多可达8MB.为了充分发挥流水线的效率,龙芯2号实现了先进的转移猜测、寄存器重命名、动态调度等乱序执行技术以及非阻塞的Cache访问和load Speculation等动态存储访问机制.龙芯2号处理器采用0.18gm的CMOS工艺实现,在正常电压下的最高工作频率为500MHz,500MHz时的实测功耗为3~5W.龙芯2号单精度峰值浮点运算速度为20亿a/秒,双精度浮点运算速度为10亿a/秒,SPECCPU2000的实测性能是龙芯1号的8~10倍,综合性能已经达到PentiumⅢ的水平.目前芯片样机能流畅运行完整的64位中文Linux操作系统,全功能的Mozilla浏览器、多媒体播放器和OpenOffice办公套件,可以满足绝大多数桌面应用的要求.
展开更多
关键词
超标量流水线
乱序执行
转移猜测
寄存器重命名
动态调度
非
阻塞
的
cache
load指令猜测执行
性能分析
下载PDF
职称材料
题名
YHFT-DX高性能DSP中Cache失效流水设计
被引量:
2
1
作者
郭阳
傅祎晖
刘胜
李勇
机构
国防科技大学计算机学院
出处
《国防科技大学学报》
EI
CAS
CSCD
北大核心
2009年第6期6-11,共6页
基金
国家自然科学基金资助项目(60573173)
新世纪优秀人才计划项目(NCET)
教育部"高性能微处理器技术"创新团队资助项目(IRT0614)
文摘
YHFT-DX是国防科技大学自主研制的一款高性能DSP。以提升YHFT-DX的Cache性能为目标,研究了降低Cache失效延迟的优化策略,设计并实现了一种针对高频高性能DSP的一级数据Cache优化策略——失效流水。与传统优化策略相比,该策略将连续访问Cache的失效请求并进行流水化处理,使多个Cache失效延迟重叠,从而达到降低平均Cache失效代价的目的。将该策略应用到YHFT-DX芯片的一级数据Cache控制器的设计与优化中,使访问Cache失效引起的流水线停顿从8拍降为2拍,显著提升了系统性能。
关键词
DSP
失效流水
非阻塞cache
数据预取
Keywords
DSP(Digital Signal Processor)
miss pipelining
unblocking
cache
data prefetching
分类号
TP368.1 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
龙芯2F上的访存优化
被引量:
7
2
作者
苏波
李凯
徐志广
何颂颂
机构
中国科学技术大学计算机科学与技术系
出处
《计算机系统应用》
2010年第1期171-175,共5页
基金
国家高技术研究发展计划(863)(2008AA010902)
文摘
一般的数据处理程序中,计算时间在其中往往只起次要作用,因此访存方式是否有效对程序的性能影响很大。在基于龙芯2F处理器研制的高性能计算机系统KD-50-I上安装ATLAS,经测试其性能只达到龙芯2F理论峰值的30%。通过循环展开减少函数存储访问次数,增大计算访存比;采用数据分块、部分拷贝以增强访存局部性,减少cache失效;利用非阻塞cache加快内存访问速度等访存优化技术,将ATLAS性能提高50%以上。
关键词
ATLAS
KD-50-I
cache
失效
非阻塞cache
Keywords
ATLAS
KD-50-I
cache
miss
non-blocking
cache
分类号
TP333 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
龙芯2号处理器设计和性能分析
被引量:
37
3
作者
胡伟武
张福新
李祖松
机构
中国科学院计算技术研究所计算机系统结构重点实验室
出处
《计算机研究与发展》
EI
CSCD
北大核心
2006年第6期959-966,共8页
基金
国家自然科学基金杰出青年基金项目(60325205)
国家"八六三"高技术研究发展计划重点基金项目(2002AA110010
+4 种基金
2005AA110010
2005AA119020)
国家"九七三"重点基础研究发展规划基金项目(2005CB321600)
中国科学院计算技术研究所基础研究基金项目(20056020)
中国科学院计算技术研究所知识创新课题(20056240)~~
文摘
介绍龙芯2号处理器设计及其性能测试结果.龙芯2号采用四发射超标量超流水结构。片内一级指令和数据高速缓存各64KB,片外二级高速缓存最多可达8MB.为了充分发挥流水线的效率,龙芯2号实现了先进的转移猜测、寄存器重命名、动态调度等乱序执行技术以及非阻塞的Cache访问和load Speculation等动态存储访问机制.龙芯2号处理器采用0.18gm的CMOS工艺实现,在正常电压下的最高工作频率为500MHz,500MHz时的实测功耗为3~5W.龙芯2号单精度峰值浮点运算速度为20亿a/秒,双精度浮点运算速度为10亿a/秒,SPECCPU2000的实测性能是龙芯1号的8~10倍,综合性能已经达到PentiumⅢ的水平.目前芯片样机能流畅运行完整的64位中文Linux操作系统,全功能的Mozilla浏览器、多媒体播放器和OpenOffice办公套件,可以满足绝大多数桌面应用的要求.
关键词
超标量流水线
乱序执行
转移猜测
寄存器重命名
动态调度
非
阻塞
的
cache
load指令猜测执行
性能分析
Keywords
superscalar pipeline
out-of-order execution
branch prediction
register renaming
dynamical scheduling
non blocking
cache
load speculation
performance analysis
分类号
TP302 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
YHFT-DX高性能DSP中Cache失效流水设计
郭阳
傅祎晖
刘胜
李勇
《国防科技大学学报》
EI
CAS
CSCD
北大核心
2009
2
下载PDF
职称材料
2
龙芯2F上的访存优化
苏波
李凯
徐志广
何颂颂
《计算机系统应用》
2010
7
下载PDF
职称材料
3
龙芯2号处理器设计和性能分析
胡伟武
张福新
李祖松
《计算机研究与发展》
EI
CSCD
北大核心
2006
37
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部