期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
同时多线程微处理器分布式保留站结构的数据流技术
1
作者
杨洪斌
吴悦
刘权胜
《应用科学学报》
CAS
CSCD
北大核心
2008年第2期188-193,共6页
为提高同时多线程微处理器数据流指令高效并行执行性能,提出一种7个部分组成的分布式保留站结构.分布式保留站结构的同时多线程微处理器中采用了线程独占重排序缓冲的提交机制及能够快速访问且硬件复杂度低的寄存器堆.两线程指令执行的...
为提高同时多线程微处理器数据流指令高效并行执行性能,提出一种7个部分组成的分布式保留站结构.分布式保留站结构的同时多线程微处理器中采用了线程独占重排序缓冲的提交机制及能够快速访问且硬件复杂度低的寄存器堆.两线程指令执行的结果表明数据流指令的并行度得到明显提高.对保留站、重排序缓冲提交机制及寄存器堆协同工作的功能进行验证与仿真,用综合工具完成逻辑综合.
展开更多
关键词
同时
多线程微处理器
保留站
重排序缓冲
寄存器
执行部件
下载PDF
职称材料
同时多线程微处理器结构的性能功耗研究
被引量:
2
2
作者
郭松柳
汪东升
汤志忠
《计算机工程与应用》
CSCD
北大核心
2008年第28期4-8,共5页
为同时多线程微处理器结构建立的准确的功耗评估模型,将可给出该结构中各部件的功耗使用情况,进而可通过调整部件电压或优化部件结构的方法,达到减少整体功耗的目的;同时,此功耗评估模型也可以作为高层功耗优化研究的测试平台,为系统级...
为同时多线程微处理器结构建立的准确的功耗评估模型,将可给出该结构中各部件的功耗使用情况,进而可通过调整部件电压或优化部件结构的方法,达到减少整体功耗的目的;同时,此功耗评估模型也可以作为高层功耗优化研究的测试平台,为系统级、软件级功耗优化研究提供支持。
展开更多
关键词
同时
多线程微处理器
(SMT)
功耗评估模型
CPU模拟器
下载PDF
职称材料
面向FT1000微处理器的STREAM并行计算与优化
被引量:
4
3
作者
迟利华
胡庆丰
+3 位作者
刘杰
甘新标
蒋杰
晏益慧
《计算机工程与科学》
CSCD
北大核心
2014年第12期2267-2271,共5页
STREAM是微处理器上内存性能的基准测试程序,在多核多线程FT1000微处理器上发挥高性能是具有挑战性的研究工作。基于多级Cache结构,优化STREAM四个程序的指令流水线,根据寄存器数,设计了多级循环展开方法,根据指令延迟和Cache行的大小...
STREAM是微处理器上内存性能的基准测试程序,在多核多线程FT1000微处理器上发挥高性能是具有挑战性的研究工作。基于多级Cache结构,优化STREAM四个程序的指令流水线,根据寄存器数,设计了多级循环展开方法,根据指令延迟和Cache行的大小确定数据预取的数目,使用汇编语言编写了优化子程序。基于OpenMP并行环境,设计了STREAM并行程序,优化了局部化数据分配方式。数据测试结果表明,优化后的STREAM的性能比原始串行程序性能提高了19.2%-64.2%。优化后,并行程序的最高访存性能达到8.5GB/s,对比优化前的最高访存性能最大提高了22.7%。
展开更多
关键词
多线程微处理器
STREAM测试程序
性能优化
下载PDF
职称材料
题名
同时多线程微处理器分布式保留站结构的数据流技术
1
作者
杨洪斌
吴悦
刘权胜
机构
上海大学计算机工程与科学学院
出处
《应用科学学报》
CAS
CSCD
北大核心
2008年第2期188-193,共6页
基金
上海应用材料研究与发展基金资助项目(No.06SA18)
文摘
为提高同时多线程微处理器数据流指令高效并行执行性能,提出一种7个部分组成的分布式保留站结构.分布式保留站结构的同时多线程微处理器中采用了线程独占重排序缓冲的提交机制及能够快速访问且硬件复杂度低的寄存器堆.两线程指令执行的结果表明数据流指令的并行度得到明显提高.对保留站、重排序缓冲提交机制及寄存器堆协同工作的功能进行验证与仿真,用综合工具完成逻辑综合.
关键词
同时
多线程微处理器
保留站
重排序缓冲
寄存器
执行部件
Keywords
simultaneous multithreading processor, reservation, reorder buffer, register, implementation unit
分类号
TP332 [自动化与计算机技术—计算机系统结构]
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
同时多线程微处理器结构的性能功耗研究
被引量:
2
2
作者
郭松柳
汪东升
汤志忠
机构
微处理器与片上系统技术研究中心
清华大学计算机科学与技术系高性能计算研究所
出处
《计算机工程与应用》
CSCD
北大核心
2008年第28期4-8,共5页
基金
国家自然科学基金No.60573100~~
文摘
为同时多线程微处理器结构建立的准确的功耗评估模型,将可给出该结构中各部件的功耗使用情况,进而可通过调整部件电压或优化部件结构的方法,达到减少整体功耗的目的;同时,此功耗评估模型也可以作为高层功耗优化研究的测试平台,为系统级、软件级功耗优化研究提供支持。
关键词
同时
多线程微处理器
(SMT)
功耗评估模型
CPU模拟器
Keywords
Simultaneous Multithreading(SMT)
power estimation model
CPU simulator
分类号
TP3 [自动化与计算机技术—计算机科学与技术]
下载PDF
职称材料
题名
面向FT1000微处理器的STREAM并行计算与优化
被引量:
4
3
作者
迟利华
胡庆丰
刘杰
甘新标
蒋杰
晏益慧
机构
国防科学技术大学并行与分布处理重点实验室
出处
《计算机工程与科学》
CSCD
北大核心
2014年第12期2267-2271,共5页
基金
国家863计划资助项目(2012AA01A301)
国家自然科学基金资助项目(60970033
91430218)
文摘
STREAM是微处理器上内存性能的基准测试程序,在多核多线程FT1000微处理器上发挥高性能是具有挑战性的研究工作。基于多级Cache结构,优化STREAM四个程序的指令流水线,根据寄存器数,设计了多级循环展开方法,根据指令延迟和Cache行的大小确定数据预取的数目,使用汇编语言编写了优化子程序。基于OpenMP并行环境,设计了STREAM并行程序,优化了局部化数据分配方式。数据测试结果表明,优化后的STREAM的性能比原始串行程序性能提高了19.2%-64.2%。优化后,并行程序的最高访存性能达到8.5GB/s,对比优化前的最高访存性能最大提高了22.7%。
关键词
多线程微处理器
STREAM测试程序
性能优化
Keywords
multithreaded processor
STREAM benchmark
performance optimization
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
同时多线程微处理器分布式保留站结构的数据流技术
杨洪斌
吴悦
刘权胜
《应用科学学报》
CAS
CSCD
北大核心
2008
0
下载PDF
职称材料
2
同时多线程微处理器结构的性能功耗研究
郭松柳
汪东升
汤志忠
《计算机工程与应用》
CSCD
北大核心
2008
2
下载PDF
职称材料
3
面向FT1000微处理器的STREAM并行计算与优化
迟利华
胡庆丰
刘杰
甘新标
蒋杰
晏益慧
《计算机工程与科学》
CSCD
北大核心
2014
4
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部