期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
一种128位高性能全流水浮点乘加部件
被引量:
4
1
作者
黎铁军
李秋亮
徐炜遐
《国防科技大学学报》
EI
CAS
CSCD
北大核心
2010年第2期56-60,共5页
高精度的浮点乘加融合(FMA)部件一直是高性能微处理器设计追求的目标。提出了一种128位精度全流水FMA体系结构,采用10级平衡流水线,重点对超宽位的乘法器、加法器、前导零预测和规格化进行了流水优化。设计综合的结果表明,基于SMIC0.13...
高精度的浮点乘加融合(FMA)部件一直是高性能微处理器设计追求的目标。提出了一种128位精度全流水FMA体系结构,采用10级平衡流水线,重点对超宽位的乘法器、加法器、前导零预测和规格化进行了流水优化。设计综合的结果表明,基于SMIC0.13μm工艺,该结构频率可以达到465MHz,比现有128位FMA性能提高了130%;在TSMC65nm工艺下,该结构的频率可达到1.075GHz,基本满足高性能计算的要求。
展开更多
关键词
浮点乘加融合
前导零预测
高性能微处理器
下载PDF
职称材料
浮点乘加部件延迟对浮点性能影响的研究
2
作者
何军
田增
+1 位作者
郭勇
陈诚
《计算机工程》
CAS
CSCD
2013年第7期311-313,317,共4页
浮点融合乘加部件会增加独立浮点加减法、乘法等运算延迟。为克服该缺陷,研究将乘加部件独立乘法、加减法等运算延迟由6拍减为4拍时对浮点性能的影响。以某支持乘加运算的国产处理器为基础,修改相关的RTL级设计代码,利用硬件仿真加速器...
浮点融合乘加部件会增加独立浮点加减法、乘法等运算延迟。为克服该缺陷,研究将乘加部件独立乘法、加减法等运算延迟由6拍减为4拍时对浮点性能的影响。以某支持乘加运算的国产处理器为基础,修改相关的RTL级设计代码,利用硬件仿真加速器平台,对SPEC CPU2000浮点测试课题进行评估。实验结果表明,该延迟优化有利于提高浮点性能,最大提高5.25%,平均提高1.61%。
展开更多
关键词
浮点加法
浮点乘法
融合乘加
硬件仿真
浮点性能
运算延迟
下载PDF
职称材料
题名
一种128位高性能全流水浮点乘加部件
被引量:
4
1
作者
黎铁军
李秋亮
徐炜遐
机构
国防科技大学计算机学院
出处
《国防科技大学学报》
EI
CAS
CSCD
北大核心
2010年第2期56-60,共5页
基金
国家自然科学基金重点资助项目(90707003)
文摘
高精度的浮点乘加融合(FMA)部件一直是高性能微处理器设计追求的目标。提出了一种128位精度全流水FMA体系结构,采用10级平衡流水线,重点对超宽位的乘法器、加法器、前导零预测和规格化进行了流水优化。设计综合的结果表明,基于SMIC0.13μm工艺,该结构频率可以达到465MHz,比现有128位FMA性能提高了130%;在TSMC65nm工艺下,该结构的频率可达到1.075GHz,基本满足高性能计算的要求。
关键词
浮点乘加融合
前导零预测
高性能微处理器
Keywords
fused
Multlply-Add(
fma
)
Leading Zero Anticipator(IZA)
high performance microprocessor
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
浮点乘加部件延迟对浮点性能影响的研究
2
作者
何军
田增
郭勇
陈诚
机构
上海高性能集成电路设计中心
出处
《计算机工程》
CAS
CSCD
2013年第7期311-313,317,共4页
文摘
浮点融合乘加部件会增加独立浮点加减法、乘法等运算延迟。为克服该缺陷,研究将乘加部件独立乘法、加减法等运算延迟由6拍减为4拍时对浮点性能的影响。以某支持乘加运算的国产处理器为基础,修改相关的RTL级设计代码,利用硬件仿真加速器平台,对SPEC CPU2000浮点测试课题进行评估。实验结果表明,该延迟优化有利于提高浮点性能,最大提高5.25%,平均提高1.61%。
关键词
浮点加法
浮点乘法
融合乘加
硬件仿真
浮点性能
运算延迟
Keywords
floating-point add
floating-point multiply
fused multiply-add(fma)
hardware emulation
floating-point performance
operation latency
分类号
TP368.1 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
一种128位高性能全流水浮点乘加部件
黎铁军
李秋亮
徐炜遐
《国防科技大学学报》
EI
CAS
CSCD
北大核心
2010
4
下载PDF
职称材料
2
浮点乘加部件延迟对浮点性能影响的研究
何军
田增
郭勇
陈诚
《计算机工程》
CAS
CSCD
2013
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部