期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
热量敏感的众核芯片多播并行测试方法 被引量:3
1
作者 方芳 韩银和 李晓维 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2010年第5期845-851,共7页
为了解决芯片测试过程中功耗密度大造成的局部过热(简称"热斑")问题,提出一种热量敏感的多播并行测试方法.对众核芯片采用多播并行测试时面临的"热斑"问题进行分析,提出一种无"热斑"的多播测试路径生成算... 为了解决芯片测试过程中功耗密度大造成的局部过热(简称"热斑")问题,提出一种热量敏感的多播并行测试方法.对众核芯片采用多播并行测试时面临的"热斑"问题进行分析,提出一种无"热斑"的多播测试路径生成算法;在温度容限内对生成的多条单类同构芯核多播测试路径进行并行优化,形成无"热斑"的快速并行测试方案,同时缩短了测试时间.实验结果表明,采用文中方法能够有效地避免多播并行测试时的"热斑",并使测试时间缩短近45%. 展开更多
关键词 众核芯片 并行测试 多播技术 热斑
下载PDF
高性能众核处理器芯片时钟网络设计 被引量:2
2
作者 马永飞 高成振 +1 位作者 黄金明 李研 《计算机工程》 CAS CSCD 北大核心 2022年第8期25-29,36,共6页
随着芯片工艺演进与设计规模增加,高性能众核处理器芯片时钟网络设计面临时序和功耗的全方位挑战。为降低芯片时钟网络功耗并缓解时钟网络分布受片上偏差影响导致的时钟偏斜,在H-Tree+MESH混合时钟网络结构的基础上,结合新一代众核处理... 随着芯片工艺演进与设计规模增加,高性能众核处理器芯片时钟网络设计面临时序和功耗的全方位挑战。为降低芯片时钟网络功耗并缓解时钟网络分布受片上偏差影响导致的时钟偏斜,在H-Tree+MESH混合时钟网络结构的基础上,结合新一代众核处理器芯片面积大及核心时钟网络分布广的特点,基于标准多源时钟树设计策略构建多源时钟树综合(MRCTS)结构,通过全局H-Tree时钟树保证芯片不同区域间时钟偏斜的稳定可控,利用局部时钟树综合进行关键路径的时序优化以实现时序收敛。实验结果表明,MRCTS能在保证时钟延时、时钟偏斜等性能参数可控的基础上,有效降低时钟网络的负载和功耗,大幅压缩综合子模块的布线资源,加速关键路径的时序收敛,并且在相同电源电压和时钟频率的实测条件下,可获得约22.15%的时钟网络功耗优化。 展开更多
关键词 高性能处理器芯片 时钟网络 时钟功耗 时钟偏斜 多源时钟树综合
下载PDF
一种实时细颗粒度片上网络功率分配方法 被引量:1
3
作者 饶东宁 李建华 《计算机应用研究》 CSCD 北大核心 2016年第8期2358-2362,共5页
片上网络(No C)不仅直接影响众核芯片的性能,而且消耗了芯片部分功率,在给定功率条件下使得片上网络的性能最优已经成为迫切需求。片上网络中路由器的工作负载(包的到达率)差异很大,需要对每一个路由器进行异构调整功率才能得到很好的... 片上网络(No C)不仅直接影响众核芯片的性能,而且消耗了芯片部分功率,在给定功率条件下使得片上网络的性能最优已经成为迫切需求。片上网络中路由器的工作负载(包的到达率)差异很大,需要对每一个路由器进行异构调整功率才能得到很好的性能。为此,针对如何在给定功率条件下优化No C性能进行了研究,提出了一个实时细颗粒度的功率分配方法,它能够根据每一个路由器的工作负载实时快速地分配功率,实现片上网络性能最优。实验结果表明相比其他功率分配方法,该方法平均减少26.1%的应用执行时间且具有较低的硬件开销。 展开更多
关键词 众核芯片 片上网络 功率受限 性能最优 功率分配
下载PDF
LQCD Dslash在神威·太湖之光上的研究分析与MPI实现 被引量:3
4
作者 张淼 周宇 +3 位作者 陈建海 何钦铭 徐顺 宫明 《计算机科学与探索》 CSCD 北大核心 2019年第10期1664-1676,共13页
“神威·太湖之光”是我国全自主研发的千万核超级计算机,目前已有很多大型应用程序在此先进架构上进行了移植优化。然而,高能物理领域的格点量子色动力学(LQCD)数值模拟软件在神威平台上尚未进行过移植优化,这引起了科学工作者们... “神威·太湖之光”是我国全自主研发的千万核超级计算机,目前已有很多大型应用程序在此先进架构上进行了移植优化。然而,高能物理领域的格点量子色动力学(LQCD)数值模拟软件在神威平台上尚未进行过移植优化,这引起了科学工作者们的关注。针对LQCD在神威平台上的移植优化问题展开研究。首先,论述了国内外对LQCD在不同硬件架构上进行并行优化的发展历程。其次,通过对其热点模块Dslash的重构,实现了在神威平台上的成功移植。再次,针对申威26010芯片异构众核的架构和并行模式,实现了从核阵列异构并行、从核本地设备存储器(LDM)与主存之间的直接存储访问(DMA)通讯、主核之间的消息传递接口(MPI)通讯及全局归约等操作。最后,经过实验测试,单核组优化程序与16核组优化程序相比单主核程序分别获得了165倍和25倍的加速比,并发现了一些重要的性能瓶颈问题,为进一步优化提升整体效率奠定重要基础。同时,对国产超算平台的推广使用具有积极意义。 展开更多
关键词 格点量子色动力学(LQCD) Dslash 消息传递接口(MPI) 神威·太湖之光 众核芯片
下载PDF
基于温度感知任务调度的3D NoC混合拓扑结构 被引量:2
5
作者 冯申杰 李冰 程良伦 《计算机应用研究》 CSCD 北大核心 2017年第8期2395-2398,共4页
3D NoC较高的功率密度容易造成温度过高,对系统性能和芯片可靠性造成负面影响。利用温度感知任务调度来控制节点温度的思路是在运行时把"热"节点上的任务迁移到"冷"节点上,这不可避免会出现迁移之后任务间通信距离... 3D NoC较高的功率密度容易造成温度过高,对系统性能和芯片可靠性造成负面影响。利用温度感知任务调度来控制节点温度的思路是在运行时把"热"节点上的任务迁移到"冷"节点上,这不可避免会出现迁移之后任务间通信距离变大进而影响整体性能。因此,在任务调度的过程中保持通信开销已经成为迫切需求。提出了分层次的ring/mesh混合拓扑结构RMH,可以在任务迁移的同时保持原来较小的通信延迟。仿真结果表明,相比于3D NoC拓扑结构,RMH拓扑可以有效缓解散热问题,并且平均减少31.1%的网络延迟。 展开更多
关键词 众核芯片 片上网络 任务调度 三维混合拓扑
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部