期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于功能单元最大利用率的调度算法
被引量:
2
1
作者
李淳
刘明业
吴沧浦
《电子学报》
EI
CAS
CSCD
北大核心
1996年第2期7-10,共4页
高级综合中调度决定系统运行速度与造价的折衷,调度问题为NP问题,本文将调度问题看作为多目标优化问题,并提出一种基于功能单元最大利用率的调度算法,以较低的时间复杂度求得调度问题的最优或近似最优解。该算法不仅可求解时间约...
高级综合中调度决定系统运行速度与造价的折衷,调度问题为NP问题,本文将调度问题看作为多目标优化问题,并提出一种基于功能单元最大利用率的调度算法,以较低的时间复杂度求得调度问题的最优或近似最优解。该算法不仅可求解时间约束下的调度问题,也可求解造价约束下的调度问题。
展开更多
关键词
调度
多目标优化
功能
单元利用率
最优化
下载PDF
职称材料
基于网络负载特征感知的数据流指令调度机制研究
被引量:
2
2
作者
冯煜晶
欧焱
+3 位作者
叶笑春
范东睿
谭旭
唐志敏
《高技术通讯》
EI
CAS
北大核心
2018年第11期885-898,共14页
研究了数据流架构的指令调度策略,基于当前普遍采用的数据流指令调度机制,提出了支持模式切换的动态指令调度机制。由于数据流架构执行模式具有并行化特点,同一时刻存在大量并行传递的数据和并行的计算,网络传输负载呈现出非均匀的分布...
研究了数据流架构的指令调度策略,基于当前普遍采用的数据流指令调度机制,提出了支持模式切换的动态指令调度机制。由于数据流架构执行模式具有并行化特点,同一时刻存在大量并行传递的数据和并行的计算,网络传输负载呈现出非均匀的分布模式。局部网络传输压力过大导致数据流节点中的处理单元内部出现流水线停顿,片上网络(NoC)的局部传输效率降低,从而影响数据流架构的网络传输延迟、计算部件的利用率和整体的执行效率,因此针对原有的指令调度策略提出改进方案。针对网络负载的动态变化实时调整指令调度策略,从而达到缓解网络局部拥塞,提高网络传输效率的目的。本研究使用数据流模拟器对提出的机制进行验证,实验结果表明,采用本文提出的指令调度机制,数据流网络的传输延迟平均降低了12. 8%,计算部件的利用率平均提高了14. 4%,数据流架构的整体性能平均提高了14. 7%。
展开更多
关键词
数据流架构
动态指令调度
片上网络(NoC)
网络负载
单元利用率
下载PDF
职称材料
基于平铺数据流的可配置神经网络加速器
被引量:
3
3
作者
李艺煌
马胜
+2 位作者
郭阳
陈桂林
徐睿
《计算机工程与科学》
CSCD
北大核心
2019年第6期963-972,共10页
卷积神经网络已经是公认最好的用于深度学习的算法,被广泛地应用于图像识别、自动翻译和广告推荐。由于神经网络结构规模的逐渐增大,使其具有大量的神经元和突触,所以,使用专用加速硬件挖掘神经网络的并行性已经成为了热门的选择。在硬...
卷积神经网络已经是公认最好的用于深度学习的算法,被广泛地应用于图像识别、自动翻译和广告推荐。由于神经网络结构规模的逐渐增大,使其具有大量的神经元和突触,所以,使用专用加速硬件挖掘神经网络的并行性已经成为了热门的选择。在硬件设计中,经典的平铺结构实现了很高的性能,但是平铺结构的单元利用率很低。目前,随着众多深度学习应用对硬件性能要求的逐渐提高,加速器对单元利用率也具有越来越严格的要求。为了在平铺数据流结构上获得更高的单元利用率,可以调换并行的顺序,采用并行输入特征图和输出通道的方式来提高计算的并行性。但是,随着神经网络运算对硬件性能要求的提高,运算单元阵列必然会越来越大。当阵列大小增加到一定程度,相对单一的并行方式会使利用率逐渐下降。这就需要硬件可以开发更多的神经网络并行度,从而抑制单元空转。同时,为了适应不同的网络结构,要求硬件阵列对神经网络的运算是可配置的。但是,可配置硬件会极大地增加硬件开销和数据的调度难度。提出了一种基于平铺结构加速器的并行度可配置的神经网络加速器。为了减少硬件复杂度,提出了部分配置的技术,既能满足大型单元阵列下单元利用率的提升,也能尽可能地减少硬件额外开销。在阵列大小超过512之后,硬件单元利用率平均可以维持在82%~90%。同时加速器性能与单元阵列数量基本成线性比例上升。
展开更多
关键词
神经网络
平铺数据流
可配置
单元利用率
并行性
下载PDF
职称材料
实时专家系统计算机体系结构(连载)——第4章 系统仿真
4
作者
常晓明
《指挥控制与仿真》
1997年第2期53-60,共8页
4.1 模拟目标 第3章里谈到的硬件系统的仿真软件已开发出来,用于预测系统性能,研究系统部件的利用率。 可用不同的度量表示系统性能。常规系统一般用MIPS(每秒百万条指令)来度量性能。虽然这个度量标准能用于内部处理机,但它不能反映系...
4.1 模拟目标 第3章里谈到的硬件系统的仿真软件已开发出来,用于预测系统性能,研究系统部件的利用率。 可用不同的度量表示系统性能。常规系统一般用MIPS(每秒百万条指令)来度量性能。虽然这个度量标准能用于内部处理机,但它不能反映系统的整个性能。该系统不执行常规的指令集,而通过—个规则基进行推理,因此,较适合的性能度量方法是LIPS(每秒逻辑推理)。系统的处理速度通过仿真预测,并在各种运行条件下度量。
展开更多
关键词
实时专家系统
计算机体系结构
功能
单元利用率
消息缓冲
推理树
仿真模型
子程序
处理速率
目标进程
离散事件仿真
下载PDF
职称材料
题名
基于功能单元最大利用率的调度算法
被引量:
2
1
作者
李淳
刘明业
吴沧浦
机构
北京理工大学计算机系
出处
《电子学报》
EI
CAS
CSCD
北大核心
1996年第2期7-10,共4页
基金
国家自然科学基金
文摘
高级综合中调度决定系统运行速度与造价的折衷,调度问题为NP问题,本文将调度问题看作为多目标优化问题,并提出一种基于功能单元最大利用率的调度算法,以较低的时间复杂度求得调度问题的最优或近似最优解。该算法不仅可求解时间约束下的调度问题,也可求解造价约束下的调度问题。
关键词
调度
多目标优化
功能
单元利用率
最优化
Keywords
Scheduling,Multi criteria optimization,Utility ratio of the function units
分类号
O224 [理学—运筹学与控制论]
TP202.7 [自动化与计算机技术—检测技术与自动化装置]
下载PDF
职称材料
题名
基于网络负载特征感知的数据流指令调度机制研究
被引量:
2
2
作者
冯煜晶
欧焱
叶笑春
范东睿
谭旭
唐志敏
机构
中国科学院计算技术研究所计算机体系结构国家重点实验室
中国科学院大学计算机与控制学院
出处
《高技术通讯》
EI
CAS
北大核心
2018年第11期885-898,共14页
基金
国家重点研发计划(2017YFC0803401)
国家自然科学基金(61332009
+4 种基金
61732018)
计算机体系结构国家重点实验室创新课题(CARCH3303
CARCH3407
CARCH3502
CARCH3505)资助项目
文摘
研究了数据流架构的指令调度策略,基于当前普遍采用的数据流指令调度机制,提出了支持模式切换的动态指令调度机制。由于数据流架构执行模式具有并行化特点,同一时刻存在大量并行传递的数据和并行的计算,网络传输负载呈现出非均匀的分布模式。局部网络传输压力过大导致数据流节点中的处理单元内部出现流水线停顿,片上网络(NoC)的局部传输效率降低,从而影响数据流架构的网络传输延迟、计算部件的利用率和整体的执行效率,因此针对原有的指令调度策略提出改进方案。针对网络负载的动态变化实时调整指令调度策略,从而达到缓解网络局部拥塞,提高网络传输效率的目的。本研究使用数据流模拟器对提出的机制进行验证,实验结果表明,采用本文提出的指令调度机制,数据流网络的传输延迟平均降低了12. 8%,计算部件的利用率平均提高了14. 4%,数据流架构的整体性能平均提高了14. 7%。
关键词
数据流架构
动态指令调度
片上网络(NoC)
网络负载
单元利用率
Keywords
dataflow architecture
dynamic instruction scheduling
network-on-chip (NoC)
network loading
utilization of computational unit
分类号
TP393.06 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于平铺数据流的可配置神经网络加速器
被引量:
3
3
作者
李艺煌
马胜
郭阳
陈桂林
徐睿
机构
国防科技大学计算机学院
出处
《计算机工程与科学》
CSCD
北大核心
2019年第6期963-972,共10页
基金
国家自然科学基金(61672526)
校预研基金(ZK17-03-06)
文摘
卷积神经网络已经是公认最好的用于深度学习的算法,被广泛地应用于图像识别、自动翻译和广告推荐。由于神经网络结构规模的逐渐增大,使其具有大量的神经元和突触,所以,使用专用加速硬件挖掘神经网络的并行性已经成为了热门的选择。在硬件设计中,经典的平铺结构实现了很高的性能,但是平铺结构的单元利用率很低。目前,随着众多深度学习应用对硬件性能要求的逐渐提高,加速器对单元利用率也具有越来越严格的要求。为了在平铺数据流结构上获得更高的单元利用率,可以调换并行的顺序,采用并行输入特征图和输出通道的方式来提高计算的并行性。但是,随着神经网络运算对硬件性能要求的提高,运算单元阵列必然会越来越大。当阵列大小增加到一定程度,相对单一的并行方式会使利用率逐渐下降。这就需要硬件可以开发更多的神经网络并行度,从而抑制单元空转。同时,为了适应不同的网络结构,要求硬件阵列对神经网络的运算是可配置的。但是,可配置硬件会极大地增加硬件开销和数据的调度难度。提出了一种基于平铺结构加速器的并行度可配置的神经网络加速器。为了减少硬件复杂度,提出了部分配置的技术,既能满足大型单元阵列下单元利用率的提升,也能尽可能地减少硬件额外开销。在阵列大小超过512之后,硬件单元利用率平均可以维持在82%~90%。同时加速器性能与单元阵列数量基本成线性比例上升。
关键词
神经网络
平铺数据流
可配置
单元利用率
并行性
Keywords
CNN
tiling dataflow
configurable
parallelism
分类号
TP368.1 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
实时专家系统计算机体系结构(连载)——第4章 系统仿真
4
作者
常晓明
出处
《指挥控制与仿真》
1997年第2期53-60,共8页
文摘
4.1 模拟目标 第3章里谈到的硬件系统的仿真软件已开发出来,用于预测系统性能,研究系统部件的利用率。 可用不同的度量表示系统性能。常规系统一般用MIPS(每秒百万条指令)来度量性能。虽然这个度量标准能用于内部处理机,但它不能反映系统的整个性能。该系统不执行常规的指令集,而通过—个规则基进行推理,因此,较适合的性能度量方法是LIPS(每秒逻辑推理)。系统的处理速度通过仿真预测,并在各种运行条件下度量。
关键词
实时专家系统
计算机体系结构
功能
单元利用率
消息缓冲
推理树
仿真模型
子程序
处理速率
目标进程
离散事件仿真
分类号
E917 [军事]
E141.1 [军事—军队指挥学]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于功能单元最大利用率的调度算法
李淳
刘明业
吴沧浦
《电子学报》
EI
CAS
CSCD
北大核心
1996
2
下载PDF
职称材料
2
基于网络负载特征感知的数据流指令调度机制研究
冯煜晶
欧焱
叶笑春
范东睿
谭旭
唐志敏
《高技术通讯》
EI
CAS
北大核心
2018
2
下载PDF
职称材料
3
基于平铺数据流的可配置神经网络加速器
李艺煌
马胜
郭阳
陈桂林
徐睿
《计算机工程与科学》
CSCD
北大核心
2019
3
下载PDF
职称材料
4
实时专家系统计算机体系结构(连载)——第4章 系统仿真
常晓明
《指挥控制与仿真》
1997
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部