期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
SWAM:SNN工作负载自动映射器
被引量:
4
1
作者
郁龚健
张鲁飞
+4 位作者
李佩琦
华夏
刘家航
柴志雷
陈闻杰
《计算机科学与探索》
CSCD
北大核心
2021年第9期1641-1657,共17页
为了满足大规模脉冲神经网络(SNN)的计算需求,类脑计算系统通常需要采用大规模并行计算平台。因此,如何快速为SNN工作负载确定合理的计算节点数(即如何把工作负载合理映射到计算平台上)以获得最佳的性能、功耗等指标就成为类脑计算系统...
为了满足大规模脉冲神经网络(SNN)的计算需求,类脑计算系统通常需要采用大规模并行计算平台。因此,如何快速为SNN工作负载确定合理的计算节点数(即如何把工作负载合理映射到计算平台上)以获得最佳的性能、功耗等指标就成为类脑计算系统需解决的关键问题之一。首先分析了SNN工作负载特性并为其建立起计算模型;然后针对NEST类脑仿真器,进一步实例化了SNN的内存、计算和通信负载模型;最终设计并实现了一种基于NEST的SNN工作负载自动映射器(SWAM)。SWAM可以自动计算出映射结果并完成映射,避免了极其耗时的工作负载映射手动试探过程。在ARM+FPGA、纯ARM、PC集群三种不同的计算平台上运行SNN典型应用,并比较SWAM、LM算法拟合和实测的映射结果。实验结果表明:SWAM的平均映射准确率达到98.833%,与LM方法与实测映射相比,SWAM具有绝对的时间代价优势。
展开更多
关键词
脉冲神经网络(SNN)
工作负载映射
pynq集群
现场可编程逻辑门阵列(FPGA)加速
NEST仿真器
下载PDF
职称材料
基于SNN神经元重分布的NEST仿真器性能优化
被引量:
2
2
作者
刘家航
郁龚健
+3 位作者
李佩琦
华夏
柴志雷
陈闻杰
《计算机工程》
CAS
CSCD
北大核心
2022年第3期189-196,共8页
为满足大规模脉冲神经网络(SNN)的计算需求,类脑计算系统通常需要采用大规模并行计算平台。然而随着节点数量的增多,通信在仿真中所占比例大幅增加,导致计算效率下降。类脑模拟器开源软件NEST采用缓冲区大小相等的策略,有效缩短了通信时...
为满足大规模脉冲神经网络(SNN)的计算需求,类脑计算系统通常需要采用大规模并行计算平台。然而随着节点数量的增多,通信在仿真中所占比例大幅增加,导致计算效率下降。类脑模拟器开源软件NEST采用缓冲区大小相等的策略,有效缩短了通信时间,但是由于缓冲区互相无交流,使得通信数据量持续增加,因此其在能耗方面表现较差。分析NEST集群的负载特性,针对其中的通信问题进行稀疏性优化,提出基于SNN子图跨节点优化的神经元重分布算法ReLOC。通过优化SNN子图的跨节点分布减少每一轮神经元到进程的数量,从而减少跨节点脉冲,使进程间通信更加稀疏,达到缩减每一轮通信进程的目的。在此基础上,以稀疏交换的思想对NEST本身的通信机制进行改进,使有脉冲交换的进程进行数据交换,从而在连接稀疏的情况下提升通信效率。以包含28个Xilinx PYNQ节点的计算集群作为实验平台,运行皮质微电路SNN模型和平衡随机网络模型,验证ReLOC算法的有效性。实验结果表明,相比循环分布算法,重分布算法能够使通信的平均稀疏性提高20%,同时配合稀疏交换最多可使通信能耗减少98.63%。
展开更多
关键词
脉冲神经网络
神经元重分布
pynq集群
NEST仿真器
稀疏交换
下载PDF
职称材料
题名
SWAM:SNN工作负载自动映射器
被引量:
4
1
作者
郁龚健
张鲁飞
李佩琦
华夏
刘家航
柴志雷
陈闻杰
机构
江南大学人工智能与计算机学院
数学工程与先进计算国家重点实验室
华东师范大学软硬件协同设计技术与应用教育部工程研究中心
出处
《计算机科学与探索》
CSCD
北大核心
2021年第9期1641-1657,共17页
基金
国家自然科学基金(61972180)
数学工程与先进计算国家重点实验室开放基金(2018A04)。
文摘
为了满足大规模脉冲神经网络(SNN)的计算需求,类脑计算系统通常需要采用大规模并行计算平台。因此,如何快速为SNN工作负载确定合理的计算节点数(即如何把工作负载合理映射到计算平台上)以获得最佳的性能、功耗等指标就成为类脑计算系统需解决的关键问题之一。首先分析了SNN工作负载特性并为其建立起计算模型;然后针对NEST类脑仿真器,进一步实例化了SNN的内存、计算和通信负载模型;最终设计并实现了一种基于NEST的SNN工作负载自动映射器(SWAM)。SWAM可以自动计算出映射结果并完成映射,避免了极其耗时的工作负载映射手动试探过程。在ARM+FPGA、纯ARM、PC集群三种不同的计算平台上运行SNN典型应用,并比较SWAM、LM算法拟合和实测的映射结果。实验结果表明:SWAM的平均映射准确率达到98.833%,与LM方法与实测映射相比,SWAM具有绝对的时间代价优势。
关键词
脉冲神经网络(SNN)
工作负载映射
pynq集群
现场可编程逻辑门阵列(FPGA)加速
NEST仿真器
Keywords
spiking neural network(SNN)
workload mapping
pynq
clusters
field programmable gate array(FPGA)acceleration
NEST simulator
分类号
TP302 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
基于SNN神经元重分布的NEST仿真器性能优化
被引量:
2
2
作者
刘家航
郁龚健
李佩琦
华夏
柴志雷
陈闻杰
机构
江南大学人工智能与计算机学院
江苏省模式识别与计算智能工程实验室
华东师范大学软硬件协同设计技术与应用教育部工程研究中心
出处
《计算机工程》
CAS
CSCD
北大核心
2022年第3期189-196,共8页
基金
国家自然科学基金“基于工作负载表征的类脑体系结构基准测试模型与自动映射方法研究”(61972180)。
文摘
为满足大规模脉冲神经网络(SNN)的计算需求,类脑计算系统通常需要采用大规模并行计算平台。然而随着节点数量的增多,通信在仿真中所占比例大幅增加,导致计算效率下降。类脑模拟器开源软件NEST采用缓冲区大小相等的策略,有效缩短了通信时间,但是由于缓冲区互相无交流,使得通信数据量持续增加,因此其在能耗方面表现较差。分析NEST集群的负载特性,针对其中的通信问题进行稀疏性优化,提出基于SNN子图跨节点优化的神经元重分布算法ReLOC。通过优化SNN子图的跨节点分布减少每一轮神经元到进程的数量,从而减少跨节点脉冲,使进程间通信更加稀疏,达到缩减每一轮通信进程的目的。在此基础上,以稀疏交换的思想对NEST本身的通信机制进行改进,使有脉冲交换的进程进行数据交换,从而在连接稀疏的情况下提升通信效率。以包含28个Xilinx PYNQ节点的计算集群作为实验平台,运行皮质微电路SNN模型和平衡随机网络模型,验证ReLOC算法的有效性。实验结果表明,相比循环分布算法,重分布算法能够使通信的平均稀疏性提高20%,同时配合稀疏交换最多可使通信能耗减少98.63%。
关键词
脉冲神经网络
神经元重分布
pynq集群
NEST仿真器
稀疏交换
Keywords
Spiking Neural Network(SNN)
neuron relocation
pynq
cluster
NEST simulator
sparse exchange
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
SWAM:SNN工作负载自动映射器
郁龚健
张鲁飞
李佩琦
华夏
刘家航
柴志雷
陈闻杰
《计算机科学与探索》
CSCD
北大核心
2021
4
下载PDF
职称材料
2
基于SNN神经元重分布的NEST仿真器性能优化
刘家航
郁龚健
李佩琦
华夏
柴志雷
陈闻杰
《计算机工程》
CAS
CSCD
北大核心
2022
2
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部