期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
一种高效的Softmax函数计算方法及硬件电路
1
作者
刘海莹
乔瑞秀
+2 位作者
陈刚
鲁华祥
申荣铉
《微电子学与计算机》
2024年第2期91-100,共10页
针对现有Softmax函数硬件实现中存在的面积消耗大、速度慢、计算效率低等问题,设计一种高效的Softmax函数计算方法及硬件电路。提出一种稀疏化最大值计算方式,仅选择有效的输入值进行计算和存储,并采用动态移位更新最大值的方式将最大...
针对现有Softmax函数硬件实现中存在的面积消耗大、速度慢、计算效率低等问题,设计一种高效的Softmax函数计算方法及硬件电路。提出一种稀疏化最大值计算方式,仅选择有效的输入值进行计算和存储,并采用动态移位更新最大值的方式将最大值求取隐藏在流水线中,提高计算效率;优化分段线性拟合算法,避免乘法器的使用,减少了硬件资源开销。基于现场可编程门阵列(Field-Programmable Gate Array,FPGA)的语音识别实验的结果表明,本方法减少了60%的指数存储需求,同时减少了50%的Softmax计算时间。在45 nm互补金属氧化物半导体(Complementary Metal Oxide Semiconductor,CMOS)工艺下的逻辑综合实验表明,所实现的Softmax函数相较之前的工作,电路综合性能提升14%,面积减小51%。
展开更多
关键词
Softmax函数
分段线性拟合
稀疏计算方式
深度神经网络
下载PDF
职称材料
一种高性能可重构深度卷积神经网络加速器
被引量:
6
2
作者
乔瑞秀
陈刚
+1 位作者
龚国良
鲁华祥
《西安电子科技大学学报》
EI
CAS
CSCD
北大核心
2019年第3期130-139,共10页
由于深度卷积神经网络的卷积层通道规模及卷积核尺寸多样,现有加速器面对这些多样性很难实现高效计算。为此,基于生物脑神经元机制提出了一种深度卷积神经网络加速器。该加速器拥有类脑神经元电路的多种分簇方式及链路组织方式,可以应...
由于深度卷积神经网络的卷积层通道规模及卷积核尺寸多样,现有加速器面对这些多样性很难实现高效计算。为此,基于生物脑神经元机制提出了一种深度卷积神经网络加速器。该加速器拥有类脑神经元电路的多种分簇方式及链路组织方式,可以应对不同通道规模。设计了3种卷积计算映射,可以应对不同卷积核大小;实现了局部存储区数据的高效复用,可大量减少数据搬移,提高了计算性能。分别以目标分类和目标检测网络进行测试,该加速器的计算性能分别达498.6×10^9次/秒和571.3×10^9次/秒;能效分别为582.0×10^9次/(秒·瓦)和651.7×10^9次/(秒·瓦)。
展开更多
关键词
深度神经网络
加速器
可重构结构
高性能
超大规模集成电路
下载PDF
职称材料
TFT-LCD显示环境温度及紫外线强度的研究
被引量:
3
3
作者
刘会刚
杨榕
+1 位作者
乔瑞秀
赵运筹
《南开大学学报(自然科学版)》
CAS
CSCD
北大核心
2012年第6期41-45,共5页
系统以AT89S52单片机为控制中心检测环境紫外线强度及温度,最终显示在TFT-LCD上.紫外线强度的采集由紫外线传感器和TLC1549共同完成;温度采集使用DS18B20温度传感器.最后在LCD上显示温度、紫外线强度、时间等各项菜单,视觉效果好,硬件简...
系统以AT89S52单片机为控制中心检测环境紫外线强度及温度,最终显示在TFT-LCD上.紫外线强度的采集由紫外线传感器和TLC1549共同完成;温度采集使用DS18B20温度传感器.最后在LCD上显示温度、紫外线强度、时间等各项菜单,视觉效果好,硬件简单,程序精简.
展开更多
关键词
TFT-LCD
单片机
紫外线传感器
温度传感器
下载PDF
职称材料
并行可配置浮点矩阵乘法IP核设计
被引量:
1
4
作者
乔瑞秀
鲁华祥
+1 位作者
龚国良
陈刚
《网络新媒体技术》
2015年第6期31-36,共6页
矩阵乘法是信息处理领域的常见计算,该文设计并实现了一个可自由配置的浮点矩阵乘法IP核,可满足不同计算场合的需求。该IP核采用并行结构设计,使用AXI接口,可通过参数配置实现任意维矩阵乘法,并在嵌入式系统设计中灵活调用,在Xilinx 7...
矩阵乘法是信息处理领域的常见计算,该文设计并实现了一个可自由配置的浮点矩阵乘法IP核,可满足不同计算场合的需求。该IP核采用并行结构设计,使用AXI接口,可通过参数配置实现任意维矩阵乘法,并在嵌入式系统设计中灵活调用,在Xilinx 7系列芯片的FPGA平台上进行验证了。实验结果证明了该浮点矩阵乘法IP核相对于传统乘法器设计具有计算速度快、移植性能好、资源利用少等特点。
展开更多
关键词
系统设计
IP核
浮点数运算
矩阵乘法
下载PDF
职称材料
题名
一种高效的Softmax函数计算方法及硬件电路
1
作者
刘海莹
乔瑞秀
陈刚
鲁华祥
申荣铉
机构
中国科学院半导体研究所
中国科学院大学
中国科学院脑科学与智能技术卓越创新中心
半导体神经网络智能感知与计算技术北京市重点实验室
出处
《微电子学与计算机》
2024年第2期91-100,共10页
基金
国家自然科学基金(U19A2080)
中国科学院战略性先导科技专项(XDA18040400,XDB44000000,XDA27040303)。
文摘
针对现有Softmax函数硬件实现中存在的面积消耗大、速度慢、计算效率低等问题,设计一种高效的Softmax函数计算方法及硬件电路。提出一种稀疏化最大值计算方式,仅选择有效的输入值进行计算和存储,并采用动态移位更新最大值的方式将最大值求取隐藏在流水线中,提高计算效率;优化分段线性拟合算法,避免乘法器的使用,减少了硬件资源开销。基于现场可编程门阵列(Field-Programmable Gate Array,FPGA)的语音识别实验的结果表明,本方法减少了60%的指数存储需求,同时减少了50%的Softmax计算时间。在45 nm互补金属氧化物半导体(Complementary Metal Oxide Semiconductor,CMOS)工艺下的逻辑综合实验表明,所实现的Softmax函数相较之前的工作,电路综合性能提升14%,面积减小51%。
关键词
Softmax函数
分段线性拟合
稀疏计算方式
深度神经网络
Keywords
Softmax function
piecewise linear fitting
sparse calculation approach
deep neural network
分类号
TN492 [电子电信—微电子学与固体电子学]
下载PDF
职称材料
题名
一种高性能可重构深度卷积神经网络加速器
被引量:
6
2
作者
乔瑞秀
陈刚
龚国良
鲁华祥
机构
中国科学院半导体研究所
中国科学院大学
中国科学院脑科学与智能技术卓越创新中心
半导体神经网络智能感知与计算技术北京市重点实验室
出处
《西安电子科技大学学报》
EI
CAS
CSCD
北大核心
2019年第3期130-139,共10页
基金
中国科学院战略性先导科技专项(A类)超导计算机研发(XDA18000000)
北京市科技计划(Z181100001518006)
+2 种基金
国家自然科学基金青年基金(61701473、61401423)
中国科学院STS计划(KFJ-STS-ZDTP-070)
中国科学院国防科技创新基金(CXJJ-17-M152)
文摘
由于深度卷积神经网络的卷积层通道规模及卷积核尺寸多样,现有加速器面对这些多样性很难实现高效计算。为此,基于生物脑神经元机制提出了一种深度卷积神经网络加速器。该加速器拥有类脑神经元电路的多种分簇方式及链路组织方式,可以应对不同通道规模。设计了3种卷积计算映射,可以应对不同卷积核大小;实现了局部存储区数据的高效复用,可大量减少数据搬移,提高了计算性能。分别以目标分类和目标检测网络进行测试,该加速器的计算性能分别达498.6×10^9次/秒和571.3×10^9次/秒;能效分别为582.0×10^9次/(秒·瓦)和651.7×10^9次/(秒·瓦)。
关键词
深度神经网络
加速器
可重构结构
高性能
超大规模集成电路
Keywords
deep neural networks
accelerator
reconfigurable architecture
high performance
very large scale integrated circuit
分类号
TN4 [电子电信—微电子学与固体电子学]
下载PDF
职称材料
题名
TFT-LCD显示环境温度及紫外线强度的研究
被引量:
3
3
作者
刘会刚
杨榕
乔瑞秀
赵运筹
机构
南开大学信息技术科学学院
出处
《南开大学学报(自然科学版)》
CAS
CSCD
北大核心
2012年第6期41-45,共5页
基金
中央高校基本科研业务费专项资金
南开大学百项工程(BX9-294)
文摘
系统以AT89S52单片机为控制中心检测环境紫外线强度及温度,最终显示在TFT-LCD上.紫外线强度的采集由紫外线传感器和TLC1549共同完成;温度采集使用DS18B20温度传感器.最后在LCD上显示温度、紫外线强度、时间等各项菜单,视觉效果好,硬件简单,程序精简.
关键词
TFT-LCD
单片机
紫外线传感器
温度传感器
Keywords
TFT-LCD
MPU
UV sensor
temperature sensor
分类号
TN27 [电子电信—物理电子学]
下载PDF
职称材料
题名
并行可配置浮点矩阵乘法IP核设计
被引量:
1
4
作者
乔瑞秀
鲁华祥
龚国良
陈刚
机构
中国科学院半导体研究所高速电路与神经网络实验室
出处
《网络新媒体技术》
2015年第6期31-36,共6页
基金
国家自然科学基金(No.61401423)资助
中国科学院战略性先导专项基金项目(XDA06020700)资助
文摘
矩阵乘法是信息处理领域的常见计算,该文设计并实现了一个可自由配置的浮点矩阵乘法IP核,可满足不同计算场合的需求。该IP核采用并行结构设计,使用AXI接口,可通过参数配置实现任意维矩阵乘法,并在嵌入式系统设计中灵活调用,在Xilinx 7系列芯片的FPGA平台上进行验证了。实验结果证明了该浮点矩阵乘法IP核相对于传统乘法器设计具有计算速度快、移植性能好、资源利用少等特点。
关键词
系统设计
IP核
浮点数运算
矩阵乘法
Keywords
system design
IP core
floating-point operation
matrix multiplication
分类号
TN791 [电子电信—电路与系统]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
一种高效的Softmax函数计算方法及硬件电路
刘海莹
乔瑞秀
陈刚
鲁华祥
申荣铉
《微电子学与计算机》
2024
0
下载PDF
职称材料
2
一种高性能可重构深度卷积神经网络加速器
乔瑞秀
陈刚
龚国良
鲁华祥
《西安电子科技大学学报》
EI
CAS
CSCD
北大核心
2019
6
下载PDF
职称材料
3
TFT-LCD显示环境温度及紫外线强度的研究
刘会刚
杨榕
乔瑞秀
赵运筹
《南开大学学报(自然科学版)》
CAS
CSCD
北大核心
2012
3
下载PDF
职称材料
4
并行可配置浮点矩阵乘法IP核设计
乔瑞秀
鲁华祥
龚国良
陈刚
《网络新媒体技术》
2015
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部