基于RISC-V的卷积神经网络处理器设计与实现被引量：5

Design and implementation of convolutional neural network processor based on RISC-V instruction set

下载PDF

导出

摘要针对卷积神经网络对于运算资源需求的不断增长,和传统的硬件卷积加速方案在功耗、面积敏感的边缘计算领域难以应用的问题,设计并实现了一个低功耗嵌入式卷积神经网络加速处理器.目标处理器基于RISC-V指令集架构,内核扩展4条自定义神经网络指令,并在硬件层面实现加速处理.该卷积神经网络处理器最大程度的复用了原RISC-V的数据通路和功能模块,减小了额外的功耗和芯片面积等资源开销.目标处理器通过RISC-V官方标准测试集验证,并对MNIST手写数据集进行识别测试,正确率达到97.23%.在TSMC 40nm标准数字工艺下,目标处理器面积仅为0.34 mm^(2,),动态功耗仅为11.1μw/MHz,与同期处理器相比,面积和功耗方面均具有一定优势. A low power embedded convolutional neural network acceleration processor is designed and implemented in response to the growing demand for computational resources in convolutional neural networks and the difficulty of applying traditional hardware convolution acceleration schemes in power-and area-sensitive edge computation applications.The target processor based on the RISC-V instruction set architecture,extend four custom neural network instructions,and accelerates the processing on the hardware architecture.The convolutional neural network processor maximizes the reuse of the original RISC-V data path and functional modules,reducing additional resourceoverhead.The target processor is verified by the RISC-V official standard test set,and the MNIST handwritten data set is identified and tested,with a correct rate of 97.23%.The target processor occupies 0.34 mm^2 area and consume 11.1μw/MHz dynamic power using TSMC 40 nm technology.Compared with the correlation processor,it has certain advantages in area and power consumption.

作者傅思扬陈华郁发新 FU Si-yang;CHEN Hua;YU Fa-xin(college of Aeronautics and Astronautics,Zhejiang University,Hangzhou,310058,China)

机构地区浙江大学航空航天学院

出处《微电子学与计算机》北大核心 2020年第4期49-54,共6页 Microelectronics & Computer

基金国家自然科学基金(61604128) 中央高校基本科研业务费专项项目(2017QN81002)。

关键词处理器卷积神经网络定制指令集 RISC-V processor convolutional neural network custom instruction set RISC-V

分类号 TP332 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献5

1杨一晨,张国和,梁峰,何平,吴斌,高震霆.一种基于可编程逻辑器件的卷积神经网络协处理器设计[J].西安交通大学学报,2018,52(7):153-159. 被引量：7
2杨维科,贺光辉,景乃锋.基于Rocket-Chip开源处理器的CNN加速模块的设计及实现[J].微电子学与计算机,2018,35(4):17-21. 被引量：6
3方睿,刘加贺,薛志辉,杨广文.卷积神经网络的FPGA并行加速方案设计[J].计算机工程与应用,2015,51(8):32-36. 被引量：27
4吕倩茹,王彦鹏,曹壮,文梅.面向网络报文转发的RISC-V压缩指令定制[J].计算机工程与科学,2018,40(3):381-387. 被引量：1
5雷思磊.RISC-V架构的开源处理器及SoC研究综述[J].单片机与嵌入式系统应用,2017,17(2):56-60. 被引量：33

二级参考文献22

1潘朝霞,王毅.ARM处理器中ARM和Thumb状态的切换[J].微计算机信息,2005,21(2):95-96. 被引量：2
2Thumb-2：Cortex的基本元素[J].电子设计技术 EDN CHINA,2005,12(6):124-124. 被引量：1
3LeCun Y,Bottou L,Bengio Y,et al.Gradient-based learningapplied to document recognition[J].Proceedings ofthe IEEE,1998,86(11):2278-2324.
4Simard P Y,Steinkraus D,Platt J C.Best practices forconvolutional neural networks applied to visual documentanalysis[C]//Proceedings of the 7th InternationalConference on Document Analysis and Recognition,2003:958-962.
5Chellapilla K,Puri S,Simard P.High performance convolutionalneural networks for document processing[C]//10th International Workshop on Frontiers in HandwritingRecognition,2006.
6Chellapilla K,Shilman M,Simard P.Optimally combininga cascade of classifiers[C]//Electronic Imaging,2006:207-214.
7Garcia C,Delakis M.Convolutional face finder:a neuralarchitecture for fast and robust face detection[J].IEEETransactions on Pattern Analysis and Machine Intelligence,2004,26(11):1408-1423.
8Frome A,Cheung G,Abdulkader A,et al.Large-scale privacyprotection in google street view[C]//IEEE InternationalConference on Computer Vision,2009:2373-2380.
9Bouvrie J.Notes on convolutional neural networks[Z].2006.
10Sankaradas M,Jakkula V,Cadambi S,et al.A massivelyparallel coprocessor for convolutional neural networks[C]//20th IEEE International Conference on Application-specificSystems,Architectures and Processors,2009:53-60.

共引文献65

1何志敏,王佳,程利甫,何俊,李欣欣.一种星载信息系统微系统电路设计[J].航天标准化,2020(2):32-35. 被引量：2
2杨德亨,徐学政,王涛,黄安文,李琼.面向RISC-V内存一致性测试的自动化分析方法[J].智能安全,2023,2(3):58-67.
3李东泽,曹凯宁,曲明,王富昕.五级流水线RISC-V处理器软硬件协同仿真验证[J].吉林大学学报（信息科学版）,2017,35(6):612-616. 被引量：9
4陈龙,曹力.一种Zynq SoC片内硬件加速的二维傅里叶变换[J].单片机与嵌入式系统应用,2018,18(2):36-40. 被引量：5
5张迅珍,梁青,李涛.RV32I控制单元设计与实现[J].微电子学与计算机,2018,35(3):74-78. 被引量：6
6杨维科,贺光辉,景乃锋.基于Rocket-Chip开源处理器的CNN加速模块的设计及实现[J].微电子学与计算机,2018,35(4):17-21. 被引量：6
7曾珍珍.一种计算机视觉算法的图像处理技术[J].信息技术,2018,42(4):74-78. 被引量：8
8王昆,周骅.深度学习中的卷积神经网络系统设计及硬件实现[J].电子技术应用,2018,44(5):56-59. 被引量：7
9肖皓,祝永新,汪宁,田犁,汪辉.面向卷积神经网络的FPGA硬件加速器设计[J].工业控制计算机,2018,31(6):99-101. 被引量：2
10张庭略.基于硬件的神经网络加速[J].通讯世界,2018,0(8):77-79. 被引量：1

同被引文献26

1刘涛,应继宏.基于RISC技术的MCU核的设计与研究[J].科学技术与工程,2007,7(7):1323-1327. 被引量：1
2雍朝良,林剑春,赵明,陈凡胜.空间大规模CMOS面阵焦平面拼接技术[J].红外与激光工程,2012,41(10):2561-2566. 被引量：8
3ZHOU YangFan,CAO ZhongXiang,QIN Qi,LI QuanLiang,SHI Cong,WU NanJian.A high speed 1000 fps CMOS image sensor with low noise global shutter pixels[J].Science China(Information Sciences),2014,57(4):231-238. 被引量：9
4吴俊成,周锐,冉华明,丁全心.遗传算法和拍卖算法在任务分配中的性能比较[J].电光与控制,2016,23(2):11-15. 被引量：16
5廖湘科,肖侬.新型高性能计算系统与技术[J].中国科学：信息科学,2016,46(9):1175-1210. 被引量：30
6史兴强,范学仕.一种SoC低功耗模式设计与实现[J].电子与封装,2018,18(2):40-45. 被引量：8
7李晓英,刘敏.基于RISCV-32I的微处理器的设计与实现[J].内江科技,2018,39(11):49-50. 被引量：1
8蹇强,张培勇,王雪洁.一种可配置的CNN协加速器的FPGA实现方法[J].电子学报,2019,47(7):1525-1531. 被引量：20
9宋可心,贾学志,李季,张弘治.帘幕式CMOS全局曝光成像技术（英文）[J].光子学报,2019,48(8):196-204. 被引量：5
10冉德成,吴东,钱磊.面向深度学习推理的矩阵乘法加速器设计[J].计算机工程,2019,45(10):40-45. 被引量：2

引证文献5

1康磊,李慧,郑豪威,李鑫.卷积神经网络RLeNet加速器设计[J].电脑知识与技术,2021,17(6):16-19. 被引量：2
2方倪,徐德利,王东,沈凡,龚祺.用于像素阵列扫描控制的低功耗RISCV处理器[J].电子设计工程,2022,30(12):53-57.
3许霁航,杨靓,娄冕,张海金.基于RISC-V调试协议的片上调试系统设计与实现[J].微电子学与计算机,2022,39(12):86-92. 被引量：3
4王荣阳,曲国远,童歆,徐佩园,李威.面向雷达多目标跟踪应用的专用片上系统设计[J].计算机工程与设计,2023,44(12):3599-3605. 被引量：1
5周理,赵祉乔,潘国腾,铁俊波,赵王.基于RISC-V的图卷积神经网络加速器设计[J].计算机工程与科学,2023,45(12):2113-2120.

二级引证文献6

1张新勇,甘恒,李昌夏,加文浩.基于卷积神经网络的手写数字识别研究[J].电脑知识与技术,2021,17(22):112-114. 被引量：2
2徐云,杨承翰,高磊.利用机器视觉的手写数字识别系统设计研究[J].自动化仪表,2022,43(9):10-13. 被引量：2
3杨园格,翟书颖,李茹.基于RISCV和MAX2830的无线通信平台设计[J].单片机与嵌入式系统应用,2023,23(7):66-70. 被引量：1
4王亚军,李俊龙,赵达,杨亮.基于RISC-V的硬件管理控制器设计[J].电子技术应用,2024,50(6):32-36.
5涂景奇,樊蓉,董一群.基于线性波门改进拍卖算法的航迹关联算法研究[J].航空电子技术,2024,55(2):34-39.
6陈芳,李耀,宋雷军,申臻,胡逸琳.面向自定义虚拟机的远程调试器设计与实现[J].先进小卫星技术（中英文）,2024,1(2):87-94.

1广发银行“智慧城市” 综合服务创新利民新举措[J].中国经贸,2019,0(24):109-110.
2清代扬州书画专题[J].中国书画,2019,0(12):30-57.
3段清娟.贵州翰凯斯:数字工艺添彩智能经济[J].当代贵州,2020,0(15):33-33.
4邵川.如何监控DELL服务器[J].网络安全和信息化,2020,0(2):62-65.
5姜雪茸.基于CUDA的最大互相关算法加速处理研究[J].甘肃科技,2019,35(22):18-20. 被引量：3
6王滢.TIC机构投资标的选择原则及调查侧重点[J].中国经贸导刊,2019,0(10Z):165-166. 被引量：1
7周瑜.DELMIA系统在数字化工厂中应用的介绍[J].成都航空职业技术学院学报,2019,35(3):41-45.
8秦览,陈继军,于国伟.基于集成回声状态网络模型在兰州市艾滋病发病例数预测中的应用[J].中国研究型医院,2019,6(6):53-57.
9熊小萍,许爽,蒙登越,韦香祥,屠德然,武文梁.基于Faster R-CNN的输电线路缺陷识别模型研究[J].自动化与仪器仪表,2020,0(3):1-6. 被引量：18
10张颖,章亦莹,杨瑞文,金明兰,季聪华,黄琦.基于中医体质辨识的糖尿病风险评估模型建立与验证[J].中国全科医学,2020,23(10):1261-1266. 被引量：12

微电子学与计算机

2020年第4期

浏览历史

内容加载中请稍等...

基于RISC-V的卷积神经网络处理器设计与实现被引量：5

参考文献5

二级参考文献22

共引文献65

同被引文献26

引证文献5

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于RISC-V的卷积神经网络处理器设计与实现 被引量：5

参考文献5

二级参考文献22

共引文献65

同被引文献26

引证文献5

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于RISC-V的卷积神经网络处理器设计与实现被引量：5