基于通用向量DSP的深度学习硬件加速技术被引量：3

Deep learning hardware acceleration based on general vector DSP

导出

摘要随着深度学习在众多领域发挥着越来越重要的作用,如何设计高性能、低功耗、低延迟的深度学习硬件加速器成为体系结构领域的研究热点.本文基于深度学习算法模型的结构和优化方法,分析了深度学习硬件实现中面临的困难和挑战,并对比当前主流的深度学习硬件加速平台的优势和不足,提出了基于飞腾–迈创通用向量DSP的深度学习硬件加速方案,对其向量广播、矩阵转换等加速技术进行了阐述.并围绕目前通用向量DSP硬件加速的不足,对兼顾通用向量计算和专用深度学习计算的可重构计算阵列等优化技术进行了深入的探讨与研究. As deep learning(DL)plays an increasingly significant role in several fields,designing a high performance,low power,low-latency hardware accelerator for DL has become a topic of interest in the field of architecture.Based on the structure and optimization method of DL algorithms,this study aims to analyze the difficulties and challenges in DL hardware design.In comparison with the current mainstream DL hardware acceleration platform,advantages of the DL hardware acceleration based on general vector DSP are discussed.Besides,acceleration techniques,such as vector broadcasting and matrix conversion,are described.From the viewpoint of the shortcomings of the general vector DSP discussed herein,optimization techniques such as reconfigurable computing arrays that take into account the general vector calculations as well as specific DL acceleration are discussed in depth.

作者王慧丽郭阳屈婉霞 Huili WANG;Yang GUO;Wanxia QU(School of Computer,National University of Defense Technology,Changsha 410073,China)

机构地区国防科技大学计算机学院

出处《中国科学：信息科学》 CSCD 北大核心 2019年第3期256-276,共21页 Scientia Sinica(Informationis)

基金国家自然科学基金(批准号:61832018 61572025)资助项目

关键词深度学习体系结构硬件设计加速器数字信号处理器(DSP) deep learning architecture hardware design accelerator digital signal processor

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献1

1黎明,黄如.后摩尔时代大规模集成电路器件与集成技术[J].中国科学：信息科学,2018,48(8):963-977. 被引量：19

共引文献18

1王洪鹏,沙于兵,王志华.Chiplet背景下的接口技术与标准化[J].微纳电子与智能制造,2022,4(2):13-21. 被引量：1
2程俊平,周长林,余道杰,徐志坚,张栋耀.基于供电网络传导耦合的FPGA电磁敏感特性分析[J].强激光与粒子束,2019,31(2):60-66. 被引量：3
3吴华.系统级封装用高阻区熔硅制备技术研究[J].数码世界,2019,0(6):75-75.
4刘健,陈弟虎,粟涛.一种FPGA芯片在射频干扰下的失效机理[J].强激光与粒子束,2019,31(9):50-55. 被引量：1
5王吉军,郝子宇,李宏亮.3D-MMA：基于3D集成电路的矩阵乘加速结构[J].计算机工程与科学,2019,41(12):2110-2118.
6王吉军,郝子宇,李宏亮.3D-ACC:基于3D集成电路的卷积神经网络加速结构研究[J].计算机应用研究,2020,37(12):3671-3676. 被引量：1
7杨秀.面向新工科的模拟电子技术课程教学模式探索与实践[J].电脑知识与技术,2020,16(31):200-201. 被引量：4
8邹坦永.集成电路技术与产业的发展演变及启示[J].中国集成电路,2020,29(12):33-41. 被引量：3
9李春泉,刘正伟,林奈,黄红艳,黄健.基于流动散热的蛇形微流道结构优化[J].价值工程,2021,40(30):166-168.
10黎明.三维垂直集成器件与工艺前沿进展[J].微纳电子与智能制造,2021,3(1):4-13. 被引量：1

同被引文献15

1连晓峰,窦丽华,陈杰.中心折反射全方位摄像头的标定方法研究[J].光学技术,2008,34(1):75-78. 被引量：1
2俞晓东,万国春.摄像头模组ESD保护模型分析与电路设计[J].电子技术应用,2015,41(12):36-38. 被引量：4
3刘志成,祝永新,汪辉,田犁,封松林.基于FPGA的卷积神经网络并行加速结构设计[J].微电子学与计算机,2018,35(10):80-84. 被引量：9
4王飞,张雪莲,裴为华,陈弘达.基于CMOS工艺的抗光噪声神经微电极[J].半导体光电,2018,39(5):671-674. 被引量：2
5薛永红,王洪鹏.机器下棋的历史与启示——从“深蓝”到AlphaZero[J].科技导报,2019,37(19):87-96. 被引量：8
6王立文,王友祥,唐雄燕,杨文聪,张雪贝,李沸乐.5G核心网UPF硬件加速技术[J].移动通信,2020,44(1):19-23. 被引量：10
7杨建,傅明驹,徐国强.人工智能基础软硬件架构的关键技术研究[J].信息技术与网络安全,2020,39(3):44-49. 被引量：1
8陈云斌,王全,陆威.MEC硬件加速技术分析[J].移动通信,2020,44(8):7-11. 被引量：1
9张志钰,支斌.浅谈5G核心网规划及建设策略[J].科学技术创新,2020(29):73-74. 被引量：7
10黄震宁,李爱华,张昊,吴玲,董嘉.3GPP R165G核心网技术综述[J].移动通信,2021,45(1):85-89. 被引量：15

引证文献3

1陈曦.5G核心网UPF硬件加速技术研究[J].信息技术与信息化,2021(11):190-192. 被引量：1
2龙诗科,蒋奇航,包友南,王建琦.基于Jetson Nano视觉应用平台设计[J].传感器与微系统,2022,41(9):99-101. 被引量：3
3马春燕,陈晶,姚鼎,张涛.嵌入式智能计算机计算能力评测方法[J].计算机学报,2023,46(11):2279-2301. 被引量：1

二级引证文献5

1郭岐锐.5G核心网SMF和UPF拓扑增强技术解析[J].中国宽带,2023,19(5):27-29.
2李鑫,王树强,李猛,吴磊,张天翼.基于Jetson Nano的视觉识别搬运智能车[J].机电工程技术,2023,52(11):186-190.
3荆旭君,郭永刚,李峰.基于Jetson Nano的农业监测系统的设计与实现[J].现代计算机,2023,29(21):71-76.
4卫易东.CUDA相邻归约与其避免线程分化算法的研究[J].信息与电脑,2023,35(18):55-57.
5李卓.计算机算法设计及数据结构离散性研究[J].科技资讯,2024,22(5):51-53.

1任红伏.这边日落[J].世界文化,2019,0(2):66-66.
2于丹,姜玉峰,陈鹏,刘春庆,王贺龙,高健,魏泽宇.IIR数字滤波器设计与实现[J].科学与信息化,2018,0(12):70-71. 被引量：1
3王飞宇,胡靖.基于FPGA实现粒子群算法解最短路径[J].数字通信世界,2019(1):277-277.
4段垿,李啸骢,邓海力,冀晓诚,彭诚.基于F28335发电机综合控制平台及其云监控系统研制[J].电气开关,2019,57(1):51-55.
5胡君磊,台州市旅游局(图).佛宗道源·山海台州[J].休闲,2018(8):124-127.
6方冉,沈丽娜.一种网格型异构可重构计算系统设计与验证[J].安徽师范大学学报（自然科学版）,2018,41(6):552-556.
7单祥茹.英特尔深度布局5G网络服务,新一代加速卡打造端到端解决方案[J].中国电子商情,2019(3):10-10.
8田芳.浅谈网络环境下计算机硬件安全维护措施[J].科技创新导报,2018,15(35):124-125. 被引量：2
9高浦国.欣闻“巨龙”竞飞腾[J].党的生活（黑龙江）,2018(12):94-94.
10网业创新[J].中国信息安全,2018(12):107-108.

中国科学：信息科学

2019年第3期

浏览历史

内容加载中请稍等...

基于通用向量DSP的深度学习硬件加速技术被引量：3

参考文献1

共引文献18

同被引文献15

引证文献3

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于通用向量DSP的深度学习硬件加速技术 被引量：3

参考文献1

共引文献18

同被引文献15

引证文献3

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于通用向量DSP的深度学习硬件加速技术被引量：3