基于FPGA的CNN应用加速技术被引量：6

An acceleration technique for CNN application based on FPGA

下载PDF

导出

摘要 FPGA(现场可编程门阵列)作为人工智能应用的新加速载体,可替GPU对人工智能应用推理阶段进行加速。文中提出了一种新的人工智能应用加速方案,利用定点、矩阵压缩等方法对卷积神经网络(CNN)模型进行处理,优化CNN网络模型,并设计开发一套驱动软件框架以适配国产平台。该技术在飞腾1500A国产服务器上对卷积神经网络中的人脸识别与目标检测应用进行加速,运算性能较目前国产服务器运算能力提升30倍以上,实现自主可控的人工智能应用加速。 As an innovative accelerator in application of artificial intelligence,FPGA is supposed to replace GPU to accelerate artificial intelligence in inference link.In this paper,a new scheme to accelerate CNN based applications is put forward,which uses quantization and matrix-compression to optimize CNN model,and develop a software framework to fit domestic server.Compared with latest domestic server,the running time which uses FPGA to accelerate face recognition application and target detection application base on CNN is 30 times faster than domestic server.Thus it can study out an independently controllable computing platform for artificial intelligence application.

作者丁立德胡怀湘 DING Li-de;HU Huai-xiang(North China Institute of Computing Technology,Beijing 100083,China)

机构地区华北计算技术研究所

出处《信息技术》 2019年第12期110-115,共6页 Information Technology

关键词计算机应用技术深度学习国产服务器现场可编程门阵列卷积神经网络 computer applications technology deep-learning domestic server FPGA convolutional neural network

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献5

1赵彤,乔庐峰,陈庆华.一种基于FPGA的CNN加速器设计[J].通信技术,2019,52(5):1242-1248. 被引量：6
2罗靖遥,黄征.基于CNN分类器和卷积的目标检测[J].信息技术,2017,41(9):101-104. 被引量：8
3吴艳霞,梁楷,刘颖,崔慧敏.深度学习FPGA加速器的进展与趋势[J].计算机学报,2019,42(11):2461-2480. 被引量：58
4黄琳,蒋为,杨铁军.基于Caffe框架的人脸定位与识别系统的设计[J].计算机时代,2019,0(6):56-58. 被引量：4
5李彦峰.深度学习在GPU上的计算优化[J].信息与电脑,2018,30(13):16-18. 被引量：5

二级参考文献8

1沈绪榜,张发存,冯国臣,车得亮,王光.计算机体系结构的分类模型[J].计算机学报,2005,28(11):1759-1766. 被引量：10
2徐晓.计算机视觉中物体识别综述[J].电脑与信息技术,2013,21(5):4-6. 被引量：8
3顾乃杰,赵增,吕亚飞,张致江.基于多GPU的深度神经网络训练算法[J].小型微型计算机系统,2015,36(5):1042-1046. 被引量：8
4芮挺,费建超,周遊,方虎生,朱经纬.基于深度卷积神经网络的行人检测[J].计算机工程与应用,2016,52(13):162-166. 被引量：73
5李冠楠.基于人脸识别企业考勤系统的研究[J].计算机时代,2017(4):53-55. 被引量：2
6景晨凯,宋涛,庄雷,刘刚,王乐,刘凯伦.基于深度卷积神经网络的人脸识别技术综述[J].计算机应用与软件,2018,35(1):223-231. 被引量：94
7党永成.人脸识别技术综述及分析[J].电子技术与软件工程,2018(3):158-158. 被引量：15
8金诗谱,康彦,张书茂.基于大数据的深度学习技术在人脸识别中的应用[J].重庆科技学院学报（自然科学版）,2018,20(2):66-68. 被引量：3

共引文献76

1陈晓武,刘国华,雷尚平.机器视觉平台在钢铁制造业的实现与应用[J].冶金自动化,2020,44(S01):197-201. 被引量：4
2杜忠文,李庚霖,蒋菡,褚江恒,伍俊.基于次级缓存的SDRAM调度策略的研究[J].电子测量技术,2023,46(14):37-42. 被引量：1
3富凤丽,佴磊,李广杰,赵淑云.中里滑坡反分析及强度参数取值研究[J].长春科技大学学报,2000,30(2):165-169. 被引量：24
4张舰.父亲(外一首)[J].岁月,2000(7):60-60.
5龚思宏.预测人眼扫视路径的新方法[J].电子技术与软件工程,2018(3):80-81.
6徐乐,刘翔,张华.基于SSD的道路前方车辆检测[J].软件导刊,2019,18(5):27-30. 被引量：4
7贾艳洁,陈曦,于洁琼,王连明.基于特征语谱图和自适应聚类SOM的快速说话人识别[J].科学技术与工程,2019,19(15):211-218. 被引量：5
8陈辰,柴志雷,夏珺.基于Zynq7000 FPGA异构平台的YOLOv2加速器设计与实现[J].计算机科学与探索,2019,13(10):1677-1693. 被引量：20
9李雷孝,刘燕凤,高静.Smith-Waterman算法优化改进与Spark并行化研究[J].内蒙古农业大学学报（自然科学版）,2019,40(5):76-85. 被引量：2
10杨博文,杨海涛,高浩浩.CNN加速器中卷积计算单元的硬件设计[J].数字技术与应用,2019,37(10):136-137. 被引量：2

同被引文献44

1王潇.一种基于风光互补电源的无线监控系统[J].工矿自动化,2021,47(S01):81-81. 被引量：2
2蒋敏,王寒寒.VHDL语言与数字系统的设计[J].科技风,2010(24). 被引量：2
3王正勇.基于FPGA的交通信号控制器的设计[J].电子测量技术,2008,31(10):188-190. 被引量：7
4王代华,宋林丽,孔祥善,张志杰.草原环境地表无线信道的路径损耗建模[J].光学精密工程,2012,20(6):1406-1413. 被引量：17
5回天,哈力旦.阿布都热依木,杜晗.结合Faster R-CNN的多类型火焰检测[J].中国图象图形学报,2019,24(1):73-83. 被引量：31
6周亚男,赵威,范亚男.遥感大数据实时渲染与交互可视化研究[J].地球信息科学学报,2016,18(5):664-672. 被引量：8
7胡晓东,张新,屈靖生.大数据架构的遥感资源存储管理方法[J].地球信息科学学报,2016,18(5):681-689. 被引量：9
8徐明迪,严飞,张帆.静态可信度量根安全证明方法[J].武汉大学学报（理学版）,2016,62(3):225-229. 被引量：1
9王群,李馥娟.可信计算技术及其进展研究[J].信息安全研究,2016,2(9):834-843. 被引量：8
10张增祥,汪潇,温庆可,赵晓丽,刘芳,左丽君,胡顺光,徐进勇,易玲,刘斌.土地资源遥感应用研究进展[J].遥感学报,2016,20(5):1243-1258. 被引量：60

引证文献6

1周敦凯.基于可信计算的嵌入式系统安全设计[J].自动化与仪器仪表,2020(10):81-84. 被引量：4
2陈春先,曲鸣飞,辛义,张丽.基于Spantan3E-100CP132的红绿灯控制系统设计实现[J].科学技术创新,2021(3):92-93.
3侯易呈,王慧琴,王可.改进的多尺度火焰检测方法[J].液晶与显示,2021,36(5):751-759. 被引量：9
4谭金林,范文童,刘亚虎,梁志锋,王梁,刘斌,黄斌.基于软硬件协同加速框架的遥感图像目标检测[J].计算机与现代化,2022(6):109-115. 被引量：1
5宋宜轩,宫新保.基于DNN压缩感知的无线分布式野外实时监测系统[J].信息技术,2022,46(8):88-92.
6折夏煜,刘玉宏,王杨圣,郭刚,王海滨,王亮,韩光洁.数据集与网络结构对基于FPGA的CNN加速器的抗软错误性能的影响[J].小型微型计算机系统,2023,44(11):2510-2515.

二级引证文献14

1涂沛驰,傅钰雯,熊宇璇,杨健晟.基于YOLOv5网络模型的火焰检测[J].智能计算机与应用,2022,12(3):158-161. 被引量：4
2姬一文,杨钊,王玉成,杨诏钧,康昱.基于长短码联合控制的程序完整性校验方法[J].信息技术与网络安全,2021,40(4):1-6.
3缪存可,杨炼,姜玥颖.基于神经网络的视频图像火焰检测方法[J].自动化应用,2021(4):71-74. 被引量：2
4葛红舞,陈民.一种可信万兆加密分流认证装置研究[J].信息通信技术与政策,2021(11):79-83.
5吕卓,郭志民,陈岑,莫坚松,常朝稳.面向智能电网嵌入式设备的网络威胁动态评估方法[J].北京航空航天大学学报,2022,48(2):324-330. 被引量：6
6黄均才,刘鉴栋,闫云凤,齐冬莲.基于高斯建模的电力场景明火检测[J].浙江电力,2022,41(10):27-33.
7杨天宇,王海瑞.基于改进YOLOv3融合特征的火焰目标检测方法[J].农业装备与车辆工程,2022,60(11):68-72. 被引量：1
8赵端,李涛,董彦强,王志强,刘春.基于边缘智能的煤矿外因火灾感知方法[J].工矿自动化,2022,48(12):108-115. 被引量：4
9魏伦胜,徐望明,张景元,陈彬.基于高效全局上下文网络的轻量级烟火检测算法[J].液晶与显示,2023,38(1):118-127.
10马庆禄,鲁佳萍,唐小垚,段学锋.改进YOLOv5s的公路隧道烟火检测方法[J].浙江大学学报（工学版）,2023,57(4):784-794. 被引量：6

1倪蓉.腹腔镜结直肠癌围手术期中加速康复外科护理的应用体会[J].实用临床护理学电子杂志,2019,4(37):61-61. 被引量：2
2黄文婷,许方婵,刘臻.加速康复外科对直肠癌合并糖尿病患者的护理效果及睡眠时间影响[J].世界睡眠医学杂志,2019,6(10):1410-1412. 被引量：5
3胡博,刘俊.“金融+科技” 焕发银行网点服务新活力[J].中国金融电脑,2019(11):25-28. 被引量：4
4孙燕齐,鄢楚平.基于虚拟FPGA的数据库运算加速装置设计[J].信息技术,2019,43(12):159-164. 被引量：1
5程康文,王贵和,束宽山,郑明,刘红霞,唐爱平,左伯海,王振兴,王亚娟,胡文君,马冬花.加速康复外科在腹腔镜辅助胃癌根治术中的应用及其对患者术后恢复、营养及应激的影响[J].中国普通外科杂志,2019,28(10):1228-1236. 被引量：64
6刘燕萍.加速康复外科护理运用于结肠癌围手术期临床分析[J].医药界,2019,0(5):0197-0197.
7夏旭田.创建世界级先进制造业产业集群[J].大学科普,2019,13(4):6-6.
8韩增霞.肥羔羊舍饲育肥技术[J].畜牧兽医科学（电子版）,2019,0(19):93-94. 被引量：1
9马丽君,蔡品云.加速康复外科护理方法对全膝关节置换术后患者恶心和呕吐的影响[J].当代护士（下旬刊）,2019,26(12):71-73. 被引量：4
10刘丹,段小芳,熊刚.一种基于FPGA和DSP的UHF RFID接收平台设计[J].通信技术,2019,52(12):3085-3089.

信息技术

2019年第12期

浏览历史

内容加载中请稍等...

基于FPGA的CNN应用加速技术被引量：6

参考文献5

二级参考文献8

共引文献76

同被引文献44

引证文献6

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

基于FPGA的CNN应用加速技术 被引量：6

参考文献5

二级参考文献8

共引文献76

同被引文献44

引证文献6

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

基于FPGA的CNN应用加速技术被引量：6