使用TensorRT进行深度学习推理被引量：24

Using TensorRT for deep learning and inference applications

下载PDF

导出

摘要 TensorRT是一个高性能的深度学习推理平台。它包括一个深度学习推理优化器和运行时为深度学习推理应用程序提供低延迟和高吞吐量。给出了一个使用TensorRT快速构建计算管道的例子,实现通过TensorRT执行智能视频分析的典型应用。该示例演示了使用片上解码器进行解码、使用片上标量进行视频缩放和GPU计算的4个并发视频流。为了演示的简单性,只有一个通道使用NVIDIA TensorRT执行对象标识,并在标识的对象周围生成包围框。该示例还使用视频转换器函数进行各种格式转换,使用EGLImage来演示缓冲区共享和图像显示。最后采用GPU卡V100对ResNet网络进行TensorRT加速性能的实际测试,结果表明TensorRT能够使吞吐量提升大约15倍。 TensorRT is a high-performance deep learning and inference platform.It includes a deep learning and inference optimizer as well as runtime that provides low latency and high throughput for deep learning and inference applications.An example of using TensorRT to quickly build computational pipelines to implement a typical application for performing intelligent video analysis with TensorRT was presented.This example demonstrated four concurrent video streams that used an on-chip decoder for decoding,on-chip scalar for video scaling,and GPU computing.For simplicity of presentation,only one channel used NVIDIA TensorRT to perform object identification and generate bounding boxes around the identified objects.This example also used video converter functions for various format conversions,EGLImage to demonstrate buffer sharing and image display.Finally,the GPU card V100 was used to test the TensorRT acceleration performance of ResNet network.The results show that TensorRT can improve the throughput by about 15 times.

作者周立君刘宇白璐刘飞王亚伟 ZHOU Lijun;LIU Yu;BAI Lu;LIU Fei;WANG Yawei(Xi’an Institute of Applied Optics,Xi’an 710065,China;Xi’an North Electro-optic Science&Technology CO.LTD.,Xi’an 710043,China)

机构地区西安应用光学研究所西安北方光电科技防务有限公司

出处《应用光学》 CAS CSCD 北大核心 2020年第2期337-341,共5页 Journal of Applied Optics

基金装备预先研究兵器工业联合基金(6141B01020205)。

关键词 TensorRT 深度学习推理对象检测统一计算设备架构 TensorRT deep learning and inference object identification compute unified device architecture

分类号 TN219 [电子电信—物理电子学]

引文网络
相关文献

同被引文献191

1蔡彪,沈宽,付金磊,张理泽.基于Mask R-CNN的铸件X射线DR图像缺陷检测研究[J].仪器仪表学报,2020,41(3):61-69. 被引量：38
2李红蕾.构建图形图像数据集的方法概述[J].计算机产品与流通,2020,0(8):97-97. 被引量：3
3李健源,柳春娜,卢晓春,吴必朗.基于改进YOLOv5s和TensorRT部署的鱼道过鱼监测[J].农业机械学报,2022,53(12):314-322. 被引量：8
4王鑫,李琦.基于深度学习的路面缺陷自动检测系统[J].光电子．激光,2022,33(11):1165-1172. 被引量：7
5刘仓.铁路综合视频监控系统分析和应用研究[J].探索科学,2019(2):200-201. 被引量：1
6刘瑞扬.货车运行故障动态图像检测系统(TFDS)的原理与应用[J].中国铁路,2005(5):26-27. 被引量：18
7孙慧文.全自动血气分析仪在临床的应用价值[J].基层医学论坛,2010,14(S1):83-83. 被引量：2
8刘兴民,赵连军.基于GStreamer的远程视频监控系统的关键技术研究[J].计算机应用与软件,2011,28(5):243-246. 被引量：5
9孙俊,杨昌永.论我国矿山环境监测与评价现状[J].山西建筑,2011,37(34):186-188. 被引量：6
10徐鹏,陈思,苏森.互联网应用PaaS平台体系结构[J].北京邮电大学学报,2012,35(1):120-124. 被引量：57

引证文献24

1李良熹,荣进国.基于深度学习的智能烘培类商品识别系统研究[J].信息与电脑,2021,33(13):156-158. 被引量：1
2钟昊,陈博,李占文,杨永成.面向铁路安全的智能视觉PaaS平台研究[J].中国铁路,2021(8):128-132. 被引量：4
3柴荣轩,赵津发,吴航,张文昌,张广,陈炜.基于IPPG的非接触式血氧饱和度检测技术研究[J].医疗卫生装备,2021,42(12):23-28. 被引量：2
4郭智超,徐君明,刘爱东.基于嵌入式平台与优化YOLOv3的航拍目标检测方法[J].兵工自动化,2022,41(3):10-15. 被引量：3
5徐丁天,李海峰,徐良.基于人眼跟踪的360°悬浮显示系统及其畸变校正方法[J].光学学报,2022,42(9):224-232. 被引量：4
6何曦,李良福,王娇颖,王洁,卢晓燕,钱钧,杨一洲,刘培桢.基于NPU的实时深度学习跟踪算法实现[J].应用光学,2022,43(4):682-692. 被引量：3
7贾云飞,郑红木,刘闪亮.基于YOLOv5s的金属制品表面缺陷的轻量化算法研究[J].郑州大学学报（工学版）,2022,43(5):31-38. 被引量：8
8王昀,刘泓,叶珺,刘亚璇,吴小莉.一种基于YoloV4-tiny算法的智能电子秤设计[J].长江信息通信,2022,35(10):37-41. 被引量：1
9刘之禹,李述,王英鹤.基于ZYNQ的深度学习卷积神经网络加速平台设计[J].计算机测量与控制,2022,30(12):264-269. 被引量：3
10马泉,张欣怡,李洪波,石广洋,郝斌,张飞.胜利煤矿智能环境监测系统研究与设计[J].中国煤炭,2023,49(1):77-82. 被引量：1

二级引证文献38

1钟昊,柴金川,宗孝鹏.基于5G的编组站咽喉区异常检测系统[J].铁路计算机应用,2022,31(7):51-57.
2王智,董明利,孙鹏,刘其林,燕必希,王君.超大范围视觉测量双相机联合标定和定向方法[J].激光与光电子学进展,2022,59(14):207-215. 被引量：1
3罗著,陈炜,王孟晋,张广,吴航,马军.高原环境下基于IPPG的非接触血氧饱和度检测方法研究[J].医疗卫生装备,2022,43(10):1-7. 被引量：4
4田方旭,张军.增强现实光学系统虚像视场角测量方法[J].激光与光电子学进展,2022,59(20):176-182. 被引量：1
5王兴智,欧阳八生.基于YOLOv5s的SIM卡壳缺陷检测方法研究[J].机电工程技术,2023,52(1):133-137.
6陈桂力,文宏武.基于深度学习的低压电能表接线盒接线状态智能识别系统[J].广西电力,2022,45(4):81-86. 被引量：2
7蒲家鹏,王雪梅,高宏伟.基于改进YOLOv4的航拍图像目标检测方法研究[J].沈阳理工大学学报,2023,42(3):46-53. 被引量：6
8王静,赵鹏飞,林倩,汪玫倩,刘林盛.基于蓝牙技术的无线智能称重系统[J].现代电子技术,2023,46(10):41-46. 被引量：3
9张震,晋志华,陈可鑫.改进YOLOv5算法在停车场火灾检测中的应用[J].郑州大学学报（工学版）,2023,44(4):16-21. 被引量：3
10张进军.基于全卷积深度学习网络的视频图像背景分割方法研究[J].信息与电脑,2023,35(8):117-119.

1张金迪,沈骏杰.专业GPU计算卡重要参数及其特色技术研究[J].中国新通信,2020,0(1):72-72.
2古广俊.智能视频分析技术在视频监控中的应用[J].数字技术与应用,2019,37(11):100-101. 被引量：7
3张晓晶.基于FPGA的视频缩放设计与实现[J].数字技术与应用,2019,37(11):118-119. 被引量：1
4恩智浦首次推出带有专用神经处理引擎的i.MX应用处理器,支持边缘计算[J].电子产品世界,2020,27(2):91-91.
5王顺权.电动自行车用氢燃料电池动力系统研究[J].电动自行车,2020,0(1):41-44. 被引量：1
6晨光.我们真的需要MQA么?MQA将会如何发展?[J].视听前线,2020,0(3):79-80.
7田乾元,徐朝阳,赵泉.基于GPU的软件雷达信号处理[J].舰船电子对抗,2020,43(1):58-63. 被引量：6
8王顺权.电动自行车用氢燃料电池动力系统研究[J].江苏科技信息,2020,37(4):49-51. 被引量：2
9沈丽宁,兰富强,徐勇勇,李岳峰,胡建平.卫生健康信息对象标识编码层级与基本规则研究[J].中国卫生信息管理杂志,2019,16(6):694-698. 被引量：5
10刘世芳,赵永华,于天禹,黄荣锋.广义稠密对称特征问题标准化算法在GPU集群上的有效实现[J].计算机科学,2020,47(4):6-12.

应用光学

2020年第2期

浏览历史

内容加载中请稍等...

使用TensorRT进行深度学习推理被引量：24

同被引文献191

引证文献24

二级引证文献38

相关作者

相关机构

相关主题

浏览历史

使用TensorRT进行深度学习推理 被引量：24

同被引文献191

引证文献24

二级引证文献38

相关作者

相关机构

相关主题

浏览历史

使用TensorRT进行深度学习推理被引量：24