一种类CPU的深度学习协处理器架构被引量：2

下载PDF

导出

摘要深度学习是当前人工智能领域的关键技术之一,它在图像识别、语音识别、自然语言处理等领域均取得了突破性的成绩,大大推进了人工智能的发展。然而,随着深度学习的发展,它的核心问题也愈显突出,如高计算量、高数据带宽、应用碎片化等,这些问题成为近年来制约相关技术发展的关键因素。本文融合了CPU和专用处理器各自的优势,提出了一种类CPU的深度学习协处理器架构,该架构具有可灵活编程、高计算密度等的特点,同时,由于该处理器还采用了存算紧耦的计算架构,因此能有效重复利用权重等数据,降低了对带宽的需求。本文从硬件架构、软件架构、软件编程模型、软件运行模型等多个角度介绍类CPU的深度学习协处理器架构,同时基于该架构的处理器芯片也已经在28nm下流片成功,进一步验证了该架构的可行性。 Deep learning is one of the key technologies in the field of artificial intelligence.It has made breakthroughs in image recognition,speech recognition,natural language processing and other fields,greatly promoting the development of artificial intelligence.However,with the development of deep learning,its core problems are more and more prominent,such as high computation,high data bandwidth,application fragmentation,etc.,which have become the key factors restricting the development of related technologies in recent years.This paper combines the advantages of CPU and special processor,and proposes a kind of deep learning coprocessor architecture of CPU.This architecture has the characteristics of flexible programming,high computing density,etc.at the same time,because the processor also uses the memory computing tight coupling computing architecture,it can effectively reuse the weight and other data,reducing the demand for bandwidth.This paper introduces the architecture of CPU like deep learning coprocessor from the aspects of hardware architecture,software architecture,software programming model,software running model,etc.at the same time,the processor chip based on the architecture has been successfully tape out at 28nm,which further verifies the feasibility of the architecture.

作者丁然林建文朱振华刘弋波

机构地区珠海全志科技股份有限公司

出处《中国集成电路》 2020年第7期41-52,共12页 China lntegrated Circuit

基金 “广东省重点领域研发计划项目资助(2019B010140002)”

关键词深度学习处理器存算紧耦 Deep learning Processor Memory computing tight coupling

分类号 TP332 [自动化与计算机技术—计算机系统结构] TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

同被引文献19

1姚丽丽.基于MQTT协议的数据断点续传方案研究[J].物联网技术,2020,10(10):30-32. 被引量：10
2万鹏,杜桐,李丹,刘秋明,肖贺.物联网管理平台后端开发研究[J].大众科技,2020,22(9):4-7. 被引量：3
3徐绍峰,陈静轩,刘都鑫,蔡希昌,鲍志平,陈钰婷,刘通,于东池,乔子凌.基于树莓派4B及Jetson Nano的多路音频采集传输系统[J].工业技术创新,2020,7(6):40-44. 被引量：6
4张辉.人工智能技术在物联网中的运用探析[J].中国设备工程,2021(1):28-29. 被引量：3
5余文科,程媛,李芳,赵琦.物联网技术发展分析与建议[J].物联网学报,2020,4(4):105-109. 被引量：31
6张萍,胡应坤.基于ZigBee和OneNET云平台的智能农业温控系统[J].物联网技术,2021,11(1):25-28. 被引量：11
7王文峰,高莹莹.基于ZigBee组网技术的智慧病房系统设计[J].物联网技术,2021,11(1):93-94. 被引量：5
8林坤林,黄成丽.基于Zigbee的环境温湿度信息采集系统设计[J].信息与电脑,2020,32(24):76-78. 被引量：2
9王美玲.物联网和大数据驱动下的智慧监管体系建设研究[J].信息系统工程,2020,33(12):47-48. 被引量：2
10卫泽刚,侯一凡,张小丹,刘飞,钱郁.微生物操作分类单元划分算法研究[J].宝鸡文理学院学报（自然科学版）,2022,42(1):80-88. 被引量：3

引证文献2

1李兵,肖茂翔.基于物联网的家居环境监测预警系统设计[J].物联网技术,2021,11(11):18-21. 被引量：6
2张小丹,杨严硕,胡婉靖,王亚峰,肖春杨.SIMD指令及其在C++编程语言中的应用[J].科技视界,2024,14(8):15-17. 被引量：1

二级引证文献7

1陈锐彬,叶成彬,李安娜,陈楷昀,方佐贤.一种物联网型的电能监控排插[J].单片机与嵌入式系统应用,2022,22(2):18-21. 被引量：2
2张卓.基于物联网的家居环境监测预警系统设计分析[J].科技创新导报,2021,18(30):34-36.
3朱小利.智能家居室内温湿度远程监测系统——云平台的应用设计[J].湖北工业职业技术学院学报,2022,35(5):63-68. 被引量：5
4艾亮东,艾文轩.物联网下餐饮行业的可燃气体测控技术研究[J].中国高新科技,2023(3):57-59.
5姚振龙,汪明涛,黄幸成,庄根富,程李奇.物联网模式下的土壤肥力检测与污染治理系统[J].福建电脑,2023,39(10):110-113.
6彭可,胡有章,刘宏胜,张志成,贺劢勍,宋雨情,崔焱.基于物联网远程监控的太阳能定向跟踪系统设计[J].电工技术,2024(6):17-22.
7柴可星,李伟成.C语言与C++语言几点差异的应用[J].智能城市应用,2024,7(10):89-92.

1柴卓,杨卉.多接入边缘计算MEC技术及业务发展对策研究[J].信息通信,2020(5):222-223. 被引量：2
2CEVA发布业界首个高性能传感器中枢DSP架构SensPro^TM[J].传感器世界,2020,26(4):42-43.
3桂祚勤,孟涛,崔广财,林存花,陈浩涓.高速SSL协议芯片关键技术研究[J].计算机技术与发展,2020,30(6):94-98. 被引量：1
4赵云鹏,池骋,周梦,郑艳,孙璐,王晓伟,张俊.一种高传输带宽海量数据高性能固态存储技术[J].航天器工程,2020,29(3):162-168. 被引量：2
5师腾,师海忠.互连网络的模p剩余类加群的笛卡尔积模型[J].计算机科学,2020,47(S01):299-304.
6徐红艳,普蓉,黄法欣,王嵘冰.基于网格和密度比的DBSCAN聚类算法研究[J].计算机与数字工程,2020,48(6):1269-1274. 被引量：4
7金炳哲,员钦升,曹士杰,邵梦麟,奚博文.基于IEC 61850的标准船用电子式互感器处理模块的研究[J].柴油机,2020,42(4):18-21.
8阳王东,王昊天,张宇峰,林圣乐,蔡沁耘.异构混合并行计算综述[J].计算机科学,2020,47(8):5-16. 被引量：12
9陆树汉,周健,丁小健,杨云帆,李小兵,王建辉,王春辉,黄创绵,王远航.电机设备远程运维云平台的边缘装置研发[J].电机与控制应用,2020,47(7):87-92. 被引量：1
10张磊,王健.超大规模集成电路倒装焊设计技术研究[J].中国集成电路,2020,29(7):85-89. 被引量：1

中国集成电路

2020年第7期

浏览历史

内容加载中请稍等...

一种类CPU的深度学习协处理器架构被引量：2

同被引文献19

引证文献2

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

一种类CPU的深度学习协处理器架构 被引量：2

同被引文献19

引证文献2

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

一种类CPU的深度学习协处理器架构被引量：2