-
题名深度学习节点分配的遗传算法设计
被引量:3
- 1
-
-
作者
蔡恒雨
郑启龙
-
机构
中国科学技术大学计算机科学与技术学院
中国科学技术大学国家高性能计算中心
-
出处
《小型微型计算机系统》
CSCD
北大核心
2021年第6期1158-1164,共7页
-
基金
国家核高基重大专项项目(2012ZX01034-001-001)资助.
-
文摘
随着深度学习技术的快速发展,模型的结构越来越复杂,需要的计算资源和存储资源也越来越多.单核计算设备通常无法满足深度学习的需求,通常将深度学习模型部署在众核和分布式计算设备上.BWDSP众核虚拟平台具有较强的计算能力和较大的存储资源,提供的并行通信接口MPIRIO适合深度学习模型的部署.本文基于BWDSP众核虚拟平台和并行通信接口MPIRIO,使用遗传算法优化深度学习模型在BWDSP虚拟平台上的部署,加速深度学习模型的训练过程.设计了静态遗传算法和动态遗传算法两种算法,优化了深度学习模型计算节点在BWDSP虚拟平台上的分配,实现了虚拟平台上的深度学习模型加速,并通过实验证明了两种遗传算法的有效性.
-
关键词
深度学习
BWDSP
众核虚拟平台
MPIRIO
静态遗传算法
动态遗传算法
-
Keywords
deep learning
BWDSP
many core virtual platform
MPIRIO
static genetic algorithm
dynamic genetic algorithm
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名国产BWDSP的并行通信接口设计
被引量:2
- 2
-
-
作者
蔡恒雨
宁成明
侯璇
郑启龙
-
机构
中国科学技术大学计算机科学与技术学院
中国科学技术大学国家高性能计算中心
-
出处
《小型微型计算机系统》
CSCD
北大核心
2021年第5期897-904,共8页
-
基金
国家核高基重大专项项目(2012ZX01034-001-001)资助.
-
文摘
BWDSP系列处理器是由中国电子科技集团公司第38研究所研制的国产DSP芯片,具有较强的计算能力.在BWDSP芯片的基础上,研发了以RapidIO为交换协议的BWDSP虚拟平台.为解决BWDSP虚拟平台提供的通信原语难以调用的问题,本文借鉴Message Passing Interface(MPI)标准规范,设计了基于虚拟平台的并行通信库——Message Passing Interface of RapidIO(MPIRIO).MPIRIO采取分层架构实现,在底层以RapidIO作为数据通信协议,在上层提供了点对点通信和群集通信函数接口.MPIRIO在MPI群集通信的基础上,提供了优化的群集通信函数,并结合BWDSP体系结构特点,为神经网络卷积运算等操作提供了优化.最后对本文设计的MPIRIO进行了仿真实验,并与MPICH进行了对比实验,表明本文设计的MPIRIO提高了BWDSP虚拟平台的可用性,并验证了MPIRIO的优点.
-
关键词
BWDSP
RAPIDIO
MPI
并行通信库
卷积操作
群集通信
-
Keywords
BWDSP
RapidIO
MPI
parallel communication library
convolution operation
cluster communication
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名基于RapidIO的多DSP互联仿真实现
被引量:5
- 3
-
-
作者
蔡恒雨
凤维杰
丁上义
卢茂辉
郑启龙
-
机构
中国科学技术大学计算机科学与技术学院
-
出处
《计算机系统应用》
2020年第7期95-102,共8页
-
基金
国家核高基重大专项(2012ZX01034-001-001)。
-
文摘
RapidIO协议作为数据通信协议之一在嵌入式系统开发中具有重要作用,适合短距离,需要多处理单元合作的应用场景,例如多DSP构成的板卡系统.BWDSP芯片作为一款高性能数字信号处理器,其丰富的计算资源在雷达信号处理等领域具有重要潜力.硬件设计开发中,直接采用已有数据通信协议很难适配具体硬件资源导致最终产品的数据传输性能较低.因此需要结合具体硬件模型,进行数据通信交换模型仿真建模设计,提高数据传输效率.本文首先介绍了RapidIO协议和BWDSP体系架构,然后设计了基于SystemC语言的串行RapidIO交换模型,最后设计实现了BWDSP虚拟平台.本文设计的BWDSP虚拟平台功能符合实际RapidIO协议标准,对硬件产品开发具有一定指导意义.
-
关键词
RAPIDIO
BWDSP
SYSTEMC
交换模型
虚拟平台
-
Keywords
RapidIO
BWDSP
SystemC
exchange model
virtual platform
-
分类号
TN915.04
[电子电信—通信与信息系统]
-
-
题名HXDSP异构计算框架的设计与优化
被引量:4
- 4
-
-
作者
宁成明
蔡恒雨
郑启龙
耿锐
-
机构
中国科学技术大学计算机科学与技术学院
中国科学技术大学高性能计算安徽省重点实验室
安徽芯纪元科技有限公司
-
出处
《小型微型计算机系统》
CSCD
北大核心
2022年第1期179-185,共7页
-
基金
国家核高基重大专项项目(2012ZX01034-001-001)资助。
-
文摘
由于CPU在处理海量数据时所面临的性能瓶颈,使得基于异构系统的异构并行计算成为并行计算领域的研究热点之一.HXDSP是中国电子科技集团第三十八所自主研制的DSP芯片,能满足多种高性能计算领域的需求.为了充分发挥HXDSP的计算能力以及多HXDSP设备并行计算的能力,本文设计了基于OpenCL的HXDSP异构计算框架.本文根据计算任务的特性设计了不同的OpenCL设备映射方式,使得HXDSP异构计算框架能适应不同的应用场景,充分利用HXDSP的计算资源并节省能耗.本文在HXDSP异构计算框架设计完成的基础上针对HXDSP异构计算应用程序进行优化,包括数据传输优化和数据访问优化.最后本文通过实验分析了HXDSP异构计算框架的程序性能,验证了HXDSP异构计算框架的可行性以及有效性.
-
关键词
HXDSP
异构计算
OPENCL
程序性能优化
-
Keywords
HXDSP
heterogeneous computing
OpenCL
program performance optimization
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-