期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
信号处理与深度学习硬件加速的一致性计算结构 被引量:2
1
作者 高彦钊 陶常勇 《国防科技大学学报》 EI CAS CSCD 北大核心 2023年第2期112-120,共9页
在计算需求层面对多种典型信号处理算法与深度学习算法进行了分析与模块化分解,提取了两类应用共有的且适合并行硬件加速的计算模块,提出了信号处理与深度学习的一致性计算模型,并基于一致性计算模型设计了控制与计算分离的层次化处理... 在计算需求层面对多种典型信号处理算法与深度学习算法进行了分析与模块化分解,提取了两类应用共有的且适合并行硬件加速的计算模块,提出了信号处理与深度学习的一致性计算模型,并基于一致性计算模型设计了控制与计算分离的层次化处理单元与阵列化计算结构。通过对不同应用计算过程的软件定义能够实现信号处理与深度学习的一致性硬件加速计算,基于Zynq计算平台从重构效率与计算性能两个方面对一致性计算模型与计算结构进行了验证,结果表明:基于一致性计算模型的软件定义可重构计算结构,具有较高的计算性能与重构效率。 展开更多
关键词 深度学习 信号处理 硬件加速 计算结构
下载PDF
基于FPGA的激光粒度仪数据采集系统
2
作者 陶常勇 陈兴梧 魏永杰 《微计算机信息》 2009年第14期160-161,141,共3页
本文采用ALTERA公司Cyclone系列的FPGA芯片和IP核PCI_t32,设计了可应用于LSA系列激光粒度测试仪的数据采集系统,并在FPGA内部实现了系统的控制逻辑和PCI总线接口。该系统利用AD7321可为112路模拟信号提供一个12位采样精度的数据采集通道... 本文采用ALTERA公司Cyclone系列的FPGA芯片和IP核PCI_t32,设计了可应用于LSA系列激光粒度测试仪的数据采集系统,并在FPGA内部实现了系统的控制逻辑和PCI总线接口。该系统利用AD7321可为112路模拟信号提供一个12位采样精度的数据采集通道,系统的数据平均传输速率达到了3Mbps。利用该数据采集系统对标准粒子板的测量结果符合ISO13320标准的要求,这表明该系统满足了设计的要求。 展开更多
关键词 FPGA 激光粒度测量 IP核 PCI总线
下载PDF
人工神经网络加速方法综述与研究
3
作者 陶常勇 高彦钊 +1 位作者 王元磊 张兴明 《天津科技》 2019年第S01期28-30,共3页
针对人工神经网络计算密集型和数据密集型的计算特点,在分析了当前常见的硬件加速架构的基础上,提出了一种可重构众核加速阵列的逻辑结构,包括规则控制层、数据缓存层和乘加算粒层,在数据缓存层上还构建片上网络,实现数据在各处理节点... 针对人工神经网络计算密集型和数据密集型的计算特点,在分析了当前常见的硬件加速架构的基础上,提出了一种可重构众核加速阵列的逻辑结构,包括规则控制层、数据缓存层和乘加算粒层,在数据缓存层上还构建片上网络,实现数据在各处理节点之间的流动。该结构突破了冯诺依曼内存墙的问题,实现了计算存储一体化的近数据计算。 展开更多
关键词 神经网络 众核架构 近数据计算 片上网络
下载PDF
分布式机会阵雷达拟态信号处理方法 被引量:2
4
作者 高彦钊 王建明 +2 位作者 雷志勇 张宇 陶常勇 《现代雷达》 CSCD 北大核心 2021年第11期1-8,共8页
针对分布式机会阵雷达多功能一体化条件下信号处理高性能、高效能与高灵活兼顾的需求,基于拟态计算技术,提出了拟态信号处理方法,对算粒抽象、构件实现、互连结构、存储结构以及处理流程等进行了设计,并在由现场可编程门阵列、数字信号... 针对分布式机会阵雷达多功能一体化条件下信号处理高性能、高效能与高灵活兼顾的需求,基于拟态计算技术,提出了拟态信号处理方法,对算粒抽象、构件实现、互连结构、存储结构以及处理流程等进行了设计,并在由现场可编程门阵列、数字信号处理以及PowerPC等组成的异构计算平台上构建了拟态信号处理验证系统,最后针对空时自适应处理、脉冲多普勒以及大斜视合成孔径雷达成像等典型分布式机会阵雷达工作模式对拟态信号处理方法的性能、灵活性、计算正确性以及重构效率等进行了全面验证。验证结果表明:拟态信号处理方法在有效提升信号处理性能的同时,能够获得分布式机会阵雷达多种工作模式下信号处理的高灵活性。 展开更多
关键词 分布式机会阵 拟态计算 雷达信号处理
下载PDF
基于RISC-V的近数据计算系统设计方法
5
作者 陶常勇 高彦钊 +1 位作者 王元磊 张兴明 《火控雷达技术》 2020年第3期92-100,共9页
针对信号处理和深度学习中存在大量规律乘加计算的特点,基于RISC-V开源指令集,提出了一种将控制与计算解耦的近数据计算系统设计方法,包括RISC-V控制指令集设计与近数据计算加速阵列设计两个部分。其中加速阵列包括数据RAM、微码表RAM... 针对信号处理和深度学习中存在大量规律乘加计算的特点,基于RISC-V开源指令集,提出了一种将控制与计算解耦的近数据计算系统设计方法,包括RISC-V控制指令集设计与近数据计算加速阵列设计两个部分。其中加速阵列包括数据RAM、微码表RAM、乘加算粒和片上网络,控制指令集部分包括数据搬移指令、微码配置指令和计算控制指令,两者的结合大幅降低了RISC-V内核计算负担,提高了计算并行度,并有利于在硬件平台上的弹性部署。 展开更多
关键词 RISC-V 微码近数据计算 片上网络
下载PDF
跨时钟域处理逻辑的EDA验证方法研究 被引量:1
6
作者 徐庆阳 汪欣 +3 位作者 陈艇 田晓旭 刘冬培 陶常勇 《电子技术(上海)》 2020年第2期25-27,共3页
通过增加时钟抖动和数据传输抖动,提供一种在EDA验证阶段对跨时钟域处理逻辑正确性检查的手段,有利于发现跨时钟域逻辑处理问题,保证验证充分性。
关键词 集成电路设计 跨时钟域处理 随机传输延时 异步FIFO
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部