期刊文献+
共找到99篇文章
< 1 2 5 >
每页显示 20 50 100
基于FPGA和多核DSP的雷达信号处理架构设计 被引量:1
1
作者 郑东卫 白亚莉 《火控雷达技术》 2023年第2期84-90,共7页
本文首先列出了信号处理系统开发设计流程,然后根据设计参数分析算法和硬件平台的选择。文中重点分析了多核DSP中算法数据流传输与划分,核间通信与同步。最后给出了多核DSP的存储空间和传输时间以及计算时间的分析。
关键词 资源估计 多核dsp 系统架构
下载PDF
基于多核DSP上下文环境备份与恢复方案的设计与实现 被引量:1
2
作者 符超 吴翼虎 钱宏文 《电子技术应用》 2023年第8期114-118,共5页
在软件定义计算体系架构中,DSP作为一种常用的硬件资源,势必向虚拟化发展,以便最大化发挥其效能。提出了一种多核DSP上下文环境的备份与恢复的方案,以核0为控制核心,通过合理地内存分配以及读写操作,完成对其余核心在计算过程中的各状态... 在软件定义计算体系架构中,DSP作为一种常用的硬件资源,势必向虚拟化发展,以便最大化发挥其效能。提出了一种多核DSP上下文环境的备份与恢复的方案,以核0为控制核心,通过合理地内存分配以及读写操作,完成对其余核心在计算过程中的各状态,如寄存器状态、堆栈状态、数据状态以及程序状态的保存与写回,实现了其从计算任务M切换到计算任务N,待N完成后再切换回M继续执行的功能;使用TI公司66AK2H14对方案作测试,验证了其可行性。该方案对多核DSP硬件资源的灵活应用提供了实际的方法和经验。 展开更多
关键词 多核dsp 上下文环境 备份 恢复
下载PDF
基于DSP的海上红外小目标检测系统设计 被引量:1
3
作者 李雷 张晔 胡楷 《现代电子技术》 2023年第4期30-34,共5页
针对海天背景下红外小目标检测实时性低的问题,文中结合DSP硬件特征、算法需求和系统要求,提出一种以多核DSP为核心处理器的红外小目标检测系统实现方案。区别于常规的串行处理方式,该方案采用DSP双核流水处理的软件架构,将海天线检测... 针对海天背景下红外小目标检测实时性低的问题,文中结合DSP硬件特征、算法需求和系统要求,提出一种以多核DSP为核心处理器的红外小目标检测系统实现方案。区别于常规的串行处理方式,该方案采用DSP双核流水处理的软件架构,将海天线检测算法和红外小目标检测算法分别运行在DSP的核1和核2,实现两套算法的并行处理;并通过核0主程序的调度实现海上红外小目标检测功能。在此基础上,采用查找表替代实时计算系数、优化计算过程最大化减少指令流水被打断、软硬件并行处理减少软件负载等方法对软件进行优化,提高软件效率。最后,在红外检测跟踪系统中对实时性和准确性进行应用验证。结果表明,所设计系统处理640×512的红外图像耗时小于25 ms,满足海上红外小目标实时检测的要求。 展开更多
关键词 小目标检测 多核dsp 双核流水处理 并行处理 红外图像 软件优化 实时检测
下载PDF
基于多核DSP的矢量高效QR分解技术
4
作者 张宇帆 陈颖 +1 位作者 方科 费霞 《电讯技术》 北大核心 2023年第4期536-543,共8页
以多核数字信号处理器(Digital Signal Processor,DSP)作为计算节点的多核DSP集群系统成为一大发展趋势。当前阶段,由于多核DSP内核硬件资源利用不充分与访存带宽限制,峰值性能与实际性能间存在鸿沟。基于C66x内核丰富的指令集架构以及... 以多核数字信号处理器(Digital Signal Processor,DSP)作为计算节点的多核DSP集群系统成为一大发展趋势。当前阶段,由于多核DSP内核硬件资源利用不充分与访存带宽限制,峰值性能与实际性能间存在鸿沟。基于C66x内核丰富的指令集架构以及运算指令编排原则,结合编译器提供的汇编信息,设计并优化了QR分解算法,在充分挖掘DSP单核性能极致的同时减少了矩阵分解的计算时间。根据掌握的优化技术,设计并实现基于多核DSP集群系统的大规模并行QR分解模型,并在分布式计算框架上完成了分解任务。分析结果表明,优化后的QR分解计算效率以及C66x单核硬件资源使用率均提升了二十余倍,随着待分解矩阵规模的成倍增加,多核DSP集群相比于单核的计算性能提升也愈加明显。 展开更多
关键词 多核数字信号处理器(dsp) QR分解 软件优化 分布式计算
下载PDF
多核数字信号处理卷积算法并行优化
5
作者 许金伟 王庆林 +4 位作者 李娅琳 姜晶菲 高蕾 李荣春 李东升 《国防科技大学学报》 EI CAS CSCD 北大核心 2024年第1期103-112,共10页
针对国防科技大学自主研发的异构多核数字信号处理(digital signal processing, DSP)芯片的特征以及卷积算法自身特点,提出了一种面向多核DSP架构的高性能多核并行卷积实现方案。针对1×1卷积提出了特征图级多核并行方案;针对卷积... 针对国防科技大学自主研发的异构多核数字信号处理(digital signal processing, DSP)芯片的特征以及卷积算法自身特点,提出了一种面向多核DSP架构的高性能多核并行卷积实现方案。针对1×1卷积提出了特征图级多核并行方案;针对卷积核大于1的卷积提出了窗口级多核并行优化设计,同时提出了逐元素向量化计算的核内并行优化实现。实验结果表明,所提并行优化方法实现单核计算效率最高能达到64.95%,在带宽受限情况下,多核并行扩展效率可达到48.36%~88.52%,在典型网络ResNet50上的执行性能与E5-2640 CPU相比,获得了5.39倍性能加速。 展开更多
关键词 多核dsp 卷积神经网络 卷积算法 并行优化
下载PDF
一种面向多核DSP的小容量紧耦合快速共享数据池 被引量:13
6
作者 陈书明 汪东 +1 位作者 陈小文 万江华 《计算机学报》 EI CSCD 北大核心 2008年第10期1737-1744,共8页
该文结合片上便笺式存储器(SPM)的结构特点,提出了一种面向异构多核DSP的新型小容量紧耦合共享存储结构——快速共享数据池(FSDP).FSDP在存储层次上与一级Cache平行,可以被访存指令直接访问,采用多体并行的结构、交叉访问模式和基于硬... 该文结合片上便笺式存储器(SPM)的结构特点,提出了一种面向异构多核DSP的新型小容量紧耦合共享存储结构——快速共享数据池(FSDP).FSDP在存储层次上与一级Cache平行,可以被访存指令直接访问,采用多体并行的结构、交叉访问模式和基于硬件信号灯的自动同步机制,支持多个DSP核的并行访问与快速的核间数据交换,两核之间交换单个数据只需4拍.该文构建了FSDP的模拟模型,并进行了RTL级设计实现和分析.多种典型测试程序的验证表明,FSDP对于DSP核间细粒度共享数据的传输具有很高的效率,相比同类的VS-SPM结构能够将程序性能提高37%,与传统的共享数据Cache结合使用能够将异构多核DSP的性能提高13%. 展开更多
关键词 便笺存储器 共享存储 多核dsp 释放一致性
下载PDF
大点数FFT算法C6678多核DSP的并行实现 被引量:25
7
作者 袁琪 杨康 +1 位作者 周建江 李虹达 《电子测量技术》 2015年第2期74-80,共7页
随着数字信号处理平台发展趋向大计算量、大带宽、高集成度的特点,单核DSP器件渐渐不能满足日益增加的复杂度及实时性要求,多片处理器并行处理的模式将逐渐被广泛应用。基于TI推出的高性能8核处理器TMS320C6678,以大点数FFT算法分解及... 随着数字信号处理平台发展趋向大计算量、大带宽、高集成度的特点,单核DSP器件渐渐不能满足日益增加的复杂度及实时性要求,多片处理器并行处理的模式将逐渐被广泛应用。基于TI推出的高性能8核处理器TMS320C6678,以大点数FFT算法分解及并行实现为例,介绍了多核DSP的KeyStone架构特点,多核处理器的任务管理和分配方式,快速内存访问EDMA的实现以及核间通信(IPC)机制。最后对算法结果及算法的实时性能进行分析,该算例说明TMS320C6678多核DSP具有卓越的运算性能。 展开更多
关键词 并行处理 FFT EDMA 核间通信 多核dsp
下载PDF
光纤实时传输的多核DSP图像处理系统(英文) 被引量:4
8
作者 孙科林 周维超 +1 位作者 吴钦章 彭真明 《光电工程》 CAS CSCD 北大核心 2012年第4期136-144,共9页
为解决光电经纬仪上高速率、高分辨率实时图像传输及处理瓶颈问题。本文提出了基于光纤传输的实时图像处理平台体系架构思想,设计了以FPGA+多核DSP结构的图像处理单元,实现高速实时图像经光纤传输至处理单元。在此基础上,开发了自定义... 为解决光电经纬仪上高速率、高分辨率实时图像传输及处理瓶颈问题。本文提出了基于光纤传输的实时图像处理平台体系架构思想,设计了以FPGA+多核DSP结构的图像处理单元,实现高速实时图像经光纤传输至处理单元。在此基础上,开发了自定义的光纤图像传输协议。利用该协议,使得图像处理系统与各个分系统之间的光纤互联,以及高速实时图像光纤传输至显示子系统,处理子系统和记录子系统。本文阐述了系统总体结构思想,系统硬件原理设计和软件设计,并对其中的图像光纤传输协议设计,多核DSP处理单元设计等进行详细介绍。搭建了实验测试平台,通过实验平台对系统进行测试和分析。实验结果表明,实时图像在光纤上进行3.125Gb/s、在FPGA与多核DSP之间进行3.125Gb/s速率上传输,系统稳定、可靠、误码率低,且具有处理能力强、抗电磁干扰性能强等优点,并已应用到实际工程项目中。 展开更多
关键词 光电经纬仪 多核dsp 嵌入式处理器 高速串行传输 图像传输协议
下载PDF
基于多核DSP的超声成像处理算法的并行实现 被引量:7
9
作者 肖亮 张学健 《电子技术应用》 北大核心 2013年第6期27-30,共4页
基于TI公司的多核DSP-TMS320C6678对黑白超声成像的中端(Mid-End)处理算法进行并行设计与实现。介绍了多核DSP编程实现算法所用到的关键技术:程序并行设计与第三代增强型直接内存存取(EDMA3),并重点分析了核间通信技术。根据算法的特点... 基于TI公司的多核DSP-TMS320C6678对黑白超声成像的中端(Mid-End)处理算法进行并行设计与实现。介绍了多核DSP编程实现算法所用到的关键技术:程序并行设计与第三代增强型直接内存存取(EDMA3),并重点分析了核间通信技术。根据算法的特点选用数据流模式对其进行了任务规划并分配到3个DSP核上执行,核间通信采用消息队列方案。实验结果证明了采用消息队列方案进行核间通信、实现多核并行的有效性。 展开更多
关键词 超声成像 多核dsp 核间通信 消息队列 EDMA3
下载PDF
基于CostarⅡ的异构多核DSP设计与实现 被引量:2
10
作者 敖天勇 陈杰 +3 位作者 刘建 许汉荆 奚杰 张伟风 《微电子学与计算机》 CSCD 北大核心 2010年第3期59-62,共4页
基于CostarⅡ DSP内核设计并实现了一种高性能的嵌入式异构多核DSP.该设计集成了四个DSP内核和一个RISC处理器内核;每个内核均拥有自己的私有存储器;所有内核共享具有多体并行存储结构的数据存储器;四个DSP内核使用可配置的共享程序存储... 基于CostarⅡ DSP内核设计并实现了一种高性能的嵌入式异构多核DSP.该设计集成了四个DSP内核和一个RISC处理器内核;每个内核均拥有自己的私有存储器;所有内核共享具有多体并行存储结构的数据存储器;四个DSP内核使用可配置的共享程序存储器;各内核之间拥有邮箱、信号量及中断等多种同步与通信机制.为了验证该设计,在该系统上测试了JPEG解码算法,并通过了FPGA验证.测试结果表明,该设计具有编程模式简洁,易于提高任务执行的并行度的优点. 展开更多
关键词 多核dsp CostarⅡ 共享存储 RISC
下载PDF
基于TMS320C6678的多核DSP上电加载技术 被引量:3
11
作者 刘章文 刘七华 +1 位作者 谢川林 袁学文 《现代电子技术》 2013年第18期111-114,共4页
对于多核DSP应用技术来说,BootLoad技术是一个关键点,也是应用难点之一。针对8核高性能DSP——TMS320C6678的根配置问题进行了研究,包括上电加载过程,单核和多核的emif NOR-FLASH存储器的映像文件的产生,二级加载器的编写和FLASH编程器... 对于多核DSP应用技术来说,BootLoad技术是一个关键点,也是应用难点之一。针对8核高性能DSP——TMS320C6678的根配置问题进行了研究,包括上电加载过程,单核和多核的emif NOR-FLASH存储器的映像文件的产生,二级加载器的编写和FLASH编程器的构成等。其中,关键是在多核映像文件中,将辅助核的入口地址作为特殊数据来处理,使其他核触发更容易,这也是其他文献未涉及的。该项技术已经用在某图像处理系统中。 展开更多
关键词 多核dsp TMS320C6678 BOOTLOAD 映像文件
下载PDF
面向SDR应用的多核DSP低功耗设计 被引量:2
12
作者 徐力 史少波 王沁 《电子科技大学学报》 EI CAS CSCD 北大核心 2012年第1期136-141,共6页
多核DSP已成为软件无线电技术(SDR)的重要组成部分,主要负责通信系统中的基带数字信号处理。通信系统对于功耗有严格要求,使得面向软件无线电应用的多核DSP低功耗研究变得越来越重要。根据基带数字信号的处理特点,设计了基于数据和任务... 多核DSP已成为软件无线电技术(SDR)的重要组成部分,主要负责通信系统中的基带数字信号处理。通信系统对于功耗有严格要求,使得面向软件无线电应用的多核DSP低功耗研究变得越来越重要。根据基带数字信号的处理特点,设计了基于数据和任务驱动门控时钟的特殊指令及相关硬件功能部件。多核DSP通过执行特殊指令调用时钟控制单元,适时开启和关闭DSP核,从而降低多核DSP的功耗。针对目标多核DSP的实验表明,采用该设计方法能有效地降低多核DSP的平均功耗。 展开更多
关键词 数据驱动 门控时钟 低功耗设计 多核dsp 软件无线电 任务驱动
下载PDF
基于可重构技术的DSP任务动态加载方法研究 被引量:5
13
作者 陆振林 赵元富 +2 位作者 兰利东 焦烨 赵光忠 《电子技术应用》 北大核心 2015年第10期24-26,33,共4页
针对国产异构多核微系统中DSP处理器任务的调度和启动的需求,基于可重构技术,提出了一种DSP任务动态加载方法。利用DSP处理器的HPI接口作为程序注入接口,在FPGA芯片中构建了具有总线隔离机制的配置通路,在SPARC V8处理器中以软件驱动的... 针对国产异构多核微系统中DSP处理器任务的调度和启动的需求,基于可重构技术,提出了一种DSP任务动态加载方法。利用DSP处理器的HPI接口作为程序注入接口,在FPGA芯片中构建了具有总线隔离机制的配置通路,在SPARC V8处理器中以软件驱动的形式,实现了DSP任务动态加载。测试结果表明,所提出的DSP任务动态加载方法用时135 ms即可完成280 KB大小的程序注入及DSP处理器的任务加载,满足微系统的实时性需求。 展开更多
关键词 异构多核微系统 dsp 动态加载 可重构技术
下载PDF
互相关跟踪算法的多核DSP快速实现 被引量:2
14
作者 田立 周付根 +2 位作者 孟偲 白相志 金挺 《高技术通讯》 CAS CSCD 北大核心 2013年第12期1248-1253,共6页
针对光侦系统的目标快速跟踪问题,提出了一种用多核数字信号处理器(DSP)高效实现归一化互相关(NCC)跟踪算法的方案。该方案充分利用德州仪器(TI)最新的6678 DSP的资源和特性,大大提高了跟踪算法实现效率。首先通过增加CPU内核对高速缓存... 针对光侦系统的目标快速跟踪问题,提出了一种用多核数字信号处理器(DSP)高效实现归一化互相关(NCC)跟踪算法的方案。该方案充分利用德州仪器(TI)最新的6678 DSP的资源和特性,大大提高了跟踪算法实现效率。首先通过增加CPU内核对高速缓存(CACHE)控制器的刷新和失效,解决了多核按照可缓存的方式共享图像数据时出现的存储器一致性问题;其次利用CACHE数据预取机制对相关系数NCC的计算方法做了改进,优先访问同一条CACHE线中的图像数据,使效率提升15%以上;最后提出一种多核间并行计算的机制,通过在从核上设置代理任务来处理主核的并行计算请求并反馈计算结果,8核加速比达到7倍以上,优于开放多处理(OpenMP)标准的效果。该方案在100FPS高帧频舰船目标跟踪系统中运行稳定且可以应用于其他需要快速跟踪的场合。 展开更多
关键词 互相关跟踪 多核数字信号处理器(dsp) 多核并行计算 高速缓存(CACHE) 一致性
下载PDF
FPGA和DSP间基于SRIO的高速通信系统设计 被引量:9
15
作者 陈婷 岳强 汪洋 《单片机与嵌入式系统应用》 2016年第3期37-40,共4页
现代信号处理系统通常需要在不同处理器之间实现高速数据通信,SRIO协议由于高效率、低延时的特性被广泛使用。本文研究了在FPGA和DSP两种处理器之间实现SRIO协议的方法,并通过电路设计和利用处理器的开发工具编程实现了两种处理器间的... 现代信号处理系统通常需要在不同处理器之间实现高速数据通信,SRIO协议由于高效率、低延时的特性被广泛使用。本文研究了在FPGA和DSP两种处理器之间实现SRIO协议的方法,并通过电路设计和利用处理器的开发工具编程实现了两种处理器间的高速通信。经测试,该系统具有较高的传输效率。 展开更多
关键词 异构处理器 高速数据通信 SRIO协议 多核dsp FPGA
下载PDF
一种DSP和通用CPU一体化的处理器架构及其4核实现 被引量:3
16
作者 王志君 梁利平 +3 位作者 洪钦智 罗汉青 王昳 赵淳 《微电子学与计算机》 CSCD 北大核心 2014年第10期32-38,共7页
提出了一种DSP和通用CPU一体化的处理器架构,并完成了一款基于该架构的同构4核处理器设计和流片验证.该处理器基于VLIW结构,支持自主定义的DSP指令系统,兼容现有通用的MIPS 4KC处理器指令集,支持最大8个指令通道的并行发射.处理器在不改... 提出了一种DSP和通用CPU一体化的处理器架构,并完成了一款基于该架构的同构4核处理器设计和流片验证.该处理器基于VLIW结构,支持自主定义的DSP指令系统,兼容现有通用的MIPS 4KC处理器指令集,支持最大8个指令通道的并行发射.处理器在不改变CPU的指令编码以及执行顺序的前提下,实现了芯片结构上的DSP和CPU执行处理的一体化,适合在统一的平台上同时完成宽带通信和多媒体的信号和协议处理的嵌入式应用开发.处理器内核通过自主定义的DSP指令字中前后并行标识位和一条专用的前导paralink指令实现了DSP与CPU指令的并行发射.在4核处理器的同构架构上,采用了全局读局部写的多核间片上数据存储策略,在控制硬件开销的基础上实现片上数据的共享.仿真和流片验证结果表明,所提出的DSP和CPU一体化处理器架构可行,在宽带通信和多媒体等嵌入式应用上具有优势. 展开更多
关键词 多核处理器 dsp和CPU一体化 VLIW结构
下载PDF
一种基于异构多核DSP的IEEE 802.11a接收端基带处理的研究和实现 被引量:1
17
作者 徐力 王沁 史少波 《计算机应用研究》 CSCD 北大核心 2012年第1期241-245,共5页
现有基于异构多核DSP的IEEE 802.11a接收端实现方法中DSP核空闲等待时间较长,不能充分体现多核DSP的高性能计算能力。结合多核DSP的特点,通过核内细粒度流水和核间粗粒度流水的方法,来提高多核DSP的执行效率,并在目标异构多核DSP上实现... 现有基于异构多核DSP的IEEE 802.11a接收端实现方法中DSP核空闲等待时间较长,不能充分体现多核DSP的高性能计算能力。结合多核DSP的特点,通过核内细粒度流水和核间粗粒度流水的方法,来提高多核DSP的执行效率,并在目标异构多核DSP上实现完整的IEEE 802.11a接收端基带处理。实验结果表明,该方法不仅能满足系统吞吐量和实时性,与类似工作相比还能保证较高的DSP核平均利用率。 展开更多
关键词 IEEE802.11A 异构多核dsp 软件无线电 接收端基带处理
下载PDF
计算高度密集型应用在异构多核DSP上的运行方法研究 被引量:1
18
作者 吴家铸 田希 +1 位作者 刘继福 陈跃跃 《微电子学与计算机》 CSCD 北大核心 2011年第5期45-47,52,共4页
研究实现了计算高度密集型应用在异构多核DSP上运行的方法.即利用存储在RISC核外设总线上的FLASH中的应用程序,通过异构多核DSP目标板加电,自动加载到RISC核RAM执行,该应用程序将计算高度密集型应用的DSP程序加载到DSPs核上,并利用RISC... 研究实现了计算高度密集型应用在异构多核DSP上运行的方法.即利用存储在RISC核外设总线上的FLASH中的应用程序,通过异构多核DSP目标板加电,自动加载到RISC核RAM执行,该应用程序将计算高度密集型应用的DSP程序加载到DSPs核上,并利用RISC核向DSPs核点火执行.主要介绍了异构多核DSP中的RISC核和DSP核的复位、启动方法,DSP核的多种冗余降级工作模式,详细分析了RISC核控制DSP核的原理及操作方法.提出的运行方法完整有效,为相关的研究人员打下了良好的基础. 展开更多
关键词 异构多核dsp RISC核 计算密集型dsp算法
下载PDF
一种面向异构多核DSP的数据流传输控制引擎设计与评测 被引量:1
19
作者 汪东 陈书明 《国防科技大学学报》 EI CAS CSCD 北大核心 2009年第5期19-23,共5页
根据多核DSP的应用特点,介绍了一种面向异构多核DSP的数据流传输控制引擎(DSTCE)的结构与设计,并实现了基于DSTCE的数据流前瞻传输技术。该技术以可编程的DSTCE模块为核心,实现了超节点内各个端口之间以及超节点之间的高效数据流传输,... 根据多核DSP的应用特点,介绍了一种面向异构多核DSP的数据流传输控制引擎(DSTCE)的结构与设计,并实现了基于DSTCE的数据流前瞻传输技术。该技术以可编程的DSTCE模块为核心,实现了超节点内各个端口之间以及超节点之间的高效数据流传输,而且将传输过程与多核间的数据前瞻和编程模型有机结合起来。该技术避免了复杂的Cache一致性问题,显著提高了大规模多核DSP计算与访存的并行性。实验结果表明,采用DSTCE的多核DSP单个超节点的性能平均提高了22%,两个超节点情况下基于DSTCE结构的系统比基于CC-NUMA结构的系统性能平均提高了14%。 展开更多
关键词 多核dsp 数据流 传输控制 数据前瞻
下载PDF
DSCF:一种面向共享存储多核DSP的数据流分簇前向技术 被引量:1
20
作者 汪东 陈书明 《计算机研究与发展》 EI CSCD 北大核心 2008年第8期1446-1453,共8页
多核数字信号处理器(DSP)的性能常常受限于共享存储的长延迟Cache一致性访问.数据前向(forwarding)技术是隐藏长延迟访问的一种有效手段.根据多核DSP应用的两类重要特征,提出了一种面向共享存储多核DSP结构的数据流分簇前向技术DSCF(dat... 多核数字信号处理器(DSP)的性能常常受限于共享存储的长延迟Cache一致性访问.数据前向(forwarding)技术是隐藏长延迟访问的一种有效手段.根据多核DSP应用的两类重要特征,提出了一种面向共享存储多核DSP结构的数据流分簇前向技术DSCF(data stream clustered forwarding).DSCF方法的主要特点是:兼容基本的共享存储Cache一致性协议;不污染目标Cache;数据的传输速度能够与消费速度相匹配;系统结构的可扩展性好.典型测试程序的模拟评测表明,采用DSCF方法能够将Cache一致性失效率平均降低44%,将系统总体性能提升30%~70%. 展开更多
关键词 多核dsp CACHE一致性 数据前瞻 数据前向 数据流
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部