期刊文献+
共找到21篇文章
< 1 2 >
每页显示 20 50 100
YHFT-QDSP:High-Performance Heterogeneous Multi-Core DSP
1
作者 陈书明 万江华 +8 位作者 鲁建壮 刘仲 孙海燕 孙永节 刘衡竹 刘祥远 李振涛 徐毅 陈小文 《Journal of Computer Science & Technology》 SCIE EI CSCD 2010年第2期214-224,共11页
Multi-core architectures are widely used to in time-to-market and power consumption of the chips enhance the microprocessor performance within a limited increase Toward the application of high-density data signal pro... Multi-core architectures are widely used to in time-to-market and power consumption of the chips enhance the microprocessor performance within a limited increase Toward the application of high-density data signal processing, this paper presents a novel heterogeneous multi-core architecture digital signal processor (DSP), YHFT-QDSP, with one RISC CPU core and 4 VLIW DSP cores. By three kinds of interconnection, YHFT-QDSP provides high efficiency message communication for inner-chip RISC core and DSP cores, inner-chip and inter-chip DSP cores. A parallel programming platform is specifically developed for the heterogeneous nmlti-core architecture of YHFT-QDSP. This parallel programming environment provides a parallel support library and a friendly interface between high level application softwares and multi- core DSP. The 130 nm CMOS custom chip design results benchmarks show that the interconnection structure of in a high speed and moderate power design. The results of typical YHFT-QDSP is much better than other related structures and achieves better speedup when using the interconnection facilities in combing methods. YHFT-QDSP has been signed off and manufactured presently. The future applications of the multi-core chip could be found in 3G wireless base station, high performance radar, industrial applications, and so on. 展开更多
关键词 digital signal processor dsp multi-core ARCHITECTURE parallel programming custom design
原文传递
Performance Analysis for EDMA Based on TIC6678Multi-core DSP
2
《信息工程期刊(中英文版)》 2015年第3期73-77,共5页
Frequent data exchange among all kinds of memories has become an inevitable phenomenon in the process of modern embeddedsoftware design. In order to improve the ability of the embedded system data's throughput and co... Frequent data exchange among all kinds of memories has become an inevitable phenomenon in the process of modern embeddedsoftware design. In order to improve the ability of the embedded system data's throughput and computation, most embeddeddevices introduce Enhanced Direct Memory Access (EDMA) data transfer technology. TMS320C6678 is a multi-core DSPproduced by Texas Instruments (TI). There are ten EDMA transmission controllers in the chip for configuration and datatransmissions are allowed to be performed between any two pieces of storage at the same time. This paper expounds the workingmechanism of EDMA based on multi-core DSP TMS320C6678. At the same time, multiple data sets are provided and thebottleneck of limiting data throughout is analyzed and solved. 展开更多
关键词 EDMA multi-core dsp HIGH-SPEED Data THROUGHOUT
下载PDF
一种基于异构处理器的可动态布署设计与实现
3
作者 钱宏文 陈光威 《电子技术应用》 2024年第1期93-100,共8页
针对卫星支持的多种生活服务需求实时切换、资源灵活智能调用需求,基于无线广域信号服务异构处理器,设计了一种即时高效、动态切换部署处理器功能的方案。通过对大资源FPGA及多片8核DSP多种功能定制结合动态部署设计,实现实时动态可重... 针对卫星支持的多种生活服务需求实时切换、资源灵活智能调用需求,基于无线广域信号服务异构处理器,设计了一种即时高效、动态切换部署处理器功能的方案。通过对大资源FPGA及多片8核DSP多种功能定制结合动态部署设计,实现实时动态可重构处理器系统功能,将5种FPGA应用结合2种DSP应用程序动态组合,配合各功能任务架构需求重建控制、数据链路,完成多任务智能切换。 展开更多
关键词 异构处理器 动态部署 可重构 FPGA dsp
下载PDF
面向大规模异构计算平台的MiniGo高效训练方法
4
作者 李荣春 贺周雨 +3 位作者 乔鹏 姜晶菲 窦勇 李东升 《国防科技大学学报》 EI CAS CSCD 北大核心 2024年第5期209-218,共10页
提出一种适用于大规模异构计算平台训练MiniGo智能体的高效多级并行训练方法,包括节点间任务级并行、中央处理器-数字信号处理器(central processing unit-digital signal processor, CPU-DSP)异构并行、DSP核内并行。实现了高效的输入... 提出一种适用于大规模异构计算平台训练MiniGo智能体的高效多级并行训练方法,包括节点间任务级并行、中央处理器-数字信号处理器(central processing unit-digital signal processor, CPU-DSP)异构并行、DSP核内并行。实现了高效的输入/输出部署,消除网络通信瓶颈。提出了面向CPU-DSP共享内存结构的异构计算内存管理,减少异构设备间的数据搬运。实现了共享内存编程优化,并利用DSP实现密集卷积计算算子加速优化。结果表明,与16核CPU计算相比,单核DSP算子加速最大加速比达16.44;该方法实现计算节点规模从1 067扩展至4 139,得到达到给定终止条件所需时间从43.02 h降至16.05 h,可扩展效率为69.1%。评估表明,该方法能够实现MiniGo在大规模异构计算平台的高效并行训练。 展开更多
关键词 MiniGo 大规模异构计算平台 数字信号处理器
下载PDF
计算高度密集型应用在异构多核DSP上的运行方法研究 被引量:1
5
作者 吴家铸 田希 +1 位作者 刘继福 陈跃跃 《微电子学与计算机》 CSCD 北大核心 2011年第5期45-47,52,共4页
研究实现了计算高度密集型应用在异构多核DSP上运行的方法.即利用存储在RISC核外设总线上的FLASH中的应用程序,通过异构多核DSP目标板加电,自动加载到RISC核RAM执行,该应用程序将计算高度密集型应用的DSP程序加载到DSPs核上,并利用RISC... 研究实现了计算高度密集型应用在异构多核DSP上运行的方法.即利用存储在RISC核外设总线上的FLASH中的应用程序,通过异构多核DSP目标板加电,自动加载到RISC核RAM执行,该应用程序将计算高度密集型应用的DSP程序加载到DSPs核上,并利用RISC核向DSPs核点火执行.主要介绍了异构多核DSP中的RISC核和DSP核的复位、启动方法,DSP核的多种冗余降级工作模式,详细分析了RISC核控制DSP核的原理及操作方法.提出的运行方法完整有效,为相关的研究人员打下了良好的基础. 展开更多
关键词 异构多核dsp RISC核 计算密集型dsp算法
下载PDF
FPGA和DSP间基于SRIO的高速通信系统设计 被引量:9
6
作者 陈婷 岳强 汪洋 《单片机与嵌入式系统应用》 2016年第3期37-40,共4页
现代信号处理系统通常需要在不同处理器之间实现高速数据通信,SRIO协议由于高效率、低延时的特性被广泛使用。本文研究了在FPGA和DSP两种处理器之间实现SRIO协议的方法,并通过电路设计和利用处理器的开发工具编程实现了两种处理器间的... 现代信号处理系统通常需要在不同处理器之间实现高速数据通信,SRIO协议由于高效率、低延时的特性被广泛使用。本文研究了在FPGA和DSP两种处理器之间实现SRIO协议的方法,并通过电路设计和利用处理器的开发工具编程实现了两种处理器间的高速通信。经测试,该系统具有较高的传输效率。 展开更多
关键词 异构处理器 高速数据通信 SRIO协议 多核dsp FPGA
下载PDF
一种基于异构多核DSP的IEEE 802.11a接收端基带处理的研究和实现 被引量:1
7
作者 徐力 王沁 史少波 《计算机应用研究》 CSCD 北大核心 2012年第1期241-245,共5页
现有基于异构多核DSP的IEEE 802.11a接收端实现方法中DSP核空闲等待时间较长,不能充分体现多核DSP的高性能计算能力。结合多核DSP的特点,通过核内细粒度流水和核间粗粒度流水的方法,来提高多核DSP的执行效率,并在目标异构多核DSP上实现... 现有基于异构多核DSP的IEEE 802.11a接收端实现方法中DSP核空闲等待时间较长,不能充分体现多核DSP的高性能计算能力。结合多核DSP的特点,通过核内细粒度流水和核间粗粒度流水的方法,来提高多核DSP的执行效率,并在目标异构多核DSP上实现完整的IEEE 802.11a接收端基带处理。实验结果表明,该方法不仅能满足系统吞吐量和实时性,与类似工作相比还能保证较高的DSP核平均利用率。 展开更多
关键词 IEEE802.11A 异构多核dsp 软件无线电 接收端基带处理
下载PDF
核能谱分析开源软件Octave在ARM/DSP架构下的移植
8
作者 王远 何剑锋 +3 位作者 余加东 王芹 肖海玲 李伦辉 《微型机与应用》 2015年第21期85-88,共4页
针对基于PC平台的核能谱分析软件成本高、体积大、使用范围受限等问题,设计及实现了一种以ARM/DSP架构为核心的核能谱分析系统。系统以内嵌TI公司DM3730的Devkit8500D评估板为开发测试平台,采用Linux操作系统,通过科学计算软件Octave的g... 针对基于PC平台的核能谱分析软件成本高、体积大、使用范围受限等问题,设计及实现了一种以ARM/DSP架构为核心的核能谱分析系统。系统以内嵌TI公司DM3730的Devkit8500D评估板为开发测试平台,采用Linux操作系统,通过科学计算软件Octave的gunplot加载处理原始核能谱数据并将能谱图显示在TFT液晶屏幕上。对于Octave的移植工作,添加必需依赖库及头文件,利用交叉工具链编译Octave,借助ext2格式TF卡将其移植到Devkit8500D平台。核能谱数据测试结果表明,该系统数据处理效率高、实时性好,具备良好的稳定性、便携性,拥有很强的实用价值。 展开更多
关键词 ARM/dsp异构 核能谱分析 DM3730 Octave/GNUplot 移植 交叉工具链
下载PDF
低频超声测井仪主控系统设计与实现
9
作者 何小英 刘付火 吴爱平 《长江大学学报(自然科学版)》 2024年第4期56-62,共7页
针对低频超声测井仪声波发射、数据采集及数据传输于一体的控制要求,设计了一种基于DSP+FPGA异构控制技术的新型主控系统。该系统使用DSP作为主控制器,通过CAN总线与井下电缆遥传通信,根据接收的指令产生控制时序,使用有限状态机完成工... 针对低频超声测井仪声波发射、数据采集及数据传输于一体的控制要求,设计了一种基于DSP+FPGA异构控制技术的新型主控系统。该系统使用DSP作为主控制器,通过CAN总线与井下电缆遥传通信,根据接收的指令产生控制时序,使用有限状态机完成工作流程控制,创新性地采用基于加权马氏距离的健康度评估方法评判仪器工作状态。使用FPGA作为从控制器,采用指令数据通道独立控制方法实时转发控制指令,同步声波激发与采集,实时接收声波数据。采用基于自定义并口双口RAM的协同通信机制完成DSP与FPGA之间的数据传输。采用差分传输技术实现与发射系统、采集系统之间的通信。测试表明:该主控系统通信误码率低,控制实时性高,状态评估准确,具备声波发射、数据采集及数据传输一体化控制能力,满足低频超声测井仪控制要求。 展开更多
关键词 低频超声测井仪 dsp+FPGA异构控制 加权马氏距离 协同通信机制
下载PDF
基于异构多核DSP的信号处理系统设计 被引量:1
10
作者 于方春 王乐 张亚棣 《航空计算技术》 2018年第1期119-122,126,共5页
异构多核DSP是在同构多核DSP中引入了通用处理器核来管理系统,让DSP专注于信号的处理,这种异构模式大大提升了DSP的信号处理性能。为适应嵌入式通用信号处理平台对小体积、低功耗和高性能等方面的要求,讨论了一种基于异构多核DSP的信号... 异构多核DSP是在同构多核DSP中引入了通用处理器核来管理系统,让DSP专注于信号的处理,这种异构模式大大提升了DSP的信号处理性能。为适应嵌入式通用信号处理平台对小体积、低功耗和高性能等方面的要求,讨论了一种基于异构多核DSP的信号处理系统设计,给出了系统的硬件结构设计和高速互连实现方案,详细介绍了Hyperlink和RapidIO等关键高速电路实现方法并对其性能进行了分析。 展开更多
关键词 异构多核dsp 高性能 高速电路
下载PDF
基于DSP电力载波通信AGC设计
11
作者 吴文平 顾民 +1 位作者 解洪亮 左平 《科技信息》 2012年第17期55-55,共1页
在电力载波通信系统中,由于通信环境存在着非均匀性和不平衡性,稳定的信号幅值是直接影响信息传输的质量,为保证信息的准确完整性,文中在分析研究AGC算法在DSP中的实现,设计出具有自适应功能数字AGC控制方案。
关键词 AGC 非均匀性 不平衡性 dsp
下载PDF
一种基于FPGA、DSP和ARM的异构运算构架及实现方案 被引量:3
12
作者 朱怀宇 冯雪 姜群兴 《工业控制计算机》 2019年第11期20-21,共2页
随着科技发展,高速海量数据运算需求越来越大,CPU、DSP等的运算能力已经不能支撑需求,并行运算能力也不够。为了达到高带宽,海量数据运算需求,提出了基于FPGA、DSP和ARM的异构运算系统。多任务操作系统根据计算需求分解成小任务,再分配... 随着科技发展,高速海量数据运算需求越来越大,CPU、DSP等的运算能力已经不能支撑需求,并行运算能力也不够。为了达到高带宽,海量数据运算需求,提出了基于FPGA、DSP和ARM的异构运算系统。多任务操作系统根据计算需求分解成小任务,再分配给各运算单元。该框架可任意扩展,使用高速接口互连,适合各种运算需求。 展开更多
关键词 FPGA dsp处理器 ARM 异构运算 SERDES
下载PDF
Qt中调用DSP库实现双核异构通信
13
作者 郑宪秋 王远 《数字技术与应用》 2015年第7期48-50,共3页
在物联网和大数据飞速发展的时代,大部分的数据在采集后都须放到PC机或服务器上处理,这使得工作效率和便捷性都受到影响,同时也制约着技术的发展,如何才能在终端嵌入式设备上也能分析处理复杂的数据,这是我们研究的方向。本文研究基于AR... 在物联网和大数据飞速发展的时代,大部分的数据在采集后都须放到PC机或服务器上处理,这使得工作效率和便捷性都受到影响,同时也制约着技术的发展,如何才能在终端嵌入式设备上也能分析处理复杂的数据,这是我们研究的方向。本文研究基于ARM/DSP双核CPU的通信方法,这使得DSP极快的数据处理能力和ARM天生的终端控制能力完美结合,实验采用TI公司基于DM3730双核CPU的devkit8500评估板和该公司研发的集成开发工具DVSDK做测试,通过ARM控制端的Qt程序来调用DSP端封装好的库函数;通过测试表明,这种双核通信方式具有良好的稳定性,处理数据的及时性和准确性,以及实用性。 展开更多
关键词 ARM/dsp 双核通信 双核异构 DVSDK dspLINK QT
下载PDF
A perceptual and predictive batch-processing memory scheduling strategy for a CPU-GPU heterogeneous system
14
作者 Juan FANG Sheng LIN +2 位作者 Huijing YANG Yixiang XU Xing SU 《Frontiers of Information Technology & Electronic Engineering》 SCIE EI CSCD 2023年第7期994-1006,共13页
When multiple central processing unit(CPU)cores and integrated graphics processing units(GPUs)share off-chip main memory,CPU and GPU applications compete for the critical memory resource.This causes serious resource c... When multiple central processing unit(CPU)cores and integrated graphics processing units(GPUs)share off-chip main memory,CPU and GPU applications compete for the critical memory resource.This causes serious resource competition and has a negative impact on the overall performance of the system.We describe the competition for shared-memory resources in a CPU-GPU heterogeneous multi-core architecture,and a sharedmemory request scheduling strategy based on perceptual and predictive batch-processing is proposed.By sensing the CPU and GPU memory request conditions in the request buffer,the proposed scheduling strategy estimates the GPU latency tolerance and reduces mutual interference between CPU and GPU by processing CPU or GPU memory requests in batches.According to the simulation results,the scheduling strategy improves CPU performance by8.53%and reduces mutual interference by 10.38%with low hardware complexity. 展开更多
关键词 CPU-GPU heterogeneous multi-core Unified memory Access scheduling
原文传递
Schedule refinement for homogeneous multi-core processors in the presence of manufacturing-caused heterogeneity
15
作者 Zhi-xiang CHEN Zhao-lin LI +2 位作者 Shan CAO Fang WANG Jie ZHOU 《Frontiers of Information Technology & Electronic Engineering》 SCIE EI CSCD 2015年第12期1018-1033,共16页
Multi-core homogeneous processors have been widely used to deal with computation-intensive embedded applications. However, with the continuous down scaling of CMOS technology, within-die variations in the manufacturin... Multi-core homogeneous processors have been widely used to deal with computation-intensive embedded applications. However, with the continuous down scaling of CMOS technology, within-die variations in the manufacturing process lead to a significant spread in the operating speeds of cores within homogeneous multi-core processors. Task scheduling approaches, which do not consider such heterogeneity caused by within-die variations,can lead to an overly pessimistic result in terms of performance. To realize an optimal performance according to the actual maximum clock frequencies at which cores can run, we present a heterogeneity-aware schedule refining(HASR) scheme by fully exploiting the heterogeneities of homogeneous multi-core processors in embedded domains.We analyze and show how the actual maximum frequencies of cores are used to guide the scheduling. In the scheme,representative chip operating points are selected and the corresponding optimal schedules are generated as candidate schedules. During the booting of each chip, according to the actual maximum clock frequencies of cores, one of the candidate schedules is bound to the chip to maximize the performance. A set of applications are designed to evaluate the proposed scheme. Experimental results show that the proposed scheme can improve the performance by an average value of 22.2%, compared with the baseline schedule based on the worst case timing analysis. Compared with the conventional task scheduling approach based on the actual maximum clock frequencies, the proposed scheme also improves the performance by up to 12%. 展开更多
关键词 Schedule refining multi-core processor heterogenEITY Representative chip operating point
原文传递
基于异构多核构架的红外与可见光实时融合系统 被引量:2
16
作者 熊伟 杨红雨 +1 位作者 袁学东 李晓峰 《四川大学学报(工程科学版)》 CSCD 北大核心 2015年第S2期118-124,共7页
描述了一个自主研制的基于异构多核构架的红外与可见光图像实时融合传输系统的设计与实现方案。本系统是具有异构多核并行计算机体系结构的嵌入式高速实时图像融合处理系统,选择基于ARM与DSP组合异构双核处理器TMS320DM6467T作为中心处... 描述了一个自主研制的基于异构多核构架的红外与可见光图像实时融合传输系统的设计与实现方案。本系统是具有异构多核并行计算机体系结构的嵌入式高速实时图像融合处理系统,选择基于ARM与DSP组合异构双核处理器TMS320DM6467T作为中心处理单元,充分利用ARM端的传输控制功能与DSP端的超强计算能力相结合的特点,发挥2种处理器构架的性能优势。提出并实现基于"灰度世界"算法的红外图像增强方式,同时使用拉普拉斯金字塔变换对红外与可见光图像进行实时融合。实验结果表明,采用该异构多核构架的图像实时融合传输系统能够良好地解决多源图像融合算法的大数据量计算处理与系统实时性要求之间的矛盾,提高了多传感器实时图像融合处理与传输系统的处理效率和性能。 展开更多
关键词 实时图像融合 异构多核处理器 数字信号处理器 ARM
下载PDF
基于异构多核SoC器件的相控阵探伤仪设计 被引量:3
17
作者 谢长生 陈振娇 +1 位作者 张俊 王胜辉 《微处理机》 2021年第1期1-8,共8页
基于TI公司的异构多核数字信号处理SoC芯片C66AK2H06完成一款PE超声相控阵探伤仪的算法处理及软件部分的设计。设计着重围绕新系统架构中的软件架构、算法组成、多核并行计算、核间通信、片间通信、共享内存和多层内存分配等展开,并对... 基于TI公司的异构多核数字信号处理SoC芯片C66AK2H06完成一款PE超声相控阵探伤仪的算法处理及软件部分的设计。设计着重围绕新系统架构中的软件架构、算法组成、多核并行计算、核间通信、片间通信、共享内存和多层内存分配等展开,并对算法处理性能、实时性性能等方面的关键指标进行优化。研究结果表明采用C66AK2H06实现的系统架构更加灵活,性能得到提升,具有很好的可扩展性和可升级性,基于该架构研制的PE超声相控阵探伤仪实现了更高性能、更低功耗以及更好的便携性。 展开更多
关键词 片上系统 数字信号处理器 C66AK器件 异构 多核 相控阵 探伤仪
下载PDF
基于1553B总线机载控制测试平台设计 被引量:2
18
作者 钱宏文 倪文龙 刘继祥 《自动化技术与应用》 2022年第7期137-141,共5页
随着美国1553B总线产品的发展和在国防军工领域的不断应用,对1553B总线产品的测试要求在不断提高。本文提出一种1553B总线控制器自动测试系统,系统利用美国国家仪器(NI)公司labview虚拟仪器技术平台开发自动上位机测试程序,完成对1553B... 随着美国1553B总线产品的发展和在国防军工领域的不断应用,对1553B总线产品的测试要求在不断提高。本文提出一种1553B总线控制器自动测试系统,系统利用美国国家仪器(NI)公司labview虚拟仪器技术平台开发自动上位机测试程序,完成对1553B总线协议的解码分析与验证;使用PCI接口的BC板卡作为1553B总线控制;再结合DSP+FPGA异构处理器实现对自动测试系统进行验证,对总线协议的交互通信正确性进行检查。验证结果表明,测试平台能够实现1553B总线控制器电气参数和协议正确性的可靠测试;具有开发短周期、操作低难度和高度自动化的特点。可以满足1553B总线控制器在设计和调试阶段的自动测试需求。 展开更多
关键词 1553B总线 BC-RT dsp+FPGA 异构处理器 LABVIEW
下载PDF
面向PHM的桌面超算平台设计 被引量:1
19
作者 司书浩 景博 +2 位作者 焦晓璇 付强 王赟 《电子测量与仪器学报》 CSCD 北大核心 2018年第9期28-35,共8页
针对复杂武器装备故障预测与健康管理(PHM)中存在的传感器种类多、采集数据量大,实时性要求高,运行平台性能低等问题,设计了一种PHM桌面超算平台。该平台基于数字信号处理器+现场可编程门阵列(DSP+FPGA)异构计算架构,用于实现系统的故... 针对复杂武器装备故障预测与健康管理(PHM)中存在的传感器种类多、采集数据量大,实时性要求高,运行平台性能低等问题,设计了一种PHM桌面超算平台。该平台基于数字信号处理器+现场可编程门阵列(DSP+FPGA)异构计算架构,用于实现系统的故障诊断、预测与健康管理功能。PHM桌面超算平台利用多块包含DSP和FPGA的协处理卡对PHM数据处理任务进行加速计算,并提供多通道高速数据采集和算法模型验证等功能。实验验证表明,该平台运行可靠,实用性强,为实现武器装备PHM系统功能提供了高性能运行平台。 展开更多
关键词 故障预测与健康管理 桌面超算平台 异构计算 数字信号处理器 现场可编程门阵列
下载PDF
面向基带处理的异构多核架构软硬件平台设计 被引量:1
20
作者 曾定立 丁国杰 《单片机与嵌入式系统应用》 2017年第3期13-17,共5页
通过研究现代通信系统集中化处理架构中基带处理单元(BBU)的特点,将异构多核处理器应用于BBU中,并提出将物理层算法与控制分离的观点。在ARM+DSP的异构多核中,ARM完成物理层控制,DSP完成物理层算法的功能,提升了BBU基带处理能力,并给出... 通过研究现代通信系统集中化处理架构中基带处理单元(BBU)的特点,将异构多核处理器应用于BBU中,并提出将物理层算法与控制分离的观点。在ARM+DSP的异构多核中,ARM完成物理层控制,DSP完成物理层算法的功能,提升了BBU基带处理能力,并给出完整的BBU硬件架构以及功能实现。提出了一种应用于基带处理中的异构多核软件架构,从软件层面上实现了对底层硬件的虚拟化,引入了中间件的概念,屏蔽了ARM与DSP操作系统上的差异,并给出基于Linux的非对称系统(AMP)的构建及移植方法,包括异构多核的BootLoader、AMP系统的设计与移植。 展开更多
关键词 基带处理单元 异构多核 ARM dsp 中间件 BOOTLOADER AMP系统
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部