期刊文献+
共找到57篇文章
< 1 2 3 >
每页显示 20 50 100
Optimized parallel architecture of evolutionary neural network for mass spectrometry data processing
1
作者 Amin Jarrah Bashar Haddad +1 位作者 Mohammad A.Al-Jarrah Muhammad Bassam Obeidat 《International Journal of Modeling, Simulation, and Scientific Computing》 EI 2017年第1期231-257,共27页
Evolutionary neural network(ENN)shows high performance in function optimization and in finding approximately global optima from searching large and complex spaces.It is one of the most efficient and adaptive optimizat... Evolutionary neural network(ENN)shows high performance in function optimization and in finding approximately global optima from searching large and complex spaces.It is one of the most efficient and adaptive optimization techniques used widely to provide candidate solutions that lead to the fitness of the problem.ENN has the extraordinary ability to search the global and learning the approximate optimal solution regardless of the gradient information of the error functions.However,ENN requires high computation and processing which requires parallel processing platforms such as field programmable gate arrays(FPGAs)and graphic processing units(GPUs)to achieve a good performance.This work involves different new implementations of ENN by exploring and adopting different techniques and opportunities for parallel processing.Different versions of ENN algorithm have also been implemented and parallelized on FPGAs platform for low latency by exploiting the parallelism and pipelining approaches.Real data form mass spectrometry data(MSD)application was tested to examine and verify our implementations.This is a very important and extensive computation application which needs to search and find the optimal features(peaks)in MSD in order to distinguish cancer patients from control patients.ENN algorithm is also implemented and parallelized on single core and GPU platforms for comparison purposes.The computation time of our optimized algorithm on FPGA and GPU has been improved by a factor of 6.75 and 6,respectively. 展开更多
关键词 Genetic algorithm neural networks evolutionary neural network fieldprogrammable gate array(FPGA) graphic processing unit(GPU) parallel architecture optimization techniques
原文传递
基于DSP模式的计算机图像处理算法研究
2
作者 刘蓓蕾 《长江信息通信》 2024年第9期65-67,共3页
基于DSP架构模式,提出了一种CNN卷积神经网络算法,并将其运用到计算机图像处理中。研究过程中,采用DSP技术进行计算机图像获取、算法处理、算例分析和结果优化,大大提高了计算机图像算法处理质量和效率。经过算法测试验证,结果表明,基于... 基于DSP架构模式,提出了一种CNN卷积神经网络算法,并将其运用到计算机图像处理中。研究过程中,采用DSP技术进行计算机图像获取、算法处理、算例分析和结果优化,大大提高了计算机图像算法处理质量和效率。经过算法测试验证,结果表明,基于DSP数字信号处理器搭建多DSP并行处理架构模式,采用CNN卷积神经网络算法进行计算机图像处理,能够提高图像处理精度。该算法运行时的性能较高,功能低,CPU占用率不高,且DSP计算机处理系统在多DSP并行处理架构模式下进行算法分析,系统的稳健性和可靠性高,能够适应不同规模级别下的计算机图像处理数据集的处理速度、精度、资源消耗和功率要求,可为计算机图像算法处理提供准确、高效、经济的解决方案,对于计算机图像处理算法设计和优化以及应用具有较好的实用参考价值。 展开更多
关键词 DSP数字信号处理器 多DSP并行处理架构模式 CNN卷积神经网络算法 计算机图像处理方法 算法验证
下载PDF
网络处理器的分析与研究 被引量:62
3
作者 谭章熹 林闯 +1 位作者 任丰源 周文江 《软件学报》 EI CSCD 北大核心 2003年第2期253-267,共15页
目前,网络在提高链路速率的同时出现了大量的新协议及新服务,而传统的网络设备一般采用专用硬件芯片或者基于纯粹的软件方案,很难兼顾性能与灵活性两方面的要求.为此,一种并行可编程的网络处理器被引入到路由器(交换机)的处理层面.它基... 目前,网络在提高链路速率的同时出现了大量的新协议及新服务,而传统的网络设备一般采用专用硬件芯片或者基于纯粹的软件方案,很难兼顾性能与灵活性两方面的要求.为此,一种并行可编程的网络处理器被引入到路由器(交换机)的处理层面.它基于ASIP技术对网络程序处理进行了优化,同时还兼有硬件和软件两种方案的特点.网络处理器的出现将经典的存储-转发结构变为存储-处理-转发,这为复杂的QoS控制和负载处理提供了可能.从网络处理器本身及其应用两个角度出发,介绍了相关的研究工作,分析了系统特点和面临的挑战,并展望其未来的发展方向. 展开更多
关键词 网络处理器 计算机网络 并行处理 路由器 服务质量
下载PDF
大点数FFT的多DSPs并行处理算法及实现 被引量:9
4
作者 刘莉 高梅国 +1 位作者 周闰 王飞 《系统工程与电子技术》 EI CSCD 北大核心 2003年第10期1193-1196,共4页
在FFT变体的基础上 ,提出一种新的并行算法 :先将数据在几片DSPs上并行地进行前几级蝶型运算 ,然后将结果汇总到另一片DSPs进行后几级蝶型运算 ,以实现大点数的FFT。该算法便于流水处理 ,只有一次简单的数据通讯 ,而且旋转因子规律简单... 在FFT变体的基础上 ,提出一种新的并行算法 :先将数据在几片DSPs上并行地进行前几级蝶型运算 ,然后将结果汇总到另一片DSPs进行后几级蝶型运算 ,以实现大点数的FFT。该算法便于流水处理 ,只有一次简单的数据通讯 ,而且旋转因子规律简单易于将大点数FFT拆分成小点数FFT。应用该算法在多DSPs系统上 (5片TI公司的高速DSP芯片 :1片C6 2 0 2和 4片C6 70 1)实现 2 5 6K点复数FFT只需用 4 9ms,说明该算法有并行度高和易于实现的特点。 展开更多
关键词 多处理器结构 并行算法 信号处理
下载PDF
网络处理器体系结构分析 被引量:4
5
作者 王兴杰 葛敬国 +1 位作者 张道庆 钱华林 《微电子学与计算机》 CSCD 北大核心 2006年第5期89-92,96,共5页
文章在阐述网络处理器NP(NetworkProcessor)产生的技术背景的基础上,介绍了网络处理器的功能,分析了网络处理器两种不同的体系结构模型,最后从体系结构方面详细探讨了网络处理器面临的挑战并提出了一些可行的解决方案。
关键词 网络处理器 体系结构 并行处理
下载PDF
多维可扩展流体系结构研究与评测 被引量:2
6
作者 吴伟 文梅 +7 位作者 伍楠 何义 杨乾明 管茂林 荀长庆 任巨 柴俊 张春元 《电子学报》 EI CAS CSCD 北大核心 2008年第5期899-905,共7页
MASA(Multiple-dimension scalable Stream Architecture)是一种可在多个维度扩展的流体系结构.本文对该体系结构的扩展性进行了深入探讨,分析了簇内、簇间和多核扩展的VLSI资源开销,并通过一组测试程序评测了MASA的性能.结果表明,三个... MASA(Multiple-dimension scalable Stream Architecture)是一种可在多个维度扩展的流体系结构.本文对该体系结构的扩展性进行了深入探讨,分析了簇内、簇间和多核扩展的VLSI资源开销,并通过一组测试程序评测了MASA的性能.结果表明,三个扩展维度形成有利互补,使得MASA流体系结构可支持扩展到单片内集成上千个ALU. 展开更多
关键词 流处理器 流体系结构 扩展性 并行处理
下载PDF
高速自适应光学波前处理器─—流水式多SIMD结构 被引量:4
7
作者 陈严 孔铁生 梁甸农 《电子学报》 EI CAS CSCD 北大核心 1998年第3期100-102,共3页
自适应光学波前处理器是自适应光学系统的核心部件之一,它必须实时完成自适应光学系统中所有信号处理任务.本文在对波前复原算法分析的基础上,根据算法内在的并发性,提出一种流水式多SIMD(单指令多数据流)并行处理结构.这种结构... 自适应光学波前处理器是自适应光学系统的核心部件之一,它必须实时完成自适应光学系统中所有信号处理任务.本文在对波前复原算法分析的基础上,根据算法内在的并发性,提出一种流水式多SIMD(单指令多数据流)并行处理结构.这种结构可以使波前处理器完成对帧频为850Hz,象素点为128×128视频图像的实时处理,整个系统的处理延迟小于1/4帧周期. 展开更多
关键词 并行处理 波前处理器 多SIMD结构 自适应光学
下载PDF
一种可扩展的并行处理器模型设计及性能评估 被引量:6
8
作者 陈鹏 袁雅婧 +1 位作者 桑红石 张天序 《航空兵器》 2011年第5期56-61,共6页
开发和设计并行处理器是一种有效提高图像处理速度的方法。本文分析了国内外近年来各种并行处理器的发展状况,提出了一种可扩展的面向图像处理的并行处理器架构(EPIP)和专用指令集。该架构复用多个流处理单元(SP)以单指令多数据流方式... 开发和设计并行处理器是一种有效提高图像处理速度的方法。本文分析了国内外近年来各种并行处理器的发展状况,提出了一种可扩展的面向图像处理的并行处理器架构(EPIP)和专用指令集。该架构复用多个流处理单元(SP)以单指令多数据流方式组织充分实现了数据级并行。单个流处理单元内采用超长指令字(VLIW)技术和并行多线程技术(SMT)分别实现指令级并行和任务级并行。专用指令集支持对私有寄存器和共享寄存器的混合寻址。利用SystemVerilog对该架构进行时钟精确建模,并将常见图像处理算法在该结构上进行了映射。最后给出了EPIP初步的性能评估结果。 展开更多
关键词 并行处理器 图像处理 微体系结构 SYSTEMVERILOG 仿真模型
下载PDF
基于CUDA的拉普拉斯边缘检测算法 被引量:6
9
作者 孟小华 刘坚强 +1 位作者 区业祥 张庆丰 《计算机工程》 CAS CSCD 2012年第18期190-193,共4页
拉普拉斯边缘检测算法常用于去除CCD天文图像中的宇宙射线噪声,但其串行算法计算复杂度较高。为此,分析拉普拉斯边缘检测算法的并行性,在统一计算设备架构(CUDA)并行编程环境下,提出一种基于CUDA的拉普拉斯边缘检测图形处理单元(GPU)并... 拉普拉斯边缘检测算法常用于去除CCD天文图像中的宇宙射线噪声,但其串行算法计算复杂度较高。为此,分析拉普拉斯边缘检测算法的并行性,在统一计算设备架构(CUDA)并行编程环境下,提出一种基于CUDA的拉普拉斯边缘检测图形处理单元(GPU)并行算法。分割天文图像得到多幅子图,根据GPU的硬件配置设定Block和Grid的大小,将子图依次传输到显卡进行并行计算,传回主存后拼接得到完整的图像输出。实验结果表明,图像尺寸越大,该并行算法与串行算法相比具有的速度优势越大,可获得10倍以上的加速比。 展开更多
关键词 拉普拉斯边缘检测算法 图形处理单元 统一计算设备架构 并行处理 天文图像 宇宙射线
下载PDF
基于混合加密算法的网络安全体系构造 被引量:8
10
作者 朱根标 张凤鸣 王金干 《微电子学与计算机》 CSCD 北大核心 2005年第6期31-33,共3页
提出了一种基于混合加密算法的网络安全参考模型NetDESR。本文运用一种改进的DESR加密算法,采用分布式KDC分配方案,对通信报文加密方式进行签名,有效地防止了报文被非法窃听、篡改或伪造。本模型不仅适用于实时的、大数据传输的网络系统... 提出了一种基于混合加密算法的网络安全参考模型NetDESR。本文运用一种改进的DESR加密算法,采用分布式KDC分配方案,对通信报文加密方式进行签名,有效地防止了报文被非法窃听、篡改或伪造。本模型不仅适用于实时的、大数据传输的网络系统,而且实现了密钥管理、加密管理、数字签名以及身份认证等功能。 展开更多
关键词 DESR算法 NetDESR 网络安全体系结构 数据安全 并行处理
下载PDF
用FPGA实现互联的多DSP并行系统结构 被引量:4
11
作者 颜露新 张天序 +1 位作者 邹胜 钟胜 《系统工程与电子技术》 EI CSCD 北大核心 2005年第10期1757-1759,1775,共4页
为满足实时图像处理要求,在分析了常见DSP并行系统结构基础上,提出了一种基于FPGA互联的DSP并行系统结构。该并行结构通过在FPGA内实现互联网络和特定的数据通信协议,实现三片DSP(TMS320C6713)的有效互联,系统结构可重构、可扩展。对采... 为满足实时图像处理要求,在分析了常见DSP并行系统结构基础上,提出了一种基于FPGA互联的DSP并行系统结构。该并行结构通过在FPGA内实现互联网络和特定的数据通信协议,实现三片DSP(TMS320C6713)的有效互联,系统结构可重构、可扩展。对采用该并行结构的原型系统的测试表明,DSP间数据通信既获得了较大的持续带宽又降低了传输延迟,可以满足并行实时处理要求。 展开更多
关键词 实时图像处理 DSP并行系统 互联网络 结构可重构
下载PDF
基于分布并行处理的攻击图构建方法研究 被引量:3
12
作者 马俊春 孙继银 +2 位作者 王勇军 赵宝康 陈珊 《兵工学报》 EI CAS CSCD 北大核心 2012年第1期109-115,共7页
针对大规模复杂网络系统安全性分析中存在的问题,提出一种基于分布并行处理的攻击图构建方法。首先,该方法站在防御者的角度,将所有具有脆弱性的主机作为攻击目标,采用正向、广度优先搜索的策略构建攻击图,解决了已有方法中的攻击目标... 针对大规模复杂网络系统安全性分析中存在的问题,提出一种基于分布并行处理的攻击图构建方法。首先,该方法站在防御者的角度,将所有具有脆弱性的主机作为攻击目标,采用正向、广度优先搜索的策略构建攻击图,解决了已有方法中的攻击目标固定、单一的问题;其次,重点研究了脆弱性分析优化处理技术,从分布并行处理的角度将不同区域的目标网络进行脆弱性分析任务划分,通过多网络脆弱性分析引擎的分布并行处理技术来满足扩展性的要求,解决了已有方法存在的复杂度高、扩展性能低,难以适用于大规模复杂网络系统的问题;最后,采用限制攻击步骤数的优化策略,解决了攻击图生成过程中存在的状态爆炸问题。实验结果表明,该方法可以提高攻击图生成的效率,并且能大大降低攻击图生成时的系统资源消耗,而且本文所提方法对于大规模复杂网络系统的整体安全性具有应用价值。 展开更多
关键词 计算机系统结构 大规模网络 网络安全 攻击图 分布并行处理
下载PDF
高速Viterbi处理器——流水式块处理并行结构 被引量:3
13
作者 宣建华 姚庆栋 《通信学报》 EI CSCD 北大核心 1995年第1期94-100,共7页
本文提出一种流水式块处理并行Viterbi处理器,可以得到LM倍增速(M为流水级数,L为块长度),为达到更高速的Viterbi处理器提供了新型的并行结构。它可用Systolie阵列构成,因而适于VLSI实现。
关键词 Viterbi处理器 并行结构 流水处理 块处理
下载PDF
多处理器信号处理系统的互连网络研究 被引量:2
14
作者 王新宏 陈航 李志舜 《计算机工程》 CAS CSCD 北大核心 2001年第9期79-80,共2页
分析了互连网络形式的特点,根据信号处理任务的特点,结合流水线处理和并行处理,采用层次结构,实现了多端口存储器互连网络形式的多处理器信号处理系统。系统充分利用了多端口存储器互连网络的高速、低传输延迟和易于控制的优点,将... 分析了互连网络形式的特点,根据信号处理任务的特点,结合流水线处理和并行处理,采用层次结构,实现了多端口存储器互连网络形式的多处理器信号处理系统。系统充分利用了多端口存储器互连网络的高速、低传输延迟和易于控制的优点,将扩展性重点放在流水线处理和并行处理的扩展性上,并避开了多端口存储器互连网络扩展性差的缺点。系统具有较好的扩展性、重建性、灵活性和通用性。 展开更多
关键词 多处理器 系统结构 信号处理系统 互连网 数据采集
下载PDF
分布式网络遥测数据处理系统软件设计 被引量:8
15
作者 于艳 乔东峰 张建琳 《测控技术》 CSCD 2006年第6期62-64,共3页
简要介绍了分布式网络遥测数据处理系统的组成和体系结构,重点介绍了分布式网络遥测数据处理系统的软件设计,归纳总结了该软件的设计思路和特点。
关键词 飞行试验 遥测数据处理 遥测前端处理器 遥测系统服务器 软件设计 NDA
下载PDF
利于GPU计算具有线性并行度的P/G网SOR求解算法 被引量:3
16
作者 唐亮 骆祖莹 +1 位作者 赵国兴 杨旭 《计算机研究与发展》 EI CSCD 北大核心 2013年第7期1491-1500,共10页
近年来电子设计自动化(EDA)研究人员尝试利用图形处理器(graphic processing unit,GPU)提供的高性能计算能力对IC参数分析进行加速研究.为了利用GPU进行电源线/地线网络(power/ground network,P/G网)快速分析,设计了一种基于经典的连续... 近年来电子设计自动化(EDA)研究人员尝试利用图形处理器(graphic processing unit,GPU)提供的高性能计算能力对IC参数分析进行加速研究.为了利用GPU进行电源线/地线网络(power/ground network,P/G网)快速分析,设计了一种基于经典的连续过松弛(successive over-relaxation,SOR)算法的高效P/G网分析并行算法.基于GPU并行计算加速原理,此算法进行了如下改进:1)采用红-黑次序的松弛策略.将所有的节点分为红黑两类,红色节点的所有邻点只有黑色节点、黑色节点的所有邻点只有红色节点,红色节点与黑色节点交替松弛,保证了GPU并行计算中的数据一致性.对于具有N个节点的P/G网而言,一次红色节点或黑色节点松弛可以同时对N/2个节点进行松弛操作,即理论上可以同时启动N?2个并行线程.2)优化数据结构.实现了对数据空间的合并访问,以保证对GPU全局存储空间的最优访问.3)在共享存储器内通过并行归约对松弛标记进行快速统计,同时利用zero-copy技术进行松弛标记的快速拷贝,以快速决定是否继续松弛.大量的实验结果表明:与单线程的CPU程序相比,此算法的加速倍数随GPU所提供物理线程的数目增加而线性增加,可以获得最大242倍的加速效果,是目前EDA研究领域中加速效果最好的GPU算法. 展开更多
关键词 图形处理器 连续过松弛算法 统一计算设备架构 并行算法 电源线 地线网络(P G网)
下载PDF
基于GPU的图像处理算法研究 被引量:2
17
作者 张春 杨俊 《西南师范大学学报(自然科学版)》 CAS CSCD 北大核心 2013年第7期41-45,共5页
对基于统一计算设备架构(CUDA)的图形处理器(GPU)在图形处理方面的算法进行了研究和实现.针对目前图像处理算法日益复杂,性能要求越来越高,而传统的基于CPU的图像处理算法无法满足需求的情况,充分利用GPU突出的并行处理能力,采用CUDA技... 对基于统一计算设备架构(CUDA)的图形处理器(GPU)在图形处理方面的算法进行了研究和实现.针对目前图像处理算法日益复杂,性能要求越来越高,而传统的基于CPU的图像处理算法无法满足需求的情况,充分利用GPU突出的并行处理能力,采用CUDA技术,利用C++语言实现了图像处理算法.研究并设计了高斯模糊处理算法、彩色负片处理算法、透明合并处理算法的GPU并行运算流程,与CPU的性能对比表明基于GPU图像处理算法的效率更高. 展开更多
关键词 统一计算设备架构 图形处理器 并行计算 数字图像处理
下载PDF
应用于过程层析成像系统的多处理机网络研究 被引量:1
18
作者 徐立军 邓红梅 徐苓安 《电子测量与仪器学报》 CSCD 2000年第2期35-40,共6页
本文从提高过程层析成像系统的实时性能出发 ,采用高性能并行处理芯片IMS T80 0作为结点处理器构造了一种基于松散耦合结构的拓扑可重构的多处理机网络 ,并对该网络的性能进行了测试 ,分析了影响系统加速比的各种因素。
关键词 并行处理 多处理机网络 过程层析成像系统
下载PDF
多核分组处理系统软件结构研究 被引量:2
19
作者 贺鹏程 王劲林 +1 位作者 邓浩江 张武 《微计算机应用》 2010年第9期12-20,共9页
结合分组处理和多核系统的特点,对分组处理系统的基本结构进行了详细的分析,并通过实际平台对分析的结论进行了验证。分析中不仅考虑了通信和同步的开销,也考虑了数据Cache和指令Cache的命中率问题。分析和实验的结果表明,如果能够对各... 结合分组处理和多核系统的特点,对分组处理系统的基本结构进行了详细的分析,并通过实际平台对分析的结论进行了验证。分析中不仅考虑了通信和同步的开销,也考虑了数据Cache和指令Cache的命中率问题。分析和实验的结果表明,如果能够对各个处理阶段的资源进行恰当的分配,使用混合结构的分组处理系统有可能获得比并行结构系统更好的性能。进一步提出了设计混合分组处理系统时需要解决的关键问题和需要遵循的一些原则。 展开更多
关键词 多核网络处理器 分组处理系统 全并行结构 混合结构
下载PDF
一种基于DSP的通用互连网络设计方法 被引量:1
20
作者 张亮 马莉波 《微处理机》 1997年第4期33-35,共3页
本文采用数字信号处理芯片作为基本的工作单元,讨论了一种所谓的六面连通网络的可重构方法。文中对信号处理中几种常用的结构做了具体的重构示范,并对系统性能进行了评估。
关键词 数字信号处理器 可重构网 互连网络 信号处理
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部