期刊文献+
共找到66篇文章
< 1 2 4 >
每页显示 20 50 100
数据不规则问题全相关Block递归方程组多维流水线并行技术研究 被引量:2
1
作者 刘鑫 陆林生 《计算机学报》 EI CSCD 北大核心 2006年第10期1750-1756,共7页
主要讨论数据不规则问题全相关Block递归方程组多维流水线并行的实现.首先给出全相关Block递归方程组的模型方程,并从图论的角度给出了流水关系有向图的定义以及流水线并行条件的判别准则,分析了影响流水线并行效率的主要因素.在此基础... 主要讨论数据不规则问题全相关Block递归方程组多维流水线并行的实现.首先给出全相关Block递归方程组的模型方程,并从图论的角度给出了流水关系有向图的定义以及流水线并行条件的判别准则,分析了影响流水线并行效率的主要因素.在此基础上,提出一种基于流水关系有向图的流水线并行实现算法并应用于数据不规则问题.实验结果表明该方法在复杂区域情况下也可以取得较高的效率. 展开更多
关键词 数据不规则问题 流水线并行计算 流水关系有向图
下载PDF
嵌入式异构智能计算系统并行多流水线设计
2
作者 赵二虎 吴济文 +2 位作者 肖思莹 晋振杰 徐勇军 《电子学报》 EI CAS CSCD 北大核心 2023年第11期3354-3364,共11页
嵌入式智能计算系统因其功耗受限和多传感器实时智能处理需要,对硬件平台的智能算力能效比和智能计算业务并行度提出了严峻挑战.传统嵌入式计算系统常采用的DSP+FPGA数字信号处理架构,无法适用于多个神经网络模型加速场景.本文基于ARM+D... 嵌入式智能计算系统因其功耗受限和多传感器实时智能处理需要,对硬件平台的智能算力能效比和智能计算业务并行度提出了严峻挑战.传统嵌入式计算系统常采用的DSP+FPGA数字信号处理架构,无法适用于多个神经网络模型加速场景.本文基于ARM+DLP+SRIO嵌入式异构智能计算架构,利用智能处理器多片多核多内存通道特性,提出了并行多流水线设计方法.该方法充分考虑智能计算业务中数据传输、拷贝、推理、结果反馈等环节时间开销,为不同的神经网络模型合理分配智能算力资源,以达到最大的端到端智能计算业务吞吐率.实验结果表明,采用并行多流水线设计方法的深度学习处理器利用率较单流水线平均提高约25.2%,较无流水线平均提高约30.7%,满足可见光、红外、SAR等多模图像实时智能处理需求,具有实际应用价值. 展开更多
关键词 嵌入式智能计算系统 异构计算架构 神经网络模型 并行流水线 深度学习处理器
下载PDF
多路并行流水线型基2^(2)FFT算法实现
3
作者 杨苗苗 郭锋 张永亮 《陆军工程大学学报》 2023年第2期54-59,共6页
FFT算法作为OFDM系统的核心算子占用其系统处理的大多数时间,为提高OFDM系统数据传输速度,提出了一种改进的多路并行流水线型基2^(2)FFT实现架构。在实现过程中着重对旋转因子的存储进行片上缓存优化,减少了乘法运算次数从而减小整体运... FFT算法作为OFDM系统的核心算子占用其系统处理的大多数时间,为提高OFDM系统数据传输速度,提出了一种改进的多路并行流水线型基2^(2)FFT实现架构。在实现过程中着重对旋转因子的存储进行片上缓存优化,减少了乘法运算次数从而减小整体运算复杂度;设计的数据整合模块用于控制时序,从而保证P路并行流水型架构正确实现,数据运算吞吐率成P倍提高。RTL仿真结果表明,与同类架构相比,提出的架构在硬件开销适中的同时使得性能分别提升了1.27%、2.04%、50.88%,并且具有FFT点数可扩展的特点,可满足随着通信标准的不断提高,FFT点数逐渐增大的实际应用需求。 展开更多
关键词 正交频分复用 快速傅里叶变换 并行流水线 多路径延迟交叉 基2^(2)
下载PDF
复式并行流水线在基于PC集群机的并行绘制中的应用 被引量:5
4
作者 彭浩宇 金哲凡 +2 位作者 秦爱红 熊华 石教英 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2006年第10期1581-1586,共6页
提出基于动态绘制组的混合式体系结构,除了动态绘制组间的并行处理流水线外,在动态绘制组内部设计了缓帧并行流水线改进工作流程,形成了复式的并行绘制流水线,大大地提高了基于PC集群机的并行图形绘制系统的整体性能.采用此复式流水线... 提出基于动态绘制组的混合式体系结构,除了动态绘制组间的并行处理流水线外,在动态绘制组内部设计了缓帧并行流水线改进工作流程,形成了复式的并行绘制流水线,大大地提高了基于PC集群机的并行图形绘制系统的整体性能.采用此复式流水线的原型系统在实际测试中表现突出,性能比单层并行绘制流水线绘制系统有较大提高. 展开更多
关键词 复式并行绘制流水线 PC集群机 混合型体系 动态绘制组 缓帧并行流水线
下载PDF
非结构网格上求解中子输运方程的并行流水线S_n扫描算法 被引量:28
5
作者 莫则尧 傅连祥 阳述林 《计算机学报》 EI CSCD 北大核心 2004年第5期587-595,共9页
间断有限元离散纵标方法 (Sn)是广泛应用于求解高维非定常中子输运方程的数值方法 ,它涉及几何网格空间、速度相空间和中子能群的离散 ,计算量很大 .该文基于非结构网格 ,提出了基于区域分解的并行流水线Sn扫描算法 ,通过设计具有不同... 间断有限元离散纵标方法 (Sn)是广泛应用于求解高维非定常中子输运方程的数值方法 ,它涉及几何网格空间、速度相空间和中子能群的离散 ,计算量很大 .该文基于非结构网格 ,提出了基于区域分解的并行流水线Sn扫描算法 ,通过设计具有不同内在并行度和通信面体比的区域分解方法和队列插入算法 ,对两个不同物理模型 ,分别使用两台并行机的 92个和 2 5 6个CPU ,获得 72倍和 78倍以上的加速 .可扩展性能分析表明 ,算法的性能非常依赖于并行机的点对点通信延迟 . 展开更多
关键词 非结构网格 中子输运方程 并行流水线Sn扫描算法 间断有限元离散纵标方法
下载PDF
并行传送带式摩托车流水线调度模型与求解 被引量:2
6
作者 孙棣华 宋潇潇 +2 位作者 刘卫宁 赵敏 廖孝勇 《计算机集成制造系统》 EI CSCD 北大核心 2011年第2期294-300,共7页
针对一类摩托车制造柔性流水线中的调度问题,提出一种考虑工位差异的并行传送带式流水线调度模型。考虑不同在制品在生产线上不同工位的不同最大加工速度对传送带速度的影响因素,引入射频识别技术实时采集线上在制品的信息,通过及时调... 针对一类摩托车制造柔性流水线中的调度问题,提出一种考虑工位差异的并行传送带式流水线调度模型。考虑不同在制品在生产线上不同工位的不同最大加工速度对传送带速度的影响因素,引入射频识别技术实时采集线上在制品的信息,通过及时调整传送带速度提高生产效率;根据生产实际需求,在生产线上不同种类在制品之间插入调整间隔,为更换车型提供准备时间。在此基础上,考虑模型以最小化最大完工时间为目标,采用基于极坐标编码的改进人工鱼群算法进行求解,说明了求解过程中的编码方法、母体迭代方式、人工鱼个体距离等关键技术。通过某摩托车生产企业的实际生产数据验证了该模型的有效性。 展开更多
关键词 调度模型 并行传送带式流水线 射频识别 人工鱼群算法 极坐标编码 摩托车
下载PDF
星敏感器图像处理系统的并行流水线操作研究 被引量:4
7
作者 周国辉 王晓东 郝志航 《航天控制》 CSCD 北大核心 2006年第1期87-91,共5页
随着天文导航和航天测控领域的要求不断提高,对星敏感器的动态性能提出了越来越高的要求。本文详细分析了星敏感器CCD处理模块输出信号的时序关系,在此基础上提出了CCD和DSP并行流水线的处理机制以提高星图处理的效率,并利用CPLD和DSP的... 随着天文导航和航天测控领域的要求不断提高,对星敏感器的动态性能提出了越来越高的要求。本文详细分析了星敏感器CCD处理模块输出信号的时序关系,在此基础上提出了CCD和DSP并行流水线的处理机制以提高星图处理的效率,并利用CPLD和DSP的HOLD方式实现了CCD和DSP的并行流水线操作。通过星光模拟器的静态测试表明:利用该处理机制能实现每秒10帧的处理速度。只要合理地安排好行场有效期和消隐期的时间,会进一步提高姿态捕获的速度。 展开更多
关键词 星敏感器 星图处理 并行流水线方式 CPLD
下载PDF
并行流水线LMS算法及其性能分析 被引量:1
8
作者 尚勇 吴顺君 项海格 《自然科学进展(国家重点实验室通讯)》 北大核心 2001年第10期1032-1037,共6页
通过将并行处理方法引入流水线LMS(PIPLMS)算法的设计,提出一种新的并行PIPLMS算法,与常规PIPLMS算法相比,提出的算法具有更小的流水时延,更高的数据吞吐率,更快的收敛速度和更大的保证算法收敛的步长因子μ选择范围,同时对具有相关性... 通过将并行处理方法引入流水线LMS(PIPLMS)算法的设计,提出一种新的并行PIPLMS算法,与常规PIPLMS算法相比,提出的算法具有更小的流水时延,更高的数据吞吐率,更快的收敛速度和更大的保证算法收敛的步长因子μ选择范围,同时对具有相关性的输入具有一定的去相关作用,特别适用于滤波器阶数高,要求系统收敛速度快的应用场合,也便于系统硬件设计。 展开更多
关键词 并行处理 自适应滤滤 并行流水线LMS算法 性能分析 收敛速度 步长因子 并行滤波 数据吞吐率
下载PDF
超高速转发引擎的并行流水线设计与实现
9
作者 刘勤让 李印海 +1 位作者 邬江兴 刘晓 《计算机工程与应用》 CSCD 北大核心 2005年第16期114-115,188,共3页
Internet的飞速发展要求将来的核心路由器具有超高速的转发能力,路由器设计的难点之一就是超高速转发引擎的设计,文章给出了一种超高速转发引擎的并行机制流水线设计方案,并给出了基于该思想的详细实现,测试结果表明依据该方案实现的转... Internet的飞速发展要求将来的核心路由器具有超高速的转发能力,路由器设计的难点之一就是超高速转发引擎的设计,文章给出了一种超高速转发引擎的并行机制流水线设计方案,并给出了基于该思想的详细实现,测试结果表明依据该方案实现的转发引擎达到了10Gbps的转发处理能力。 展开更多
关键词 超高速 转发引擎 并行流水线设计
下载PDF
网格中数据并行流水线的任务指派优化
10
作者 王庆江 桂小林 郑守淇 《西安交通大学学报》 EI CAS CSCD 北大核心 2004年第8期771-774,共4页
为了缩短网格中数据并行流水线在吞吐率受限下的延迟,提出了一种优化任务指派的算法.在一个流水线中,每个任务都可以是一个数据并行程序.当多个任务被指派到同一个并行系统时,假设每个任务排他地使用一组处理机.根据优化目的,优化过程... 为了缩短网格中数据并行流水线在吞吐率受限下的延迟,提出了一种优化任务指派的算法.在一个流水线中,每个任务都可以是一个数据并行程序.当多个任务被指派到同一个并行系统时,假设每个任务排他地使用一组处理机.根据优化目的,优化过程可分成连续的两个阶段,即提高吞吐率和缩短吞吐率受限下的延迟.对不同的优化阶段,用不同的启发式算法确定一个并行系统中每个任务的处理机数.改派任一任务都会使流水线的性能发生变化,性能提高的幅度被称为任务优先级.通过重复改派优先级最高的任务,流水线的性能可迅速提高,这在仿真实验中已得到了证实. 展开更多
关键词 网格 流水线 数据并行流水线 吞吐率 延迟 任务指派
下载PDF
并行分时流水线A/D转换器系统级研究
11
作者 王友华 张俊安 +1 位作者 余金山 王永禄 《微电子学》 CAS CSCD 北大核心 2010年第2期165-168,共4页
基于并行分时A/D转换器的理论研究,对该类型A/D转换器进行了系统行为级设计和仿真。分析了系统中并行误差及流水线A/D转换器等误差源对整个系统性能的影响。通过计算机仿真,给出了系统模块的设计参数。通过理论分析与系统仿真,为并行分... 基于并行分时A/D转换器的理论研究,对该类型A/D转换器进行了系统行为级设计和仿真。分析了系统中并行误差及流水线A/D转换器等误差源对整个系统性能的影响。通过计算机仿真,给出了系统模块的设计参数。通过理论分析与系统仿真,为并行分时流水线A/D转换器的设计提供了理论依据和数据参考,为该类型A/D转换器提供了设计优化方向。 展开更多
关键词 并行分时流水线 A/D转换器 系统建模
下载PDF
数据并行流水线网格调度的一种优化方法
12
作者 张琳 王庆江 《计算机工程》 CAS CSCD 北大核心 2007年第11期82-84,共3页
为改进计算网格上数据并行流水线的性能,用模拟退火算法优化调度,用一个实验性方法确定初始控制参数,用一个随机方法选择下一个调度方案。调整最佳调度方案的稳定次数,可实现优化开销和优化效果之间的折中。实验显示,该文的模拟退火可... 为改进计算网格上数据并行流水线的性能,用模拟退火算法优化调度,用一个实验性方法确定初始控制参数,用一个随机方法选择下一个调度方案。调整最佳调度方案的稳定次数,可实现优化开销和优化效果之间的折中。实验显示,该文的模拟退火可有效优化流水线的调度。 展开更多
关键词 网格 调度 数据并行流水线 模拟退火
下载PDF
堆滤波并行流水线实现结构
13
作者 胡梦佑 陈钧量 马宗龙 《中山大学学报(自然科学版)》 CAS CSCD 1994年第1期37-41,共5页
根据信号的广义阈值分解特性,获得了调整阈值电平的修正二叉树搜索算法,并提出一种堆滤波的并行流水线式实现结构。
关键词 堆滤波 并行流水线结构 滤波理论
下载PDF
并行流水线实现的多红外标志点实时标记与识别新方法 被引量:5
14
作者 周平 王肖玉 +1 位作者 刘越 王涌天 《仪器仪表学报》 EI CAS CSCD 北大核心 2009年第6期1240-1244,共5页
提出了一种FPGA实现的实时标记与识别多个红外标志点的方法。针对红外标志点所形成的连通域特点,提出对应的扫描窗口以及减少等价表处理量的办法。通过使用并行流水线完成图像平滑滤波?阈值处理?初次标记?二次扫描以及重心解算等一系列... 提出了一种FPGA实现的实时标记与识别多个红外标志点的方法。针对红外标志点所形成的连通域特点,提出对应的扫描窗口以及减少等价表处理量的办法。通过使用并行流水线完成图像平滑滤波?阈值处理?初次标记?二次扫描以及重心解算等一系列操作,实现了在不同照度环境下对多个红外标志点目标的实时标记和二维位置识别。实验结果表明原始图像数据与处理结果之间只有4个像素时钟的延迟,识别精度精确到亚像素,能够满足医学手术导航等对实时性要求高的应用场合要求。 展开更多
关键词 实时处理 连通域标记 识别 并行流水线
下载PDF
并行流水线模数转换器 被引量:1
15
作者 吕彦涛 张晓林 张超 《电子测量技术》 2005年第6期63-64,共2页
文中讨论并行流水线模数转换器的结构和设计方法,并且给出CMOS工艺下的测试结论。对高速模数转换器设计方法的研究对于开发第三代移动通信产品具有重要的意义。
关键词 CMOS 并行流水线 模数转换器 设计方法 ADC结构
下载PDF
实时星图预处理的并行流水线算法 被引量:1
16
作者 秦天沐 王伟东 +1 位作者 王海涌 刘佳琪 《半导体光电》 北大核心 2017年第2期257-263,共7页
为提高星敏感器的星图预处理速度,减少嵌入式资源消耗,提出了一种并行流水线算法。剔除了星像点本身对背景噪声标准差(噪声水平)和均值两个特征值估计的影响,建立了是否开展滤噪的准则,确定了星图噪声的提取阈值,保证了质心定位精度。... 为提高星敏感器的星图预处理速度,减少嵌入式资源消耗,提出了一种并行流水线算法。剔除了星像点本身对背景噪声标准差(噪声水平)和均值两个特征值估计的影响,建立了是否开展滤噪的准则,确定了星图噪声的提取阈值,保证了质心定位精度。将星图缓存量降低至两行数据,用100个移位寄存器记录连通域标号,解决了嵌入式资源浪费和连通域溢出问题。仿真结果表明,50M速率输入的496×496星图流水处理完成后延迟10μs便可实时输出需要的亮星数据,使用的存储器和寄存器资源不到80kB。加入背景电平和高斯噪声后,在信噪比大于1的条件下质心精度优于1/23像素量级,验证了并行流水线的实时星图预处理算法的有效性,有助于提高星敏感器数据输出率及抗动态性能。 展开更多
关键词 并行流水线 实时性 资源消耗 质心定位 滤波
下载PDF
基于优化时间重叠技术的并行流水线A/D转换器
17
作者 张思栋 黄鲁 林贝元 《微电子学》 CAS CSCD 北大核心 2007年第5期712-716,共5页
提出了一种基于优化时间重叠技术的10位300 MHz采样率4路并行流水线A/D转换器的设计方法,该方法降低了对运算放大器的要求。通过理论计算和实例设计,证明了此低功耗设计方法的显著效果。设计了一个用于前端的运算放大器,在CSM 0.35μm C... 提出了一种基于优化时间重叠技术的10位300 MHz采样率4路并行流水线A/D转换器的设计方法,该方法降低了对运算放大器的要求。通过理论计算和实例设计,证明了此低功耗设计方法的显著效果。设计了一个用于前端的运算放大器,在CSM 0.35μm CMOS工艺、3.3 V电源电压下,该运放的增益为106 dB,单位增益带宽为402 MHz,建立时间为8.8 ns。采用优化时间重叠技术后,可满足4路并行300 MHz采样率的要求,功耗仅为8.57 mW,可大大降低整个并行流水线A/D转换器的功耗。 展开更多
关键词 并行流水线A/D转换器 时间重叠 低功耗运算放大器 采样保持电路
下载PDF
HARP:并行流水线RISC处理机
18
作者 Stev.,GB 范伟光 《国外微计算机》 1990年第1期1-11,共11页
关键词 并行流水线 PISC 处理机 指令系统
下载PDF
高速深流水线浮点加法单元的设计
19
作者 张明 郑莉平 余宁梅 《微型机与应用》 2015年第20期15-17,共3页
在X87执行环境下,采用基于Two-Path算法的并行深度流水线优化算法,设计了一种能够实现符合IEEE-754标准的单精度、双精度和扩展双精度及整型数据且舍入模式可控的高速浮点加法器。采用并行深度流水设计,经验证,功能满足设计要求,使用TSM... 在X87执行环境下,采用基于Two-Path算法的并行深度流水线优化算法,设计了一种能够实现符合IEEE-754标准的单精度、双精度和扩展双精度及整型数据且舍入模式可控的高速浮点加法器。采用并行深度流水设计,经验证,功能满足设计要求,使用TSMC 65 nm工艺库进行综合,其工作频率可达900 MHz。 展开更多
关键词 浮点加法器 IEEE-754 Two-Path算法 并行流水线
下载PDF
网络存储系统多并行度I/O流水调度策略与实践
20
作者 曾令仿 冯丹 +1 位作者 王芳 田磊 《计算机研究与发展》 EI CSCD 北大核心 2007年第z1期161-167,共7页
将应用的I/O请求处理划分为多个阶段,为流水线技术引入网络存储提供了新思路.同时,应用的I/O请求(工作量)以并行度划分为多个子工作量来通过各流水段,这样,一批处于同一流水段的子工作量之间存在同步开销,合理划分网络存储I/O流水段、探... 将应用的I/O请求处理划分为多个阶段,为流水线技术引入网络存储提供了新思路.同时,应用的I/O请求(工作量)以并行度划分为多个子工作量来通过各流水段,这样,一批处于同一流水段的子工作量之间存在同步开销,合理划分网络存储I/O流水段、探讨I/O流水机制,对提高网络存储系统整体性能具有一定的指导及实践意义.实验表明,I/O调度采用流水线的方式,能重叠I/O处理相关各阶段的操作,提高网络存储系统I/O性能. 展开更多
关键词 网络存储 I/O流水线 流水线并行 网络磁盘阵列
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部