期刊文献+
共找到378篇文章
< 1 2 19 >
每页显示 20 50 100
Experiment investigation on visualization and operating characteristics of closed loop plate oscillating heat pipe with parallel channels 被引量:1
1
作者 SHI Wei-xiu PAN Li-sheng 《Journal of Central South University》 SCIE EI CAS CSCD 2016年第9期2410-2418,共9页
Using ethanol or acetone as the working fluid, visualization of oscillations in steady state was observed visually by high-speed cameras, and temperature oscillating and heat transfer characteristics of closed-loop pl... Using ethanol or acetone as the working fluid, visualization of oscillations in steady state was observed visually by high-speed cameras, and temperature oscillating and heat transfer characteristics of closed-loop plate oscillating heat pipe with parallel channels(POHP-PC) were experimentally investigated by varying liquid filled ratios(50%, 70%, 85%), section scales(1 mm×1 mm and 1 mm×1.5 mm), inclination angles, working fluids and heating inputs. It was found that during operating there was mixed flow consisting of plug flow and annular flow in channels of oscillating heat pipe at steady-state. There was an equilibrium position for working fluid of condenser during oscillating, and periodic oscillations occurred up and down in the vicinity of equilibrium position. With heat input increasing, equilibrium position rose slowly as a result of vapor pressure of evaporation.Evaporation temperature oscillating amplitude possessed a trend of small-large-small and frequency trend was of small-large during steady-state. It may be generally concluded that temperature, whether evaporator or condenser, fluctuated sharply or rose continuously when oscillating heat pipe coming to dry burning state. Simultaneously, it was found that temperature difference of cooling water possibly dropped with heat input rising during dry burning state. Thermal resistance of No. 2 with acetone was lower than that of No. 1 during experiments, but No. 2 achieving heat transfer limit was earlier than No. 1. However, with ethanol, thermal resistance of No. 1 and No. 2 were similar with the heating input less than 110-120 W and filling ratios of 50% and 70%. And with filling ratio of 85%, heating transfer performance of No. 2 was better compared to No. 1 during all the experiments. 展开更多
关键词 closed loop with parallel channels plate oscillating heat pipe VISUALIZATION temperature oscillating heat transfer performance filling ratio section scale
下载PDF
单回路空间两平移并联机构拓扑设计与尺度优化
2
作者 李菊 佘俊杰 +1 位作者 沈惠平 杜中秋 《农业机械学报》 EI CAS CSCD 北大核心 2024年第9期470-480,共11页
针对狭小空间内工作机器的需求,根据基于方位特征集的并联机构拓扑设计理论和方法,设计了12个移动副驱动的单回路空间两平移并联机构,并对其进行了自由度计算;对其中8个机构进行运动学建模,分别推导出其一元八次方程(封闭解)和符号式反... 针对狭小空间内工作机器的需求,根据基于方位特征集的并联机构拓扑设计理论和方法,设计了12个移动副驱动的单回路空间两平移并联机构,并对其进行了自由度计算;对其中8个机构进行运动学建模,分别推导出其一元八次方程(封闭解)和符号式反解,并进行数值算例验证;运用差分进化算法以限定尺度约束下的可达工作空间最大为优化目标,分别对其中8个机构进行尺度优化,并求得其对应的可达工作空间,对比分析后优选出2个具有最大可达工作空间的两平移并联机构;为刚度分析、动力学分析及结构设计奠定了基础。 展开更多
关键词 并联机构 单回路空间 两平移 尺度优化
下载PDF
一种变自由度单回路机构的变拓扑结构设计及拓扑分析
3
作者 李霞 沈惠平 +2 位作者 孟庆梅 李菊 杨廷力 《机械传动》 北大核心 2024年第2期83-89,共7页
特殊单回路机构通过一些特殊位置后会发生自由度变化,从而使其拓扑学、运动学/动力学性能发生变化,并适用于不同的应用背景。研究设计了一种由8个转动副(R)组成的单回路并联机构,它有3种运动模式,分别为2自由度、4自由度以及3自由度驱动... 特殊单回路机构通过一些特殊位置后会发生自由度变化,从而使其拓扑学、运动学/动力学性能发生变化,并适用于不同的应用背景。研究设计了一种由8个转动副(R)组成的单回路并联机构,它有3种运动模式,分别为2自由度、4自由度以及3自由度驱动,对应3个机构;然后,分析计算了3种运动模式下机构的方位特征集、自由度、耦合度3个主要拓扑特性,并分析了3种机构变拓扑结构的稳定性及可转变性;同时,对运动模式1、模式3下机构的位置正反解进行了分析。为基于这种变自由度单回路机构单元的可重构并联机构的研究提供了基础。 展开更多
关键词 变自由度 单回路 并联机构 拓扑设计 位置分析
下载PDF
3轨式横向对称分布6-PSS并联机构及性能优化 被引量:2
4
作者 施利涛 张海峰 叶伟 《轻工机械》 CAS 2024年第1期43-49,共7页
针对多滑块共轨式6-PSS并联机构存在的姿态工作空间小、容易奇异等问题,课题组提出一种3轨式分布的6-PSS并联机构(P为移动副,S为球副)。该并联机构杆件长度和轨道间距呈不均匀布置,以提升姿态工作空间;采用闭环矢量法进行位置分析,通过... 针对多滑块共轨式6-PSS并联机构存在的姿态工作空间小、容易奇异等问题,课题组提出一种3轨式分布的6-PSS并联机构(P为移动副,S为球副)。该并联机构杆件长度和轨道间距呈不均匀布置,以提升姿态工作空间;采用闭环矢量法进行位置分析,通过极限边界搜索法求解工作空间;基于运动/力传递指标对机构性能进行评估,并采用性能图谱法基于全域指标GTI进行机构尺寸优化。结果表明优化后机构运动/力传递性能有显著提升,同时姿态工作空间也得到提升。该机构在工程上有一定的实用性。 展开更多
关键词 并联机构 螺旋理论 闭环矢量法 极限边界搜索法 工作空间 全局传递性能指标
下载PDF
非线性环路补偿的交错并联BUCK变换器数字控制策略研究
5
作者 王重 周克亮 +1 位作者 吴琼 刘东南 《湖南文理学院学报(自然科学版)》 CAS 2024年第2期27-32,44,共7页
针对氢能燃料电池输出低电压、大电流,不能适用通讯基站电源的问题,设计了一种电力电子交错并联BUCK变换器,同时提出了一种非线性环路补偿的数字控制策略。文中采用两个BUCK电路并联,控制信号为180°两相交错脉冲宽度控制,采用小信... 针对氢能燃料电池输出低电压、大电流,不能适用通讯基站电源的问题,设计了一种电力电子交错并联BUCK变换器,同时提出了一种非线性环路补偿的数字控制策略。文中采用两个BUCK电路并联,控制信号为180°两相交错脉冲宽度控制,采用小信号模型建立了电压环、电流环数学模型,控制策略采用电流内环、电压外环双闭环控制。为了控制快准稳,分别对两环路控制策略补偿校正设计,通过环路补偿数字控制策略搭建交错并联BUCK变换器simulink模型,仿真结果表明变换器在输入范围下实现了48 V直流稳定输出,验证了本研究的有效性。 展开更多
关键词 小信号模型 环路补偿 交错并联 数字控制策略
下载PDF
基于双滞环的铅酸蓄电池组并联充放电控制
6
作者 于艇 李吉生 李彬 《自动化与仪表》 2024年第10期46-50,共5页
铅酸蓄电池组并联充放电过程中,面临单体性能差异导致的充放电不均衡问题,进而影响了电池组整体性能和寿命。对此,研究基于双滞环的铅酸蓄电池组并联充放电控制方法。首先,通过分析铅酸蓄电池组并联充放电工作状态,建立铅酸蓄电池组工... 铅酸蓄电池组并联充放电过程中,面临单体性能差异导致的充放电不均衡问题,进而影响了电池组整体性能和寿命。对此,研究基于双滞环的铅酸蓄电池组并联充放电控制方法。首先,通过分析铅酸蓄电池组并联充放电工作状态,建立铅酸蓄电池组工作等效模型;然后,将识别出的扰动因素作为传递函数的输入变量,从而确定扰动变量的传递函数;最后,基于双滞环技术原理,分解扰动变量进行误差弥补,实现铅酸蓄电池组并联充放电工作的均衡控制。实验结果表明,以某直流系统中退运的铅酸蓄电池组作为测试对象,在所设计方法应用后,可以实现单组电池在并联充放电过程中的额定电压控制,有效保证其稳定运行。 展开更多
关键词 铅酸蓄电池组 双滞环技术 并联方式 充放电状态 控制方法
下载PDF
循环展开在电磁场计算中的应用
7
作者 邢阔鹏 阎秀恪 任自艳 《东北电力技术》 2024年第2期5-10,共6页
在电气设备电磁场数值分析过程中,程序代码中含有大量的循环计算,其计算时间随有限元分析网格中单元和节点数量的增加而迅速增加。为提高循环计算时硬件资源的利用率、减少计算时间,根据循环计算相关特征量,研究能够预测不同循环中最佳... 在电气设备电磁场数值分析过程中,程序代码中含有大量的循环计算,其计算时间随有限元分析网格中单元和节点数量的增加而迅速增加。为提高循环计算时硬件资源的利用率、减少计算时间,根据循环计算相关特征量,研究能够预测不同循环中最佳循环展开因子的机器学习算法。首先建立不同的机器学习回归算法模型预测不同特征变量的循环计算时间,对模型的参数进行优化以提高预测准确率,通过比较计算时间找出最佳展开因子。然后建立循环特征变量与展开因子之间机器学习分类算法模型,预测得到最优循环展开因子。最后将算法应用于预测有限元分析代码中循环计算的最佳展开因子,将结果在1台单相变压器磁场有限元分析代码中进行循环展开,计算得到展开前后时间的加速程度。循环展开技术可以应用到有限元串行和并行计算中,并且在不同的程序中都有很好的适应性。 展开更多
关键词 循环展开 电磁计算 机器学习 并行计算
下载PDF
极对数为奇数的分数槽4支路绕组接线设计
8
作者 赵志强 黄亿良 《大电机技术》 2024年第5期38-45,共8页
三相电机的分数槽绕组通常采用6×60°标准相带进行设计,其并联支路数必须为每相槽数和极数的公因数才能实现三相平衡。据此,当极对数为奇数时不能实现4支路平衡绕组。某些水轮发电机由于并联支路数受此限制而无法设计得具有合... 三相电机的分数槽绕组通常采用6×60°标准相带进行设计,其并联支路数必须为每相槽数和极数的公因数才能实现三相平衡。据此,当极对数为奇数时不能实现4支路平衡绕组。某些水轮发电机由于并联支路数受此限制而无法设计得具有合理的电磁参数和经济性。本文提出一种新的设计方法—环状相带设计法,可以避免标准相带设计理论中对于并联支路数的限制,在极对数为奇数时仍然能够采用4支路三相平衡绕组,解决了抽水蓄能电站用大容量14极发电电动机的最佳电磁设计问题。文中详细描述了环状相带的电气短距效应的构成方法,给出了包括铁心振动计算所需的分数次谐波在内的所有谐波的分布系数和短距系数的计算公式。 展开更多
关键词 分数槽 波绕组 四支路 环状相带 三相电机
下载PDF
TMS320C6X的SPLOOP技术
9
作者 方志红 常越 《雷达科学与技术》 2014年第4期437-440,445,共5页
软件流水是一种实现循环迭代中指令级并行的指令调度技术。它可以克服多周期指令延迟对CPU处理性能的影响,保证循环核的运行效率最优。从C64X+开始,TMS320C6X系列DSP引入SPLOOP技术,软件上增加SPLOOP(D/W)、SPKERNEL等相关指令,硬件上... 软件流水是一种实现循环迭代中指令级并行的指令调度技术。它可以克服多周期指令延迟对CPU处理性能的影响,保证循环核的运行效率最优。从C64X+开始,TMS320C6X系列DSP引入SPLOOP技术,软件上增加SPLOOP(D/W)、SPKERNEL等相关指令,硬件上增加软件流水缓存等专用模块,通过模调度软件流水模式,有效缩小了软件代码量,提升了执行代码效率。一般情况下,采用SPLOOP技术后机器编译输出的循环代码质量很高,编程人员无需再对代码进行进一步的手工优化。 展开更多
关键词 软件流水 模调度 循环核 并行运算
下载PDF
低压大电流DCDC变换器并联均流控制研究
10
作者 罗国盛 汪国辉 《船电技术》 2024年第6期113-116,共4页
本文讨论了低压大电流工况下移相全桥变换器双模块并联电流失衡机理与均流控制技术。该技术采用电压环、电流环与均流环三环平均电流控制结构,给出了控制系统设计原则。利用Matlab仿真与一台10 kW样机分别进行仿真与实验验证,验证结果... 本文讨论了低压大电流工况下移相全桥变换器双模块并联电流失衡机理与均流控制技术。该技术采用电压环、电流环与均流环三环平均电流控制结构,给出了控制系统设计原则。利用Matlab仿真与一台10 kW样机分别进行仿真与实验验证,验证结果表明该控制结构有较好的自适应性,能够兼顾负载调整率与均流精度。 展开更多
关键词 变换器 移相全桥并联 三环控制 平均电流控制
下载PDF
复合驱动并联机构的动力学建模与仿真分析
11
作者 吴孟丽 陈莫 +3 位作者 李德祚 王旭浩 李明宇 林玉飞 《机械设计》 CSCD 北大核心 2024年第3期112-121,共10页
针对一种PUU-2PRRS 5自由度复合驱动并联机构的刚体动力学建模问题,采用拉格朗日法结合虚功原理建立刚体动力学模型并进行仿真分析。首先,在考虑存在次闭环的情况下,采用闭环矢量法对并联机构进行运动学分析,推导出机构各构件质心的线... 针对一种PUU-2PRRS 5自由度复合驱动并联机构的刚体动力学建模问题,采用拉格朗日法结合虚功原理建立刚体动力学模型并进行仿真分析。首先,在考虑存在次闭环的情况下,采用闭环矢量法对并联机构进行运动学分析,推导出机构各构件质心的线速度和角速度;其次,采用拉格朗日法结合虚功原理建立复合驱动并联机构的刚体动力学模型,为复合驱动并联机构驱动力的求解及后续动力学仿真分析奠定了基础;最后,基于MATLAB软件和ADAMS软件对该并联机构进行动力学仿真分析,在给定相同末端轨迹的情况下,对比两种软件得到的驱动力变化曲线,仿真结果验证了所建动力学模型的正确性。文中不仅为PUU-2PRRS 5自由度复合驱动并联机构控制系统的搭建打下了基础,也为其他复合驱动并联机构的动力学建模分析提供了理论依据。 展开更多
关键词 复合驱动并联机构 次闭环结构 刚体动力学建模 拉格朗日法 虚功原理
下载PDF
基于扩张状态观测器的并联直流变换器增强控制策略
12
作者 段鸣航 段建东 +1 位作者 王露霄 孙力 《电机与控制学报》 EI CSCD 北大核心 2024年第6期1-12,共12页
为进一步改善并联直流变换器在多种内外部扰动下的动态性能,提出一种基于双闭环扩张状态观测器(ESO)的增强控制策略。该策略将比例调节器与ESO相结合,然后分别应用于公共电压外环和各个电流内环,实现各功率单元的动态均流,也强化对输入... 为进一步改善并联直流变换器在多种内外部扰动下的动态性能,提出一种基于双闭环扩张状态观测器(ESO)的增强控制策略。该策略将比例调节器与ESO相结合,然后分别应用于公共电压外环和各个电流内环,实现各功率单元的动态均流,也强化对输入电压扰动的抑制能力,且无需额外传感器。首先,根据并联变换器的状态方程,推导内环电流ESO控制的表达式。然后,根据电流闭环极点的分布情况,从理论上分析ESO型电流内环在输入电压扰动抑制方面强于比例积分型电流内环的原因。此外,借助伯德图,给出ESO型电流内环对电感失配的鲁棒性更强并能有效消除动态电流偏差的理论依据。最后,使用三相buck变换器进行不同方案的对比验证,实验结果证明了所提策略在改进动态性能方面的有效性和先进性。 展开更多
关键词 并联直流变换器 扩张状态观测器 双闭环控制 参数鲁棒性 扰动抑制 动态均流
下载PDF
面向FT-M7002的阈值分割算法优化实现
13
作者 陈云 胡伟方 +1 位作者 王梦园 商建东 《计算机应用与软件》 北大核心 2024年第8期254-258,310,共6页
在国产高性能DSP的快速发展过程中,缺乏能充分发挥其体系结构优势的高性能图像处理算法。针对以上问题,对应用比较广泛的Otsu阈值分割算法进行面向FT平台的并行优化。在分析FT-M7002体系结构以及Otsu阈值分割算法的基础上,使用飞腾向量... 在国产高性能DSP的快速发展过程中,缺乏能充分发挥其体系结构优势的高性能图像处理算法。针对以上问题,对应用比较广泛的Otsu阈值分割算法进行面向FT平台的并行优化。在分析FT-M7002体系结构以及Otsu阈值分割算法的基础上,使用飞腾向量指令集进行手工向量化改写以充分利用FT-M7002平台超长向量寄存器,从而减少数据访存次数提高数据级并行性。在多种图像矩阵规模下进行性能测试,结果显示,阈值分割中的阈值比较模块优化后获得了3.74~4.39倍的加速效果,Otsu阈值分割算法总体优化实现获得了1.77~1.87倍的加速效果。 展开更多
关键词 FT-M7002 Otsu阈值分割 手工向量化 循环展开 数据级并行
下载PDF
基于无人机视频流的实时拼接方法研究
14
作者 刘彬 梁攀攀 +1 位作者 卢迪 靳冉 《现代电子技术》 北大核心 2024年第23期49-54,共6页
针对无人机视频流的实时拼接方法进行深入研究,提出一种多线程并行处理的无人机视频实时拼接方法,主要解决无人机视频流实时拼接问题。该方法充分利用计算机并行运算的特点,将视频实时拼接工作分解成多线程工作模式,主要由图像配准线程... 针对无人机视频流的实时拼接方法进行深入研究,提出一种多线程并行处理的无人机视频实时拼接方法,主要解决无人机视频流实时拼接问题。该方法充分利用计算机并行运算的特点,将视频实时拼接工作分解成多线程工作模式,主要由图像配准线程、非线性优化线程、闭环检测线程、图像拼接线程组成,其中图像配准线程实现对视频关键帧的自适应提取和配准,包括特征点检测、特征点匹配、图像粗配准;非线性优化线程完成对拼接参数模型的动态优化以最小化配准误差,及时修正实时配准引入的误差;闭环检测线程检测当前帧与历史帧存在的闭环图像对,通过闭环图像对进行非线性全局优化以最小化全局配准误差;图像拼接线程则根据优化后的配准参数动态生成拼接影像。通过4组实验数据验证了该方法的有效性和实用性,能有效消除多帧拼接的累积误差,实现对无人机视频流的实时拼接。 展开更多
关键词 无人机视频 多线程 并行处理 图像配准 非线性优化 闭环检测 累积误差 实时拼接
下载PDF
Loop Peeling Based on Quasi-Invariance/Induction Variables 被引量:1
15
作者 Litong Song, Robert Glück, Yoshihiko Futamura Institute for Software Production Technology, Waseda University, Okubo 3 4 1, Shinjuku ku Tokyo 169 8555, Japan 《Wuhan University Journal of Natural Sciences》 CAS 2001年第Z1期362-367,共6页
Loop optimization plays an important role in compiler optimization and program transformation. Many sophisticated techniques such as loop invariance code motion have been developed. Loop peeling is a technique to ass... Loop optimization plays an important role in compiler optimization and program transformation. Many sophisticated techniques such as loop invariance code motion have been developed. Loop peeling is a technique to assist parallelization of loops by unfolding loops a few times. This paper introduces a novel technique called loop peeling based on quasi invariance/induction variables. It aims at finding a general and automatic method to derive how many times a given loop should be peeled. Our technique allows for a number of iterations before some variables assigned inside a given loop become invariance or induction variables. In this paper we define the notion of quasi invariance/induction variables, present an algorithm for statically computing the optimal peeling length of a given loop. Our technique can increase the accuracy of program analyses, improve the effectiveness of loop peeling and is well suited as supporting other optimization techniques in the context of supercomputers. 展开更多
关键词 loop peeling parallelization induction variables quasi induction variables quasi invariance variables
下载PDF
Low-Delay Loop Detection Algorithm for LDPC Codes 被引量:5
16
作者 MA Ke-xiang ZHANG Peng 《中国电子科学研究院学报》 北大核心 2015年第4期341-343,349,共4页
Abstract:A low-delay loop detection algorithm for bit-flipping based iteration LDPC decoding is proposed.By introducing the concept of loop characteristic,only the iteration steps with loop characteristics are detecte... Abstract:A low-delay loop detection algorithm for bit-flipping based iteration LDPC decoding is proposed.By introducing the concept of loop characteristic,only the iteration steps with loop characteristics are detected and labeled for the subsequent loop detection.As a result,computation delay is greatly reduced.Furthermore,the position vector for the selected iteration steps is also established to implement loop detection for these iteration steps,which reduces the hardware cost of the loop detection as well.The validity of the proposed algorithm is verified by simulations. 展开更多
关键词 loop characteristics low delay position vector parallel
下载PDF
OPTIMAL ALGORITHM FOR NO TOOl-RETRACTIONS CONTOUR-PARALLEL OFFSET TOOL-PATH LINKING 被引量:8
17
作者 HAO Yongtao JIANG Lili 《Chinese Journal of Mechanical Engineering》 SCIE EI CAS CSCD 2007年第2期21-25,共5页
A contour-parallel offset (CPO) tool-path linking algorithm is derived without toolretractions and with the largest practicability. The concept of "tool-path loop tree" (TPL-tree) providing the information on th... A contour-parallel offset (CPO) tool-path linking algorithm is derived without toolretractions and with the largest practicability. The concept of "tool-path loop tree" (TPL-tree) providing the information on the parent/child relationships among the tool-path loops (TPLs) is presented. The direction, tool-path loop, leaf/branch, layer number, and the corresponding points of the TPL-tree are introduced. By defining TPL as a vector, and by traveling throughout the tree, a CPO tool-path without tool-retractions can be derived. 展开更多
关键词 Contour-parallel offset machining Tool-path loops Tool-path loop tree Optimal algorithm
下载PDF
基于LLVM Pass的复杂嵌套循环自动并行化框架 被引量:1
18
作者 马春燕 吕炳旭 +1 位作者 叶许姣 张雨 《软件学报》 EI CSCD 北大核心 2023年第7期3022-3042,共21页
随着多核处理器的普及应用,针对嵌入式遗留系统中串行代码的自动并行化方法是研究热点.其中,针对具有非完美嵌套结构、非仿射依赖关系特征的复杂嵌套循环的自动并行化方法存在技术挑战.提出了一种基于LLVMPass的复杂嵌套循环的自动并行... 随着多核处理器的普及应用,针对嵌入式遗留系统中串行代码的自动并行化方法是研究热点.其中,针对具有非完美嵌套结构、非仿射依赖关系特征的复杂嵌套循环的自动并行化方法存在技术挑战.提出了一种基于LLVMPass的复杂嵌套循环的自动并行化框架(CNLPF).首先,提出了一种复杂嵌套循环的表示模型,即循环结构树,并将嵌套循环的正则区域自动转换为循环结构树表示;然后,对循环结构树进行数据依赖分析,构建循环内和循环间的依赖关系;最后,基于OpenMP共享内存的编程模型生成并行的循环程序.针对SPEC2006数据集中包含近500个复杂嵌套循环的6个程序案例,分别对其进行复杂嵌套循环占比统计和并行性能加速测试.结果表明,提出的自动并行化框架可以处理LLVMPolly无法优化的复杂嵌套循环,增强了LLVM的并行编译优化能力,且该方法结合Polly的组合优化,比单独采用Polly优化的加速效果提升了9%-43%. 展开更多
关键词 复杂嵌套循环 自动并行化 LLVM Pass 依赖分析
下载PDF
RUMINATE METHOD-SOFTWARE PIPELINING ON NESTED LOOPS
19
作者 LEI WANG ZHIZHONGTANG and CHIHONG ZHANG(Dept. of Computer Science, Tsinghua Lirnivcrsitg Beijing 100084,P. R. China)(Final: wl,t ang ,zch@est4. dcs. tsinghua.edu. cn) 《Wuhan University Journal of Natural Sciences》 CAS 1996年第Z1期430-436,共7页
This paper offers a new method to solve the problem of software pipelininsr on nested loops. We first introduce our new software pipelininog method. Ruminate Method, which can optimize program with nested loops. We al... This paper offers a new method to solve the problem of software pipelininsr on nested loops. We first introduce our new software pipelininog method. Ruminate Method, which can optimize program with nested loops. We also outline an algorithm to realize it and introduce the hardware support we designed. The performance of Ruminate Method is analyzed at the end of this paper with the aid of our preliminary experimental result. 展开更多
关键词 Instruction-level parallelism Software Pipeline Ruminate Method Nested loop.
下载PDF
基于FPGA的卷积神经网络硬件加速器设计 被引量:3
20
作者 黄沛昱 赵强 李煜龙 《计算机应用与软件》 北大核心 2023年第3期38-44,共7页
为了提高中小规模设备卷积神经网络的推理速度,提出一种基于FPGA的卷积神经网络硬件加速器设计方案。针对模型中的卷积运算单元,该硬件加速器采用输入、输出二维循环展开和循环分块的方法,设计128个并行乘法器单元。模型的输入输出接口... 为了提高中小规模设备卷积神经网络的推理速度,提出一种基于FPGA的卷积神经网络硬件加速器设计方案。针对模型中的卷积运算单元,该硬件加速器采用输入、输出二维循环展开和循环分块的方法,设计128个并行乘法器单元。模型的输入输出接口采用双缓存设计,通过乒乓操作,降低数据传输带来的时间延迟。同时,采用16位定点量化模型中权重参数,偏置参数和输入输出特征图的像素值。实验结果表明,与通用CPU酷睿i5-4440处理器相比,在COCO数据集上准确率几乎不变的情况下,计算性能提高5.77倍。在系统时钟频率为150 MHz时,硬件加速器的计算性能达到28.88 GOPS。 展开更多
关键词 卷积神经网络 FPGA 循环展开 循环分块 并行乘法器单元 双缓存设计
下载PDF
上一页 1 2 19 下一页 到第
使用帮助 返回顶部