期刊文献+
共找到572篇文章
< 1 2 29 >
每页显示 20 50 100
一种基于ARMv8架构CPU的算法加速方法
1
作者 孟承 王静娇 《雷达与对抗》 2023年第3期37-39,47,共4页
基于目前主流的硬件平台ARMv8架构CPU,提出一种使用SIMD技术的算法加速方法,以atan2函数为例,与标准库的性能作对比。实验结果表明,在FT1500计算平台上,采用此种方式优化的算法性能有显著提升。
关键词 雷达信号处理 CPU SIMD 算法加速
下载PDF
全局自动图像配准算法加速器 被引量:3
2
作者 李宝峰 田宝华 +1 位作者 张晓明 郑明玲 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2012年第10期1363-1368,共6页
由于全局自动图像配准算法计算和存储复杂度高,不易实现实时处理,为此提出一种改进的基于块的全局自动图像配准算法加速器结构(BWAGIR II).该结构采用双组多体存储结构及优化的数据放置策略,支持在单个时钟周期内同时读取4×4插值... 由于全局自动图像配准算法计算和存储复杂度高,不易实现实时处理,为此提出一种改进的基于块的全局自动图像配准算法加速器结构(BWAGIR II).该结构采用双组多体存储结构及优化的数据放置策略,支持在单个时钟周期内同时读取4×4插值窗口中的16个像素值;并采用定浮混合计算逻辑,以支持定点和浮点操作数的混合计算.FPGA实现结果表明,采用文中结构对5个BWAGIR II处理单元的数据吞吐率超过258×106像素?s. 展开更多
关键词 图像配准 并行处理 算法加速 FPGA
下载PDF
实现基于FPGA的硬件算法加速器 被引量:2
3
作者 叶淑群 陈鸿鹏 梁士坤 《宝鸡文理学院学报(自然科学版)》 CAS 2006年第2期154-155,168,共3页
目的通过具体的方法和示例,说明使用FPGA来实现硬件算法加速是一种较好的方法。方法通过采用FPGA实现CRC算法的硬件加速器与采用传统的软件优化相比较,说明FPGA的优越性。结果基于FPGA的硬件算法加速器,既可提高系统的计算能力,也可节... 目的通过具体的方法和示例,说明使用FPGA来实现硬件算法加速是一种较好的方法。方法通过采用FPGA实现CRC算法的硬件加速器与采用传统的软件优化相比较,说明FPGA的优越性。结果基于FPGA的硬件算法加速器,既可提高系统的计算能力,也可节约成本,缩小系统体积。结论根据目标系统的功能需求,使用FPGA来实现硬件算法加速是一种有效、简便、经济的方法。 展开更多
关键词 硬件算法加速 FPGA处理器 CRC外围电路
下载PDF
基于SIMD的CFAR算法加速 被引量:1
4
作者 李寿阳 何国强 刘巍 《国外电子测量技术》 2019年第1期42-47,共6页
针对雷达信号处理领域中的恒虚警率(constant false alarm rate,CFAR)算法的广泛应用,在高性能DSP上实现CFAR算法的性能优化具有研究价值。首先阐述了CFAR算法在雷达信号处理流程中用来解决杂波背景数据的干扰问题的基本原理;其次给出... 针对雷达信号处理领域中的恒虚警率(constant false alarm rate,CFAR)算法的广泛应用,在高性能DSP上实现CFAR算法的性能优化具有研究价值。首先阐述了CFAR算法在雷达信号处理流程中用来解决杂波背景数据的干扰问题的基本原理;其次给出了高性能DSP向量核的硬件架构设计,给出了流水排布优化、Cache预取等利于算法并行化运算的硬件优化实现方案;最后运用单指令多数据流(SIMD)指令对CFAR算法进行了重写优化。实验结果表明,设计的向量核模块与SIMD指令集使CFAR算法能够充分发挥处理器的计算性能,与C接口的CFAR算法相比可以大幅度缩小算法实现时间。 展开更多
关键词 恒虚警率算法 SIMD 向量运算部件 算法加速实现
下载PDF
基于CPU-FPGA异构系统的排序算法加速 被引量:1
5
作者 寇远博 邱泽宇 +1 位作者 王亮 黄建强 《电子技术应用》 2022年第1期18-23,30,共7页
传统的排序方法主要以软件串行的方式实现,包括冒泡排序、选择排序等。这些算法往往采用顺序比较,运算的时间复杂度较高。近年来已经提出了一些并行度较高的排序算法,但是由于CPU的硬件特点,不能很好地利用这些算法的并行性。而FPGA具... 传统的排序方法主要以软件串行的方式实现,包括冒泡排序、选择排序等。这些算法往往采用顺序比较,运算的时间复杂度较高。近年来已经提出了一些并行度较高的排序算法,但是由于CPU的硬件特点,不能很好地利用这些算法的并行性。而FPGA具有良好的灵活性、并行性和集成性等特点,因此在FPGA上可以更好地发挥这些并行算法的优势,从而大大提高数据排序的实时性。基于此设计了一个CPU-FPGA异构系统,将一些排序算法移植到FPGA上,并进行功能验证和理论性能评估。结果显示,该系统对于并行性高的排序算法具有良好的加速效果,但逻辑资源消耗巨大,适用于实时性要求高的算法加速场景。 展开更多
关键词 FPGA 排序算法 异构系统 算法加速
下载PDF
基于改进Markov邻域的非线性0-1规划智能算法加速策略 被引量:1
6
作者 李维鹏 曾静 张国良 《计算机应用》 CSCD 北大核心 2016年第9期2416-2421,2471,共7页
大规模非线性0-1规划问题求解时间较长,通过分析非线性0-1规划问题特点及算法寻优的Markov过程,提出一种基于改进Markov邻域的智能算法加速策略。首先,根据0-1规划问题解特点给出了非线性0-1规划问题的改写模型;随后,基于该模型给出了... 大规模非线性0-1规划问题求解时间较长,通过分析非线性0-1规划问题特点及算法寻优的Markov过程,提出一种基于改进Markov邻域的智能算法加速策略。首先,根据0-1规划问题解特点给出了非线性0-1规划问题的改写模型;随后,基于该模型给出了改进的Markov邻域,并推导和证明了改进邻域下任意两个状态之间的可达概率及其条件;最后,通过进一步分析非线性0-1规划模型并融合所提出的改进邻域,设计了采用Markov过程的智能算法的约束条件和目标函数递推更新策略对算法进行加速。采用不同算例进行多次测试,结果表明,在保持加速算法与原算法寻优效果相当的前提下,该策略对多种智能算法的寻优效率均有不同程度的提升。 展开更多
关键词 非线性0-1规划 Markov邻域 智能算法加速 递推更新
下载PDF
基于Eigen和OpenCV的图像算法加速 被引量:1
7
作者 舒畅 秦肖臻 《微型机与应用》 2017年第24期40-43,共4页
OpenCV作为一款免费、开源的计算机视觉库已广泛应用于图像处理的各种项目开发中。在算法实现中,高性能的线性代数运算库能提升算法的执行效率和算法实现灵活性。介绍了Eigen线性代数运算库,并在矩阵运算效率上与OpenCV进行了比较。以基... OpenCV作为一款免费、开源的计算机视觉库已广泛应用于图像处理的各种项目开发中。在算法实现中,高性能的线性代数运算库能提升算法的执行效率和算法实现灵活性。介绍了Eigen线性代数运算库,并在矩阵运算效率上与OpenCV进行了比较。以基于SVD分解的图像压缩算法为例,将Eigen和OpenCV进行联合编程并给出了主要代码。 展开更多
关键词 OPENCV EIGEN 图像处理 算法加速
下载PDF
对Schoof算法加速方法的研究
8
作者 杨元华 邵桂芳 《现代计算机》 2009年第4期36-39,共4页
介绍两种计算椭圆曲线离散对数的求解算法——袋鼠算法和BSGS算法,并比较了它们各自的特点。将它们应用于对Schoof算法的加速过程中,提出了加速后的算法。实验结果说明加速后可以获得很大的速度的提升。
关键词 算法 袋鼠算法 算法 算法加速
下载PDF
使用紧耦合协处理器进行算法加速
9
作者 Harn Hua Ng Dan Isaacs 《电子产品世界》 2005年第10B期85-88,共4页
关键词 紧耦合协处理器 算法加速 现场可编程门阵列 芯片 FPGA 加速机制
下载PDF
利用 VMM 平台和 AMBA VIP 对安全算法加速器模块的验证
10
作者 陈岩 王琪 李薇 《中国集成电路》 2013年第4期42-47,共6页
随着安全算法的发展,其复杂性和算法操作数据位数也随之迅速增加。安全算法的硬件实现和加速器化已成为必然趋势。本文针对北京华虹集成电路设计有限公司的安全算法加速器IP核的验证项目,介绍了Synopsys公司VMM验证平台和AMBAVIP在其中... 随着安全算法的发展,其复杂性和算法操作数据位数也随之迅速增加。安全算法的硬件实现和加速器化已成为必然趋势。本文针对北京华虹集成电路设计有限公司的安全算法加速器IP核的验证项目,介绍了Synopsys公司VMM验证平台和AMBAVIP在其中的应用。主要阐述了选择VMM验证平台与AMBAVIP的依据;VMM环境中定向测试发生器(Generator)模块的编写、测试案例编写、安全算法的设计、仿真信息筛选方面的应用技巧。通过本验证平台,查出了加速器很多处设计错误。仿真平台验证结束后,在FPGA上对本加速器进行了大量椭圆曲线的测试。所有测试全部通过,证明了本验证平台的有效性。 展开更多
关键词 验证 VMM AMBA VIP 安全算法加速 SYSTEMVERILOG
下载PDF
求解非线性方程组的非单调自适应加速Levenberg-Marquardt算法
11
作者 曹名圆 李蓉 +1 位作者 闫雪丽 黄庆道 《吉林大学学报(理学版)》 CAS 北大核心 2024年第3期538-546,共9页
提出一种新的求解非线性方程组的非单调自适应加速Levenberg-Marquardt算法,该算法使用一种新的自适应函数更新Levenberg-Marquardt参数,这种Levenberg-Marquardt参数的更新方式可提高过于成功的迭代中模型与目标函数的一致性,从而加快... 提出一种新的求解非线性方程组的非单调自适应加速Levenberg-Marquardt算法,该算法使用一种新的自适应函数更新Levenberg-Marquardt参数,这种Levenberg-Marquardt参数的更新方式可提高过于成功的迭代中模型与目标函数的一致性,从而加快算法的收敛速度.数值实验结果表明,该算法具有良好的数值计算性能. 展开更多
关键词 自适应函数 非单调技术 加速Levenberg-Marquardt算法
下载PDF
基于双向安德森加速分解协调算法的输配协同无功优化
12
作者 路镇铭 徐英 +2 位作者 仪忠凯 李志民 郭钰锋 《电力系统自动化》 EI CSCD 北大核心 2024年第12期130-138,共9页
新型电力系统中新能源渗透率不断增加,输电网和配电网协同运行环境复杂多变,对输配协同优化算法的收敛性提出了更高的挑战。鉴于此,应用广义主从分裂法将输配协同无功优化问题分解为输电网和多个配电网的并行优化问题;为改善广义主从分... 新型电力系统中新能源渗透率不断增加,输电网和配电网协同运行环境复杂多变,对输配协同优化算法的收敛性提出了更高的挑战。鉴于此,应用广义主从分裂法将输配协同无功优化问题分解为输电网和多个配电网的并行优化问题;为改善广义主从分裂法的计算效率,提出了基于功率、电压等多元信息交互及历史信息修正的双向安德森加速策略;在此基础上,提出了融合原对偶内点法、启发式算法和辅助函数的输配协同无功优化方法,实现了输电网和配电网多种类灵活性资源的协调配合和优化控制。算例仿真结果表明,所提方法能有效改善主从分裂法边界的收敛性能,在大规模分布式能源接入的输配协同无功优化场景中具有更好的应用价值。 展开更多
关键词 新型电力系统 输配协同优化 无功优化 广义主从分裂法 双向安德森加速算法
下载PDF
云环境下实现容器部署的加速粒子群优化算法
13
作者 陆海锋 赵嘉凌 +2 位作者 欧阳学名 周娜琴 左利云 《计算机应用研究》 CSCD 北大核心 2024年第3期756-763,共8页
基于容器的微服务部署是一个具有挑战性的问题,为获得更好的用户体验并给云供应商带来更多的利润,需要在降低微服务的故障率和减少响应时间的同时提高资源利用率。提出了一种改进的加速粒子群优化算法,用于解决集群中微服务容器部署的... 基于容器的微服务部署是一个具有挑战性的问题,为获得更好的用户体验并给云供应商带来更多的利润,需要在降低微服务的故障率和减少响应时间的同时提高资源利用率。提出了一种改进的加速粒子群优化算法,用于解决集群中微服务容器部署的多目标优化问题。该算法通过考虑微服务之间的调用关系,使得容器聚集在一起,从而降低服务的数据传输成本、减少故障率,并提高集群资源利用率。与现有部署算法相比,实验结果表明,所提出的优化算法在服务间的数据传输开销、故障率和资源利用率等性能指标上有明显改善。具体表现在:容器聚集度的提升达到40%以上,数据传输消耗平均有提升4%以上,故障率减少10%~20%,利用率提升3%左右。 展开更多
关键词 云计算 微服务 容器 加速粒子群算法 多目标优化
下载PDF
基于加速分层遗传算法-投影寻踪模型的三峡水质评价
14
作者 吴克祥 《绿色科技》 2024年第8期128-133,共6页
针对基于遗传算法的投影寻踪模型的不足,提出了基于加速分层遗传算法的投影寻踪模型,提高了全局搜索能力和收敛速度。并将其应用于长江流域水体水质的评价中。利用长江三峡库区8个断面的水质指标监测数据,建立基于加速分层遗传算法的投... 针对基于遗传算法的投影寻踪模型的不足,提出了基于加速分层遗传算法的投影寻踪模型,提高了全局搜索能力和收敛速度。并将其应用于长江流域水体水质的评价中。利用长江三峡库区8个断面的水质指标监测数据,建立基于加速分层遗传算法的投影寻踪模型,对各断面水质展开评价。结果显示:该段流域内水体质量整体良好,水质等级主要分布在《地表水环境质量标准》(GB3838-2002)Ⅱ类、Ⅲ类、Ⅳ类等级中。该模型能够合理的评价水质等级,值得广泛推广应用。 展开更多
关键词 加速分层遗传算法 投影寻踪 长江 水质评价
下载PDF
基于加速遗传算法的电力系统继电保护定值优化方法
15
作者 韩晓光 郭安琪 《电气时代》 2024年第6期66-69,共4页
提出基于加速遗传算法的电力系统继电保护定值优化方法研究。对原始继电保护定值优化问题进行转化,将其抽象成一个多目标、多变量和多约束的优化求解过程,分别以选择性、速动性、灵敏性及可靠性为基础,构建了约束条件,并设计了电力系统... 提出基于加速遗传算法的电力系统继电保护定值优化方法研究。对原始继电保护定值优化问题进行转化,将其抽象成一个多目标、多变量和多约束的优化求解过程,分别以选择性、速动性、灵敏性及可靠性为基础,构建了约束条件,并设计了电力系统继电保护定值优化的适应度函数。 展开更多
关键词 电力系统继电保护 加速遗传算法 继电保护定值 速动性 适应度函数 定值优化 约束条件 优化求解
下载PDF
低剂量CT图像降噪的深度图像先验的目标偏移加速算法
16
作者 曾理 熊西林 陈伟 《电子与信息学报》 EI CSCD 北大核心 2023年第6期2188-2196,共9页
低剂量CT(LDCT)图像可大幅降低X射线辐射剂量,但存在大量噪声影响医生诊断。深度图像先验(DIP)是用随机张量作为神经网络的输入图像,以单张LDCT图像为目标进行迭代的无监督深度学习算法。但DIP方法需经过上千次的网络迭代才能得到最佳... 低剂量CT(LDCT)图像可大幅降低X射线辐射剂量,但存在大量噪声影响医生诊断。深度图像先验(DIP)是用随机张量作为神经网络的输入图像,以单张LDCT图像为目标进行迭代的无监督深度学习算法。但DIP方法需经过上千次的网络迭代才能得到最佳降噪结果,导致该方法运行速度过慢。因此,该文提出一种用于LDCT降噪的目标偏移DIP加速算法,旨在保持降噪图像质量的基础上提高运行速度。根据一个器官(如肺部)LDCT切片序列图像的相似性,该算法将以各切片分别作为目标图像对应的相互独立的网络迭代通过继承参数关联起来,在上一切片对应的网络参数的基础上更新当前切片对应的网络参数,并将当前切片对应的网络参数作为下一切片对应的网络迭代的基础;由于DIP网络的输入是固定的随机张量,与目标图像差距较大,该文利用传统降噪模型预处理后的LDCT图像作为网络输入,进一步提高网络迭代速度。实验表明,不使用传统模型预处理时,与原DIP网络运行速度相比,该文所提出的加速算法可以将迭代速度提高10.45%;当使用经过相对全变分(RTV)模型预处理的LDCT作为网络输入时,图像峰值信噪比不仅可以达到29.13,而且总迭代速度可以提高94.31%。综上所述,该文算法可在保持DIP降噪效果的基础上,大幅度提高运行速度,特别是RTV模型预处理后的CT图像作为网络输入时,对提高运行速度的效果更加明显。 展开更多
关键词 图像降噪 低剂量CT 深度学习 深度图像先验 加速算法
下载PDF
基于神经网络的格子玻尔兹曼算法
17
作者 韦伟汛 贺胜圣 黄志刚 《机电工程技术》 2024年第1期115-118,共4页
在科学研究和工业应用的复杂流域、多相流以及多物理流动问题的处理中,相较于传统计算流体力学方法(Computational Fluid Dynamics,CFD),格子玻尔兹曼算法(Lattice Boltzmann Method,LBM)具有程序结构简单、对复杂边界和非线性问题适应... 在科学研究和工业应用的复杂流域、多相流以及多物理流动问题的处理中,相较于传统计算流体力学方法(Computational Fluid Dynamics,CFD),格子玻尔兹曼算法(Lattice Boltzmann Method,LBM)具有程序结构简单、对复杂边界和非线性问题适应性强以及便于并行计算等诸多优点。然而,其作为一种显式算法,在计算过程中的迭代次数较多,进而消耗大量计算资源。利用神经网络在预测与回归方面的强大能力,基于LBM设计了一个具备单隐藏层的浅层人工神经网络预测模型并将其命名为ML-LBM(Machine Learning LBM)模型。该模型通过动态调整碰撞算子中不同驰豫时间,以粗化网格来重现精细分辨的参考模拟。对于顶盖驱动流问题,模型完成训练后,对测试集均方误差在6×10-5以下,精度得到了保障。相较于经典LBGK模型,ML-LBM模型的计算效率提升约9倍。 展开更多
关键词 格子玻尔兹曼算法 碰撞算子 神经网络结构 算法加速
下载PDF
两种新的Toeplitz矩阵填充加速临近梯度算法
18
作者 王川龙 牛建华 申倩影 《运筹学学报》 CSCD 北大核心 2023年第3期96-108,共13页
本文提出了两种改进的Toeplitz矩阵填充加速临近梯度算法,使迭代矩阵每一步都保持Toeplitz结构,从而降低了奇异值分解时间。在理论上,证明了新算法在一些合理条件下的收敛性。同时,数值实验表明,在Toeplitz矩阵填充问题中,新算法比加速... 本文提出了两种改进的Toeplitz矩阵填充加速临近梯度算法,使迭代矩阵每一步都保持Toeplitz结构,从而降低了奇异值分解时间。在理论上,证明了新算法在一些合理条件下的收敛性。同时,数值实验表明,在Toeplitz矩阵填充问题中,新算法比加速临近梯度(APG)算法在时间上有明显减少。 展开更多
关键词 矩阵填充 TOEPLITZ矩阵 加速临近梯度算法
下载PDF
分支定界搜索信息深度引导的电-气互联系统调度决策加速求解方法
19
作者 高倩 杨知方 +1 位作者 李文沅 卢毓东 《电工技术学报》 EI CSCD 北大核心 2024年第13期3990-4002,共13页
电-气互联系统调度决策问题旨在实现天然气系统和电力系统中可调节资源的最佳配置,其精准性与高效性直接影响电-气互联系统运行的安全性与经济性。为描述可调节资源离散状态、非线性运行特性等物理性质,电-气互联系统调度决策问题中含... 电-气互联系统调度决策问题旨在实现天然气系统和电力系统中可调节资源的最佳配置,其精准性与高效性直接影响电-气互联系统运行的安全性与经济性。为描述可调节资源离散状态、非线性运行特性等物理性质,电-气互联系统调度决策问题中含有规模庞大的离散决策变量,模型复杂度高,使得现有依赖于商业混合整数线性规划(MILP)求解器的电力系统运筹优化技术面临“组合爆炸”的计算负担。为此,该文提出一种分支定界搜索信息深度引导的电-气互联系统调度决策加速求解方法。所提方法利用分支定界初始搜索阶段的信息构建小规模辅助MILP模型,并内嵌于分支定界搜索过程,引导剪除更多冗余搜索空间,在不损失最优性的前提下加速收敛。基于RTS-GMLC电力系统和天然气系统不同负荷水平及线性分段数下的30个算例仿真结果说明,相比于直接使用商业MILP求解器,所提方法在不损失最优性的前提下可实现平均4.20倍的加速,验证了所提方法的有效性。 展开更多
关键词 电-气互联 调度决策 混合整数线性规划 加速算法
下载PDF
基于ARM + DSP的异构平台优化加速算法
20
作者 宋奇伟 晋高成 李丕丁 《建模与仿真》 2023年第3期2318-2329,共12页
OpenCL编程模型应用于ARM + DSP异构多核平台存在核心利用率低、开发效率低等问题。本文基于AM5728异构开发平台,对OpenCL异构编程模型进行研究,提出了异构多核计算动态优化加速算法。分析了动态优化加速算法中的最优分配比例算法和数... OpenCL编程模型应用于ARM + DSP异构多核平台存在核心利用率低、开发效率低等问题。本文基于AM5728异构开发平台,对OpenCL异构编程模型进行研究,提出了异构多核计算动态优化加速算法。分析了动态优化加速算法中的最优分配比例算法和数据划分原则,动态算法会根据运行情况动态调整相应参数。完成了测试系统的设计,对异构计算加速算法的相关参数进行测量,展示了Sobel算法、奇异值分解算法(SVD)分别采用计算加速驱动的结果和OpenCL异构编程模型的结果,分析两种不同方式下算法完成时间情况。测试结果表明优化加速算法使得Sobel算法执行时间降低至原执行时间的72.2%,SVD算法执行时间降低至原执行时间的80.2%。 展开更多
关键词 加速算法 异构平台 SVD算法 数据划分 异构计算 奇异值分解算法 编程模型 计算加速
下载PDF
上一页 1 2 29 下一页 到第
使用帮助 返回顶部