期刊文献+
共找到5,044篇文章
< 1 2 250 >
每页显示 20 50 100
一种二维来波方向估计的快速ESPRIT算法 被引量:3
1
作者 斯德谊 乐强 +1 位作者 沈士团 刘荣科 《北京航空航天大学学报》 EI CAS CSCD 北大核心 1999年第1期8-11,共4页
提出了一种快速ESPRIT算法.使用该算法和两平行均匀线阵可实现二维来波方向的快速估计.快速ESPRIT算法利用协方差矩阵中不受噪声影响的子块来估计来波方向,避免估计整个协方差矩阵和噪声功率,减少了特征分解的次数,大... 提出了一种快速ESPRIT算法.使用该算法和两平行均匀线阵可实现二维来波方向的快速估计.快速ESPRIT算法利用协方差矩阵中不受噪声影响的子块来估计来波方向,避免估计整个协方差矩阵和噪声功率,减少了特征分解的次数,大幅度地降低了运算量.而参数的估计性能接近PROESPRIT算法.最后给出计算机仿真结果。 展开更多
关键词 测向 信息处理 阵列雷达 快速esprit算法
下载PDF
用于线阵三维SAR成像的二维快速ESPRIT算法 被引量:2
2
作者 赵逸超 朱宇涛 +1 位作者 粟毅 杨猛 《雷达学报(中英文)》 CSCD 2015年第5期591-599,共9页
线阵3维SAR系统可实现对地面场景的3维成像,是近年来研究的热点。但受载机平台和硬件条件的限制,其切航迹向和沿航迹向的分辨率难以提高。为了改善2维分辨率,该文提出了一种用于线阵3维SAR成像的2维快速ESPRIT算法,首先结合盖式圆方法和... 线阵3维SAR系统可实现对地面场景的3维成像,是近年来研究的热点。但受载机平台和硬件条件的限制,其切航迹向和沿航迹向的分辨率难以提高。为了改善2维分辨率,该文提出了一种用于线阵3维SAR成像的2维快速ESPRIT算法,首先结合盖式圆方法和ESPRIT算法估计出点目标在切航迹向和沿航迹向位置,并通过该文改进的基于"区域生长"的2维位置配对方法替代最小二乘法快速求得目标散射系数,实现线阵2维SAR切航迹向和沿航迹向超分辨成像。该算法具有分辨精度高、运算速度快、实时性能好等优点。仿真实验证明了其有效性。 展开更多
关键词 线阵3维SAR esprit算法 超分辨 成像 区域生长
下载PDF
基于负集加权迭代修正最小二乘拟合原理的快速自适应拉曼光谱基线校正算法
3
作者 徐嘉阳 蒙思宇 +6 位作者 张志伟 陈弘毅 马玉婷 王策 齐向东 胡慧杰 宋一之 《光谱学与光谱分析》 北大核心 2025年第2期344-350,共7页
拉曼光谱是无损光谱分析技术,通过分析散射光的频率变化获取物质的分子结构信息。基线校正是提升光谱数据质量的关键步骤,可以去除背景信号和不相关噪声,凸显并纯化目标信号。传统的拉曼光谱技术对基线校正的时效性要求不高,但随着流式... 拉曼光谱是无损光谱分析技术,通过分析散射光的频率变化获取物质的分子结构信息。基线校正是提升光谱数据质量的关键步骤,可以去除背景信号和不相关噪声,凸显并纯化目标信号。传统的拉曼光谱技术对基线校正的时效性要求不高,但随着流式拉曼和内窥拉曼等需要实时处理光谱数据的应用场景增多,基线校正在速度和准确性要求也随之提高。传统的迭代多项式拟合和小波变换方法在时间、精度或自适应能力上存在不足。本研究开发了一种基于负集加权迭代修正最小二乘原理的快速自适应基线校正算法(MWIALS)。主要原理是提取负数集并赋予更高权重,在迭代过程中不断修正基线,并通过设置参数阈值以跳出循环,实现快速准确的基线校正。提出两种参数选择策略:固定参数(FMWIALS)适用于批量同类型光谱的快速处理,自适应(AMWIALS)适用于差异化光谱的自适应处理。该算法应用于颗粒物的流式拉曼光谱分析。结果表明,与其他主流算法相比,MWIALS在实际光谱处理上显著高效(平均处理时长47 ms·谱^(-1)),具有较高的准确性和自适应性。该算法能够满足流式拉曼和内窥拉曼等生物样本检测中实时光谱处理的需求,为拉曼光谱技术的进一步应用提供了强有力的支持。 展开更多
关键词 拉曼光谱 基线校正 流式拉曼 快速 自适应 负集加权迭代修正最小二乘算法(MWIALS)
下载PDF
基于RC-ESPRIT的稀疏EMVS-MIMO雷达二维测向算法
4
作者 王建龙 汪皓宇 +2 位作者 王习东 文方青 师俊朋 《信息对抗技术》 2025年第1期72-81,共10页
电磁矢量传感器多输入多输出(electromagnetic vector sensor multiple-input multiple-output,EMVS-MIMO)雷达是一种新兴技术,可实现二维波达角(2D-DOA)估计。针对单基地稀疏阵列EMVS-MIMO雷达,提出一种基于旋转不变性信号参数估计技术... 电磁矢量传感器多输入多输出(electromagnetic vector sensor multiple-input multiple-output,EMVS-MIMO)雷达是一种新兴技术,可实现二维波达角(2D-DOA)估计。针对单基地稀疏阵列EMVS-MIMO雷达,提出一种基于旋转不变性信号参数估计技术ESPRIT(estimation of signal parameters via rotational invariance techniques)的降复杂度(reduced-complexity,RC)信号参数估计算法,能够实现对目标2D-DOA的快速估计。首先,对接收阵列数据进行RC处理,以消除阵列冗余数据;其次,利用ESPRIT可获得高分辨率的俯仰角估计,由于阵列的稀疏性,该估计值具有模糊性;再次,利用矢量叉积技术获得具有无模糊特性的2D-DOA;最后,利用无模糊的俯仰角估计对有周期模糊的估计进行解模糊,获得具有高分辨率、无模糊特性的俯仰角估计。该算法适用于大规模EMVS-MIMO雷达系统,且相比现有的ESPRIT-Like算法拥有更高的估计精度,通过MATLAB仿真验证了算法的有效性。 展开更多
关键词 电磁矢量传感器 稀疏阵列 DOA估计 降复杂度 esprit算法
下载PDF
快速ESPRIT谐波集检测算法
5
作者 薛山花 尹力 黄海宁 《应用声学》 CSCD 北大核心 2011年第5期370-376,共7页
在各种高分辨谐波检测算法中,TLS-ESPRIT估计精度较高,因不需要谱峰搜索而具有较小的运算量。提出了一种快速ESPRIT算法,在不降低谱估计性能条件下,进一步减小了运算量。快速ESPRIT算法所需采样时间短,仅需两次特征值分解。分析表明,此... 在各种高分辨谐波检测算法中,TLS-ESPRIT估计精度较高,因不需要谱峰搜索而具有较小的运算量。提出了一种快速ESPRIT算法,在不降低谱估计性能条件下,进一步减小了运算量。快速ESPRIT算法所需采样时间短,仅需两次特征值分解。分析表明,此算法可以检测不同飞行状态的直升机声信号谐波集,是一种实时性好、有效实用的目标谱集探测方法。 展开更多
关键词 谐波集 TLS-esprit 快速esprit算法
下载PDF
合成孔径雷达快速后向投影算法综述 被引量:6
6
作者 邢孟道 马鹏辉 +2 位作者 楼屹杉 孙光才 林浩 《雷达学报(中英文)》 EI CSCD 北大核心 2024年第1期1-22,共22页
后向投影(BP)算法是合成孔径雷达成像算法发展的重要方向之一。然而,由于BP算法具有较大的计算量,阻碍了其在工程应用上的发展。因此,近年来如何有效地提高BP算法的运算效率受到了广泛的重视。该文讨论了基于多种成像面坐标系的快速BP算... 后向投影(BP)算法是合成孔径雷达成像算法发展的重要方向之一。然而,由于BP算法具有较大的计算量,阻碍了其在工程应用上的发展。因此,近年来如何有效地提高BP算法的运算效率受到了广泛的重视。该文讨论了基于多种成像面坐标系的快速BP算法,包括距离-方位平面坐标系、地平面坐标系和非欧氏坐标系。该文首先简要介绍了原始BP算法的原理和不同坐标系对加速BP算法的影响,并对BP算法的发展历程进行梳理。然后讨论了基于不同成像面坐标系的快速BP算法的研究进展,并重点介绍了作者所在研究团队近年来在快速BP成像方面完成的研究工作。最后介绍了快速BP算法在工程上的应用,并展望了未来快速BP成像算法的研究发展趋势。 展开更多
关键词 合成孔径雷达 快速后向投影算法 成像面 坐标系 运算效率
下载PDF
基于快速TLS-ESPRIT的间谐波检测算法 被引量:15
7
作者 张滨生 喻乐 +1 位作者 和敬涵 周文 《电力自动化设备》 EI CSCD 北大核心 2011年第2期26-31,共6页
提出改进的快速TLS-ESPRIT(全局最小二乘子空间旋转不变)算法,其在TLS-ESPRIT算法的基础上,通过降低奇异值分解维数,减小了计算量,并对计算结果不产生影响,可高精度地辨识电力系统中任意组合谐波和间谐波的频率、幅值和相位参数信息。... 提出改进的快速TLS-ESPRIT(全局最小二乘子空间旋转不变)算法,其在TLS-ESPRIT算法的基础上,通过降低奇异值分解维数,减小了计算量,并对计算结果不产生影响,可高精度地辨识电力系统中任意组合谐波和间谐波的频率、幅值和相位参数信息。在采样间隔10μs、采样2000点的实验条件下,用仿真信号(含均方差为1的白噪声)和实际牵引变电站监测信号进行间谐波分析试验,结果表明,该方法具有良好的频率分辨率和抗噪声能力,能够在较短的数据窗内有效地辨识出信号中的主要谐波和间谐波分量,计算误差小于0.5%;并且算法仅对周期信号敏感,不受频谱泄漏影响,实用性强。 展开更多
关键词 间谐波 esprit 快速傅里叶变换 TLS—esprit 降维
下载PDF
基于高阶累积量ESPRIT算法的指数衰减正弦信号参数估计
8
作者 单泽彪 徐恩达 +1 位作者 张旭 刘小松 《电子测量与仪器学报》 CSCD 北大核心 2024年第1期187-194,共8页
工程应用中环境噪声多表现为高斯有色噪声,而针对高斯白噪声进行处理的算法失效问题,提出了一种高斯色噪声环境中用于多分量衰减正弦信号频率和衰减因子估计的四阶累积量ESPRIT算法。首先,推导出四阶累积量与观测样本中的自相关矩阵和... 工程应用中环境噪声多表现为高斯有色噪声,而针对高斯白噪声进行处理的算法失效问题,提出了一种高斯色噪声环境中用于多分量衰减正弦信号频率和衰减因子估计的四阶累积量ESPRIT算法。首先,推导出四阶累积量与观测样本中的自相关矩阵和互相关矩阵之间的关系,求出其四阶累积量矩阵。其次,通过对四阶累积量进行广义特征值分解,根据广义特征值即可得到信号衰减因子和频率的估计值。最后对所提算法进行了仿真实验验证,在混合信噪比为0 dB时,所提算法针对多分量衰减正弦信号角频率和衰减因子的平均估计误差分别为0.002 0πrad和0.002 0。在高斯白噪声和高斯色噪声背景下与ESPRIT算法和Prony算法相比具有更强的噪声抑制能力和更高的估计精度。 展开更多
关键词 衰减正弦信号 高阶累积量 esprit算法 衰减因子估计 频率估计
下载PDF
基于约束最小冗余线阵的TLS-ESPRIT快速算法 被引量:1
9
作者 于波 杨莘元 《应用科技》 CAS 2004年第5期34-36,共3页
在各种高分辨测向算法中,TLS ESPRIT估计精度较高,因不需要谱峰搜索而具有更小的运算量.提出一种利用约束最小冗余线阵的快速TLS ESPRIT算法,在不降低阵列孔径利用率前提下,进一步减小了运算量.分析表明,该算法不仅降低了运算量,而且在... 在各种高分辨测向算法中,TLS ESPRIT估计精度较高,因不需要谱峰搜索而具有更小的运算量.提出一种利用约束最小冗余线阵的快速TLS ESPRIT算法,在不降低阵列孔径利用率前提下,进一步减小了运算量.分析表明,该算法不仅降低了运算量,而且在一定条件下,性能优于常规TLS ESPRIT算法,所得结论通过计算机仿真得到了验证. 展开更多
关键词 约束最小冗余线阵 TLS—esprit快速算法 估计精度 计算机仿真 空间谱估计 信号处理
下载PDF
一种快速二维虚拟ESPRIT算法 被引量:2
10
作者 李国民 薛倩 王安义 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2004年第2期321-324,共4页
通过对二维虚拟ESPRIT信号参量估计算法的分析,提出了一种快速二维虚拟ESPRIT算法.理论分析表明二者的估计结果相同,但快速二维虚拟ESPRIT算法的计算复杂度低,并由计算机仿真实验进行了验证.
关键词 谱估计 特征分解 虚拟阵列 二维esprit算法 阵列信号处理
下载PDF
二维ESPRIT算法参数的快速配对 被引量:4
11
作者 刁鸣 缪善林 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2008年第3期290-293,共4页
针对二维ESPRIT算法的参数估计问题,为了简化算法的复杂度,提高参数配对的速度,提出了一种新的二维ESPRIT参数配对方法.该方法利用矩阵、矩阵的特征值及特征值对应的特征向量三者之间的关系,只需对包含信号到达角信息的2个矩阵中的1个进... 针对二维ESPRIT算法的参数估计问题,为了简化算法的复杂度,提高参数配对的速度,提出了一种新的二维ESPRIT参数配对方法.该方法利用矩阵、矩阵的特征值及特征值对应的特征向量三者之间的关系,只需对包含信号到达角信息的2个矩阵中的1个进行1次特征值分解以及简单的除法运算就可以实现参数的自动配对,无需经过多次矩阵变换.在保证二维ESPRIT算法参数估计性能的前提下,该方法简化了参数的配对过程.计算机仿真验证了该方法的有效性. 展开更多
关键词 空间谱估计 二维波达方向估计 esprit算法 快速参数配对
下载PDF
金属片狭缝的快速DGTD算法研究
12
作者 杨谦 魏兵 李林茜 《电波科学学报》 CSCD 北大核心 2024年第6期1083-1088,共6页
某些精细结构(如周期结构)仿真中常含有金属片狭缝结构,此类结构精确仿真需要适应狭缝网格尺寸,消耗计算资源较大。为解决此问题,本文借鉴本小组前期细导线研究结果,基于电磁学理论中的对偶原理,即细导线可等效为电流、金属狭缝可等效... 某些精细结构(如周期结构)仿真中常含有金属片狭缝结构,此类结构精确仿真需要适应狭缝网格尺寸,消耗计算资源较大。为解决此问题,本文借鉴本小组前期细导线研究结果,基于电磁学理论中的对偶原理,即细导线可等效为电流、金属狭缝可等效为磁流,在研究中将金属片狭缝等效为磁流,从而避开复杂的前处理建模过程,可以降低建模及计算难度。算例表明,本文方案精确度较高,且能大幅降低计算资源,对其进一步优化研究可为相关多尺度问题提供技术储备。 展开更多
关键词 时域非连续伽辽金法 周期结构 金属片狭缝 细导线 快速算法
下载PDF
IPV6多跳网络环境下双通道快速切换算法的构建研究
13
作者 王祝先 赵忠凯 +3 位作者 叶润泽 关兴民 杨智涛 宋邦钰 《应用科技》 CAS 2024年第5期101-106,共6页
多跳网络环境下,节点的复杂性通常会对网络技术的适配性带来极大的挑战。为了提高其适应性,提出了一种双通道快速切换算法。该算法采用双通道设计和半监督学习策略,结合多头注意力机制,提高节点分类的精度和效率,同时优化网络的响应和... 多跳网络环境下,节点的复杂性通常会对网络技术的适配性带来极大的挑战。为了提高其适应性,提出了一种双通道快速切换算法。该算法采用双通道设计和半监督学习策略,结合多头注意力机制,提高节点分类的精度和效率,同时优化网络的响应和切换时间。实验结果证明,该方法的节点分类准确率达到95.56%,相较于卷积神经网络提高35.56%~62.23%;其最佳响应时间为0.22 s,相较于卷积神经网络领先了0.52~1.03 s;最佳切换时间为0.89 s。该方法的提出和实施,尤其是在节点分类精度和网络响应时间方面的优异表现,为多跳网络IPv6技术的适应性研究提供参考思路。 展开更多
关键词 快速切换 双通道 注意力机制 半监督学习 IPV6 图神经网络 节点分类 算法构建
下载PDF
ESPRIT算法广义逆矩阵求解的快速FPGA实现 被引量:1
14
作者 王卫江 张拓锋 +4 位作者 蒋荣堃 李泽英 王晓华 谭志昕 薛丞博 《北京理工大学学报》 EI CAS CSCD 北大核心 2022年第11期1200-1206,共7页
在基于旋转不变子空间的信号参数估计(estimating signal parameter via rotational invariance techniques,ESPRIT)算法中涉及到求解信号子空间矩阵的逆矩阵,针对常用方法计算复杂度高,实时性差等问题,提出使用广义逆公式对信号子空间... 在基于旋转不变子空间的信号参数估计(estimating signal parameter via rotational invariance techniques,ESPRIT)算法中涉及到求解信号子空间矩阵的逆矩阵,针对常用方法计算复杂度高,实时性差等问题,提出使用广义逆公式对信号子空间矩阵进行求解的方法.在FPGA平台上设计并实现了由复数矩阵乘法、矩阵LU分解、下三角矩阵求逆等子模块构成的广义逆矩阵求解系统.利用该系统求解广义逆矩阵所用的时间约为2.18 ms,与在MATLAB上对同样矩阵进行广义逆求解的平均用时15.7 ms减少了7.2倍.使用该系统的结果在MATLAB上完成后续仿真,对ESPRIT算法最终所得角度进行误差分析,最终所得角度的平均估计误差约为0.04°.结果表明,该系统能在保证结果精确度的同时有效减少运算时间. 展开更多
关键词 广义逆矩阵 基于旋转不变子空间的信号参数估计(esprit)算法 现场可编程门阵列(FPGA)
下载PDF
“毁伤快速算法与仿真技术”专题出版前言
15
作者 卢芳云 《爆炸与冲击》 EI CAS CSCD 北大核心 2024年第3期1-1,共1页
区别于一般的爆炸力学和冲击动力学计算,毁伤仿真计算往往需要对完整目标场景甚至阵地场景进行武器打击全过程计算,同时又需要近实时给出计算结果。这种大场景和快速计算在武器研发和运用的工程实际中有着强烈的应用需求。现有爆炸和冲... 区别于一般的爆炸力学和冲击动力学计算,毁伤仿真计算往往需要对完整目标场景甚至阵地场景进行武器打击全过程计算,同时又需要近实时给出计算结果。这种大场景和快速计算在武器研发和运用的工程实际中有着强烈的应用需求。现有爆炸和冲击动力学计算方法(如FEM)由于计算规模和计算效率的限制,在进行毁伤场景计算时往往只能对目标构件或者局部区域进行计算,很难满足毁伤仿真的应用需求。近年来出现了一些快速算法,如镜像爆源法、侵彻微分面元法和破片射线追踪法等,这些快速算法充分利用解析公式、经验数据或代理模型,结合计算机仿真与可视化技术,形成实用工具,有力支撑了国防工业和军事领域的应用。 展开更多
关键词 计算机仿真 快速算法 可视化技术 仿真技术 冲击动力学 经验数据 代理模型 射线追踪法
下载PDF
基于FCM及快速迭代收缩阈值算法的平面ECT图像重建
16
作者 张立峰 唐志浩 《计量学报》 CSCD 北大核心 2024年第6期899-906,共8页
为提高平面阵列电容成像系统的成像精度,提出一种基于模糊C均值聚类(FCM)进行数据优化的快速迭代收缩阈值算法(FISTA)。根据平面阵列电容数据的特点,首先利用FCM算法对测量电容值进行分类,保留有效电容值,实现电容向量降维;然后利用离... 为提高平面阵列电容成像系统的成像精度,提出一种基于模糊C均值聚类(FCM)进行数据优化的快速迭代收缩阈值算法(FISTA)。根据平面阵列电容数据的特点,首先利用FCM算法对测量电容值进行分类,保留有效电容值,实现电容向量降维;然后利用离散小波基(DWT)对灰度值进行稀疏表示,并建立L1正则化模型,采用FISTA进行求解,以实现图像重建;最后将FCM处理后的电容值分别用于Landweber算法、Tikhonov算法进行重建对比。仿真与实验结果表明,该算法重建图像的平均相对误差约为0.0527,平均相关系数约为0.9422,均优于其它算法,且重建图像伪影较少,更接近真实情况;因此,所提算法具有更好的重建效果。。 展开更多
关键词 电容层析成像 平面阵列电容 图像重建 模糊C均值聚类 快速迭代收缩阈值算法 缺陷检测
下载PDF
面向360°全景视频的帧内预测编码的快速算法
17
作者 金雪松 王田田 《无线电工程》 2024年第5期1074-1082,共9页
为了节省360°全景视频的编码时间,对通用视频编码标准中的编码单元划分决策过程进行了研究,提出了一种面向360°全景视频的帧内预测编码的快速算法。通过优化编码树单元(Coding Tree Unit,CTU)的编码深度范围和编码单元的划分... 为了节省360°全景视频的编码时间,对通用视频编码标准中的编码单元划分决策过程进行了研究,提出了一种面向360°全景视频的帧内预测编码的快速算法。通过优化编码树单元(Coding Tree Unit,CTU)的编码深度范围和编码单元的划分模式的选择过程,减少编码时间。实验结果表明,在全帧内模式下,所提算法比原始算法平均可以节省34.33%的时间复杂度,同时带来的BDBR平均增量仅为1.665%,BDPSNR的平均降低量仅为0.076 dB。 展开更多
关键词 通用视频编码 360°全景视频 帧内编码 快速算法
下载PDF
基于CU特征差异的VVC帧内快速划分算法 被引量:2
18
作者 陈燕辉 李强 +1 位作者 董阳 明艳 《计算机应用研究》 CSCD 北大核心 2024年第3期939-943,共5页
针对通用视频编码(versatile video coding,VVC)在编码单元(coding unit,CU)划分中引入了多类型树划分结构导致编码复杂度增加的问题,提出了一种基于CU子块方向特性与空间复杂度的快速划分算法。首先利用CU整体的纹理复杂度对当前CU进... 针对通用视频编码(versatile video coding,VVC)在编码单元(coding unit,CU)划分中引入了多类型树划分结构导致编码复杂度增加的问题,提出了一种基于CU子块方向特性与空间复杂度的快速划分算法。首先利用CU整体的纹理复杂度对当前CU进行分类,筛选出不划分CU;然后利用子块不同划分方向的特性差异提前决策CU划分方向;最后利用CU中间区域与边缘区域的复杂度差异特征判断是否跳过三叉树(ternary tree,TT)划分,进一步减少候选列表划分模式数量。实验结果表明,与官方测试平台VTM10.0相比,编码器在平均输出比特率增加1.12%的代价下,编码时间减少了40.25%,说明该算法在通用视频编码中能以较小的质量损失实现更短的编码时间。 展开更多
关键词 通用视频编码 编码单元划分 纹理特征 快速算法
下载PDF
基于SRM模型的宽带MVDR快速算法研究
19
作者 何宪文 温东阳 +1 位作者 董永峰 李智忠 《舰船科学技术》 北大核心 2024年第8期126-129,共4页
为满足潜艇等水下航行器宽带自适应波束形成算法的更高实时性要求,在经典的MVDR(Minimum Variance Distortionless Response)时域解析信号模型的基础上,设计一种基于SRM(Spiked Random Matrix)的协方差逆运算的快速估计算法。首先对宽... 为满足潜艇等水下航行器宽带自适应波束形成算法的更高实时性要求,在经典的MVDR(Minimum Variance Distortionless Response)时域解析信号模型的基础上,设计一种基于SRM(Spiked Random Matrix)的协方差逆运算的快速估计算法。首先对宽带信号进行时域解析信号的构造,依据基于随机矩阵理论,然后通过对快拍信号的协方差矩阵的特征值进行调整和处理,实现精确的协方差矩阵的逆运算估计,避免了传统的复杂求逆运算,尤其适合多传感器和快拍样本受限的环境。仿真实验和海试数据证明,提出的算法波束指向性能更优,信号处理复杂度更低,随着阵元间距数的增加,性能获得明显的提升。 展开更多
关键词 宽带信号 SRM模型 MVDR 快速算法
下载PDF
面向飞腾处理器平台的快速卷积算法优化
20
作者 赵亚飞 杨耀功 +1 位作者 王永刚 魏继增 《上海理工大学学报》 CAS CSCD 北大核心 2024年第6期610-619,共10页
为解决卷积神经网络难以在计算资源受限设备上部署的问题,面向国产FT-2000/4多核处理器提出一种高性能的快速卷积算法FastInfer。采用分块策略优化通用矩阵乘法,将处理器访问频率高的数据存入更靠近处理器的缓存中,从而提高计算过程中... 为解决卷积神经网络难以在计算资源受限设备上部署的问题,面向国产FT-2000/4多核处理器提出一种高性能的快速卷积算法FastInfer。采用分块策略优化通用矩阵乘法,将处理器访问频率高的数据存入更靠近处理器的缓存中,从而提高计算过程中的访存效率。配合分块方案设计实现高性能的矩阵乘法微内核,使用向量外积运算更新数据,提高计算访存比,实现最大程度掩盖访存指令的延迟。最终实验结果表明,FastInfer在FT-2000/4处理器上的峰值计算性能达到99.56 GFLOPS。在不同输入规模的通用矩阵乘法测试中,FastInfer性能是OpenBLAS算法的1.07倍和1.52倍。在卷积测试中,FastInfer性能是ARM Compute Library算法的1.32倍,实现了在FT-2000/4多核处理器上的高性能卷积计算。 展开更多
关键词 深度学习 快速卷积算法 并行计算 通用矩阵乘法
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部