-
题名面向现代GPU的Winograd卷积加速研究
- 1
-
-
作者
童敢
黄立波
吕雅帅
-
机构
国防科技大学计算机学院
华为技术有限公司
-
出处
《电子学报》
EI
CAS
CSCD
北大核心
2024年第1期244-257,共14页
-
基金
国家自然科学基金(No.61872374)。
-
文摘
卷积运算是现代卷积神经网络中必不可少的组成部分,同时也是最耗时的.为了解决卷积算子的性能问题,包括快速傅里叶变换(Fast Fourier Transform,FFT)和Winograd在内的快速卷积算法被提出. Winograd卷积可被用于提高小卷积核的推理性能,是目前卷积神经网络中的主流实现方法 .然而,Winograd卷积在许多高度优化的深度神经网络库和深度学习编译器中的实现比较低效.由于Winograd卷积的四个阶段的复杂数据依赖关系,面向GPU对其进行优化非常具有挑战性.本文针对现代GPU体系结构优化了Winograd卷积算子的性能.本文提出了Winograd计算阶段的等价变化及其利用Tensor Core进行计算的无同步实现,并进一步提出了利用不同GPU内存层级的部分计算核融合方法 PKF(Partial Kernel Fusion).基于张量虚拟机(Tensor Virtual Machine,TVM)和代码重构器PKF-Reconstructor(Partial Kernel Fusion Reconstructor),实现了高性能的Winograd卷积.对真实应用中卷积神经网络的卷积算子的评估表明,与cuDNN相比,本文所提算法实现了7.58~13.69倍的性能提升.
-
关键词
Winograd卷积
低精度
部分计算核融合
卷积加速
GPU内存层级
Tensor
Core
-
Keywords
Winograd convolution
low precision
partial kernel fusion
accelerating convolution
GPU memory hi⁃erarchy
Tensor Core
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
-
-
题名无线传感器网络测试系统数据融合研究
被引量:6
- 2
-
-
作者
蔡科
左宪章
康健
方育奇
-
机构
军械工程学院电气工程系
-
出处
《计算机仿真》
CSCD
北大核心
2010年第7期1-4,9,共5页
-
基金
国家自然科学基金(60672143)
-
文摘
根据无线传感器网络在军事领域中研究与应用,对无线传感器网络用于军事装备测试成为新的应用方向。针对无线传感器网络在军事装备测试系统中数据冗余大、关联性强、实时性要求高等问题,为提高传输率与数据精度,提出了基于核偏最小二乘法的无线传感器网络数据融合算法。利用核偏最小二乘法对数据进行回归建模并进行仿真,实现数据快速融合。仿真结果表明,方法的可行性和有效性。
-
关键词
无线传感器网络
数据融合
核偏最小二乘法
网络化测试
-
Keywords
Wireless sensor networks
Data fusion
kernel partial least-squares
Networked test
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名一种传感器网络时空融合模型
- 3
-
-
作者
康健
左宪章
唐力伟
张西红
李浩
-
机构
军械工程学院火炮工程系
军械工程学院电气工程系
军械工程学院计算机工程系
[
-
出处
《军械工程学院学报》
2010年第3期63-66,共4页
-
基金
国家自然科学基金资助项目(60672143)
-
文摘
针对多传感器间存在时空相关性和先验知识未知的情况,提出了一种基于核偏最小二乘最优加权的传感器网络时空融合模型。首先用核偏最小二乘法对每个传感器在不同时刻的测量值进行融合,然后将各个传感器同时刻的估计值进行空间最优融合,从而得到被测参量的最终融合估计。该模型还能排除那些取值远离样本点集合平均水平的奇异点。理论分析和融合实验表明,该模型能取得较高的融合精度,并能显著节省网络能量。
-
关键词
核函数
传感器网络
数据融合
偏最小二乘
方差估计
-
Keywords
kernel
sensor networks
data fusion
partial least squares
variance estimation
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名引入目标分块模型的核相关滤波目标追踪算法
被引量:4
- 4
-
-
作者
徐小超
严华
-
机构
四川大学电子信息学院
-
出处
《计算机应用》
CSCD
北大核心
2020年第3期683-688,共6页
-
基金
国家自然科学基金资助项目(61403265)~~
-
文摘
为了降低目标追踪过程中光照变化、尺度变化、局部遮挡等因素的影响,提出一种引入目标分块模型的核相关滤波(KCF)目标追踪算法。首先,通过融合方向梯度直方图特征和色名属性特征来更好地表征目标;其次,通过构建尺度金字塔对目标进行尺度预测;最后,利用特征响应图的峰值旁瓣比值检测遮挡,并通过引入高置信度分块重定位模块和模型自适应动态更新来处理局部遮挡问题。在多个数据集上与当前多个主流算法进行对比实验,实验结果表明,所提算法具有最高精度和成功率,且比KCF算法分别提升了11.89%和15.24%,表明所提算法在应对光照变化、尺度变化、局部遮挡等因素时具有更强的鲁棒性。
-
关键词
核相关滤波
特征融合
尺度变化
局部遮挡
模型更新
-
Keywords
kernelized Correlation Filter(KCF)
feature fusion
scale estimation
partial occlusion
model updating
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-