-
题名基于Halo注意力机制的双阶段临近降水预报网络
- 1
-
-
作者
周云龙
季繁繁
潘泽锋
-
机构
南京信息工程大学计算机学院
南京信息工程大学电子与信息工程学院
-
出处
《计算机系统应用》
2024年第5期67-75,共9页
-
基金
科技创新2030—“新一代人工智能”重大项目(2018AAA0100400)
国家自然科学基金(U21B2049,61936005)。
-
文摘
先前基于深度学习进行临近降水预报的方法试图在统一架构中建模雷达回波的时空演变,然而,这些方法可能难以完全捕捉到这种复杂的时空关系.本文提出了一种基于Halo注意力机制的双阶段临近降水预报网络,该网络将降水预测的时空演变过程分为运动趋势预测和空间外观重建两个阶段.首先,可学习光流模块对雷达回波的运动趋势进行建模并生成粗略的预测结果.其次,特征重建模块对历史雷达回波序列的空间外观变化建模并对粗粒度预测结果的空间外观进行特征细化重建,生成精细的雷达回波图.通过在CIKM数据集上的实验表明,本文所提出的方法与主流方法相比,平均的海德克技能得分和关键成功指数分别提高了4.60%和3.63%,达到了0.48和0.45;结构相似性提高了4.84%,达0.52;均方误差降低了6.13%,达70.23.
-
关键词
深度学习
临近降水预报
光流
注意力机制
双阶段预测
-
Keywords
deep learning
precipitation nowcasting
optical flow
attention mechanism
two-stage prediction
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
P457.6
[天文地球—大气科学及气象学]
-
-
题名随机初始化神经网络剪枝的稀疏二值规划方法
被引量:1
- 2
-
-
作者
陆林
季繁繁
袁晓彤
-
机构
南京信息工程大学自动化学院
江苏省大数据分析技术重点实验室
南京信息工程大学计算机学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2023年第8期138-147,共10页
-
基金
科技创新2030-“新一代人工智能”重大项目(2018AAAA0100400)
国家自然科学基金(61876090,61936005,U21B2049)。
-
文摘
传统深度神经网络剪枝方法往往以预训练模型为初始网络并需要在剪枝后进行微调。受到近年来edgepopup等基于随机初始化网络的剪枝算法优异性能的启发,提出了一种基于稀疏二值规划的随机初始化网络剪枝算法。该算法将剪枝训练过程建模为一个稀疏二值约束优化问题。其核心思想是利用稀疏二值规划来学习一个二值掩膜,利用该掩膜可以从随机初始化的神经网络上裁剪出一个未经训练却性能良好的稀疏网络。与之前基于随机初始化网络的剪枝算法相比,该算法找到的稀疏网络在多个稀疏度下都具有更好的分类泛化性能。与edge-popup算法相比,在ImageNet数据集分类任务中,模型在稀疏度为70%时精度提升7.98个百分点。在CIFAR-10数据集分类任务中,模型在稀疏度为50%时精度提升2.48个百分点。
-
关键词
神经网络剪枝
随机初始化
二值掩膜
二值规划
稀疏优化
-
Keywords
neural network pruning
random initialization
binary mask
binary programming
sparse optimization
-
分类号
TP39
[自动化与计算机技术—计算机应用技术]
-
-
题名基于深度神经网络二阶信息的结构化剪枝算法
被引量:4
- 3
-
-
作者
季繁繁
杨鑫
袁晓彤
-
机构
南京信息工程大学江苏省大数据分析技术重点实验室
-
出处
《计算机工程》
CAS
CSCD
北大核心
2021年第2期12-18,共7页
-
基金
国家自然科学基金(61876090,61936005)
国家新一代人工智能重大项目(2018AAA0100400)。
-
文摘
现有结构化剪枝算法通常运用深度神经网络(DNN)的一阶或者零阶信息对通道进行剪枝,为利用二阶信息加快DNN网络模型收敛速度,借鉴HAWQ算法思想提出一种新的结构化剪枝算法。采用幂迭代法得到经过预训练的网络参数对应Hessian矩阵的主特征向量,据此向量衡量网络通道的重要性并进行通道剪枝,同时对剪枝后的网络参数进行微调提高DNN分类性能。实验结果表明,该算法在网络参数量和每秒浮点运算次数分别减少29.9%和34.6%的情况下,在ResNet110网络上的分类准确率提升了0.74%,剪枝效果优于PF、LCCL等经典剪枝算法。
-
关键词
深度神经网络
网络压缩
结构化剪枝
二阶信息
幂迭代法
-
Keywords
Deep Neural Network(DNN)
network compression
structural pruning
second-order information
power iteration method
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于伪孪生网络双层优化的对比学习
被引量:3
- 4
-
-
作者
陈庆宇
季繁繁
袁晓彤
-
机构
南京信息工程大学自动化学院
南京信息工程大学数字取证教育部工程研究中心
南京信息工程大学江苏省大数据分析技术重点实验室
南京信息工程大学计算机学院
-
出处
《模式识别与人工智能》
EI
CSCD
北大核心
2022年第10期928-938,共11页
-
基金
科技创新2030-“新一代人工智能”重大项目(No.2018AAA0100400)
国家自然科学基金项目(No.U21B2049,61876090,61936005)资助。
-
文摘
目前,基于伪孪生网络的对比学习算法使用各种组件以获得最优学生网络,但忽略教师网络在下游任务中的表现,因此,文中提出基于伪孪生网络双层优化的对比学习,促进学生网络和教师网络相互学习,获得最优教师网络。双层优化策略包括基于近邻优化的学生网络优化策略和基于随机梯度下降的教师网络优化策略。基于近邻优化的学生网络优化策略让教师网络成为约束项,帮助学生网络更好地向教师网络学习。基于随机梯度下降的教师网络优化策略求解近似教师网络,梯度更新教师网络。在5个数据集上的实验表明,文中算法取得较高的k-NN(k=1)分类精度和线性分类精度,特别在批次大小较小时,优势较大。
-
关键词
对比学习
双层优化
学生网络
近邻优化
教师网络
随机梯度下降
-
Keywords
Contrastive Learning
Bilevel Optimization
Student Network
Nearest Neighbor Optimization
Teacher Network
Stochastic Gradient Descent
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于梯度追踪的结构化剪枝算法
被引量:1
- 5
-
-
作者
王珏
季繁繁
袁晓彤
-
机构
南京信息工程大学江苏省大数据分析技术重点实验室
-
出处
《计算机仿真》
北大核心
2022年第8期347-355,414,共10页
-
基金
国家新一代人工智能重大项目(2018AAA0100400)
国家自然科学基金项目(61876090,61936005)。
-
文摘
针对深度卷积神经网络存在的过参数化问题,提出一种梯度追踪的结构化剪枝算法。在优化器步骤中选择梯度最大的滤波器,将其索引与参数幅值最大的滤波器索引合并,形成一个并集;根据上述并集更新模型参数;使用一种动态的滤波器选择方法,从而获得压缩后的模型。实验结果表明,采用梯度追踪的剪枝算法使用参数信息和梯度信息,能有效地剪除卷积神经网络的冗余参数。最后结论是,上述方法在压缩深度卷积神经网络的同时,能够更好地保持网络精度。
-
关键词
结构化剪枝
梯度追踪算法
动态剪枝
模型压缩
卷积神经网络
-
Keywords
Structured pruning
Gradient support pursuit
Dynamic pruning
Model compression
Convolutional neural network(CNN)
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
-
-
题名终是心头一道伤
- 6
-
-
作者
季繁繁
古德.哞尼(图)
-
机构
不详
-
出处
《中学生博览》
2020年第30期10-10,共1页
-
文摘
小时候,我在一所村办小学上学,一个年级不到30个学生,3个老师换着不同的年级讲语数英。我自认为不是个内向的孩子,可课间的大部分时间却都坐在座位上,连大气儿也不敢出,努力将自己的存在感降到最低。
-
关键词
一所
课间
村办小学
年级
老师
-
分类号
G62
[文化科学—教育学]
-
-
题名是的,饭也堵不住我们的嘴
- 7
-
-
作者
季繁繁
-
机构
不详
-
出处
《中学生博览》
2020年第11期55-55,共1页
-
文摘
每天宅在家里,干吗呢?这种紧急关头我怎么可能看得进去书呢?!当然是刷微博啦!于是每天一觉醒来,我就拿起手机躺在床上一直刷到晚上,当然除了三餐和去厕所……“你们小屁孩一个个瞎紧张个什么劲儿……”“这次严重多了!好吧!”“知道啦!咱这不是都躲在家里嘛,你快去写你的作业去……”于是在刷微博之余,我们开通了一个新的副业:哔哔机。
-
关键词
微博
手机
三餐
-
分类号
G62
[文化科学—教育学]
-