期刊文献+
共找到49篇文章
< 1 2 3 >
每页显示 20 50 100
结合MACH滤波最大池化及多类SVM的行为识别 被引量:2
1
作者 何俊林 赵晓亮 +1 位作者 孙连海 甘胜江 《计算机工程与设计》 北大核心 2017年第12期3431-3435,共5页
提出一种人体行为识别方法。构建MACH滤波器组,对视频片段的三维时空体进行滤波,得到时空相关体;采用三层最大池化方法提取时空相关体的特征向量,采用高斯隶属函数对池化特征向量进行扩展;构建多类SVM分类器并进行特征分类,识别行为类... 提出一种人体行为识别方法。构建MACH滤波器组,对视频片段的三维时空体进行滤波,得到时空相关体;采用三层最大池化方法提取时空相关体的特征向量,采用高斯隶属函数对池化特征向量进行扩展;构建多类SVM分类器并进行特征分类,识别行为类别。在ADL和UCF Sports两个国际上通用的人体行为数据集上进行人体行为识别实验,实验结果表明,该方法的识别率高于现有的人体行为识别方法,对不同人体行为的区分能力更强。 展开更多
关键词 行为识别 MACH滤波 最大池化 多类支持向量机 高斯隶属函数
下载PDF
基于自适应图卷积和注意力池化的点云分类与分割
2
作者 刘玉珍 张冬霞 陶志勇 《计算机工程与科学》 CSCD 北大核心 2024年第5期872-880,共9页
针对现有点云分类与分割方法使用最大池化聚合局部邻域特征,导致最大值以外的重要信息丢失的缺陷,提出一种结合自适应图卷积AdaptConv和注意力池化AP的点云分类与分割网络。首先,采用K近邻算法构建点云局部图结构,根据点的特征生成自适... 针对现有点云分类与分割方法使用最大池化聚合局部邻域特征,导致最大值以外的重要信息丢失的缺陷,提出一种结合自适应图卷积AdaptConv和注意力池化AP的点云分类与分割网络。首先,采用K近邻算法构建点云局部图结构,根据点的特征生成自适应卷积核,灵活精确地捕获点云的局部邻域特征;其次,为有效提高特征聚合能力,采用注意力池化定义能量函数得到权重值,加权并聚合出更具代表性的点云局部特征;最后,堆叠自适应图卷积和注意力池化逐层提取全局特征,提高网络的分类和分割精度。实验结果表明,相较基准方法,点云分类的平均类别精度提升0.9%,部件分割和语义分割的平均交并比分别提升0.8%和0.3%,证明所提方法可有效提升点云分类与分割的准确率,具有较高的鲁棒性。 展开更多
关键词 自适应图卷积 注意力 能量函数 最大池化
下载PDF
基于改进残差池化层的纹理识别
3
作者 郭锐 熊风光 +2 位作者 谢剑斌 尹宇慧 刘磊 《计算机技术与发展》 2023年第9期37-44,共8页
纹理一直是物体图像最重要的特征之一。针对现有纹理识别模型在复杂数据集下识别准确率不高的问题,提出一种基于改进残差池化层的纹理识别算法。首先,提出多维特征融合模块,在纹理识别模型中同时利用高层特征和低层特征来提取更加有效... 纹理一直是物体图像最重要的特征之一。针对现有纹理识别模型在复杂数据集下识别准确率不高的问题,提出一种基于改进残差池化层的纹理识别算法。首先,提出多维特征融合模块,在纹理识别模型中同时利用高层特征和低层特征来提取更加有效的纹理特征;其次,对残差池化层进行改进,在原残差池化层的基础上,引入全局最大池化支路,为纹理识别模型增加全局空间结构观察,将原残差池化层与全局最大池化支路得到的特征向量进行拼接后作为纹理特征,提升纹理识别的准确率;再次,应用局部二值模式辅助识别策略,使用局部二值模式编码映射图像为纹理识别模型提供辅助信息;最后,将得到的纹理特征输入到分类层中,得到纹理识别结果。与现有的纹理识别方法B-CNN、Deep filter banks、Deep TEN、TEX-Net-LF、locality-aware coding、DRP-Net相比,该方法具有更好的纹理识别效果。 展开更多
关键词 纹理识别 残差 全局最大池化 多维特征融合模块 多尺度特征
下载PDF
基于Sobel算子的池化算法设计
4
作者 冯松松 王斌君 《科学技术与工程》 北大核心 2023年第3期1145-1151,共7页
池化算法是卷积神经网络中用于特征降维、参数压缩、扩大感受野的重要一层。针对现有的池化方法没有充分考虑到池化前特征图的整体内容及风格特征分布问题,提出了一种通过Sobel算子对卷积后的特征图计算每个特征点的梯度值,并根据梯度... 池化算法是卷积神经网络中用于特征降维、参数压缩、扩大感受野的重要一层。针对现有的池化方法没有充分考虑到池化前特征图的整体内容及风格特征分布问题,提出了一种通过Sobel算子对卷积后的特征图计算每个特征点的梯度值,并根据梯度值分布确定每个池化窗口取最大值、均值或者最小值的池化算法。该算法充分考虑了特征图池化前后的整体内容及风格特征分布,保持了特征图的整体不变性。实验表明,该池化算法在VGG、ResNet等经典网络架构上取得了优异性能,具有普适性,可用来替代常用的最大池化、平均池化。 展开更多
关键词 卷积神经网络 最大池化 平均 最小 SOBEL算子
下载PDF
池化和注意力相结合的新闻文本分类方法 被引量:4
5
作者 陶永才 杨朝阳 +1 位作者 石磊 卫琳 《小型微型计算机系统》 CSCD 北大核心 2019年第11期2393-2397,共5页
信息时代互联网上产生了海量的文本数据,它们蕴含着巨大的商业和科研价值,由此文本分类技术得到了广泛的关注.文本分类在信息检索等应用领域占据着重要地位,同时也是自然语言处理等研究的关键技术.本文针对新闻文本的特点以及深度学习... 信息时代互联网上产生了海量的文本数据,它们蕴含着巨大的商业和科研价值,由此文本分类技术得到了广泛的关注.文本分类在信息检索等应用领域占据着重要地位,同时也是自然语言处理等研究的关键技术.本文针对新闻文本的特点以及深度学习分类方法训练时间长的问题,提出了一种池化和注意力相结合的模型,并将其应用于中文新闻文本分类.该模型首先利用最大池化和平均池化提取出文本特征,然后利用注意力机制为句子生成权重,使用两者的拼接结果进行分类.模型在NLPCC2014新闻文本分类的数据集上进行了实验,一级类别的分类正确率达到了83. 96%,接近该数据集上的最优结果,而且比标准深度学习算法的收敛时间更短. 展开更多
关键词 文本分类 注意力机制 最大池化 机器学习
下载PDF
基于最大池化稀疏编码的煤岩识别方法 被引量:13
6
作者 伍云霞 田一民 《工程科学学报》 EI CSCD 北大核心 2017年第7期981-987,共7页
针对现今煤岩图像识别方法的缺乏与不足,为了挖掘新的煤岩图像识别方法以及更好地处理高维煤岩图像数据,提出了基于最大池化稀疏编码的煤岩识别方法.本方法在提取煤岩图像特征时加入了池化操作,在分类识别时采用了集成分类器,即多个弱... 针对现今煤岩图像识别方法的缺乏与不足,为了挖掘新的煤岩图像识别方法以及更好地处理高维煤岩图像数据,提出了基于最大池化稀疏编码的煤岩识别方法.本方法在提取煤岩图像特征时加入了池化操作,在分类识别时采用了集成分类器,即多个弱分类器组成一个强分类器.实验结果表明:最大池化稀疏编码的特征提取方式能简单有效表达煤岩图像的纹理特征,大大增强煤岩图像的可区分性,获得较高的识别率,并且具有良好的识别稳定性.研究结果可为煤岩界面的自动识别提供新的思路和方法. 展开更多
关键词 煤岩识别 图像处理 最大池化 稀疏编码 特征提取 集成分类
原文传递
一种基于BERT和池化操作的文本分类模型 被引量:2
7
作者 张军 邱龙龙 《计算机与现代化》 2022年第6期1-7,共7页
使用预训练语言模型的微调方法在以文本分类为代表的许多自然语言处理任务中取得了良好的效果,尤其以基于Transformer框架的BERT模型为典型代表。然而,BERT直接使用[CLS]对应的向量作为文本表征,没有从全局和局部考虑文本的特征,从而限... 使用预训练语言模型的微调方法在以文本分类为代表的许多自然语言处理任务中取得了良好的效果,尤其以基于Transformer框架的BERT模型为典型代表。然而,BERT直接使用[CLS]对应的向量作为文本表征,没有从全局和局部考虑文本的特征,从而限制了模型的分类性能。因此,本文提出一种引入池化操作的文本分类模型,使用平均池化、最大池化以及K-MaxPooling等池化方法从BERT输出矩阵中提取文本的表征向量。实验结果表明,与原始的BERT模型相比,本文提出的引入池化操作的文本分类模型具有更好的性能,在实验的所有文本分类任务中,其准确率和F1-Score值均优于BERT模型。 展开更多
关键词 文本分类 分类模型 BERT 平均 最大池化 K-MaxPooling
下载PDF
面向文本分类的多头注意力池化RCNN模型 被引量:4
8
作者 翟一鸣 王斌君 +1 位作者 周枝凝 仝鑫 《计算机工程与应用》 CSCD 北大核心 2021年第12期155-160,共6页
针对经典循环卷积神经网络(RCNN)在池化层采用的最大池化策略较为单一,会忽略除最突出特征外的其他特征,影响分类精度的问题,提出基于多头注意力池化的循环卷积神经网络(MHAP-RCNN)模型。多头注意力池化可以充分考虑各特征对分类的贡献... 针对经典循环卷积神经网络(RCNN)在池化层采用的最大池化策略较为单一,会忽略除最突出特征外的其他特征,影响分类精度的问题,提出基于多头注意力池化的循环卷积神经网络(MHAP-RCNN)模型。多头注意力池化可以充分考虑各特征对分类的贡献,且能在训练过程中动态优化,有效缓解最大池化的单一性问题。在三个公开的文本分类数据集上进行实验,结果表明与经典RCNN及其他各模型相比,提出的模型具有更好的文本分类性能。 展开更多
关键词 文本分类 循环卷积神经网络 最大池化 多头注意力
下载PDF
融合Inception V1-CBAM-CNN的轴承剩余寿命预测模型 被引量:2
9
作者 余江鸿 彭雄露 +2 位作者 刘涛 杨文 叶帅 《机电工程》 北大核心 2024年第1期107-114,共8页
针对现有的滚动轴承剩余寿命(RUL)预测方法精度低、轴承健康指标(HI)构建困难等问题,提出了一种基于卷积神经网络(CNN)并融合Inception V1模块和卷积注意力机制模块(CBAM)的滚动轴承RUL预测模型。首先,在CNN中添加了CBAM机制,并进行了... 针对现有的滚动轴承剩余寿命(RUL)预测方法精度低、轴承健康指标(HI)构建困难等问题,提出了一种基于卷积神经网络(CNN)并融合Inception V1模块和卷积注意力机制模块(CBAM)的滚动轴承RUL预测模型。首先,在CNN中添加了CBAM机制,并进行了加权处理,在通道和空间维度对重要特征进行了强化,对次要特征进行了抑制,通过添加改进的InceptionV1模块,提高了CNN通道间信息交互水平,全面提取了退化特征;然后,进行了网络优化,采用全局最大池化(GMP)方法对模型进行了简化,采用Dropout和批量归一化(BN)方法,避免了过拟合,提高了精度,且克服了训练时出现的梯度消失问题;最后,对数据进行了处理,将降噪后的信号重组为三维张量,将其作为HI,构建了退化标签,引入了评价指标,采用PHM2012轴承数据集进行了实验验证,在3种工况下将其与深度神经网络(DNN)、CNN方法、结合注意力机制的残差网络方法(ResNet)进行了对比。研究结果表明:该方法在变负载条件下的平均RMSE为0.033,较其他方法的RMSE值分别降低了86%、78%和69%,在预测精度和泛化能力方面具有明显优势。 展开更多
关键词 滚动轴承 剩余使用寿命 Inception V1模块 卷积注意力机制模块 卷积神经网络 全局最大池化 批量归一
下载PDF
基于轻量级残差网络的苹果叶病识别
10
作者 周罕觅 陈佳庚 +4 位作者 代智光 牛晓丽 秦龙 向友珍 赵龙 《福建农业学报》 CAS CSCD 北大核心 2024年第1期83-92,共10页
【目的】解决卷积神经网络在复杂环境下识别率低、模型参数多等问题,为苹果叶病智能识别提供参考。【方法】本研究提出一种基于改进ResNet18的苹果叶病识别模型。首先,通过离线增强和在线增强两种方式解决数据不平衡和数据过拟合现象,... 【目的】解决卷积神经网络在复杂环境下识别率低、模型参数多等问题,为苹果叶病智能识别提供参考。【方法】本研究提出一种基于改进ResNet18的苹果叶病识别模型。首先,通过离线增强和在线增强两种方式解决数据不平衡和数据过拟合现象,增强模型的泛化能力;其次,引入缩放因子调整通道参数以减少网络参数量,并在下采样残差结构的恒等映射中用最大池化层代替1×1卷积完成下采样,去除图片中的冗余特征,增大模型的感受野;将ResNet18模型的第一层7×7卷积层替换为多尺度特征提取模块,提高模型对细小病斑的提取能力;最后,在特征提取网络中插入DenseBlock模块,加强模型对浅层有效特征的重用。【结果】改进后的ResNet18模型准确率为97.94%,比原模型高出0.88个百分点;模型大小为3.97MB,比原模型减小90.77%。与ShuffleNetv2、MobileNetv3、EfficientNet等轻量化模型和Inceptionv2、DenseNet、ResNet等经典模型相比,该模型拥有更好的性能。【结论】改进后的模型在复杂环境下能够准确识别苹果叶病,并且具有较少的模型参数,方便移植到移动设备上,为苹果叶病的智能诊断提供参考。 展开更多
关键词 ResNet18模型 多尺度特征提取 最大池化 DenseBlock模块
下载PDF
基于改进卷积神经网络的化纤丝饼表面缺陷识别 被引量:13
11
作者 王泽霞 陈革 陈振中 《纺织学报》 EI CAS CSCD 北大核心 2020年第4期39-44,共6页
针对传统人工检测化纤丝饼表面缺陷方法的不足,提出改进的卷积神经网络对正常以及3种常见缺陷丝饼进行分类识别。首先对采集的丝饼图像进行分块处理,然后利用改进的卷积神经网络进行特征提取,采用全局最大池化层代替全连接层,增强了图... 针对传统人工检测化纤丝饼表面缺陷方法的不足,提出改进的卷积神经网络对正常以及3种常见缺陷丝饼进行分类识别。首先对采集的丝饼图像进行分块处理,然后利用改进的卷积神经网络进行特征提取,采用全局最大池化层代替全连接层,增强了图像对空间变换的鲁棒性,减少了模型参数,并利用softmax分类器进行分类。最后在网络学习过程中提出主动学习方法,用少量标注样本对网络进行训练,选出对提升网络性能最具价值的样本进行标注并加入到训练样本中进行训练检测。结果表明,该方法可有效实现丝饼的缺陷识别,识别准确率达到97.1%,并有效减少了网络所需的标注样本数量,节省大量的标注成本,具有一定的通用性。 展开更多
关键词 纤丝饼 缺陷识别 图像分块 卷积神经网络 全局最大池化 主动学习方法
下载PDF
利用优化剪枝GoogLeNet的人脸表情识别方法 被引量:12
12
作者 张宏丽 白翔宇 《计算机工程与应用》 CSCD 北大核心 2021年第19期179-188,共10页
为了提高人脸表情识别的准确率和加快处理速度,提出了一种基于优化剪枝GoogLeNet的人脸表情识别方法。利用GoogLeNet网络提取面部特征,其中Inception模块加深学习深度,并利用典型的分类器实现人脸表情分类。改进GoogLeNet网络,添加全局... 为了提高人脸表情识别的准确率和加快处理速度,提出了一种基于优化剪枝GoogLeNet的人脸表情识别方法。利用GoogLeNet网络提取面部特征,其中Inception模块加深学习深度,并利用典型的分类器实现人脸表情分类。改进GoogLeNet网络,添加全局最大池化层并保留检测目标的位置信息,以Sigmoid交叉熵作为训练目标,获得全面的人脸表情特征信息。通过剪枝算法对GoogLeNet网络进行训练、修剪低权重连接和再训练网络等操作,以简化网络结构和参数量,提高运行效率。在JAFFE、CK+和Cohn-Kanade数据集上对所提方法进行验证,实验结果表明,所提方法的识别准确率分别为83.84%、85.09%和84.87%,运行时间低于200 ms,优于对比方法,具有较好的适用性。 展开更多
关键词 剪枝算法 GoogLeNet 人脸表情识别 Inception模块 全局最大池化 运行效率
下载PDF
基于优化YOLO-V4的交通标志检测识别方法 被引量:6
13
作者 潘惠苹 王敏琴 张福泉 《计算机科学》 CSCD 北大核心 2022年第11期179-184,共6页
交通标志检测识别是自动驾驶系统的核心功能,为了实时准确地识别交通标志,在YOLO-V4的基础上进行改进,并结合了空间金字塔池化(Spatial Pyramid Pooling,SPP)模块。首先,为了提高分辨率和增大感受野,将原特征图3个尺度的分辨率更改为26&... 交通标志检测识别是自动驾驶系统的核心功能,为了实时准确地识别交通标志,在YOLO-V4的基础上进行改进,并结合了空间金字塔池化(Spatial Pyramid Pooling,SPP)模块。首先,为了提高分辨率和增大感受野,将原特征图3个尺度的分辨率更改为26×26和52×52;然后,在连接层中添加SPP模块,消除网络对固定尺度的约束,在最大池化层中得到最优特征,改善网络性能。实验中,利用行车记录仪采集各种交通标志图像,与其他优秀方法相比,所提方法取得了更优的性能,其平均检测识别准确度达99.0%,平均检测时间为0.449 s,达到了实时检测的要求。 展开更多
关键词 交通标志识别 感受野 YOLO-V4 最大池化 空间金字塔 分辨率
下载PDF
融合低通滤波器的孪生网络跟踪算法
14
作者 杨晓强 刘文昊 《计算机工程与应用》 CSCD 北大核心 2023年第23期237-245,共9页
针对深层次网络中的填充操作会破坏网络严格的平移不变性,提出了一种改进的孪生神经网络目标跟踪算法(BsSiamCAR)。在SiamCAR基础上,用ResNet-50网络对模板图像和搜索区域进行特征提取时,采用低通滤波器和最大池化相融合的策略,改善平... 针对深层次网络中的填充操作会破坏网络严格的平移不变性,提出了一种改进的孪生神经网络目标跟踪算法(BsSiamCAR)。在SiamCAR基础上,用ResNet-50网络对模板图像和搜索区域进行特征提取时,采用低通滤波器和最大池化相融合的策略,改善平移不变性对深层次网络的影响,提高深层次网络的稳定性。为了解决目标跟踪中背景干扰、尺度变化等复杂场景中的问题,引入通道注意力,注意力机制能够有选择性地突出对跟踪有利的特征通道,增强算法在复杂环境中的鲁棒性。实验结果表明,BsSiamCAR在OTB100、VOT2018、UAV123数据集上较SiamRPN和SiamCAR等多种算法在成功率和精度上均有提升,跟踪速度达到43 FPS。 展开更多
关键词 目标跟踪 孪生网络 低通滤波器 通道注意力 最大池化
下载PDF
基于弱监督的改进Transformer在人群定位中的应用 被引量:1
15
作者 高辉 邓淼磊 +2 位作者 赵文君 陈法权 张德贤 《计算机工程与应用》 CSCD 北大核心 2023年第19期92-98,共7页
针对现有人群定位方法采用伪边界框或预先设计的定位图,需要复杂的预处理和后处理来获得头部位置的问题,提出一种基于弱监督的端到端人群定位网络LocalFormer。在特征提取阶段,将纯Transformer作为骨干网络,并对每个阶段的特征执行全局... 针对现有人群定位方法采用伪边界框或预先设计的定位图,需要复杂的预处理和后处理来获得头部位置的问题,提出一种基于弱监督的端到端人群定位网络LocalFormer。在特征提取阶段,将纯Transformer作为骨干网络,并对每个阶段的特征执行全局最大池化操作,提取更加丰富的人头细节信息。在编码器-解码器阶段,将聚合特征嵌入位置信息作为编码器的输入,且每个解码器层采用一组可训练嵌入作为查询,并将编码器最后一层的视觉特征作为键和值,解码后的特征用于预测置信度得分。通过二值化模块自适应优化阈值学习器,从而精确地二值化置信度图。在不同数据环境下对三个数据集进行实验,结果表明该方法实现了最佳定位性能。 展开更多
关键词 人群定位 弱监督 卷积神经网络 全局最大池化 视觉Transformer
下载PDF
基于TDFFCNN模型的电能质量扰动分类
16
作者 胡杰 程志友 +2 位作者 姜帅 李悦 汪德胜 《安徽大学学报(自然科学版)》 CAS 北大核心 2023年第5期58-64,共7页
为提高电能质量扰动(power quality disturbances,简称PQD)分类准确率,提出双模态特征融合的卷积神经网络(two-dimensional feature fusion convolutional neural network,简称TDFFCNN)模型,该模型包含2个轻量化子模型.子模型1运用全局... 为提高电能质量扰动(power quality disturbances,简称PQD)分类准确率,提出双模态特征融合的卷积神经网络(two-dimensional feature fusion convolutional neural network,简称TDFFCNN)模型,该模型包含2个轻量化子模型.子模型1运用全局最大池化,在大量降低数据量的同时学习电能质量扰动(power quality disturbances,简称PQD)时间序列的时序特征,以增加模型提取时序特征的能力;子模型2使用小卷积核与小步长为参数的堆叠单元提取图像振幅特征,对高中低层特征进行融合,以获得细节与结构性语义.实验结果表明:TDFFCNN模型具有较强的抗噪性能;相对于其他3种模型,TDFFCNN模型的平均准确率最高.因此,TDFFCNN模型具有更强分类性能. 展开更多
关键词 电能质量 特征融合 全局最大池化 振幅特征
下载PDF
基于改进YOLOv5的鸽子蛋壳破损检测 被引量:1
17
作者 杨航 何皓明 +5 位作者 李滕科 王嘉雯 吴霆 钟乐 邹娟 杨灵 《西南师范大学学报(自然科学版)》 CAS 2023年第8期92-102,共11页
破损鸽蛋检测是鸽蛋分拣过程中最重要的步骤之一.为解决破损鸽蛋实时检测问题,提出一种改进YOLOv5的破损鸽蛋检测方法.首先,为解决鸽蛋细微裂纹检测难的问题,采用Kmeans聚类算法计算细微裂纹锚框适应度,在head模块增加Anchor值为[7,9,13... 破损鸽蛋检测是鸽蛋分拣过程中最重要的步骤之一.为解决破损鸽蛋实时检测问题,提出一种改进YOLOv5的破损鸽蛋检测方法.首先,为解决鸽蛋细微裂纹检测难的问题,采用Kmeans聚类算法计算细微裂纹锚框适应度,在head模块增加Anchor值为[7,9,13,8,9,12]的检测层,从而提高细微裂纹图像的特征提取能力;其次,为解决裂纹特征权重较低的问题,采用融合反向最大池化层的注意力机制,将色值权重提高,从而增强裂纹特征的权重;再次,为解决检测模型负向梯度消失问题,采用Hardswish激活函数的全连接层替换ReLU激活函数的全连接层,解决输入为负时存在的神经元坏死问题,确保神经网络误差正常反馈.最后,基于改进YOLOv5方法建立鸽蛋裂纹识别模型,采用7∶2∶1交叉验证方法对模型进行验证.经对比验证,改进YOLOv5模型的检测效果有明显提升,其准确率、召回率和平均精度分别达到98%,97.3%和98.3%,比原始YOLOv5模型分别提高了14.8%,6.2%和3.4%,检测速度大约为111帧/s,且模型大小仅为4.6Mb,为鸽蛋破损检测提供了一种新方法. 展开更多
关键词 鸽子蛋 YOLOv5 裂纹检测 Hardswish 最大池化
下载PDF
基于改进YOLOv5s的道路坑洼检测算法 被引量:1
18
作者 白芮 徐杨 +1 位作者 王彬 张雯雯 《计算机与现代化》 2023年第6期69-75,共7页
针对现有目标检测算法难以对道路坑洼进行精准检测、检测速度慢等问题,提出一种基于改进YOLOv5s的道路坑洼检测算法。首先在YOLOv5s主干网络中融入坐标注意力(Coordinate Attention,CA)模块,使模型不仅捕获跨通道信息,还捕获方向和位置... 针对现有目标检测算法难以对道路坑洼进行精准检测、检测速度慢等问题,提出一种基于改进YOLOv5s的道路坑洼检测算法。首先在YOLOv5s主干网络中融入坐标注意力(Coordinate Attention,CA)模块,使模型不仅捕获跨通道信息,还捕获方向和位置敏感信息,有助于模型更准确地定位和识别检测对象;然后在空间金字塔池化(Spatial Pyramid Pool,SPP)模块中采用软池化SoftPool改进最大池化操作,保留更详细的特征信息;在特征融合阶段,使用基于内容的功能重组(Content-Aware ReAssembly of Features,CARAFE)对多尺度特征融合中上采样进行改进,动态生成自适应内核,可以在一个大的感受野内聚集上下文信息;最后,使用Alpha-IoU对损失函数进行改进,提高边框回归精度。实验结果表明,改进的YOLOv5s算法在平均精度上较原始网络提高了4.6个百分点,与其他主流算法SSD、Faster R-CNN、YO⁃LOv3、YOLOv3-tiny、YOLOv4-tiny相比检测精度有较大提升。 展开更多
关键词 深度学习 坑洼检测 坐标注意力 最大池化
下载PDF
基于改进VGG-16网络模型的苹果病害识别
19
作者 赵慧勐 刘向举 金彬峰 《白城师范学院学报》 2023年第5期59-64,共6页
针对苹果叶面病害识别问题,文章在对现有的VGG网络模型研究的基础上,提出了一种在VGG-16网络模型基础上进行改进的方法,即VGG-16-BN模型.首先对西北农林科技大学制作的数据集进行处理,然后将max pooling层替换为sort-pool2d池化层,使模... 针对苹果叶面病害识别问题,文章在对现有的VGG网络模型研究的基础上,提出了一种在VGG-16网络模型基础上进行改进的方法,即VGG-16-BN模型.首先对西北农林科技大学制作的数据集进行处理,然后将max pooling层替换为sort-pool2d池化层,使模型更快地收敛,最后在每一卷积层后增设BN层,加快训练速度,防止过拟合.实验结果表明,新的网络模型在数据集中的准确率相较于未增设BN层有了一定提高,其准确率达到96.67%. 展开更多
关键词 病害识别 苹果 叶片 VGG-16 图像分类 最大池化 批标准
下载PDF
基于深度残差收缩网络的恶意代码分类
20
作者 陈姮 陈志翔 +1 位作者 申高宁 王舒琪 《闽南师范大学学报(自然科学版)》 2023年第1期50-58,共9页
针对多数分类方法模型参数多、训练耗时长、占用空间大的问题,提出一种基于单通道视觉特征的深度残差收缩网络(IDRSN)模型.首先,优化深度残差收缩网络的结构,解决模型参数多体积大的问题;其次,引入最大池化来缓解过拟合现象.该网络训练... 针对多数分类方法模型参数多、训练耗时长、占用空间大的问题,提出一种基于单通道视觉特征的深度残差收缩网络(IDRSN)模型.首先,优化深度残差收缩网络的结构,解决模型参数多体积大的问题;其次,引入最大池化来缓解过拟合现象.该网络训练参数较少,训练时间较短.实验结果表明,该模型应用于恶意代码分类时,有更高的准确率及鲁棒性,特别在部分相似家族的分类上,取得较好的效果. 展开更多
关键词 恶意代码分类 深度残差网络 深度残差收缩网络(DRSN) 最大池化
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部