期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
针对小样本改进的MobileViT算法
1
作者 张埠石 范红 《计算机工程与应用》 CSCD 北大核心 2024年第22期251-260,共10页
为了提高基于Transformer的MobileViT算法在小样本数据上的分类能力,加快算法的训练、收敛以及提高推理速度,提出了卷积池化下采样(convolutional maxpooling downsampling,CMP)和多分支残差特征融合(multi-branch residual feature fus... 为了提高基于Transformer的MobileViT算法在小样本数据上的分类能力,加快算法的训练、收敛以及提高推理速度,提出了卷积池化下采样(convolutional maxpooling downsampling,CMP)和多分支残差特征融合(multi-branch residual feature fusion,MR-FF)两个模块,并插入到MobileViT算法的模块中,分别用于降低模型的参数量,减少特征冗余和防止输入特征丢失。以最小参数量的MobileViT实验结果为例,在Oxford Flower102、Mini-ImageNet小样本数据集上进行了对比实验,插入以上两个模块的MobileViT在测试准确率上分别提升了12.9、9.4个百分点,在训练速度上提升了17%,在推理速度上提升了0.31 ms。当在MobileViT中只插入CMP模块时,可以在小于60 000张图像的小样本数据集上获得更高的分类准确度、最短的推理时间。最后与五种先进的图像分类算法进行了比较,改进的MobileVIT在小样本分类数据上取得了最优的测试结果。 展开更多
关键词 最大池化 小样本 TRANSFORMER 图像分类
下载PDF
基于改进YOLOv5的鸽子蛋壳破损检测 被引量:2
2
作者 杨航 何皓明 +5 位作者 李滕科 王嘉雯 吴霆 钟乐 邹娟 杨灵 《西南师范大学学报(自然科学版)》 CAS 2023年第8期92-102,共11页
破损鸽蛋检测是鸽蛋分拣过程中最重要的步骤之一.为解决破损鸽蛋实时检测问题,提出一种改进YOLOv5的破损鸽蛋检测方法.首先,为解决鸽蛋细微裂纹检测难的问题,采用Kmeans聚类算法计算细微裂纹锚框适应度,在head模块增加Anchor值为[7,9,13... 破损鸽蛋检测是鸽蛋分拣过程中最重要的步骤之一.为解决破损鸽蛋实时检测问题,提出一种改进YOLOv5的破损鸽蛋检测方法.首先,为解决鸽蛋细微裂纹检测难的问题,采用Kmeans聚类算法计算细微裂纹锚框适应度,在head模块增加Anchor值为[7,9,13,8,9,12]的检测层,从而提高细微裂纹图像的特征提取能力;其次,为解决裂纹特征权重较低的问题,采用融合反向最大池化层的注意力机制,将色值权重提高,从而增强裂纹特征的权重;再次,为解决检测模型负向梯度消失问题,采用Hardswish激活函数的全连接层替换ReLU激活函数的全连接层,解决输入为负时存在的神经元坏死问题,确保神经网络误差正常反馈.最后,基于改进YOLOv5方法建立鸽蛋裂纹识别模型,采用7∶2∶1交叉验证方法对模型进行验证.经对比验证,改进YOLOv5模型的检测效果有明显提升,其准确率、召回率和平均精度分别达到98%,97.3%和98.3%,比原始YOLOv5模型分别提高了14.8%,6.2%和3.4%,检测速度大约为111帧/s,且模型大小仅为4.6Mb,为鸽蛋破损检测提供了一种新方法. 展开更多
关键词 鸽子蛋 YOLOv5 裂纹检测 Hardswish 最大池化层
下载PDF
一种基于BERT和池化操作的文本分类模型 被引量:2
3
作者 张军 邱龙龙 《计算机与现代化》 2022年第6期1-7,共7页
使用预训练语言模型的微调方法在以文本分类为代表的许多自然语言处理任务中取得了良好的效果,尤其以基于Transformer框架的BERT模型为典型代表。然而,BERT直接使用[CLS]对应的向量作为文本表征,没有从全局和局部考虑文本的特征,从而限... 使用预训练语言模型的微调方法在以文本分类为代表的许多自然语言处理任务中取得了良好的效果,尤其以基于Transformer框架的BERT模型为典型代表。然而,BERT直接使用[CLS]对应的向量作为文本表征,没有从全局和局部考虑文本的特征,从而限制了模型的分类性能。因此,本文提出一种引入池化操作的文本分类模型,使用平均池化、最大池化以及K-MaxPooling等池化方法从BERT输出矩阵中提取文本的表征向量。实验结果表明,与原始的BERT模型相比,本文提出的引入池化操作的文本分类模型具有更好的性能,在实验的所有文本分类任务中,其准确率和F1-Score值均优于BERT模型。 展开更多
关键词 文本分类 分类模型 BERT 平均池化 最大池化 K-maxpooling
下载PDF
基于优化YOLO-V4的交通标志检测识别方法 被引量:11
4
作者 潘惠苹 王敏琴 张福泉 《计算机科学》 CSCD 北大核心 2022年第11期179-184,共6页
交通标志检测识别是自动驾驶系统的核心功能,为了实时准确地识别交通标志,在YOLO-V4的基础上进行改进,并结合了空间金字塔池化(Spatial Pyramid Pooling,SPP)模块。首先,为了提高分辨率和增大感受野,将原特征图3个尺度的分辨率更改为26&... 交通标志检测识别是自动驾驶系统的核心功能,为了实时准确地识别交通标志,在YOLO-V4的基础上进行改进,并结合了空间金字塔池化(Spatial Pyramid Pooling,SPP)模块。首先,为了提高分辨率和增大感受野,将原特征图3个尺度的分辨率更改为26×26和52×52;然后,在连接层中添加SPP模块,消除网络对固定尺度的约束,在最大池化层中得到最优特征,改善网络性能。实验中,利用行车记录仪采集各种交通标志图像,与其他优秀方法相比,所提方法取得了更优的性能,其平均检测识别准确度达99.0%,平均检测时间为0.449 s,达到了实时检测的要求。 展开更多
关键词 交通标志识别 感受野 YOLO-V4 最大池化 空间金字塔池化 分辨率
下载PDF
基于热图回归的停车位检测算法研究 被引量:1
5
作者 邹斌 黄瑞昌 李文博 《武汉理工大学学报》 CAS 2023年第6期146-152,160,共8页
实际停车场景存在环视视野受限或车位标记被遮挡等问题,现有方法难以有效地检测停车位。为提高自动驾驶车辆在复杂场景中停车位检测的可靠性,提出一种基于热图回归的停车位检测方法,将停车位简化为关键点、入口线和分隔线3个部分,首先... 实际停车场景存在环视视野受限或车位标记被遮挡等问题,现有方法难以有效地检测停车位。为提高自动驾驶车辆在复杂场景中停车位检测的可靠性,提出一种基于热图回归的停车位检测方法,将停车位简化为关键点、入口线和分隔线3个部分,首先将输入图像通过ResNet50和上采样模块提取关键点特征图;然后利用关键点估计模块生成关键点热图以及关键点坐标偏移、方向和长度属性,通过MaxPool提取热图中的峰值,输出置信度大于阈值的关键点;最后整合关键点的属性得到停车位,实现了端到端的停车位检测。实验表明:该方法在视野受限或被遮挡场景下具有良好的检测效果,在ps2.0测试集中实现99.01%的精度和98.27%的召回率,单帧检测速度为19.0 ms。 展开更多
关键词 停车位检测 关键点估计 热图回归 maxpool ResNet50
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部