期刊文献+
共找到326篇文章
< 1 2 17 >
每页显示 20 50 100
基于DSConvBiGRU网络和热电堆阵列的动态手势识别方法
1
作者 顾亮 于莲芝 《计量学报》 CSCD 北大核心 2024年第6期795-805,共11页
提出了适用于嵌入式系统并融合深度可分离卷积神经网络与双向门控循环单元的DSConvBiGRU网络模型,将其用于动态手势序列的分类,设计并实现了一种使用低分辨率热电堆阵列传感器的动态手势识别解决方案,构建了动态手势数据集并在公开网站... 提出了适用于嵌入式系统并融合深度可分离卷积神经网络与双向门控循环单元的DSConvBiGRU网络模型,将其用于动态手势序列的分类,设计并实现了一种使用低分辨率热电堆阵列传感器的动态手势识别解决方案,构建了动态手势数据集并在公开网站发布,完成了预训练网络模型在Raspberry Pi边缘端的部署。系统对传感器输出的连续20个温度矩阵进行区间映射、背景减除、Lanczos插值和Otsu二值化预处理得到单个动态手势序列,再由预训练的DSConvBiGRU网络进行分类。实验结果表明:网络模型在测试集上识别准确率为99.291%,在边缘端预处理耗时5.513 ms,推理耗时8.231 ms,该系统满足低功耗、高精度和实时性的设计需求。 展开更多
关键词 机器视觉 光电检测 动态手势识别 热电堆阵列 深度可分离卷积神经网络 双向门控循环单元
下载PDF
A Lightweight Convolutional Neural Network with Hierarchical Multi-Scale Feature Fusion for Image Classification
2
作者 Adama Dembele Ronald Waweru Mwangi Ananda Omutokoh Kube 《Journal of Computer and Communications》 2024年第2期173-200,共28页
Convolutional neural networks (CNNs) are widely used in image classification tasks, but their increasing model size and computation make them challenging to implement on embedded systems with constrained hardware reso... Convolutional neural networks (CNNs) are widely used in image classification tasks, but their increasing model size and computation make them challenging to implement on embedded systems with constrained hardware resources. To address this issue, the MobileNetV1 network was developed, which employs depthwise convolution to reduce network complexity. MobileNetV1 employs a stride of 2 in several convolutional layers to decrease the spatial resolution of feature maps, thereby lowering computational costs. However, this stride setting can lead to a loss of spatial information, particularly affecting the detection and representation of smaller objects or finer details in images. To maintain the trade-off between complexity and model performance, a lightweight convolutional neural network with hierarchical multi-scale feature fusion based on the MobileNetV1 network is proposed. The network consists of two main subnetworks. The first subnetwork uses a depthwise dilated separable convolution (DDSC) layer to learn imaging features with fewer parameters, which results in a lightweight and computationally inexpensive network. Furthermore, depthwise dilated convolution in DDSC layer effectively expands the field of view of filters, allowing them to incorporate a larger context. The second subnetwork is a hierarchical multi-scale feature fusion (HMFF) module that uses parallel multi-resolution branches architecture to process the input feature map in order to extract the multi-scale feature information of the input image. Experimental results on the CIFAR-10, Malaria, and KvasirV1 datasets demonstrate that the proposed method is efficient, reducing the network parameters and computational cost by 65.02% and 39.78%, respectively, while maintaining the network performance compared to the MobileNetV1 baseline. 展开更多
关键词 MobileNet Image Classification Lightweight convolutional Neural Network depthwise Dilated separable convolution Hierarchical Multi-Scale Feature Fusion
下载PDF
一种基于YOLOX_s的雾天场景目标检测方法
3
作者 娄铮铮 张欣 +1 位作者 胡世哲 吴云鹏 《计算机科学》 CSCD 北大核心 2024年第7期206-213,共8页
文中提出了一个基于深度可分离卷积和注意力机制的雾天目标检测模型,旨在实现在雾天场景中对目标的快速、准确检测。该模型由去雾模块和检测模块组成,并在训练过程中共同训练。为确保模型在雾天场景中检测的准确性和实时性,在去雾模块方... 文中提出了一个基于深度可分离卷积和注意力机制的雾天目标检测模型,旨在实现在雾天场景中对目标的快速、准确检测。该模型由去雾模块和检测模块组成,并在训练过程中共同训练。为确保模型在雾天场景中检测的准确性和实时性,在去雾模块方面,采用AODNet对输入图像进行去雾处理,以降低雾对图像中待检测目标的干扰,在检测模块中使用改进后的YOLOX_s模型,输出目标的分类置信度和位置坐标。为提升网络的检测性能,在YOLOX_s基础上采用深度可分离卷积和注意力机制来提高特征提取能力,扩大特征图感受野。所提模型能提高有雾场景中模型的检测精度,且不增加模型参数量和计算量。实验结果表明,所提模型在RTTS数据集和合成有雾目标检测数据集上均表现出色,有效提高了模型在雾天场景中的检测精度。与基准模型相比,平均精度(mAP@50_95)分别提升了1.9%和2.37%。 展开更多
关键词 雾天场景 目标检测 图像去雾 深度可分离卷积 注意力机制
下载PDF
基于改进ResNet50的钨矿石双能X射线图像分选方法
4
作者 刘志锋 曾灵锋 +2 位作者 彭芳伟 魏振华 张寰宇 《现代电子技术》 北大核心 2024年第13期87-92,共6页
文中提出一种基于深度扩张可分离卷积和注意力机制的残差网络模型(DWAtt-ResNet),通过实验对比表明,该模型在钨矿石双能X射线图像数据集上准确率、F1分数、AUC值和AP值均优于ConvNeXt、DenseNet121和EfficientNet_b4等主流的图像分类模... 文中提出一种基于深度扩张可分离卷积和注意力机制的残差网络模型(DWAtt-ResNet),通过实验对比表明,该模型在钨矿石双能X射线图像数据集上准确率、F1分数、AUC值和AP值均优于ConvNeXt、DenseNet121和EfficientNet_b4等主流的图像分类模型。通过消融实验表明,该模型准确率达到87.4%,计算量为2.7GFLOPs,参数量为16.95M,相比ResNet50准确率提高3%,计算量降低1.42 GFLOPs,参数量降低6.56M,准确率提升的同时,效率大幅提升,更适合工业生产的矿石快速分拣需求。 展开更多
关键词 钨矿石 双能X射线 图像分类 ResNet50 深度扩张可分离卷积 注意力机制
下载PDF
多尺度特征金字塔融合的街景图像语义分割
5
作者 曲海成 王莹 +1 位作者 董康龙 刘万军 《计算机系统应用》 2024年第3期73-84,共12页
针对街景图像语义分割任务中的目标尺寸差异大、多尺度特征难以高效提取的问题,本文提出了一种语义分割网络(LDPANet).首先,将空洞卷积与引入残差学习单元的深度可分离卷积结合,来优化编码器结构,在降低了计算复杂度的同时缓解梯度消失... 针对街景图像语义分割任务中的目标尺寸差异大、多尺度特征难以高效提取的问题,本文提出了一种语义分割网络(LDPANet).首先,将空洞卷积与引入残差学习单元的深度可分离卷积结合,来优化编码器结构,在降低了计算复杂度的同时缓解梯度消失的问题.然后利用层传递的迭代空洞空间金字塔,将自顶向下的特征信息依次融合,提高了上下文信息的有效交互能力;在多尺度特征融合之后引入属性注意力模块,使网络抑制冗余信息,强化重要特征.再者,以通道扩展上采样代替双线插值上采样作为解码器,进一步提升了特征图的分辨率.最后,LDPANet方法在Cityscapes和CamVid数据集上的精度分别达到了91.8%和87.52%,与近几年网络模型相比,本文网络模型可以精确地提取像素的位置信息以及空间维度信息,提高了语义分割的准确率. 展开更多
关键词 语义分割 MDSDC IDCP-LC 属性注意力 通道扩展上采样 特征融合
下载PDF
煤矿工业物联网设备识别模型
6
作者 郝秦霞 李慧敏 《工矿自动化》 CSCD 北大核心 2024年第3期99-107,共9页
煤矿工业物联网(IIoT)设备计算与存储资源受限,易遭受非法网络入侵,造成敏感数据泄露或恶意篡改,威胁煤矿生产安全。精准识别煤矿IIoT设备可实现有效管理并维护设备正常运转,提高设备安全防护能力,然而现有设备识别算法存在特征构造复... 煤矿工业物联网(IIoT)设备计算与存储资源受限,易遭受非法网络入侵,造成敏感数据泄露或恶意篡改,威胁煤矿生产安全。精准识别煤矿IIoT设备可实现有效管理并维护设备正常运转,提高设备安全防护能力,然而现有设备识别算法存在特征构造复杂、内存与计算需求较高导致难以部署在资源受限的煤矿IIoT设备中等问题。针对上述问题,提出了一种煤矿IIoT设备识别模型。首先,对支持TCP/IP协议传输的流量数据进行流量切分、无关字段去除、去重、定长字段截取操作后转换为IDX格式存储;其次,使用卷积块注意力模块(CBAM)优化深度可分离卷积(DSC),从而搭建轻量级DSC−CBAM模型来过滤Non−IIoT设备;然后,利用带有阶段惩罚的Wasserstein生成对抗网络(WGAN−GP)扩充流量较少的煤矿IIoT设备数据,达到平衡偏移流量数据的目的;最后,在DSC−CBAM基础上引入多尺度特征融合(MFF)技术捕获浅层全局特征信息,并增加Mish激活函数提高模型训练稳定性,建立优化混合模态识别(MDCM)模型,实现煤矿IIoT设备精准识别。实验结果表明,该模型收敛速度快,准确率、召回率、精确率与F1−score指标均高达99.98%,且参数量小,能精准、高效识别煤矿IIoT设备。 展开更多
关键词 煤矿工业物联网 设备识别 深度可分离卷积 注意力机制 生成对抗网络
下载PDF
基于改进SegNet的鸡只检测算法
7
作者 吉训生 孙贝贝 夏圣奎 《计算机工程与设计》 北大核心 2024年第1期102-109,共8页
为实现智能化检测出鸡场中死亡鸡只,提出一种基于改进语义分割模型AT-SegNet的鸡只检测算法。基于对称编码解码结构SegNet,利用空洞卷积在解码前聚合不同感受野的上下文信息,设计一种三尺度注意力级联融合模块,以并联方式嵌入编、解码器... 为实现智能化检测出鸡场中死亡鸡只,提出一种基于改进语义分割模型AT-SegNet的鸡只检测算法。基于对称编码解码结构SegNet,利用空洞卷积在解码前聚合不同感受野的上下文信息,设计一种三尺度注意力级联融合模块,以并联方式嵌入编、解码器间,丰富解码器信息。利用多层深度可分离卷积替代标准卷积,提取深层次语义信息,减少计算量提高实时性。将鸡群图像分割结果交并比与阈值对比判别鸡只状态。实验结果表明,改进的AT-SegNet较原算法的检测精度提高了25.17%,能够在复杂鸡群环境中准确、高效地发现死亡鸡只。 展开更多
关键词 深度学习 鸡只检测 语义分割 编码解码结构 注意力机制 软池化 深度可分离卷积
下载PDF
基于改进YOLOv5s的面向自动驾驶场景的道路目标检测算法
8
作者 胡丹丹 张忠婷 《智能系统学报》 CSCD 北大核心 2024年第3期653-660,共8页
在复杂道路场景中检测车辆、行人、自行车等目标时,存在因多尺度目标及部分遮挡易造成漏检及误检等情况,提出一种基于改进YOLOv5s的面向自动驾驶场景的道路目标检测算法。首先,利用深度可分离卷积替换部分普通卷积,减少模型的参数量以... 在复杂道路场景中检测车辆、行人、自行车等目标时,存在因多尺度目标及部分遮挡易造成漏检及误检等情况,提出一种基于改进YOLOv5s的面向自动驾驶场景的道路目标检测算法。首先,利用深度可分离卷积替换部分普通卷积,减少模型的参数量以提升检测速度。其次,在特征融合网络中引入基于感受野模块(receptive field block,RFB)改进的RFB-s,通过模仿人类视觉感知,增强特征图的有效感受野区域,提高网络特征表达能力及对目标特征的可辨识性。最后,使用自适应空间特征融合(adaptively spatial feature fusion,ASFF)方式以提升PANet对多尺度特征融合的效果。实验结果表明,在PASCAL VOC数据集上,所提算法检测平均精度均值相较于YOLOv5s提高1.71个百分点,达到84.01%,在满足自动驾驶汽车实时性要求的前提下,在一定程度上减少目标检测时的误检及漏检情况,有效提升模型在复杂驾驶场景下的检测性能。 展开更多
关键词 YOLOv5s 自动驾驶 目标检测算法 深度可分离卷积 感受野模块 自适应空间特征融合 PANet 多尺度特征融合
下载PDF
基于锚点的快速三维手部关键点检测算法
9
作者 秦晓飞 何文 +2 位作者 班东贤 郭宏宇 于景 《电子科技》 2024年第4期77-86,共10页
在人机协作任务中,手部关键点检测为机械臂提供目标点坐标,A2J(Anchor-to-Joint)是具有代表性的一种利用锚点进行关键点检测的方法。A2J以深度图为输入,可实现较好的检测效果,但对全局特征获取能力不足。文中设计了全局-局部特征融合模... 在人机协作任务中,手部关键点检测为机械臂提供目标点坐标,A2J(Anchor-to-Joint)是具有代表性的一种利用锚点进行关键点检测的方法。A2J以深度图为输入,可实现较好的检测效果,但对全局特征获取能力不足。文中设计了全局-局部特征融合模块(Global-Local Feature Fusion,GLFF)对骨干网络浅层和深层的特征进行融合。为了提升检测速度,文中将A2J的骨干网络替换为ShuffleNetv2并对其进行改造,用5×5深度可分离卷积替换3×3深度可分离卷积,增大感受野,有效提升了骨干网络对全局特征的提取能力。文中在锚点权重估计分支引入高效通道注意力模块(Efficient Channel Attention,ECA),提升了网络对重要锚点的关注度。在主流数据集ICVL和NYU上进行的训练和测试结果表明,相比于A2J,文中所提方法的平均误差分别降低了0.09 mm和0.15 mm。在GTX1080Ti显卡上实现了151 frame·s^(-1)的检测速率,满足人机协作任务对于实时性的要求。 展开更多
关键词 人机协作 三维手部关键点检测 锚点 深度图 全局-局部特征融合 ShuffleNetv2 深度可分离卷积 高效通道注意力
下载PDF
面向小目标检测的轻量化改进CenterNet算法
10
作者 张伟丰 《湖北汽车工业学院学报》 2024年第2期57-63,70,共8页
为提高传统目标检测算法的实时性,并解决小目标检测效果不佳及漏检率高的问题,提出了改进CenterNet算法。首先将特征提取网络由ResNet50改为SqueezeNet,卷积计算的部分用深度可分离卷积代替;接着使用双阈值改进NMS算法替代单阈值-非极... 为提高传统目标检测算法的实时性,并解决小目标检测效果不佳及漏检率高的问题,提出了改进CenterNet算法。首先将特征提取网络由ResNet50改为SqueezeNet,卷积计算的部分用深度可分离卷积代替;接着使用双阈值改进NMS算法替代单阈值-非极大值抑制算法,通过DIoU计算损失函数。结果表明:改进算法在安全帽和口罩检测数据集的检测精度分别为91.3%和85.5%,与CenterNet算法相比,性能分别提升了2.35%和3.76%,同时具有更快的检测速度。 展开更多
关键词 目标检测 SqueezeNet 深度可分离卷积 CenterNet
下载PDF
基于深度可分离卷积和残差注意力模块的车道线检测方法 被引量:1
11
作者 崔明义 冯治国 +2 位作者 代建琴 赵雪峰 袁森 《激光杂志》 CAS 北大核心 2024年第4期81-87,共7页
针对全天候条件下道路车道线视觉检测技术存在的算法结构复杂、参数数量较多等问题,提出一种基于深度可分离卷积和残差注意力模块的车道线检测方法,建立了LPINet网络模型。利用深度可分离卷积减小输入图像尺寸,设计三种不同结构的瓶颈... 针对全天候条件下道路车道线视觉检测技术存在的算法结构复杂、参数数量较多等问题,提出一种基于深度可分离卷积和残差注意力模块的车道线检测方法,建立了LPINet网络模型。利用深度可分离卷积减小输入图像尺寸,设计三种不同结构的瓶颈残差单元降低网络参数数量,引入ECANet注意力机制增加重要特征通道权重,提升车道线检测精度。在Tusimple数据集和GZUCDS自建数据集上的实验结果表明:在晴天场景下,LPINet网络车道线检测精度可达96.62%,且模型参数量降至1.64 MB,实现了轻量化设计;在雾天、雨天、夜晚和隧道复杂场景中进行了探索性研究,车道线检测精度达到93.86%,证明了方法的有效性。 展开更多
关键词 车道线检测 深度学习 残差网络 深度可分离卷积 注意力机制
下载PDF
轻量化YOLO-v7的数显仪表检测及读数 被引量:1
12
作者 章芮宁 闫坤 叶进 《计算机工程与应用》 CSCD 北大核心 2024年第8期192-201,共10页
由于较大的参数体量和较高的计算复杂度,通用检测及识别模型直接在移动端部署的难度较高。为解决这个困难,研究了移动设备上使用计算机视觉的仪表检测及读数方法。针对实际工业生产环境下检测及识别的需求,基于YOLO-v7重新设计了轻量化... 由于较大的参数体量和较高的计算复杂度,通用检测及识别模型直接在移动端部署的难度较高。为解决这个困难,研究了移动设备上使用计算机视觉的仪表检测及读数方法。针对实际工业生产环境下检测及识别的需求,基于YOLO-v7重新设计了轻量化的仪表检测网络以及字符检测及识别网络。利用深度可分离卷积进一步降低计算复杂度,压缩模型大小。采用K-means++聚类算法加遗传算法自动产生初始锚框。使用通道剪枝,再一次压缩模型。实验结果证明,专用网络模型设计、深度可分离卷积以及通道剪枝对减少模型参数体量和降低算力需求具有显著效果。参数数量相较于原始YOLO-v7模型均下降了99.67%,模型算力需求均降至0.3 GFLOPs,下降了99.71%。实验中平均图片检测时间为10.7 ms。各网络的平均精准度(mAP0.5)达到了99.63%和99.53%。系统整体读数精确度达98.44%。 展开更多
关键词 数显仪表 YOLO-v7 深度可分离卷积 模型压缩 通道剪枝
下载PDF
交叉特征融合和RASPP驱动的场景分割方法 被引量:1
13
作者 朱新杰 熊风光 +2 位作者 谢帅康 宋宁栋 李文清 《计算机系统应用》 2024年第1期76-86,共11页
本文针对场景中目标多样性和尺度不统一等现象造成的边缘分割错误、特征不连续问题,提出了一种交叉特征融合和RASPP驱动的场景分割方法.该方法以交叉特征融合的方式合并编码器输出的多尺度特征,在融合高层语义信息时使用复合卷积注意力... 本文针对场景中目标多样性和尺度不统一等现象造成的边缘分割错误、特征不连续问题,提出了一种交叉特征融合和RASPP驱动的场景分割方法.该方法以交叉特征融合的方式合并编码器输出的多尺度特征,在融合高层语义信息时使用复合卷积注意力模块进行处理,避免上采样操作造成的特征信息丢失以及引入噪声的影响,细化目标边缘分割效果.同时提出了深度可分离残差卷积,在此基础上设计并实现了结合残差的金字塔池化模块——RASPP,对交叉融合后的特征进行处理,获得不同尺度的上下文信息,增强特征语义表达.最后,将RASPP模块处理后的特征进行合并,提升分割效果.在Cityscapes和CamVid数据集上的实验结果表明,本文提出方法相比现有方法具有更好的表现,并且对场景中的目标边缘有更好的分割效果. 展开更多
关键词 语义分割 交叉特征融合 金字塔池化 注意力机制 深度可分离卷积
下载PDF
基于改进注意力模块的船舶涂装缺陷检测方法
14
作者 庞博 卜赫男 +2 位作者 李磊 周宏根 景旭文 《江苏科技大学学报(自然科学版)》 CAS 2024年第3期1-8,共8页
针对人工检测船舶缺陷效率低、传统检测网络准确率差的问题,提出一种基于改进注意力模块(improved convolutional block attention module, ICBAM)的船舶涂装缺陷检测方法.首先,YOLOv4在路径聚合网络中将深度可分离卷积代替常规卷积形成... 针对人工检测船舶缺陷效率低、传统检测网络准确率差的问题,提出一种基于改进注意力模块(improved convolutional block attention module, ICBAM)的船舶涂装缺陷检测方法.首先,YOLOv4在路径聚合网络中将深度可分离卷积代替常规卷积形成IYOLOv4,减少模型计算量;其次,将ICBAM融入IYOLOv4的路径聚合网络Route层后形成ICBAM-IYOLOv4,ICBAM在通道上构建多频率通道改善全局平均池化,利用一维卷积代替全连接层聚合相邻通道间的信息,减少模型参数;然后,在空间上融合Inception v3思想和特征分层思想改善空洞卷积;最后,在船舶涂装缺陷样本数据增强的基础上,对ICBAM-IYOLOv4进行测试.实验结果表明:ICBAM-IYOLOv4相比其他算法,其损失值更低、收敛更快;平均精度均值(mean average precision, MAP)在训练集和测试集上分别提高了1.89%和1.91%. 展开更多
关键词 船舶涂装 缺陷检测 特征分层 多频率通道 注意力模块 深度可分离卷积 一维卷积
下载PDF
基于深度可分离卷积神经网络的水声目标分类研究及FPGA实现
15
作者 张天帅 刘金涛 王良 《中国海洋大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第8期152-165,共14页
针对传统声纳处理器算力受限,能效比低,难以支撑水声目标识别实时推理的问题,本文基于异构SoC平台设计了面向被动声纳水下目标实时计算处理系统。该系统具有较低资源开销和较小分类精度损失等优点,是一种低时延、高能效比的硬件加速器... 针对传统声纳处理器算力受限,能效比低,难以支撑水声目标识别实时推理的问题,本文基于异构SoC平台设计了面向被动声纳水下目标实时计算处理系统。该系统具有较低资源开销和较小分类精度损失等优点,是一种低时延、高能效比的硬件加速器解决方案。本文以MobileNetV1网络模型为基础并对其进行结构优化,在现场可编程门阵列(Field programmable gate array,FPGA)上通过并行流水线的加速结构实现它的前向推理过程,并对其权值参数进行二值化的处理,以达到减少存储量和计算量的同时加快其推理速度的目的。同时,根据在输入通道维度以及输出图像高度上分块并行的优化思想,设计了深度可分离卷积的流水优化策略,采用并行流水的结构极大减少了前向推理的时间。实验表明,在利用出海实际采集得到的水声数据集上,本文实现的系统识别精度为88.5%,在的分辨率的图像上,时间延迟达到4.23 ms。对比CPU速度提升了70.68倍,是GPU速度的68%。能效比分别为CPU的0.08%,GPU的2.12%。本文为神经网络在硬件资源有限以及功耗存在限制的轻量型移动端或者边缘设备上的应用与部署,以及对促进融合水下勘探网络的建设和水下信息的快速获取提供了设计思路。 展开更多
关键词 水声目标分类 深度可分离卷积 定点量化 FPGA
下载PDF
一种基于对偶学习的场景分割模型
16
作者 刘思纯 王小平 +1 位作者 裴喜龙 罗航宇 《计算机科学》 CSCD 北大核心 2024年第8期133-142,共10页
城市场景分割等复杂任务存在特征图空间信息利用率低下、分割边界不够精准以及网络参数量过大的问题。为解决这些问题,提出了一种基于对偶学习的场景分割模型DualSeg。首先,采用深度可分离卷积使模型参数量显著减少;其次,融合空洞金字... 城市场景分割等复杂任务存在特征图空间信息利用率低下、分割边界不够精准以及网络参数量过大的问题。为解决这些问题,提出了一种基于对偶学习的场景分割模型DualSeg。首先,采用深度可分离卷积使模型参数量显著减少;其次,融合空洞金字塔池化与双重注意力机制模块获取准确的上下文信息;最后,利用对偶学习构建闭环反馈网络,通过对偶关系约束映射空间,同时训练“图像场景分割”和“对偶图像重建”两个任务,辅助场景分割模型的训练,帮助模型更好地感知类别边界、提高识别能力。实验结果表明,在自然场景分割数据集PASCAL VOC中,基于Xception骨架网络的DualSeg模型的mIoU和全局准确率分别达到81.3%和95.1%,在CityScapes数据集上mIoU达到77.4%,并且模型参数量减少18.45%,验证了模型的有效性。后续将探索更有效的注意力机制,进一步提高分割精度。 展开更多
关键词 场景分割 图像重建 对偶学习 注意力机制 深度可分离卷积 多层次特征融合
下载PDF
面向小型边缘计算的深度可分离神经网络模型与硬件加速器设计
17
作者 孟群康 李强 +5 位作者 赵峰 庄莉 王秋琳 陈锴 罗军 常胜 《计算机应用研究》 CSCD 北大核心 2024年第3期861-865,879,共6页
神经网络参数量和运算量的扩大,使得在资源有限的硬件平台上流水线部署神经网络变得更加困难。基于此,提出了一种解决深度学习模型在小型边缘计算平台上部署困难的方法。该方法基于应用于自定义数据集的深度可分离网络模型,在软件端使... 神经网络参数量和运算量的扩大,使得在资源有限的硬件平台上流水线部署神经网络变得更加困难。基于此,提出了一种解决深度学习模型在小型边缘计算平台上部署困难的方法。该方法基于应用于自定义数据集的深度可分离网络模型,在软件端使用迁移学习、敏感度分析和剪枝量化的步骤进行模型压缩,在硬件端分析并设计了适用于有限资源FPGA的流水线硬件加速器。实验结果表明,经过软件端的网络压缩优化,这种量化部署模型具有94.60%的高准确率,16.64 M的较低的单次推理定点数运算量和0.079 M的参数量。此外,经过硬件资源优化后,在国产FPGA开发板上进行流水线部署,推理帧率达到了366 FPS,计算能效为8.57 GOPS/W。这一研究提供了一种在小型边缘计算平台上高性能部署深度学习模型的解决方案。 展开更多
关键词 边缘计算 深度可分离卷积 流水线部署 硬件加速器 FPGA
下载PDF
基于跨通道融合与注意力机制的轻量化目标检测模型
18
作者 曹瑞颖 赵志诚 +1 位作者 谢新林 刘宁 《火力与指挥控制》 CSCD 北大核心 2024年第3期142-150,共9页
针对当前目标检测算法模型复杂度高、实时检测图片速度较慢的难题,提出一种基于跨通道融合与注意力机制的轻量化目标检测模型,便于移动场景搭载。利用MV1模块构建主干特征提取网络,CDC模块改造多层基础卷积,提出一种基于深度可分离卷积(... 针对当前目标检测算法模型复杂度高、实时检测图片速度较慢的难题,提出一种基于跨通道融合与注意力机制的轻量化目标检测模型,便于移动场景搭载。利用MV1模块构建主干特征提取网络,CDC模块改造多层基础卷积,提出一种基于深度可分离卷积(depthwise separable convolution,DW)的轻量化模型。在网络的颈部,三通道扩展为四通道;同时设计一种跨通道路径,融合深浅层信息,进一步加强特征提取。最后融合一种高效通道注意力机制(efficient channel attention,ECA),使算法聚焦图像中的目标位置。仿真实验结果表明:该算法在Pascal VOC 07+12数据集上所有类别的平均识别准确率达到91.64%,与最新的YOLOv7相比,模型参数量降低了60%,检测速度达到55.54 FPS,证明了该算法的有效性。 展开更多
关键词 轻量化 YOLOv4 MobileNet 多尺度融合 深度可分离卷积
下载PDF
改进YOLOv7的轻量化交通标志检测算法 被引量:1
19
作者 李禹纬 付锐 刘帆 《太原理工大学学报》 北大核心 2024年第1期195-203,共9页
【目的】针对现有交通标志检测算法中的较大计算量和较高参数量的问题,提出一种改进YOLOv7的轻量化交通标志检测算法。【方法】该算法分为输入、提取特征的骨干网络、融合特征的颈部网络和对目标进行预测的头部网络4个部分。在骨干网络... 【目的】针对现有交通标志检测算法中的较大计算量和较高参数量的问题,提出一种改进YOLOv7的轻量化交通标志检测算法。【方法】该算法分为输入、提取特征的骨干网络、融合特征的颈部网络和对目标进行预测的头部网络4个部分。在骨干网络引入大核卷积,增大了有效感受野,提升了骨干网络提取特征的能力;检测颈部融合坐标注意力、随机池化等方法,既能构建通道注意力又能捕捉准确位置,同时提升网络的泛化能力;此外,提出集中综合深度可分离卷积模块,在减少参数量的同时更好地提取图像特征。【结果】实验结果表明,本文算法在CCTSDB2021数据集上的检测精度达到了93.13%,mAP也达到了87.59%,相较于同类型的方法有了较大的提高,该网络在较低的参数量和计算量的情况下实现了较高的精确率,不仅能够精准地捕捉交通标志的位置信息,同时能够准确地对交通标志进行预测。 展开更多
关键词 交通标志检测 轻量化 大核卷积 坐标注意力 深度可分离卷积
下载PDF
基于自适应注意力机制的YOLOv4无人超市商品检测
20
作者 章超华 丁胜 苏浩 《计算机应用与软件》 北大核心 2024年第4期129-134,158,共7页
针对无人超市智能结算任务中商品检测实时性不高、堆叠商品检测效果差、相似商品难分类的问题,提出一种基于YOLOv4改进的商品识别算法。使用轻量级网络MobileNetv2进行特征提取加快检测速度;在MobileNetv2的倒残差结构中引入通道注意力... 针对无人超市智能结算任务中商品检测实时性不高、堆叠商品检测效果差、相似商品难分类的问题,提出一种基于YOLOv4改进的商品识别算法。使用轻量级网络MobileNetv2进行特征提取加快检测速度;在MobileNetv2的倒残差结构中引入通道注意力和空间注意力放大局部特征权重,从而加强对堆叠商品的检测能力;在损失函数中使用焦点损失(Focal loss)解决类间差异小的难分类问题。实验结果表明,该方法在自建商品数据集Goods上准确率达到了80.3%,检测速度达到73帧/s,优于YOLOv4算法。 展开更多
关键词 无人超市 商品检测 注意力机制 深度可分离卷积
下载PDF
上一页 1 2 17 下一页 到第
使用帮助 返回顶部