期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
Improved multi-scale inverse bottleneck residual network based on triplet parallel attention for apple leaf disease identification
1
作者 Lei Tang Jizheng Yi Xiaoyao Li 《Journal of Integrative Agriculture》 SCIE CAS CSCD 2024年第3期901-922,共22页
Accurate diagnosis of apple leaf diseases is crucial for improving the quality of apple production and promoting the development of the apple industry. However, apple leaf diseases do not differ significantly from ima... Accurate diagnosis of apple leaf diseases is crucial for improving the quality of apple production and promoting the development of the apple industry. However, apple leaf diseases do not differ significantly from image texture and structural information. The difficulties in disease feature extraction in complex backgrounds slow the related research progress. To address the problems, this paper proposes an improved multi-scale inverse bottleneck residual network model based on a triplet parallel attention mechanism, which is built upon ResNet-50, while improving and combining the inception module and ResNext inverse bottleneck blocks, to recognize seven types of apple leaf(including six diseases of alternaria leaf spot, brown spot, grey spot, mosaic, rust, scab, and one healthy). First, the 3×3 convolutions in some of the residual modules are replaced by multi-scale residual convolutions, the convolution kernels of different sizes contained in each branch of the multi-scale convolution are applied to extract feature maps of different sizes, and the outputs of these branches are multi-scale fused by summing to enrich the output features of the images. Second, the global layer-wise dynamic coordinated inverse bottleneck structure is used to reduce the network feature loss. The inverse bottleneck structure makes the image information less lossy when transforming from different dimensional feature spaces. The fusion of multi-scale and layer-wise dynamic coordinated inverse bottlenecks makes the model effectively balances computational efficiency and feature representation capability, and more robust with a combination of horizontal and vertical features in the fine identification of apple leaf diseases. Finally, after each improved module, a triplet parallel attention module is integrated with cross-dimensional interactions among channels through rotations and residual transformations, which improves the parallel search efficiency of important features and the recognition rate of the network with relatively small computational costs while the dimensional dependencies are improved. To verify the validity of the model in this paper, we uniformly enhance apple leaf disease images screened from the public data sets of Plant Village, Baidu Flying Paddle, and the Internet. The final processed image count is 14,000. The ablation study, pre-processing comparison, and method comparison are conducted on the processed datasets. The experimental results demonstrate that the proposed method reaches 98.73% accuracy on the adopted datasets, which is 1.82% higher than the classical ResNet-50 model, and 0.29% better than the apple leaf disease datasets before preprocessing. It also achieves competitive results in apple leaf disease identification compared to some state-ofthe-art methods. 展开更多
关键词 multi-scale module inverse bottleneck structure triplet parallel attention apple leaf disease
下载PDF
基于改进YOLOv8n的煤矿井下钻杆计数方法
2
作者 姜媛媛 刘宋波 《工矿自动化》 CSCD 北大核心 2024年第8期112-119,共8页
为提高煤矿井下钻杆计数的效率和精度,提出了一种基于改进YOLOv8n模型的煤矿井下钻杆计数方法。建立了YOLOv8n−TBiD模型,该模型可准确检测矿井钻机工作视频中的钻杆并进行有效分割:为有效捕获钻杆的边界信息,提高模型对钻杆形状识别的精... 为提高煤矿井下钻杆计数的效率和精度,提出了一种基于改进YOLOv8n模型的煤矿井下钻杆计数方法。建立了YOLOv8n−TBiD模型,该模型可准确检测矿井钻机工作视频中的钻杆并进行有效分割:为有效捕获钻杆的边界信息,提高模型对钻杆形状识别的精度,使用加权双向特征金字塔网络(BiFPN)替换路径聚合网络(PANet);针对钻杆易与昏暗的矿井环境混淆的问题,在Backbone网络的SPPF模块后添加三分支注意力(Triplet Attention),以增强模型抑制背景干扰的能力;针对钻杆在图像中占比小、背景信息繁杂的问题,采用Dice损失函数替换CIoU损失函数来优化模型对目标钻杆的分割处理。利用YOLOv8n−TBiD模型分割出的钻杆及其掩码信息,根据打钻过程中钻杆掩码面积变小而装新钻杆时钻杆掩码面积突然增大的规律,设计了一种钻杆计数算法。选取综采工作面实际采集的钻机工作视频对基于YOLOv8n−TBiD模型的钻杆计数方法进行了实验验证,结果表明:①YOLOv8n−TBiD模型检测钻杆的平均精度均值达94.9%,与对比模型GCI−YOLOv4,ECO−HC,P−MobileNetV2,YOLOv5,YOLOX相比,检测准确率分别提升了4.3%,7.5%,2.1%,6.3%,5.8%,检测速度较原始YOLOv8n模型提升了17.8%。②所提钻杆计数算法在不同煤矿井下环境的视频数据集上实现了99.3%的钻杆计数精度。 展开更多
关键词 矿井钻机 钻杆计数 YOLOv8n−TBiD BiFPN triplet attention Dice损失函数 钻杆掩码 图像分割
下载PDF
Triplet Label Based Image Retrieval Using Deep Learning in Large Database 被引量:1
3
作者 K.Nithya V.Rajamani 《Computer Systems Science & Engineering》 SCIE EI 2023年第3期2655-2666,共12页
Recent days,Image retrieval has become a tedious process as the image database has grown very larger.The introduction of Machine Learning(ML)and Deep Learning(DL)made this process more comfortable.In these,the pair-wi... Recent days,Image retrieval has become a tedious process as the image database has grown very larger.The introduction of Machine Learning(ML)and Deep Learning(DL)made this process more comfortable.In these,the pair-wise label similarity is used tofind the matching images from the database.But this method lacks of limited propose code and weak execution of misclassified images.In order to get-rid of the above problem,a novel triplet based label that incorporates context-spatial similarity measure is proposed.A Point Attention Based Triplet Network(PABTN)is introduced to study propose code that gives maximum discriminative ability.To improve the performance of ranking,a corre-lating resolutions for the classification,triplet labels based onfindings,a spatial-attention mechanism and Region Of Interest(ROI)and small trial information loss containing a new triplet cross-entropy loss are used.From the experimental results,it is shown that the proposed technique exhibits better results in terms of mean Reciprocal Rank(mRR)and mean Average Precision(mAP)in the CIFAR-10 and NUS-WIPE datasets. 展开更多
关键词 Image retrieval deep learning point attention based triplet network correlating resolutions classification region of interest
下载PDF
基于上下文语义联合YOLOv7的分心驾驶检测算法 被引量:3
4
作者 李富 徐凯 +2 位作者 朱灵龙 沈昊君 王泉 《国外电子测量技术》 2024年第3期121-128,共8页
针对分心驾驶检测方法存在实时性差、精度低、可部署性差的问题,提出了一种基于上下文语义增强联合YOLOv7的分心驾驶检测算法。首先将模型backbone和head部分的ELAN模块替换成语义上下文增强模块(contextual transformer,CoT),提高上下... 针对分心驾驶检测方法存在实时性差、精度低、可部署性差的问题,提出了一种基于上下文语义增强联合YOLOv7的分心驾驶检测算法。首先将模型backbone和head部分的ELAN模块替换成语义上下文增强模块(contextual transformer,CoT),提高上下文语义信息的捕获能力。其次,将语义关联增强机制(triplet attention)融入卷积块中,插入backbone和head的连接头之间以及融合MP2模块,强化目标间的关联关系以及提升目标特征提取能力。最后,将自注意力双向Transformer模块(Biformer)模块融合SPPCSPC模块,提升模型对分心驾驶中的复杂场景和遮挡目标的处理能力。改进的YOLOv7算法在分心驾驶数据集下平均精度均值(mean average precision,mAP)达到了87.3%,比原算法提高了4.3%,模型参数量减少了4.7%,每秒传输帧数达到了90 fps,具有较好的检测精度与速度。 展开更多
关键词 YOLOv7 分心驾驶检测 COT Biformer triplet attention
下载PDF
基于HGTC−YOLOv8n模型的煤矸识别算法研究 被引量:1
5
作者 滕文想 王成 费树辉 《工矿自动化》 CSCD 北大核心 2024年第5期52-59,共8页
现有基于深度学习的煤矸识别方法在煤矿井下低照度、高噪声及运动模糊等复杂工况下存在煤矸识别精度低、小目标煤矸容易漏检、模型参数量和运算量大,难以部署到计算资源有限的设备中等问题,提出了一种基于HGTC−YOLOv8n模型的煤矸识别算... 现有基于深度学习的煤矸识别方法在煤矿井下低照度、高噪声及运动模糊等复杂工况下存在煤矸识别精度低、小目标煤矸容易漏检、模型参数量和运算量大,难以部署到计算资源有限的设备中等问题,提出了一种基于HGTC−YOLOv8n模型的煤矸识别算法。采用HGNetv2网络替换YOLOv8n的主干网络,通过多尺度特征的有效提取,提高煤矸识别效果并减少模型的存储需求和计算资源消耗;在主干网络中嵌入三重注意力机制模块Triplet Attention,捕获不同维度间的交互信息,增强煤矸图像目标特征的提取,减少无关信息的干扰;选用内容感知特征重组模块(CARAFE)来改进YOLOv8n颈部特征融合网络上采样算子,利用上下文信息提高感受视野,提高小目标煤矸识别准确率。实验结果表明:①HGTC−YOLOv8n模型的平均精度均值为93.5%,模型的参数量为2.645×10^(6),浮点运算量为8.0×10^(9),帧速率为79.36帧/s。②平均精度均值较YOLOv8n模型提升了2.5%,参数量和浮点运算量较YOLOv8n模型分别下降了16.22%和10.11%。③与YOLO系列模型相比,HGTC−YOLOv8n模型的平均精度均值最高,且参数量和浮点运算量最少,检测速度较快,综合检测性能最佳。④基于HGTC−YOLOv8n模型的煤矸识别算法在煤矿井下复杂工况下,改善了煤矸识别精度低、小目标煤矸容易漏检等问题,满足煤矸图像实时检测要求。 展开更多
关键词 煤矸识别 小目标识别 YOLOv8n 内容感知特征重组模块 三重注意力机制 triplet attention HGNetv2
下载PDF
基于注意力机制的多尺度手部分割方法
6
作者 周雯晴 代素敏 +1 位作者 王阳萍 王文润 《液晶与显示》 CAS CSCD 北大核心 2024年第11期1506-1518,共13页
针对手部边缘细节信息分割不精确及小面积手部的错检、漏检问题,提出一种基于注意力机制的多尺度手部分割方法。首先,对Transformer模块重新进行设计优化,提出窗口自注意力结构和双分支前馈神经网络(Dual-branch FeedForward Networks,D... 针对手部边缘细节信息分割不精确及小面积手部的错检、漏检问题,提出一种基于注意力机制的多尺度手部分割方法。首先,对Transformer模块重新进行设计优化,提出窗口自注意力结构和双分支前馈神经网络(Dual-branch FeedForward Networks,D-FFN)机制,通过窗口自注意力机制整合全局和局部的依赖信息,D-FFN抑制背景信息的干扰;然后,提出一种结合条形池化和级联网络的多尺度特征提取模块增大感受野,提高手部分割模型的准确性和鲁棒性;最后,提出基于Triplet Attention机制的上采样解码器模块,通过调节通道维度与空间维度的注意力权重将目标特征和背景的冗余特征区分开。将所提算法在公开数据集GTEA(Georgia Tech Egocentric Activity)和EYTH(EgoYouTubeHands)上测试,实验结果表明,该算法在两个数据集上的平均交并比(MIoU)值分别达到了95.8%和90.2%,相较于TransUnet算法分别提升了2.5%和2.1%,满足手部图像分割的稳定可靠、精度高、抗干扰能力强等要求。 展开更多
关键词 手部分割 深度学习 TransUnet 前馈神经网络 空洞空间金字塔池化模块 triplet attention
下载PDF
改进的EfficientDet及直方图均衡化的工件检测算法研究 被引量:1
7
作者 石林坤 田怀文 杨玉洁 《机械科学与技术》 CSCD 北大核心 2023年第9期1445-1454,共10页
针对流水线加工作业环境下工业机器人对工件检测及定位率较低,速度慢等问题,提出基于改进的EfficientDet工件检测神经网络模型。采用EfficientNet作为主干特征提取网络,利用Triplet Attention注意力机制代替原始的SE Attention机制,同... 针对流水线加工作业环境下工业机器人对工件检测及定位率较低,速度慢等问题,提出基于改进的EfficientDet工件检测神经网络模型。采用EfficientNet作为主干特征提取网络,利用Triplet Attention注意力机制代替原始的SE Attention机制,同时借鉴循环特征融合思想,采用Recursive-BiFPN循环特征融合网络结构。针对正负样本不均等问题,采用generalized focal loss改进原始focal loss损失函数。考虑到机械加工特定生产环境,采用直方图均衡化思想对数据进行对比度提高。最后利用工业相机建立自制数据集并进行模型训练,在复杂工业生产情况下,改进后的EfficientDet在mAP上较原始网络提高6.1%,同时速度提高到72帧/s。最后实验结果表明,该算法在生产环境下能快速准确地对工件进行定位检测,为实际生产需要提供新的解决思路。 展开更多
关键词 工件检测 EfficientDet模型 triplet attention generalized focal loss
下载PDF
基于人物交互的学生课堂行为识别研究
8
作者 周珍玉 秦学 《软件工程与应用》 2022年第6期1191-1203,共13页
学生课堂行为分析是评估课堂教学效果的有效方法,现有的学生行为识别研究仅针对学生自身进行识别,而对学生与周围物品的交互关注不够。基于此,本文提出了一种基于人物交互的学生课堂行为识别研究方法,通过分析教室监控视频,检测出学生... 学生课堂行为分析是评估课堂教学效果的有效方法,现有的学生行为识别研究仅针对学生自身进行识别,而对学生与周围物品的交互关注不够。基于此,本文提出了一种基于人物交互的学生课堂行为识别研究方法,通过分析教室监控视频,检测出学生和物品目标,并基于人与物的交互关系来识别其课堂行为。首先,考虑到笔和手机等小目标物品所占像素和可提取的有效特征较少,提出了一种改进YOLOv5s的目标检测方法,解决随着网络层数的叠加,小目标的特征信息逐渐消失导致漏检的问题。然后,为解决教室环境中目标数量较多,目标与目标间存在遮挡等因素导致网络难以提取特征的问题,引入Triplet注意力机制,增强网络提取特征的能力。接下来,采用VSGNet网络识别人与物的交互关系以确定行为类别。最后,在自制教室数据集和公开数据集进行了多组对比实验,实验结果表明,与原YOLOv5s网络相比,改进后的网络在自制和公开数据集上mAP分别提升了3.06%和3.2%,召回率分别提升了3.1%和4.2%,验证了改进方法的有效性。 展开更多
关键词 YOLOv5s 学生行为识别 人物交互 triplet attention
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部