期刊文献+
共找到1,220篇文章
< 1 2 61 >
每页显示 20 50 100
引入上下文信息和Attention Gate的GUS-YOLO遥感目标检测算法 被引量:9
1
作者 张华卫 张文飞 +2 位作者 蒋占军 廉敬 吴佰靖 《计算机科学与探索》 CSCD 北大核心 2024年第2期453-464,共12页
目前基于通用YOLO系列的遥感目标检测算法存在并未充分利用图像的全局上下文信息,在特征融合金字塔部分并未充分考虑缩小融合特征之间的语义鸿沟、抑制冗余信息干扰的缺点。在结合YOLO算法优点的基础上提出GUS-YOLO算法,其拥有一个能够... 目前基于通用YOLO系列的遥感目标检测算法存在并未充分利用图像的全局上下文信息,在特征融合金字塔部分并未充分考虑缩小融合特征之间的语义鸿沟、抑制冗余信息干扰的缺点。在结合YOLO算法优点的基础上提出GUS-YOLO算法,其拥有一个能够充分利用全局上下文信息的骨干网络Global Backbone。除此之外,该算法在融合特征金字塔自顶向下的结构中引入Attention Gate模块,可以突出必要的特征信息,抑制冗余信息。另外,为Attention Gate模块设计了最佳的网络结构,提出了网络的特征融合结构U-Net。最后,为克服ReLU函数可能导致模型梯度不再更新的问题,该算法将Attention Gate模块的激活函数升级为可学习的SMU激活函数,提高模型鲁棒性。在NWPU VHR-10遥感数据集上,该算法相较于YOLOV7算法取得宽松指标mAP^(0.50)1.64个百分点和严格指标mAP^(0.75)9.39个百分点的性能提升。相较于目前主流的七种检测算法,该算法取得较好的检测性能。 展开更多
关键词 遥感图像 Global Backbone Attention Gate SMU U-neck
下载PDF
基于改进YOLOv5s的输电线路螺栓缺销检测方法
2
作者 赵文清 贾梦颖 +1 位作者 翟永杰 赵振兵 《华北电力大学学报(自然科学版)》 CAS 北大核心 2024年第3期92-100,共9页
针对无人机输电线路巡检图像中螺栓缺销检测精度较低、漏检较多的问题,提出了一种基于改进YOLOv5s的输电线路螺栓缺销检测方法。在Backbone部分嵌入Coordinate Attention注意力模块;在Neck部分原有的“FPN+PAN”结构的基础上,新增一条... 针对无人机输电线路巡检图像中螺栓缺销检测精度较低、漏检较多的问题,提出了一种基于改进YOLOv5s的输电线路螺栓缺销检测方法。在Backbone部分嵌入Coordinate Attention注意力模块;在Neck部分原有的“FPN+PAN”结构的基础上,新增一条“自顶向下”的特征信息传递路径,跨越临近的同尺度特征层,与较浅层网络以加权融合的方式进行特征融合;将Head部分设置为解耦检测头,将对螺栓检测的分类任务与定位任务分开进行。改进后的YOLOv5s算法增强了对螺栓特征信息的学习能力。使用本方法在螺栓缺销数据集上实验,精确率提升了2.3%,召回率提升了3.4%,平均精度提升了3.1%,检测速度达到了41.1帧/秒,表明改进后的方法能提升输电线路螺栓缺销的检测能力,在智能巡检中具有一定的应用价值。 展开更多
关键词 巡检图像 故障检测 螺栓缺销 YOLOv5s Coordinate Attention 特征融合 解耦检测头
下载PDF
改进注意力机制嵌入PR-Net模型的水稻病害识别仿真
3
作者 路阳 刘鹏飞 +3 位作者 许思源 刘启旺 顾福谦 王鹏 《系统仿真学报》 CAS CSCD 北大核心 2024年第6期1322-1333,共12页
针对现有的CNN模型在水稻叶部病害的识别中准确率较低的问题,提出了一种结合并行结构和残差结构的混合卷积神经网络模型PRC-Net(parallel residual with coordinate attention network)。引入并行结构,提高卷积的感受野;结合残差结构,... 针对现有的CNN模型在水稻叶部病害的识别中准确率较低的问题,提出了一种结合并行结构和残差结构的混合卷积神经网络模型PRC-Net(parallel residual with coordinate attention network)。引入并行结构,提高卷积的感受野;结合残差结构,使特征信息完整的连续传递;在骨干模型PR-Net中嵌入改进的空间注意力机制,增强对不同尺度病斑特征信息的凝聚程度;为进一步提升病害识别的准确率,并减少模型的训练时间和推理时间,通过改变加权方式对模型结构进行优化。仿真结果表明:与InceptionResNetV2等分类模型相比,PRC-Net具有更少的训练参数、更短的训练时间和更高的识别精度,性能优于其他作物病害识别模型。 展开更多
关键词 水稻叶部病害 PRC-Net(parallel residual with coordinate attention network) 卷积神经网络 注意力机制 图像识别
下载PDF
基于深度学习提取时空信息的流域内库水位预测模型研究
4
作者 周兰庭 陈思思 孙永明 《水电能源科学》 北大核心 2024年第4期133-136,132,共5页
为了解决流域连通水库增多,库水位影响因素复杂且具有非平稳性,难以直接通过水文计算预测的问题,对流域水文站点日降雨序列进行分析,首先将时间序列经小波变换去噪,在此基础上采用最大信息系数(MIC)相关性分析筛选与日水位序列相关性,... 为了解决流域连通水库增多,库水位影响因素复杂且具有非平稳性,难以直接通过水文计算预测的问题,对流域水文站点日降雨序列进行分析,首先将时间序列经小波变换去噪,在此基础上采用最大信息系数(MIC)相关性分析筛选与日水位序列相关性,增加了输入时序降雨与预测水位相关的信息密度,并提出将强相关性序列输入引入Attention机制的长短期记忆(LSTM)预测模型,提高LSTM神经网络选择和提取序列特征的能力。以福建某流域站点实测日降雨序列为例进行试验,结果表明该方法的均方预测误差仅为0.1908,相比LSTM模型有更高的预测精度,为水库水情调度及防洪减灾管理提供了决策依据。 展开更多
关键词 库水位预测 相关性分析 小波变换 Attention机制 LSTM
下载PDF
基于FasterNet和YOLOv5改进的玻璃绝缘子自爆缺陷快速检测方法
5
作者 邬开俊 徐泽浩 单宏全 《高电压技术》 EI CAS CSCD 北大核心 2024年第5期1865-1876,共12页
为了实现对电力输电线路中绝缘子缺陷实时快速的巡检需求,提出了一种结合FasterNet-tiny和YOLOv5-s-v6.1网络模型改进的缺陷快速检测算法FasterNet-YOLOv5。首先引入参数量小推理速度更快的FasterNet网络替换原先的CSPDarkNet53主干网络... 为了实现对电力输电线路中绝缘子缺陷实时快速的巡检需求,提出了一种结合FasterNet-tiny和YOLOv5-s-v6.1网络模型改进的缺陷快速检测算法FasterNet-YOLOv5。首先引入参数量小推理速度更快的FasterNet网络替换原先的CSPDarkNet53主干网络,加快网络的检测速度。然后结合由GhostNetv2网络提出的解耦全连接注意力机制(decoupled fully connected,DFC),在主干特征提取网络中设计了DFC-FasterNet模块,模块中的DFC Attention机制可以在特征提取过程中增大感受野,提升网络的检测精度。最后针对玻璃绝缘子自爆缺陷目标较小和背景较复杂的情况,重新设计Neck模块,提出BiFPN-F特征融合模块,使网络更精确地定位绝缘子缺陷区域。实验结果表明:改进后的算法可以快速精准定位,其均值平均精度(mean average precision,mAP)达到93.3%,相较于改进前提升5.67%,检测速度达到45.7 Hz,较改进前提升近1倍。同时与最新的YOLOv8n和YOLOv7-tiny相比,改进后的FasterNet-YOLOv5在自爆缺陷上的检测精度和速度更具优势,该文所提算法能够更快速地对绝缘子及其自爆缺陷实时定位识别。 展开更多
关键词 缺陷检测 BiFPN-F FasterNet YOLOv5s DFC Attention PConv
下载PDF
基于改进YOLOv8n的煤矿井下钻杆计数方法
6
作者 姜媛媛 刘宋波 《工矿自动化》 CSCD 北大核心 2024年第8期112-119,共8页
为提高煤矿井下钻杆计数的效率和精度,提出了一种基于改进YOLOv8n模型的煤矿井下钻杆计数方法。建立了YOLOv8n−TBiD模型,该模型可准确检测矿井钻机工作视频中的钻杆并进行有效分割:为有效捕获钻杆的边界信息,提高模型对钻杆形状识别的精... 为提高煤矿井下钻杆计数的效率和精度,提出了一种基于改进YOLOv8n模型的煤矿井下钻杆计数方法。建立了YOLOv8n−TBiD模型,该模型可准确检测矿井钻机工作视频中的钻杆并进行有效分割:为有效捕获钻杆的边界信息,提高模型对钻杆形状识别的精度,使用加权双向特征金字塔网络(BiFPN)替换路径聚合网络(PANet);针对钻杆易与昏暗的矿井环境混淆的问题,在Backbone网络的SPPF模块后添加三分支注意力(Triplet Attention),以增强模型抑制背景干扰的能力;针对钻杆在图像中占比小、背景信息繁杂的问题,采用Dice损失函数替换CIoU损失函数来优化模型对目标钻杆的分割处理。利用YOLOv8n−TBiD模型分割出的钻杆及其掩码信息,根据打钻过程中钻杆掩码面积变小而装新钻杆时钻杆掩码面积突然增大的规律,设计了一种钻杆计数算法。选取综采工作面实际采集的钻机工作视频对基于YOLOv8n−TBiD模型的钻杆计数方法进行了实验验证,结果表明:①YOLOv8n−TBiD模型检测钻杆的平均精度均值达94.9%,与对比模型GCI−YOLOv4,ECO−HC,P−MobileNetV2,YOLOv5,YOLOX相比,检测准确率分别提升了4.3%,7.5%,2.1%,6.3%,5.8%,检测速度较原始YOLOv8n模型提升了17.8%。②所提钻杆计数算法在不同煤矿井下环境的视频数据集上实现了99.3%的钻杆计数精度。 展开更多
关键词 矿井钻机 钻杆计数 YOLOv8n−TBiD BiFPN Triplet Attention Dice损失函数 钻杆掩码 图像分割
下载PDF
一种采用记忆神经网络和曲线形状修正的负荷预测方法
7
作者 张家安 李凤贤 +1 位作者 王铁成 郝妍 《电力工程技术》 北大核心 2024年第1期117-126,共10页
针对分布式电源和新型负荷容量累积造成负荷影响因素多元化和不确定性特性增强的问题,文中提出一种采用记忆神经网络和曲线形状修正的负荷预测方法。在负荷峰值预测中,采用最大信息系数计算负荷峰值与影响因素的非线性相关性,实现对输... 针对分布式电源和新型负荷容量累积造成负荷影响因素多元化和不确定性特性增强的问题,文中提出一种采用记忆神经网络和曲线形状修正的负荷预测方法。在负荷峰值预测中,采用最大信息系数计算负荷峰值与影响因素的非线性相关性,实现对输入特征的筛选;综合考虑负荷峰值序列的长短期自相关性和输入特征与负荷峰值的不同程度相关性,结合Attention机制和双向长短时记忆(bidirectional long short-term memory,BiLSTM)神经网络建立负荷峰值预测模型。在负荷标幺曲线预测中,通过误差倒数法组合相似日和相邻日,建立负荷标幺曲线预测模型;针对预测偏差的非平稳特征,利用自适应噪声的完全集成经验模态分解和BiLSTM网络建立误差预测模型,对曲线形状进行修正。应用中国北方某城市的区域电网负荷数据为算例,验证了所提模型的有效性。 展开更多
关键词 超短期负荷预测 Attention机制 双向长短时记忆(BiLSTM)神经网络 负荷峰值 负荷标幺曲线 曲线形状修正
下载PDF
基于改进残差网络的油气柱高度预测
8
作者 杜睿山 程永昌 孟令东 《海南大学学报(自然科学版)》 CAS 2024年第1期19-29,共11页
针对目前油气柱高度预测技术局限于传统的地质方法且预测效果不太理想的现状,展开一种基于改进残差神经网络的油气柱高度预测的研究.该模型从断层解释和油藏解剖提取的圈闭结构化特征数据中提取特征信息,以估计油气柱高度.模型将原始残... 针对目前油气柱高度预测技术局限于传统的地质方法且预测效果不太理想的现状,展开一种基于改进残差神经网络的油气柱高度预测的研究.该模型从断层解释和油藏解剖提取的圈闭结构化特征数据中提取特征信息,以估计油气柱高度.模型将原始残差块中的串行连接网络变成多个并行连接的网络,可以在多个尺度上同时进行卷积再聚合,能提取到不同尺度的特征,使其变成一个稀疏性、高计算性能的网络结构;同时保留了网络中跳跃连接的结构,缓解了在深度神经网络中增加深度带来了梯度消失和网络退化的问题,通过直接将输入信息绕道传到输出,保护信息的完整性;并在模型的首层和尾层增加注意力模块,来捕获集中于某个局部信息,使模型其能更快地收敛.此外对机器学习中常用的RF和BP神经网络以及深度学习中CNN、GoogleNet、ResNet和ResNet+Atten在圈闭数据上的应用进行了比较和分析.实验结果表明,改进的ResNet对油气柱高度预测有更加准确的结果 . 展开更多
关键词 油气柱高度 ResNet GoogleNet Attention机制 预测
下载PDF
基于XGBoost-WOA-BiLSTM-Attention的公共建筑暖通空调能耗预测研究
9
作者 于水 罗宇晨 +2 位作者 安瑞 李思尧 陈志杰 《建筑技术》 2024年第17期2071-2075,共5页
为在双碳目标下实现节能减排,降低能源成本,提出一种基于BiLSTM的公共建筑暖通空调能耗预测模型。在BiLSTM模型基础上,使用XGBoost算法对输入特征进行选择,剔除冗余特征,得到最佳模型输入特征;然后利用WOA优化算法对添加了Attention机制... 为在双碳目标下实现节能减排,降低能源成本,提出一种基于BiLSTM的公共建筑暖通空调能耗预测模型。在BiLSTM模型基础上,使用XGBoost算法对输入特征进行选择,剔除冗余特征,得到最佳模型输入特征;然后利用WOA优化算法对添加了Attention机制的BiLSTM模型中的6个超参数进行优化,将得到的最优参数代入BiLSTM-Attention神经网络中进行预测,并与BiLSTM模型、BiLSTM-Attention模型和WOA-BiLSTM-Attention模型进行对比。结果表明,所提出的XGBoost-WOA-BiLSTM-Attention模型的RMSE、MAE、R2分别为0.0106、0.006、0.9991,优于其他模型,且相对于持续模型在均方根误差RMSE上提升了98%,为降低公共建筑暖通空调能耗研究提供了参考。 展开更多
关键词 HVAC能耗 XGBoost WOA优化 Attention机制 BiLSTM
下载PDF
基于Conformer的端到端中英文管制语音识别
10
作者 孔建国 韩琪聪 +1 位作者 梁海军 李煜琨 《航空计算技术》 2024年第3期1-5,共5页
将语音识别技术应用到空中交通管理系统中可以提高飞行安全并降低管制员的工作负荷,目前已有的管制语音识别技术在中英文识别上效果较差,因此提出了一种基于Conformer-CTC/Attention的中英文管制语音识别框架。该方法使用基于改进的Conf... 将语音识别技术应用到空中交通管理系统中可以提高飞行安全并降低管制员的工作负荷,目前已有的管制语音识别技术在中英文识别上效果较差,因此提出了一种基于Conformer-CTC/Attention的中英文管制语音识别框架。该方法使用基于改进的Conformer共享编码器对输入序列进行语言分类并以参数有效的方式对音频序列的局部和全局相依性进行建模,添加了语种分类模块来判断输入语音序列的语种,还采用了CTC解码器和注意力解码器联合解码的多任务建模方法。最后在建立的民航数据集对所提出的框架进行验证,试验结果表明,Conformer-CTC/Attention(Language-Category)相对于基线模型错误率降低,识别效果达到预期。 展开更多
关键词 空中交通管制 中英文语音识别 Conformer-CTC/Attention 多任务学习 端到端
下载PDF
基于改进BiLSTM的电力工程数据智能分析算法设计 被引量:1
11
作者 毛华 房向阳 +1 位作者 王斌 孙岳 《电子设计工程》 2024年第2期69-73,共5页
针对目前电力工程费用计算复杂、时间成本较高且准确性低的问题,文中开展了基于改进BiLSTM的电力工程数据智能分析算法设计研究。从技术、工程量和费用三个维度构建了电力工程数据智能分析指标体系,进而提出了一种基于BiLSTM与Attentio... 针对目前电力工程费用计算复杂、时间成本较高且准确性低的问题,文中开展了基于改进BiLSTM的电力工程数据智能分析算法设计研究。从技术、工程量和费用三个维度构建了电力工程数据智能分析指标体系,进而提出了一种基于BiLSTM与Attention联合模型的电力工程费用预测算法。该算法将电力工程数据作为BiLSTM的模型输入,并采用Attention机制提高了对重要数据的关注程度。通过引入数据指标与电力工程费用的自动关联分析技术,实现了对电力工程费用的精准预测。仿真算例分析结果表明,与LSTM及BiLSTM算法相比,所提算法具有更高的预测准确性,平均预测误差小于5%。 展开更多
关键词 电力工程 费用计算 深度学习 BiLSTM算法 Attention模型
下载PDF
基于HGTC−YOLOv8n模型的煤矸识别算法研究 被引量:1
12
作者 滕文想 王成 费树辉 《工矿自动化》 CSCD 北大核心 2024年第5期52-59,共8页
现有基于深度学习的煤矸识别方法在煤矿井下低照度、高噪声及运动模糊等复杂工况下存在煤矸识别精度低、小目标煤矸容易漏检、模型参数量和运算量大,难以部署到计算资源有限的设备中等问题,提出了一种基于HGTC−YOLOv8n模型的煤矸识别算... 现有基于深度学习的煤矸识别方法在煤矿井下低照度、高噪声及运动模糊等复杂工况下存在煤矸识别精度低、小目标煤矸容易漏检、模型参数量和运算量大,难以部署到计算资源有限的设备中等问题,提出了一种基于HGTC−YOLOv8n模型的煤矸识别算法。采用HGNetv2网络替换YOLOv8n的主干网络,通过多尺度特征的有效提取,提高煤矸识别效果并减少模型的存储需求和计算资源消耗;在主干网络中嵌入三重注意力机制模块Triplet Attention,捕获不同维度间的交互信息,增强煤矸图像目标特征的提取,减少无关信息的干扰;选用内容感知特征重组模块(CARAFE)来改进YOLOv8n颈部特征融合网络上采样算子,利用上下文信息提高感受视野,提高小目标煤矸识别准确率。实验结果表明:①HGTC−YOLOv8n模型的平均精度均值为93.5%,模型的参数量为2.645×10^(6),浮点运算量为8.0×10^(9),帧速率为79.36帧/s。②平均精度均值较YOLOv8n模型提升了2.5%,参数量和浮点运算量较YOLOv8n模型分别下降了16.22%和10.11%。③与YOLO系列模型相比,HGTC−YOLOv8n模型的平均精度均值最高,且参数量和浮点运算量最少,检测速度较快,综合检测性能最佳。④基于HGTC−YOLOv8n模型的煤矸识别算法在煤矿井下复杂工况下,改善了煤矸识别精度低、小目标煤矸容易漏检等问题,满足煤矸图像实时检测要求。 展开更多
关键词 煤矸识别 小目标识别 YOLOv8n 内容感知特征重组模块 三重注意力机制 Triplet Attention HGNetv2
下载PDF
基于上下文语义联合YOLOv7的分心驾驶检测算法 被引量:1
13
作者 李富 徐凯 +2 位作者 朱灵龙 沈昊君 王泉 《国外电子测量技术》 2024年第3期121-128,共8页
针对分心驾驶检测方法存在实时性差、精度低、可部署性差的问题,提出了一种基于上下文语义增强联合YOLOv7的分心驾驶检测算法。首先将模型backbone和head部分的ELAN模块替换成语义上下文增强模块(contextual transformer,CoT),提高上下... 针对分心驾驶检测方法存在实时性差、精度低、可部署性差的问题,提出了一种基于上下文语义增强联合YOLOv7的分心驾驶检测算法。首先将模型backbone和head部分的ELAN模块替换成语义上下文增强模块(contextual transformer,CoT),提高上下文语义信息的捕获能力。其次,将语义关联增强机制(triplet attention)融入卷积块中,插入backbone和head的连接头之间以及融合MP2模块,强化目标间的关联关系以及提升目标特征提取能力。最后,将自注意力双向Transformer模块(Biformer)模块融合SPPCSPC模块,提升模型对分心驾驶中的复杂场景和遮挡目标的处理能力。改进的YOLOv7算法在分心驾驶数据集下平均精度均值(mean average precision,mAP)达到了87.3%,比原算法提高了4.3%,模型参数量减少了4.7%,每秒传输帧数达到了90 fps,具有较好的检测精度与速度。 展开更多
关键词 YOLOv7 分心驾驶检测 COT Biformer Triplet Attention
下载PDF
基于Coordinate Attention和空洞卷积的异物识别 被引量:1
14
作者 王春霖 吴春雷 +1 位作者 李灿伟 朱明飞 《计算机系统应用》 2024年第3期178-186,共9页
在我国工厂的工业化生产中,带式运输机占有重要的地位,但是在其运输物料的过程中,常有木板、金属管、大型金属片等混入物料中,从而对带式运输机的传送带造成损毁,引起巨大的经济损失.为了检测出传送带上的不规则异物,设计了一种新的异... 在我国工厂的工业化生产中,带式运输机占有重要的地位,但是在其运输物料的过程中,常有木板、金属管、大型金属片等混入物料中,从而对带式运输机的传送带造成损毁,引起巨大的经济损失.为了检测出传送带上的不规则异物,设计了一种新的异物检测方法.针对传统异物检测方法中存在的对于图像特征提取能力不足以及网络感受野相对较小的问题,我们提出了一种基于coordinate attention和空洞卷积的单阶段异物识别方法.首先,网络利用coordinate attention机制,使网络更加关注图像的空间信息,并对图像中的重要特征进行了增强,增强了网络的性能;其次,在网络提取多尺度特征的部分,将原网络的静态卷积变为空洞卷积,有效减少了常规卷积造成的信息损失;除此之外,我们还使用了新的损失函数,进一步提高了网络的性能.实验结果证明,我们提出的网络能有效识别出传送带上的异物,较好地完成异物检测任务. 展开更多
关键词 coordinate attention 异物检测 空洞卷积 损失函数 目标识别
下载PDF
基于深度学习域适应的飞机结冰图像气泡提取方法
15
作者 赵红梅 彭博 +1 位作者 周志宏 易贤 《南京航空航天大学学报》 CAS CSCD 北大核心 2024年第2期291-299,共9页
针对采用深度学习方法提取结冰显微图像中的气泡需要大量标注数据,但人工标注气泡任务较为困难的问题,提出了一种基于风格迁移网络CycleGAN和图像分割网络Attention U-Net的域适应提取方法。该方法通过程序模拟气泡形态生成的图像为源域... 针对采用深度学习方法提取结冰显微图像中的气泡需要大量标注数据,但人工标注气泡任务较为困难的问题,提出了一种基于风格迁移网络CycleGAN和图像分割网络Attention U-Net的域适应提取方法。该方法通过程序模拟气泡形态生成的图像为源域,结冰显微图像为目标域,通过CycleGAN将源域图像转为目标域风格,采用风格转换后的源域数据集训练Attention U-Net网络。通过对比实验对无标注结冰图像和少量标注图像两种情况进行验证。实验结果表明,在无标注图像的情况下,可实现无监督的结冰显微图像的气泡提取;在只有少量标注图像的情况下,该方法可实现更精确的气泡提取。 展开更多
关键词 动态结冰 气泡提取 图像分割 域适应 Attention U-Net
下载PDF
基于双分支多头注意力的场景图生成方法
16
作者 王立春 付芳玉 +2 位作者 徐凯 徐洪波 尹宝才 《北京工业大学学报》 CAS CSCD 北大核心 2024年第10期1198-1205,共8页
针对已有场景图生成模型获取上下文信息有限的问题,提出一种有效的上下文融合模块,即双分支多头注意力(dual-stream multi-head attention, DMA)模块,并将DMA分别用于物体分类阶段和关系分类阶段,基于此提出基于双分支多头注意力的场景... 针对已有场景图生成模型获取上下文信息有限的问题,提出一种有效的上下文融合模块,即双分支多头注意力(dual-stream multi-head attention, DMA)模块,并将DMA分别用于物体分类阶段和关系分类阶段,基于此提出基于双分支多头注意力的场景图生成网络(dual-stream multi-head attention-based scene graph generation network, DMA-Net)。该网络由目标检测、物体语义解析和关系语义解析3个模块组成。首先,通过目标检测模块定位图像中的物体并提取物体特征;其次,使用物体语义解析模块中的节点双分支多头注意力(object dual-stream multi-head attention, O-DMA)获取融合了节点上下文的特征,该特征经过物体语义解码器获得物体类别标签;最后,通过关系语义解析模块中的边双分支多头注意力(relationship dual-stream multi-head attention, R-DMA)输出融合了边上下文的特征,该特征经过关系语义解码器输出关系类别标签。在公开的视觉基因组(visual genome, VG)数据集上分别计算了DMA-Net针对场景图检测、场景图分类和谓词分类3个子任务的图约束召回率和无图约束召回率,并与主流的场景图生成方法进行比较。实验结果表明,所提出的方法能够充分挖掘场景中的上下文信息,基于上下文增强的特征表示有效提升了场景图生成任务的精度。 展开更多
关键词 场景图生成 上下文融合 双分支多头注意力(dual-stream multi-head attention DMA) 目标检测 物体分类 关系分类
下载PDF
Point Cloud Classification Using Content-Based Transformer via Clustering in Feature Space 被引量:2
17
作者 Yahui Liu Bin Tian +2 位作者 Yisheng Lv Lingxi Li Fei-Yue Wang 《IEEE/CAA Journal of Automatica Sinica》 SCIE EI CSCD 2024年第1期231-239,共9页
Recently, there have been some attempts of Transformer in 3D point cloud classification. In order to reduce computations, most existing methods focus on local spatial attention,but ignore their content and fail to est... Recently, there have been some attempts of Transformer in 3D point cloud classification. In order to reduce computations, most existing methods focus on local spatial attention,but ignore their content and fail to establish relationships between distant but relevant points. To overcome the limitation of local spatial attention, we propose a point content-based Transformer architecture, called PointConT for short. It exploits the locality of points in the feature space(content-based), which clusters the sampled points with similar features into the same class and computes the self-attention within each class, thus enabling an effective trade-off between capturing long-range dependencies and computational complexity. We further introduce an inception feature aggregator for point cloud classification, which uses parallel structures to aggregate high-frequency and low-frequency information in each branch separately. Extensive experiments show that our PointConT model achieves a remarkable performance on point cloud shape classification. Especially, our method exhibits 90.3% Top-1 accuracy on the hardest setting of ScanObjectN N. Source code of this paper is available at https://github.com/yahuiliu99/PointC onT. 展开更多
关键词 Content-based Transformer deep learning feature aggregator local attention point cloud classification
下载PDF
基于改进YOLOv7的SAR图像舰船目标检测算法 被引量:2
18
作者 张上 李梦思 +1 位作者 陈永麟 张卓 《电光与控制》 CSCD 北大核心 2024年第5期46-53,共8页
针对SAR舰船数据集小物体在图像中像素占比小、物体识别不清、检测效率低等问题,提出一种改进YOLOv7的SAR舰船目标检测算法STSD-YOLO。首先,根据SAR图像特点,重新设计网络结构,改变多尺度特征融合与特征提取的关系,解决下采样次数过多... 针对SAR舰船数据集小物体在图像中像素占比小、物体识别不清、检测效率低等问题,提出一种改进YOLOv7的SAR舰船目标检测算法STSD-YOLO。首先,根据SAR图像特点,重新设计网络结构,改变多尺度特征融合与特征提取的关系,解决下采样次数过多而丢失细节特征的问题;然后,使用轻量型注意力机制Shuffle Attention,在空间域与通道域注意力机制基础上,融合特征分组与通道置换,提升网络特征提取能力,降低计算复杂度;其次,引入卷积变体DSConv,通过在可变量化内核中仅储存整数来实现减少计算量;最后,加入NWD度量,将边界框建模为2D高斯分布,以衡量小物体的边界框之间的相似性来增强对小物体的检测性能。使用HRSID舰船数据集进行了实验验证,结果表明,相较于基准算法,所提STSD-YOLO算法在舰船检测任务中mAP提升9.9%,模型体积下降62.55%。通过对比实验验证,所提改进算法对比其余主流算法检测效果更优,能有效解决SAR图像检测的问题,可以胜任SAR图像中的舰船检测任务。 展开更多
关键词 目标检测 YOLOv7 模型轻量化 Shuffle Attention DSConv NWD
下载PDF
基于ALBERT-Seq2Seq-Attention模型的数字化档案多标签分类
19
作者 王少阳 成新民 +3 位作者 王瑞琴 陈静雯 周阳 费志高 《湖州师范学院学报》 2024年第2期65-72,共8页
针对现有的数字化档案多标签分类方法存在分类标签之间缺少关联性的问题,提出一种用于档案多标签分类的深层神经网络模型ALBERT-Seq2Seq-Attention.该模型通过ALBERT(A Little BERT)预训练语言模型内部多层双向的Transfomer结构获取进... 针对现有的数字化档案多标签分类方法存在分类标签之间缺少关联性的问题,提出一种用于档案多标签分类的深层神经网络模型ALBERT-Seq2Seq-Attention.该模型通过ALBERT(A Little BERT)预训练语言模型内部多层双向的Transfomer结构获取进行文本特征向量的提取,并获得上下文语义信息;将预训练提取的文本特征作为Seq2Seq-Attention(Sequence to Sequence-Attention)模型的输入序列,构建标签字典以获取多标签间的关联关系.将分类模型在3种数据集上分别进行对比实验,结果表明:模型分类的效果F1值均超过90%.该模型不仅能提高档案文本的多标签分类效果,也能关注标签之间的相关关系. 展开更多
关键词 ALBERT Seq2Seq ATTENTION 多标签分类 数字化档案
下载PDF
基于改进YOLOv5的柑橘病虫害检测
20
作者 李吴洁 危疆树 +2 位作者 王玉超 陈金荣 罗好 《南京农业大学学报》 CAS CSCD 北大核心 2024年第5期1000-1008,共9页
[目的]柑橘叶片受到病菌感染或虫害侵袭后,导致柑橘树生长发育异常、产量减少甚至死亡。早期柑橘叶片病虫害检测有助于做好预防措施减少损失。[方法]实际检测过程中YOLOv5s模型存在定位不精确、背景复杂等问题,受VAN(visual attention n... [目的]柑橘叶片受到病菌感染或虫害侵袭后,导致柑橘树生长发育异常、产量减少甚至死亡。早期柑橘叶片病虫害检测有助于做好预防措施减少损失。[方法]实际检测过程中YOLOv5s模型存在定位不精确、背景复杂等问题,受VAN(visual attention network)模型的启发,引入LKA(large kernel attention)模块,对YOLOv5s模型进行改进。改进的YOLOv5s模型可实现对图像信息的集中关注和精细抽取;使用CARAFE轻量级算子替换常规的上采样方法,能够提高特征重建质量,解决尺度不匹配问题并提高检测性能;使用FReLU激活函数,能够捕捉更多的柑橘病虫害的关键特征,提高检测准确度。此外,还构建了一个包含炭疽病、溃疡病和受潜叶蝇病虫侵害的柑橘叶片数据集,采用该数据集进行试验。[结果]改进后的模型YOLOv5-LC对于柑橘病虫害的检测结果显示:平均检测精度mAP50达到94.5%,mAP50:95为84.3%,较原模型分别提高了2.0%和4.4%,模型大小仅为7.3 MB。准确率为93.8%,召回率84.5%,浮点运算次数仅为18.5 G。[结论]改进后的YOLOv5-LC模型可以更加准确检测出柑橘病虫害。 展开更多
关键词 柑橘 病害 虫害 目标检测 YOLOv5 Large Kernel Attention CARAFE FReLU
下载PDF
上一页 1 2 61 下一页 到第
使用帮助 返回顶部