期刊文献+
共找到159篇文章
< 1 2 8 >
每页显示 20 50 100
Clothing Parsing Based on Multi-Scale Fusion and Improved Self-Attention Mechanism
1
作者 陈诺 王绍宇 +3 位作者 陆然 李文萱 覃志东 石秀金 《Journal of Donghua University(English Edition)》 CAS 2023年第6期661-666,共6页
Due to the lack of long-range association and spatial location information,fine details and accurate boundaries of complex clothing images cannot always be obtained by using the existing deep learning-based methods.Th... Due to the lack of long-range association and spatial location information,fine details and accurate boundaries of complex clothing images cannot always be obtained by using the existing deep learning-based methods.This paper presents a convolutional structure with multi-scale fusion to optimize the step of clothing feature extraction and a self-attention module to capture long-range association information.The structure enables the self-attention mechanism to directly participate in the process of information exchange through the down-scaling projection operation of the multi-scale framework.In addition,the improved self-attention module introduces the extraction of 2-dimensional relative position information to make up for its lack of ability to extract spatial position features from clothing images.The experimental results based on the colorful fashion parsing dataset(CFPD)show that the proposed network structure achieves 53.68%mean intersection over union(mIoU)and has better performance on the clothing parsing task. 展开更多
关键词 clothing parsing convolutional neural network multi-scale fusion self-attention mechanism vision Transformer
下载PDF
基于Informer融合模型的油田开发指标预测方法
2
作者 张强 薛陈斌 +1 位作者 彭骨 卢青 《吉林大学学报(信息科学版)》 CAS 2024年第5期799-807,共9页
为解决油田开发指标的预测问题,提出了一种基于物质平衡方程和Informer的融合模型。首先,通过物质平衡方程领域知识建立油田开发产量递减前后的机理模型;其次,将所建机理模型作为约束与Informer模型损失函数进行融合建立符合油田开发物... 为解决油田开发指标的预测问题,提出了一种基于物质平衡方程和Informer的融合模型。首先,通过物质平衡方程领域知识建立油田开发产量递减前后的机理模型;其次,将所建机理模型作为约束与Informer模型损失函数进行融合建立符合油田开发物理规律的指标预测模型;最后,采用油田实际生产数据进行实验分析,结果表明相比于纯数据驱动的几种循环结构预测模型,本融合模型在相同数据条件下的预测效果更优。该模型的机理约束部分能引导模型的训练过程,使其收敛速度更快,且波峰波谷处的预测更准确。该融合模型具有更好的预测能力和泛化能力和比较合理的物理可解释性。 展开更多
关键词 informer模型 机理模型 深度融合模型 预测
下载PDF
非结构化数据表征增强的术后风险预测模型
3
作者 王亚强 杨潇 +3 位作者 朱涛 郝学超 舒红平 陈果 《中文信息学报》 CSCD 北大核心 2024年第1期156-165,共10页
准确的术后风险预测对临床资源的规划、应急方案的准备以及患者术后风险和死亡率的降低具有积极的作用。目前,术后风险预测主要基于患者的基本信息、术前的实验室检查及术中的生命体征等结构化数据,蕴含着丰富语义信息的非结构化术前诊... 准确的术后风险预测对临床资源的规划、应急方案的准备以及患者术后风险和死亡率的降低具有积极的作用。目前,术后风险预测主要基于患者的基本信息、术前的实验室检查及术中的生命体征等结构化数据,蕴含着丰富语义信息的非结构化术前诊断的价值尚待验证。针对上述问题,该文提出一种非结构化数据表征增强的术后风险预测模型,利用自注意力机制,将结构化数据与术前诊断进行信息加权融合。基于临床数据,该文将所提出的模型与术后风险预测常用的统计机器学习模型以及最新的深度神经网络进行对比,在肺部并发症风险预测、ICU入室风险预测和心血管不良风险预测任务上的F1值平均提升了9.533%,同时预测模型还具有良好的可解释性。 展开更多
关键词 术后风险预测 自注意力机制 数据表征 信息融合
下载PDF
基于结构功能交叉神经网络的多模态医学图像融合
4
作者 邸敬 郭文庆 +2 位作者 任莉 杨燕 廉敬 《光学精密工程》 EI CAS CSCD 北大核心 2024年第2期252-267,共16页
针对多模态医学图像融合中存在纹理细节模糊和对比度低的问题,提出了一种结构功能交叉神经网络的多模态医学图像融合方法。首先,根据医学图像的结构信息和功能信息设计了结构功能交叉神经网络模型,不仅有效地提取解剖学和功能学医学图... 针对多模态医学图像融合中存在纹理细节模糊和对比度低的问题,提出了一种结构功能交叉神经网络的多模态医学图像融合方法。首先,根据医学图像的结构信息和功能信息设计了结构功能交叉神经网络模型,不仅有效地提取解剖学和功能学医学图像的结构信息和功能信息,而且能够实现这两种信息之间的交互,从而很好地提取医学图像的纹理细节信息。其次,利用交叉网络通道和空间特征变化构造了一种新的注意力机制,通过不断调整结构信息和功能信息权重来融合图像,提高了融合图像的对比度和轮廓信息。最后,设计了一个从融合图像到源图像的分解过程,由于分解图像的质量直接取决于融合结果,因此分解过程可以使融合图像包含更多的细节信息。通过与近年来提出的7种高水平方法相比,本文方法的AG,EN,SF,MI,QAB/F和CC客观评价指标分别平均提高了22.87%,19.64%,23.02%,12.70%,6.79%,30.35%,说明本文方法能够获得纹理细节更清晰、对比度更好的融合结果,在主观视觉和客观指标上都优于其他对比算法。 展开更多
关键词 多模态医学图像融合 结构功能信息交叉网络 注意力机制 分解网络
下载PDF
基于多维度特征融合的信息热度预测研究--以校园信息平台为例
5
作者 王龙 黄嘉凯 +1 位作者 逄华 李晓光 《情报杂志》 CSSCI 北大核心 2024年第12期133-141,共9页
[研究目的]面对校园信息平台中出现的信息过载情况,用户如何从海量信息中发现和获取热点信息成为了急需解决的问题。[研究方法]为了更准确地捕捉和预测信息的真实热度,提出了一种基于多维度特征融合的信息热度预测模型MIHP。该模型不仅... [研究目的]面对校园信息平台中出现的信息过载情况,用户如何从海量信息中发现和获取热点信息成为了急需解决的问题。[研究方法]为了更准确地捕捉和预测信息的真实热度,提出了一种基于多维度特征融合的信息热度预测模型MIHP。该模型不仅考虑文本内容的分析,而且将非文本特征的提取和分析纳入算法流程中。通过这种多维度的特征融合,模型能够更全面地评估信息的吸引力和传播潜力,从而更准确地反映信息的真实热度。[研究结论]在校园信息平台数据集上的实验结果表明,MIHP模型优于其他基线模型,为信息热度预测提供了新的解决思路。 展开更多
关键词 信息热度 多维度特征融合 注意力机制 校园信息平台 热度预测模型
下载PDF
基于多嵌入融合的top-N推荐
6
作者 杨真真 王东涛 +1 位作者 杨永鹏 华仁玉 《计算机科学》 CSCD 北大核心 2024年第7期140-145,共6页
异构信息网络(Heterogeneous Information Network, HIN)凭借其丰富的语义信息和结构信息被广泛应用于推荐系统中,虽然取得了很好的推荐效果,但较少考虑局部特征放大、信息交互和多嵌入聚合等问题。针对这些问题,提出了一种新的用于top-... 异构信息网络(Heterogeneous Information Network, HIN)凭借其丰富的语义信息和结构信息被广泛应用于推荐系统中,虽然取得了很好的推荐效果,但较少考虑局部特征放大、信息交互和多嵌入聚合等问题。针对这些问题,提出了一种新的用于top-N推荐的多嵌入融合推荐(Multi-embedding Fusion Recommendation, MFRec)模型。首先,该模型在用户和项目学习分支中都采用对象上下文表示网络,充分利用上下文信息以放大局部特征,增强相邻节点的交互性;其次,将空洞卷积和空间金字塔池化引入元路径学习分支,以便获取多尺度信息并增强元路径的节点表示;然后,采用多嵌入融合模块以便更好地进行用户、项目以及元路径的嵌入融合,细粒度地进行多嵌入之间的交互学习,并强调了各特征的不同重要性程度;最后,在两个公共推荐系统数据集上进行了实验,结果表明所提模型MFRec优于现有的其他top-N推荐系统模型。 展开更多
关键词 异构信息网络 推荐系统 top-N推荐 多嵌入融合 注意力机制
下载PDF
基于边缘特征和注意力机制的图像语义分割
7
作者 王军 张霁云 程勇 《计算机系统应用》 2024年第7期63-73,共11页
在语义分割任务中,编码器的下采样过程会导致分辨率降低,造成图像空间信息细节的丢失,因此在物体边缘会出现分割不连续或者错误分割的现象,进而对整体分割性能产生负面影响.针对上述问题,提出基于边缘特征和注意力机制的图像语义分割模... 在语义分割任务中,编码器的下采样过程会导致分辨率降低,造成图像空间信息细节的丢失,因此在物体边缘会出现分割不连续或者错误分割的现象,进而对整体分割性能产生负面影响.针对上述问题,提出基于边缘特征和注意力机制的图像语义分割模型EASSNet.首先,使用边缘检测算子计算原始图像的边缘图,通过池化下采样和卷积运算提取边缘特征.接着,将边缘特征融合到经过编码器提取的深层语义特征当中,恢复经过下采样的特征图像的空间细节信息,并且通过注意力机制来强化有意义的信息,从而提高物体边缘分割的准确性,进而提升语义分割的整体性能.最后,EASSNet在PASCAL VOC 2012和Cityscapes数据集上的平均交并比分别达到85.9%和76.7%,与当前流行的语义分割网络相比,整体分割性能和物体边缘的分割效果都具有明显优势. 展开更多
关键词 语义分割 空间细节信息 边缘特征 特征融合 注意力机制
下载PDF
特征融合的装修案例跨模态检索方法
8
作者 亢洁 刘威 《智能系统学报》 CSCD 北大核心 2024年第2期429-437,共9页
目前家装客服系统中主要依靠人工方式进行装修案例检索,导致该系统不能满足用户对咨询服务快捷、及时的需求而且人力成本高,故提出一种基于特征融合的装修案例跨模态检索算法。针对多模态数据的语义信息挖掘不充分,模型检索精度低等问题... 目前家装客服系统中主要依靠人工方式进行装修案例检索,导致该系统不能满足用户对咨询服务快捷、及时的需求而且人力成本高,故提出一种基于特征融合的装修案例跨模态检索算法。针对多模态数据的语义信息挖掘不充分,模型检索精度低等问题,对现有的风格聚合模块进行改进,在原始模块中引入通道注意力机制,以此来为每组装修案例中不同图片的特征向量添加合适的权重,从而增强包含更多有用信息的重要特征并削弱其他不重要的特征。同时,为充分利用多模态信息,设计一种适用于检索场景下的多模态特征融合模块,该模块能够自适应地控制2种不同模态的特征向量进行一系列的融合操作,以实现跨模态数据间的知识流动与共享,从而生成语义更丰富、表达能力更强的特征向量,进一步提升模型的检索性能。在自建的装修案例多模态数据集上将该方法与其他方法进行比较,试验结果表明本文方法在装修案例检索上具有更优越的性能。 展开更多
关键词 家装客服系统 装修案例检索 跨模态检索 风格聚合 多模态 特征融合 通道注意力机制 语义信息
下载PDF
基于注意力机制堆叠LSTM的多传感器信息融合刀具磨损预测 被引量:1
9
作者 成佳闻 赛希亚拉图 +1 位作者 张超勇 罗敏 《工业工程》 2024年第3期64-77,86,共15页
刀具磨损是影响数控机床加工质量和加工效率的重要因素之一。针对现有铣刀磨损预测中信号单一和预测精度不足的问题,提出了一种基于注意力机制的堆叠LSTM (long short-term memory,长短期记忆网络)的多传感器信息融合刀具磨损预测方法... 刀具磨损是影响数控机床加工质量和加工效率的重要因素之一。针对现有铣刀磨损预测中信号单一和预测精度不足的问题,提出了一种基于注意力机制的堆叠LSTM (long short-term memory,长短期记忆网络)的多传感器信息融合刀具磨损预测方法。对多传感器信号进行预处理,然后提取多域特征,利用核主成分分析法对其进行特征级信息融合,得到后续网络的输入。采用基于注意力机制的堆叠LSTM网络模型,使得网络能够自适应地学习数据的重要信息,在PHM2010的数据集上预测精度达到99.9%。通过与其他算法的对比试验和加入人工噪声的方法,验证了本文所提出的模型的高精度和鲁棒性。 展开更多
关键词 刀具磨损 核主成分分析(KPCA) 信息融合 注意力机制 鲁棒性
下载PDF
基于信息融合和SA-CNN的轴承故障诊断 被引量:1
10
作者 王云 徐彦伟 +3 位作者 何可承 颉潭成 王军华 蔡海潮 《机械与电子》 2024年第7期3-9,共7页
针对轴承故障特征提取困难、输入信号单一及故障识别率低等问题,提出基于多头注意力机制信息融合和自注意力机制卷积神经网络的轴承故障诊断方法。首先,预制地铁牵引电机轴承故障,搭建变工况轴承实验台并设计实验方案,采集轴承振动信号... 针对轴承故障特征提取困难、输入信号单一及故障识别率低等问题,提出基于多头注意力机制信息融合和自注意力机制卷积神经网络的轴承故障诊断方法。首先,预制地铁牵引电机轴承故障,搭建变工况轴承实验台并设计实验方案,采集轴承振动信号和声发射信号;其次,利用多头注意力机制将轴承的振动信号和声发射信号进行融合;最后,将融合后的信号输入自注意力机制卷积神经网络中进行故障诊断。实验结果表明,基于多头注意力机制信息融合和SA-CNN的轴承故障智能诊断方法,可以有效关注到轴承故障特征信号,提升变工况下轴承故障诊断的准确率。 展开更多
关键词 轴承故障诊断 多头注意力机制 信息融合 自注意力机制 CNN
下载PDF
G-YOLO:基于改进YOLOv5的嵌入式小目标缺陷检测算法 被引量:1
11
作者 石兰娟 张梦斯 +1 位作者 刘文浩 周迪斌 《杭州师范大学学报(自然科学版)》 CAS 2024年第2期201-208,共8页
针对人工检测缺陷模式或YOLOv5等深度学习算法对工业产品的缺陷检测存在识别准确率低、模型参数规模大等问题,提出一种对微小缺陷端到端检测的嵌入式算法G-YOLO.该算法使用卷积核为3和卷积核为1的双层卷积FConv模块,改善了原单层卷积带... 针对人工检测缺陷模式或YOLOv5等深度学习算法对工业产品的缺陷检测存在识别准确率低、模型参数规模大等问题,提出一种对微小缺陷端到端检测的嵌入式算法G-YOLO.该算法使用卷积核为3和卷积核为1的双层卷积FConv模块,改善了原单层卷积带来的参数量较大的问题;改进的轻量级跨阶段GSP模块融合坐标注意力机制用于主干网络中能够利用冗余信息实现廉价的线性操作和聚焦缺陷信息来增强特征,以提高网络对缺陷特征的提取能力;去除原YOLOv5的颈部模块,减少网络的参数量和提升网络检测速度.结果表明,G-YOLO嵌入式算法减少了模型大小,改善了缺陷检测的效果,较好地满足轻量化嵌入式模型的要求. 展开更多
关键词 嵌入式 特征融合 注意力机制 冗余信息 特征提取
下载PDF
基于自适应多尺度注意力机制的CNN-GRU矿用电动机健康状态评估 被引量:1
12
作者 谭东贵 袁逸萍 樊盼盼 《工矿自动化》 CSCD 北大核心 2024年第2期138-146,共9页
利用多传感器信息融合技术进行电动机健康状态评估时,矿用电动机监测数据中存在异常值和缺失值,而卷积神经网络和循环神经网络等深度学习模型在数据质量下降严重的情况下难以有效提取数据特征和更新网络权重,导致梯度消失或爆炸等问题... 利用多传感器信息融合技术进行电动机健康状态评估时,矿用电动机监测数据中存在异常值和缺失值,而卷积神经网络和循环神经网络等深度学习模型在数据质量下降严重的情况下难以有效提取数据特征和更新网络权重,导致梯度消失或爆炸等问题。针对上述问题,提出了一种基于自适应多尺度注意力机制的CNN-GRU(CNN-GRU-AMSA)模型,用于评估矿用电动机健康状态。首先,对传感器采集的电动机运行数据进行填补、剔除和标准化处理,并以环境温度变化作为依据对矿用电动机运行数据进行工况划分。然后,根据马氏距离计算出电动机电流、电动机三相绕组温度、电动机前端轴承温度和电动机后端轴承温度等健康评估指标的健康指数(HI),采用Savitzky–Golay滤波器对指标HI进行降噪、平滑、归一化处理,并结合主成分分析法计算的不同指标对矿用电动机的贡献度,对指标HI进行加权融合得到矿用电动机HI。最后,将矿用电动机HI输入CNN-GRU-AMSA模型中,该模型通过动态调整注意力权重,实现对不同尺度特征的信息融合,从而准确输出电动机健康状态评估结果。实验结果表明,与其他常见的深度学习模型CNN,CNN-GRU,CNN-LSTM,CNN-LSTM-Attention相比,CNN-GRU-AMSA模型在均方根误差、平均绝对误差、准确率、Macro F1及Micro F1等评价指标上更优,且预测残差的波动范围更小,稳定性更优。 展开更多
关键词 电动机健康状态评估 自适应多尺度注意力机制 CNN-GRU 多传感器信息融合 主成分分析
下载PDF
基于跨模态信息过滤的视觉问答网络
13
作者 何世阳 王朝晖 +1 位作者 龚声蓉 钟珊 《计算机科学》 CSCD 北大核心 2024年第5期85-91,共7页
视觉问答作为多模态任务,瓶颈在于需要解决不同模态间的融合问题,这不仅需要充分理解图像中的视觉和文本,还需具备对齐跨模态表示的能力。注意力机制的引入为多模态融合提供了有效的路径,然而先前的方法通常将提取的图像特征直接进行注... 视觉问答作为多模态任务,瓶颈在于需要解决不同模态间的融合问题,这不仅需要充分理解图像中的视觉和文本,还需具备对齐跨模态表示的能力。注意力机制的引入为多模态融合提供了有效的路径,然而先前的方法通常将提取的图像特征直接进行注意力计算,忽略了图像特征中含有噪声和不正确的信息这一问题,且多数方法局限于模态间的浅层交互,未曾考虑模态间的深层语义信息。为解决这一问题,提出了一个跨模态信息过滤网络,即首先以问题特征为监督信号,通过设计的信息过滤模块来过滤图像特征信息,使之更好地契合问题表征;随后将图像特征和问题特征送入跨模态交互层,在自注意力和引导注意力的作用下分别建模模态内和模态间的关系,以获取更细粒度的多模态特征。在VQA2.0数据集上进行了广泛的实验,实验结果表明,信息过滤模块的引入有效提升了模型准确率,在test-std上的整体精度达到了71.51%,相比大多数先进的方法具有良好的性能。 展开更多
关键词 视觉问答 深度学习 注意力机制 多模态融合 信息过滤
下载PDF
基于跨模态语义信息增强的多模态情感分析
14
作者 李梦云 张景 +2 位作者 张换香 张晓琳 刘璐瑶 《计算机科学与探索》 CSCD 北大核心 2024年第9期2476-2486,共11页
随着社交网络的发展,人类通过不同的方式表达自己的情感,包括文本、视觉和语音,即多模态。针对以往的多模态情感分析方法未能有效地获取多模态情感特征表示,以及没有充分考虑在多模态特征融合过程中冗余信息对实验的影响,提出了一种基... 随着社交网络的发展,人类通过不同的方式表达自己的情感,包括文本、视觉和语音,即多模态。针对以往的多模态情感分析方法未能有效地获取多模态情感特征表示,以及没有充分考虑在多模态特征融合过程中冗余信息对实验的影响,提出了一种基于跨模态语义信息增强的多模态情感分析模型。该模型采用BiLSTM网络挖掘各单模态内部存在的上下文信息。通过跨模态信息交互机制对多种模态间的信息交互进行建模,得到文本对语音、视觉,语音对文本、视觉,视觉对文本、语音六种信息交互特征,将目标模态相同的信息交互特征进行拼接,得到信息增强后的单模态特征向量,有效地获取模态间共享和补充的深度语义特征。另外,使用多头自注意力机制分别计算原始单模态特征向量和信息增强后的单模态特征向量间存在的语义相关性,提高识别关键情感特征的能力,降低冗余信息对情感分析的负面干扰。在公共数据集CMU-MOSI和CMU-MOSEI的实验结果表明,所提出的模型既能增强情感特征表示,也能有效降低冗余信息的干扰,在多模态情感分类准确率和泛化能力上的表现优于相关工作。 展开更多
关键词 多模态情感分析 信息增强 信息交互 多头注意力机制 特征融合
下载PDF
改进ResNet50和FPN的多尺度目标检测算法研究
15
作者 郭宝鑫 谢晓尧 刘嵩 《贵州师范大学学报(自然科学版)》 CAS 北大核心 2024年第1期94-101,126,共9页
针对ResNet50和FPN结构无法将浅层的细节信息和深层的语义信息充分融合利用等问题,提出了一种改进ResNet50和FPN结构的算法,在ResNet50网络结构不同层次中引入了改进的通道和空间注意力模块,充分利用不同特征层的细节信息和语义信息。此... 针对ResNet50和FPN结构无法将浅层的细节信息和深层的语义信息充分融合利用等问题,提出了一种改进ResNet50和FPN结构的算法,在ResNet50网络结构不同层次中引入了改进的通道和空间注意力模块,充分利用不同特征层的细节信息和语义信息。此外,在FPN结构中,为了能让浅层特征层更好的利用深层特征层的语义信息,在FPN自上而下的路径中,不同特征层之间增加了旁路来加强特征的重用。实验结果表明,在MS COCO数据集训练以后在PASCAL VOC 2012测试的均值平均精度(mAP)达到了83.2%,提升了2.7%,在MS COCO数据集上的mAP提升了1.5%,具有不错的检测性能。 展开更多
关键词 注意力机制 特征金字塔 特征重用 特征融合 特征层信息
下载PDF
图像特征与振动频谱多源融合驱动的煤矸识别技术研究
16
作者 李立宝 袁永 +3 位作者 秦正寒 李波 闫政天 李勇 《工矿自动化》 CSCD 北大核心 2024年第11期43-51,共9页
针对目前图像与振动信号融合的方法在煤矸识别领域应用存在特征融合困难、实时性和模型复杂度不满足实际应用要求等问题,设计了基于多头注意力(MA)的多层长短期记忆(ML-LSTM)模型MA-ML-LSTM。采用经粒子群优化(PSO)算法优化的变分模态分... 针对目前图像与振动信号融合的方法在煤矸识别领域应用存在特征融合困难、实时性和模型复杂度不满足实际应用要求等问题,设计了基于多头注意力(MA)的多层长短期记忆(ML-LSTM)模型MA-ML-LSTM。采用经粒子群优化(PSO)算法优化的变分模态分解(VMD)算法对振动信号进行处理,将能量、能量矩、峭度、波形因数与矩阵奇异值作为特征量,并采用一维卷积网络获取振动信息;在多分类网络ResNet-18基础上删除最后的全连接层,用于对煤矸图像进行深度特征提取;通过MA机制和ML-LSTM网络实现图像与振动双通道特征融合,强化各通道重要特征信息的表达。实验结果表明:MA-ML-LSTM模型的平均识别准确率达98.72%,相比传统单一的ResNet,MobilenetV3,1D-CNN,LSTM模型分别高4.60%,7.96%,5.37%,6.11%,相比EMD-RF,IMF-SVM,CSPNet-YOLOv7分别高4.18%,4.45%,3.46%,验证了图像特征与振动频谱多源融合驱动的煤矸识别技术的有效性。 展开更多
关键词 煤矸识别 多源信息融合 振动信号 图像识别 多头注意力机制 多层长短期记忆模型
下载PDF
基于轻量化高效层聚合网络的黄花成熟度检测方法 被引量:1
17
作者 吴利刚 陈乐 +2 位作者 周倩 史建华 马宇波 《农业机械学报》 EI CAS CSCD 北大核心 2024年第2期268-277,共10页
针对黄花传统人工识别效率低,辨识标准不统一的问题,提出基于轻量化和高效层聚合过渡网络的黄花成熟度识别方法LSEB YOLO v7。首先,引入轻量化卷积对高效层聚合网络和过渡模块进行轻量化处理,减少模型计算量。其次,在特征提取与特征融... 针对黄花传统人工识别效率低,辨识标准不统一的问题,提出基于轻量化和高效层聚合过渡网络的黄花成熟度识别方法LSEB YOLO v7。首先,引入轻量化卷积对高效层聚合网络和过渡模块进行轻量化处理,减少模型计算量。其次,在特征提取与特征融合网络之间增加通道注意力机制,提升模型检测性能。最后,在特征融合网络中,优化通道信息融合方式,使用双向特征金字塔网络替换Concatenate,增加信息融合通道,持续提升模型性能。实验结果表明:与原始模型相比,在黄花成熟度检测中,改进后的LSEB YOLO v7模型参数量和浮点运算量分别减少约2.0×10^(6)和7.7×10^(9)。训练时长由8.025 h降低至7.746 h,模型体积压缩约4 MB。同时,训练精确率和召回率分别提升约0.64个百分点和0.14个百分点,mAP@0.5和mAP@0.5:0.95分别提升约1.84个百分点和1.02个百分点。此外,调和均值性能保持不变,均为84.00%。LSEB YOLO v7算法可均衡模型复杂性与性能,为黄花成熟度检测和智能化采摘设备提供技术支持。 展开更多
关键词 黄花 成熟度 深度学习 注意力机制 信息融合机制 轻量化
下载PDF
基于细节信息增强的无监督双目立体匹配算法 被引量:1
18
作者 王晓峰 孙志恒 +3 位作者 喻骏 孙贾梦 丁坤岭 舒航 《电子测量技术》 北大核心 2024年第5期94-101,共8页
无监督立体匹配算法在自动驾驶等领域有重要的应用,然而无监督立体匹配算法在物体连续、边缘等细节信息区域的视差精度较低,本文提出了一种提高细节信息区域精度的无监督立体匹配算法。通过在特征金字塔网络中引入空间注意力机制和残差... 无监督立体匹配算法在自动驾驶等领域有重要的应用,然而无监督立体匹配算法在物体连续、边缘等细节信息区域的视差精度较低,本文提出了一种提高细节信息区域精度的无监督立体匹配算法。通过在特征金字塔网络中引入空间注意力机制和残差网络,设计了一种空间特征金字塔网络算法,抑制特征提取过程中边缘和小目标细节信息的丢失。构建了视差融合模块,将半全局立体匹配算法生成的原始视差和视差回归生成的初步视差进行置信度视差融合,提升连续细节信息区域的精度。对于网络损失函数,集成了原始视差监督损失和置信度遮挡损失,保留更多图像边缘和连续区域处的细节信息。实验结果表明,本文算法在KITTI 2015测试集中非遮挡区域和所有区域的误匹配率分别为6.24%和5.89%,与其他经典算法相比在细节信息区域的效果、精度方面有较大提升。 展开更多
关键词 无监督 立体匹配 细节信息增强 注意力机制 视差融合
下载PDF
基于改进对抗学习及融合特征的短文本分类框架
19
作者 宁召阳 申情 +1 位作者 郝秀兰 赵康 《计算机与现代化》 2024年第4期66-76,共11页
在短文本分类中,由于短文本具有字数较少、存在歧义、关键信息少并且不易捕捉等特点,对其进行分类的算法模型在训练及推理时往往存在差异性,并且主流分类模型基本是在关键特征上进行建模而忽略了非关键特征信息,这加大了其在精确分类上... 在短文本分类中,由于短文本具有字数较少、存在歧义、关键信息少并且不易捕捉等特点,对其进行分类的算法模型在训练及推理时往往存在差异性,并且主流分类模型基本是在关键特征上进行建模而忽略了非关键特征信息,这加大了其在精确分类上面临的挑战。针对上述问题,本文提出一种结合多种对抗训练策略融合及改进自注意力机制的短文本分类框架。模型一开始在文本向量表示层面进行对字嵌入加入对抗扰动,强化文本表示能力,并在F1分数达到一定阈值后加入改进对模型权重的对抗扰动,强化模型在训练及推理时的泛化能力,从而辅助提高该框架各分类器的特征学习能力。在特征学习网络模块方面,本文利用多尺度卷积模块和双向长短期记忆神经网络相结合来学习不同粒度特征,为了学习不相邻的特征信息,引入空洞卷积,增大卷积感受野,设计一个门控机制来控制该层信息的学习速度;最后,通过加入一种新型注意力机制,建模关键信息的同时也建模了非关键特征信息,同时加入损失进行计算,增强模型学习特征信息的能力并降低过拟合的风险。在2个大型公开数据集THUCNews新闻标题数据集及今日头条新闻标题数据集测试显示,本文方法的F1分数相比于当前主流模型及经典模型分类效果最多提升了4.93个百分点及6.14个百分点,取得了不错的效果,本文还对加入权重扰动阈值和不同模块的有效性进行了对比及消融实验探究。 展开更多
关键词 对抗训练 策略融合 空洞卷积 非关键信息 注意力机制
下载PDF
融合时空信息的Transformer单目标跟踪算法
20
作者 江进宝 宣士斌 付杰 《计算机工程与应用》 CSCD 北大核心 2024年第19期230-241,共12页
目前,主流的基于孪生网络的单目标跟踪方法,通过计算模板与搜索区域之间的相似度来匹配目标,缺乏对目标时空状态信息的利用。特别是当场景中存在多个相似目标时,孪生网络跟踪器往往无法精确区分目标,从而导致跟踪错误。针对上述问题,提... 目前,主流的基于孪生网络的单目标跟踪方法,通过计算模板与搜索区域之间的相似度来匹配目标,缺乏对目标时空状态信息的利用。特别是当场景中存在多个相似目标时,孪生网络跟踪器往往无法精确区分目标,从而导致跟踪错误。针对上述问题,提出一种融合时空信息的Transformer单目标跟踪算法(SIFTransT)。该算法通过MixFormer(end-to-end tracking with iterative mixed attention)跟踪器获取初步的跟踪结果,设计了一个目标状态计算模块,用于计算并存储目标的状态信息,包括目标位置、边界框、速度、加速度、运动方向等,以此深入挖掘目标状态信息。构建了一个基于Transformer的时空信息融合模块,利用编码器的自注意力和解码器的交叉注意力,深入融合目标最近一段时间的状态信息,从而更加准确地对目标状态进行建模,提高目标跟踪的准确性。在LaSOT数据集上的实验结果表明,相比基准算法MixFormer,SIFTransT算法在AUC指标提高了2.8个百分点,PNorm指标提升了2.6个百分点,P指标提升了2.1个百分点,在搭载RTX8000显卡的服务器上平均每秒处理帧数达28帧。 展开更多
关键词 单目标跟踪 目标状态计算 注意力机制 时空信息融合
下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部