期刊文献+
共找到73篇文章
< 1 2 4 >
每页显示 20 50 100
融合MobileNet与Contextual Transformer的人脸识别研究
1
作者 陈经纬 熊继平 程汉权 《智能计算机与应用》 2024年第3期61-66,共6页
FaceNet作为人脸识别的一大跨越,以其高精度、低硬件配置等优势被广泛应用于各个人脸识别相关领域。本文开源了首个餐厅支付场景下的中国人脸数据集CN-Face,该数据集拥有13000人的人脸图像,总计100000张。此外,本文以CA-SIA-WebFace作... FaceNet作为人脸识别的一大跨越,以其高精度、低硬件配置等优势被广泛应用于各个人脸识别相关领域。本文开源了首个餐厅支付场景下的中国人脸数据集CN-Face,该数据集拥有13000人的人脸图像,总计100000张。此外,本文以CA-SIA-WebFace作为训练集,利用改进后的MobileNet主干网络,采取不同的注意力机制添加方法,改变激活函数并且融入Contextual Transformer模块,大大降低了参数量和识别速度,显著提升了人脸识别精度。相较于原版FaceNet,在LFW测试集下,准确率达到98.79%,提升了2.74%,在CN-Face数据集中准确率达到95.22%,提升了1.35%。 展开更多
关键词 ECA注意力机制 人脸识别 FaceNet 深度学习 contextual Transformer
下载PDF
Residual Feature Attentional Fusion Network for Lightweight Chest CT Image Super-Resolution 被引量:1
2
作者 Kun Yang Lei Zhao +4 位作者 Xianghui Wang Mingyang Zhang Linyan Xue Shuang Liu Kun Liu 《Computers, Materials & Continua》 SCIE EI 2023年第6期5159-5176,共18页
The diagnosis of COVID-19 requires chest computed tomography(CT).High-resolution CT images can provide more diagnostic information to help doctors better diagnose the disease,so it is of clinical importance to study s... The diagnosis of COVID-19 requires chest computed tomography(CT).High-resolution CT images can provide more diagnostic information to help doctors better diagnose the disease,so it is of clinical importance to study super-resolution(SR)algorithms applied to CT images to improve the reso-lution of CT images.However,most of the existing SR algorithms are studied based on natural images,which are not suitable for medical images;and most of these algorithms improve the reconstruction quality by increasing the network depth,which is not suitable for machines with limited resources.To alleviate these issues,we propose a residual feature attentional fusion network for lightweight chest CT image super-resolution(RFAFN).Specifically,we design a contextual feature extraction block(CFEB)that can extract CT image features more efficiently and accurately than ordinary residual blocks.In addition,we propose a feature-weighted cascading strategy(FWCS)based on attentional feature fusion blocks(AFFB)to utilize the high-frequency detail information extracted by CFEB as much as possible via selectively fusing adjacent level feature information.Finally,we suggest a global hierarchical feature fusion strategy(GHFFS),which can utilize the hierarchical features more effectively than dense concatenation by progressively aggregating the feature information at various levels.Numerous experiments show that our method performs better than most of the state-of-the-art(SOTA)methods on the COVID-19 chest CT dataset.In detail,the peak signal-to-noise ratio(PSNR)is 0.11 dB and 0.47 dB higher on CTtest1 and CTtest2 at×3 SR compared to the suboptimal method,but the number of parameters and multi-adds are reduced by 22K and 0.43G,respectively.Our method can better recover chest CT image quality with fewer computational resources and effectively assist in COVID-19. 展开更多
关键词 SUPER-RESOLUTION COVID-19 chest CT lightweight network contextual feature extraction attentional feature fusion
下载PDF
SSD Real-Time Illegal Parking Detection Based on Contextual Information Transmission 被引量:5
3
作者 Huanrong Tang Aoming Peng +2 位作者 Dongming Zhang Tianming Liu Jianquan Ouyang 《Computers, Materials & Continua》 SCIE EI 2020年第1期293-307,共15页
With the improvement of the national economic level,the number of vehicles is still increasing year by year.According to the statistics of National Bureau of Statics,the number is approximately up to 327 million in Ch... With the improvement of the national economic level,the number of vehicles is still increasing year by year.According to the statistics of National Bureau of Statics,the number is approximately up to 327 million in China by the end of 2018,which makes urban traffic pressure continues to rise so that the negative impact of urban traffic order is growing.Illegal parking-the common problem in the field of transportation security is urgent to be solved and traditional methods to address it are mainly based on ground loop and manual supervision,which may miss detection and cost much manpower.Due to the rapidly developing deep learning sweeping the world in recent years,object detection methods relying on background segmentation cannot meet the requirements of complex and various scenes on speed and precision.Thus,an improved Single Shot MultiBox Detector(SSD)based on deep learning is proposed in our study,we introduce attention mechanism by spatial transformer module which gives neural networks the ability to actively spatially transform feature maps and add contextual information transmission in specified layer.Finally,we found out the best connection layer in the detection model by repeated experiments especially for small objects and increased the precision by 1.5%than the baseline SSD without extra training cost.Meanwhile,we designed an illegal parking vehicle detection method by the improved SSD,reaching a high precision up to 97.3%and achieving a speed of 40FPS,superior to most of vehicle detection methods,will make contributions to relieving the negative impact of illegal parking. 展开更多
关键词 contextual information transmission illegal parking detection spatial attention mechanism deep learning
下载PDF
融合半波注意力机制的低光照图像增强算法研究 被引量:1
4
作者 胡聪 陈绪君 吴雨锴 《激光杂志》 CAS 北大核心 2024年第1期109-114,共6页
针对当前基于卷积神经网络的低光照图像增强算法(CycleGAN,Retinex-Net等)存在模型参数过大、内存消耗高、图像复原质量不佳等问题,在轻量级算法IAT基础上,提出了融合半波注意力模块的低光照图像增强算法HBTNet。为了改善网络频繁卷积... 针对当前基于卷积神经网络的低光照图像增强算法(CycleGAN,Retinex-Net等)存在模型参数过大、内存消耗高、图像复原质量不佳等问题,在轻量级算法IAT基础上,提出了融合半波注意力模块的低光照图像增强算法HBTNet。为了改善网络频繁卷积造成的空间信息损失,在网络中引入半波注意力模块,可有效获得小波域的特性,丰富上下文信息,提高特征提取能力。通过引入MS-SSIM损失函数用来保存图像的边缘和细节信息,提升图像恢复的质量。实验结果表明,在LOL数据集上HBTNet相较于IAT算法PSNR提升了2.69%,SSIM提升了5.56%。HBTNet算法的模型参数量仅为0.11 M,可以满足终端用户实时性要求。 展开更多
关键词 图像增强 半波注意力机制 上下文信息 MS-SSIM损失函数
下载PDF
融合全局-局部上下文信息的小目标多人姿态估计
5
作者 龙辰志 陈平 李传坤 《计算机工程》 CAS CSCD 北大核心 2024年第4期342-349,共8页
尽管多人2D姿态估计方法趋近成熟,但是现有方法无法有效识别小目标的姿态。针对当前小目标姿态难以识别的问题,提出一种融合全局-局部上下文信息的多人姿态估计方法。利用高分辨率网络(HRNet)输出的不同尺度特征对人体的多个解剖中心进... 尽管多人2D姿态估计方法趋近成熟,但是现有方法无法有效识别小目标的姿态。针对当前小目标姿态难以识别的问题,提出一种融合全局-局部上下文信息的多人姿态估计方法。利用高分辨率网络(HRNet)输出的不同尺度特征对人体的多个解剖中心进行粗糙的定位,通过多个中心点给小目标提供更多的监督信息,提高对小目标的定位能力。以定位的人体中心点坐标为线索,通过可变形采样的方式提取中心点附近不同尺度的局部上下文信息,并计算不同目标局部上下文信息之间的对比损失以提高目标之间的判别能力。以HRNet网络的低分辨率特征作为全局上下文信息,以局部上下文信息作为交叉注意力的查询,结合全局和局部上下文信息构建多层Transformer模型,增强小目标的上下文信息。将增强的小目标上下文信息作为聚类中心,解耦多尺度融合的特征得到不同目标对应的关键点热图,从而实现小目标多人姿态估计。实验结果表明,该方法能够有效提高小目标姿态的识别性能,在COCO test-dev2017数据集上取得了69.0%的平均精度(AP),APM比对偶解剖中心(DAC)方法提高1.4个百分点。 展开更多
关键词 姿态估计 小目标 多中心点 注意力 上下文信息
下载PDF
结合三维交互注意力与语义聚合的表情识别
6
作者 王广宇 罗晓曙 +2 位作者 徐照兴 丰芳宇 许江杰 《计算机工程与应用》 CSCD 北大核心 2024年第6期238-248,共11页
针对传统卷积网络难以有效整合不同阶段人脸面部表情的特征、存在特征表征瓶颈以及无法高效利用上下文语义等问题,提出了一种结合三维交互注意力与语义聚合的面部表情识别方法。在秩扩展(ReXNet)网络的基础上对其进行优化,在消除表征瓶... 针对传统卷积网络难以有效整合不同阶段人脸面部表情的特征、存在特征表征瓶颈以及无法高效利用上下文语义等问题,提出了一种结合三维交互注意力与语义聚合的面部表情识别方法。在秩扩展(ReXNet)网络的基础上对其进行优化,在消除表征瓶颈的情况下,融合上下文特征,使其更适配表情识别任务。为捕获判别性人脸表情细粒度特征,结合非本地块与跨维度信息交互理论构建了三维交互注意力。为充分利用表情的浅中层底层特征与高层语义特征,设计了语义聚合模块,将多级全局上下文特征与高级语义信息进行聚合,达到同一类别的表情语义相互增益、增强类内一致性的目的。实验表明,该方法在公开数据集RAF-DB、FERPlus和AffectNet-8上的准确率分别为88.89%、89.53%与62.22%,展现了该方法的先进性。 展开更多
关键词 人脸表情识别 表征瓶颈 三维交互注意力 上下文语义
下载PDF
基于局部增强的中文医疗命名实体识别模型
7
作者 陈晶 邢珂萱 +2 位作者 孟伟伦 郭景峰 冯建周 《通信学报》 EI CSCD 北大核心 2024年第7期171-183,共13页
医学实体的识别往往受到其相邻上下文的影响,目前的命名实体识别方法通常依赖于BiLSTM捕捉文本中的全局依赖关系,缺乏对字符之间局部依赖关系的建模。针对这一问题,提出了一种基于局部增强的中文医疗命名实体识别模型LENER。首先,LENER... 医学实体的识别往往受到其相邻上下文的影响,目前的命名实体识别方法通常依赖于BiLSTM捕捉文本中的全局依赖关系,缺乏对字符之间局部依赖关系的建模。针对这一问题,提出了一种基于局部增强的中文医疗命名实体识别模型LENER。首先,LENER使用包括字音、字形和语义在内的多源信息来丰富底层字符表征。然后,结合相对位置编码对滑动窗口划分出的序列片段进行局部注意力计算,并通过非线性计算融合局部信息和BiLSTM得到的全局信息。最后,对识别出的实体头部和尾部进行组合,进而提取出实体。实验结果表明,LENER模型具有良好的实体识别能力,与其他模型相比,LENER模型的F1值提升了0.5%~2.0%。 展开更多
关键词 中文命名实体识别 上下文环境 注意力机制 多源信息 滑动窗口
下载PDF
基于BERT的双特征融合注意力的方面情感分析模型 被引量:1
8
作者 李锦 夏鸿斌 刘渊 《计算机科学与探索》 CSCD 北大核心 2024年第1期205-216,共12页
方面情感分析旨在预测句子或文档中一个特定方面的情感极性,现阶段大部分的研究都是使用注意力机制对上下文进行建模。然而,目前情感分类模型在使用BERT模型计算表征之间的依赖关系抽取特征时,大多未根据不同的语境背景考虑上下文信息,... 方面情感分析旨在预测句子或文档中一个特定方面的情感极性,现阶段大部分的研究都是使用注意力机制对上下文进行建模。然而,目前情感分类模型在使用BERT模型计算表征之间的依赖关系抽取特征时,大多未根据不同的语境背景考虑上下文信息,导致建模后的特征缺乏上下文的语境信息。同时,方面词的重要性未能得到充分的重视而影响模型整体分类的性能。针对上述问题,提出双特征融合注意力方面情感分析模型(DFLGA-BERT),分别设计了局部与全局的特征抽取模块,充分捕捉方面词和上下文的语义关联。并将一种改进的“准”注意力添加到DFLGA-BERT的全局特征抽取器中,使模型学习在注意力的融合中使用减性注意力以削弱噪声产生的负面影响。基于条件层规泛化(CLN)设计了局部特征和全局特征的特征融合结构来更好地融合局部和全局特征。在SentiHood和SemEval 2014 Task 4数据集上进行了实验,实验结果表明,与基线模型相比该模型在融入了上下文语境特征后取得了较明显的性能提升。 展开更多
关键词 情感分析 自然语言理解 准注意力机制 上下文注意
下载PDF
基于特征聚合和传播网络的图像超分辨率重建
9
作者 薄阳瑜 刘晓晶 +1 位作者 武永亮 王学军 《模式识别与人工智能》 EI CSCD 北大核心 2024年第4期299-312,共14页
基于深度学习的图像超分辨率重建通过网络加深提升图像重建性能,但复杂网络会导致参数量急剧增加,限制其在资源受限设备上的应用.针对此问题,文中提出基于特征聚合和传播网络的图像超分辨率重建方法,采用逐步提取融合特征的方式获取图... 基于深度学习的图像超分辨率重建通过网络加深提升图像重建性能,但复杂网络会导致参数量急剧增加,限制其在资源受限设备上的应用.针对此问题,文中提出基于特征聚合和传播网络的图像超分辨率重建方法,采用逐步提取融合特征的方式获取图像丰富的内部信息.首先,提出上下文交互注意力模块,使网络学习到特征图丰富的上下文信息,提高特征的利用率.然后,设计多维注意力增强模块,提高网络对关键特征的判别能力,分别在通道和空间两个维度提取高频信息.最后,提出特征聚合传播模块,有效聚合深层细节信息,去除冗余信息,并促进有效信息在网络中传播.在Set5、Set14、BSD100、Urban100等基准数据集上的测试实验表明,文中方法性能较优,重建后的图像细节纹理较清晰. 展开更多
关键词 图像超分辨率重建 卷积神经网络 上下文交互注意力 多维注意力 特征聚合
下载PDF
基于YOLOv4改进特征融合及全局感知的目标检测算法
10
作者 程德强 马尚 +2 位作者 寇旗旗 张皓翔 钱建生 《智能系统学报》 CSCD 北大核心 2024年第2期325-334,共10页
YOLOv4算法在检测速度和精度上达到了很好的平衡,但仍存在着定位框不准确、检测率低的问题,尤其是在检测目标较小、尺度变化大的情况下。针对以上问题,提出一种新的基于YOLOv4改进的目标检测算法。该算法采用改进的特征融合模块(path ag... YOLOv4算法在检测速度和精度上达到了很好的平衡,但仍存在着定位框不准确、检测率低的问题,尤其是在检测目标较小、尺度变化大的情况下。针对以上问题,提出一种新的基于YOLOv4改进的目标检测算法。该算法采用改进的特征融合模块(path aggregation network combined with bi-directional feature pyramid network,P-Bifpn)代替PANet(path aggregation network),增加跨尺度连接的同时在输出端引入权重,增强重要特征的表现力,解决由多尺度变化而引起的精度下降。然后,采用新的全局注意力机制(global association network,GANet),在减少平均池化与计算量的同时增强Sigmoid函数输出,加强模型对目标上下文关系的学习,减少噪声干扰和全局信息的损失。试验采用RSOD、NWPU VHR-10数据集,平均检测精度分别提升了约5%和3%;泛化试验采用VOC2007+2012公共数据集,平均检测精度提升了约0.6%。试验结果表明改进的算法能够有效提高模型的检测能力。 展开更多
关键词 YOLOv4 目标检测 特征融合 跨尺度 多尺度变化 全局注意力 平均池化 上下文信息
下载PDF
面向船闸船舶的在线多目标跟踪技术研究
11
作者 仇耀宗 李琳 +1 位作者 郭皓捷 于清泽 《装备环境工程》 CAS 2024年第3期73-79,共7页
目的 满足船闸船舶在线跟踪要求,改善由于复杂背景、遮挡等因素导致轨迹不连续和身份变更的问题,提出一种增强上下文联系和上下文注意力的多目标跟踪方法。方法 基于设计的在线系统,采集连续帧图像,改进FairMOT多目标跟踪模型。首先,通... 目的 满足船闸船舶在线跟踪要求,改善由于复杂背景、遮挡等因素导致轨迹不连续和身份变更的问题,提出一种增强上下文联系和上下文注意力的多目标跟踪方法。方法 基于设计的在线系统,采集连续帧图像,改进FairMOT多目标跟踪模型。首先,通过在骨干网络设计基于Bottleneck和Contextual Transformer的上下文建模模块,以加强上下文联系,增强场景理解的能力。其次,在迭代聚合后的特征图上应用全局上下文注意力,提高定位船舶目标的能力。结果 相对于原生的Fair MOT方法,设计上下文建模模块后,多目标跟踪准确度指标MOTA提高2.1%,继续添加全局上下文注意力MOTA,共计提高3.5%,同时在多项指标中取得了最佳表现。结论 改进的Fair MOT方法不仅拥有更强的轨迹保持能力,而且在身份维持方面更胜一筹。 展开更多
关键词 在线多目标跟踪 船闸船舶 改进FairMOT 上下文联系 contextual Transformer 上下文注意力
下载PDF
基于Attention机制和双向LSTM编码模型的智能软件工程情景式翻译研究
12
作者 葛腾飞 《自动化与仪器仪表》 2024年第7期256-261,共6页
为了有效改善面向智能软件工程情景式英语翻译的翻译模型性能和其翻译效果,此次研究结合注意力机制和双向长短时记忆网络搭建了新型的英语翻译模型,在此基础上,结合各类软件和硬件设备设计了面向智能软件工程的情景式英语语料库。研究... 为了有效改善面向智能软件工程情景式英语翻译的翻译模型性能和其翻译效果,此次研究结合注意力机制和双向长短时记忆网络搭建了新型的英语翻译模型,在此基础上,结合各类软件和硬件设备设计了面向智能软件工程的情景式英语语料库。研究结果表明,所搭建的翻译模型具有较好的性能表现,最多迭代20次能够达到稳定状态,其运行误差值也保持在0.05以下,翻译准确率高达0.98。在实际应用中也能够获得更高的专家满意度。综上,此次研究所搭建的翻译模型和英语语料库能够为软件工程情景式英语翻译提供新的技术支持,促进英语翻译更加智能和更加情景化。 展开更多
关键词 注意力机制 Bi-LSTM 软件工程 翻译 情景式
原文传递
基于改进YOLOv8的棉花虫害检测算法
13
作者 刘润飞 《农业工程》 2024年第7期42-47,共6页
传统的棉花病虫害检测方法依赖于植物保护专家或经验丰富的农民,这种方法费时费力,并且对于人眼难以观察到的微小病变识别准确率较低。这对如何利用深度学习方法提高识别的准确率和效率,降低人力成本,并且能够对微小病变进行准确识别,... 传统的棉花病虫害检测方法依赖于植物保护专家或经验丰富的农民,这种方法费时费力,并且对于人眼难以观察到的微小病变识别准确率较低。这对如何利用深度学习方法提高识别的准确率和效率,降低人力成本,并且能够对微小病变进行准确识别,提出了新的挑战。针对此问题,提出一种准确率高和实时性好的基于改进YOLOv8的棉花虫害检测算法。首先,使用DCNv3结构,替换YOLOv8 C2模块Bottleneck结构中的普通卷积,形成新的模块记为C2f-DCNv3;其次,在Head的最后一个C2f-DCNv3模块后面加入高效通道注意力,在提升模型精度的同时保持能够实现实时检测。在开源的CottonInsect棉田昆虫识别研究图像数据集上的试验结果表明,所改进方法的mAP为0.706,推理时间为0.6ms,模型大小5.7 MB,相较于原模型YOLOv8n,mAP提升3.0,推理时间提升0.1 ms,模型大小基本保持不变,实现了对于棉花虫害准确且高效的识别。 展开更多
关键词 YOLOv8 棉花虫害 目标检测 可变形卷积 高效通道注意力
下载PDF
基于Bert-GNNs异质图注意力网络的早期谣言检测
14
作者 欧阳祺 陈鸿昶 +2 位作者 刘树新 王凯 李星 《电子学报》 EI CAS CSCD 北大核心 2024年第1期311-323,共13页
网络谣言的广泛传播已经造成了很大的社会危害,因此早期谣言检测任务已成为重要的研究热点.现有谣言检测方法主要从文本内容、用户配置和传播结构中挖掘相关特征,但没有同时利用到文本全局语义关系和局部上下文语义关系.为了克服以上局... 网络谣言的广泛传播已经造成了很大的社会危害,因此早期谣言检测任务已成为重要的研究热点.现有谣言检测方法主要从文本内容、用户配置和传播结构中挖掘相关特征,但没有同时利用到文本全局语义关系和局部上下文语义关系.为了克服以上局限性,充分利用到谣言数据中的文本全局-局部上下文语义关系、文本语义内容特征和推文传播的结构特征,本文提出了一种基于Bert-GNNs异质图注意力网络的早期谣言检测算法(Bert-GNNs Heterogeneous Graph Attention Network,BGHGAN).该方法根据历史谣言集和用户特征构建一个推文-词-用户异质图,通过采用预训练语言模型Bert和图卷积神经网络(Graph Convolutional Network,GCN)结合的方法进行特征学习,以挖掘谣言的文本语义特征和文本之间的关系,并将异质图分解为推文-词子图和推文-用户子图,采用图注意力网络(Graph Attention network,GAT)的方式分别进行特征学习,从而更充分利用文本全局-局部上下文语义关系和传播图的全局结构关系以加强特征表达;最后,通过子图级注意力机制将不同模块的学习集成进行最终的谣言检测.所提算法在真实的Twitter15和Twitter16数据上进行实验,验证了该算法在检测准确率上分别为91.4%和91.9%,较现有最佳模型分别提高了1%和1.4%,也具备在早期阶段对谣言的检测能力;同时,本文通过实验探讨了不同特征对谣言检测的重要性、对异质图构建质量的重要性. 展开更多
关键词 虚假谣言 Bert-GCN模块 子图注意力网络模块 全局语义关系 全局结构关系 局部上下文语义关系
下载PDF
改进YOLOv5s的遥感图像目标检测 被引量:13
15
作者 赵文清 康怿瑾 +1 位作者 赵振兵 翟永杰 《智能系统学报》 CSCD 北大核心 2023年第1期86-95,共10页
针对遥感图像中感兴趣目标特征不明显、背景信息复杂、小目标居多导致的目标检测精度较低的问题,本文提出了一种改进YOLOv5s的遥感图像目标检测算法(Swin-YOLOv5s)。首先,在骨干特征提取网络的卷积块中加入轻量级通道注意力结构,抑制无... 针对遥感图像中感兴趣目标特征不明显、背景信息复杂、小目标居多导致的目标检测精度较低的问题,本文提出了一种改进YOLOv5s的遥感图像目标检测算法(Swin-YOLOv5s)。首先,在骨干特征提取网络的卷积块中加入轻量级通道注意力结构,抑制无关信息的干扰;其次,在多尺度特征融合的基础上进行跨尺度连接和上下文信息加权操作来加强待检测目标的特征提取,将融合后的特征图组成新的特征金字塔;最后,在特征融合的过程中引入Swin Transformer网络结构和坐标注意力机制,进一步增强小目标的语义信息和全局感知能力。将本文提出的算法在DOTA数据集和RSOD数据集上进行消融实验,结果表明,本文提出的算法能够明显提高遥感图像目标检测的平均准确率。 展开更多
关键词 遥感图像 感兴趣目标 目标检测 特征提取 轻量级通道注意力结构 多尺度特征融合 上下文信息 Swin变换器 坐标注意力机制
下载PDF
结合上下文和注意力机制改进的视盘分割模型 被引量:1
16
作者 王振华 刘阳星 +1 位作者 赵晓雨 张书台 《中国医学物理学杂志》 CSCD 2023年第1期47-53,共7页
青光眼为多发性眼底疾病,是致盲的主要原因之一。眼底图像来源广,质量参差不齐,且视盘区域具有多尺度性特征,融合上下文信息有利于准确分割多尺度视盘边界。以U-Net为基础,结合上下文信息和卷积注意力模块(CBAM),提出了一种改进的视盘... 青光眼为多发性眼底疾病,是致盲的主要原因之一。眼底图像来源广,质量参差不齐,且视盘区域具有多尺度性特征,融合上下文信息有利于准确分割多尺度视盘边界。以U-Net为基础,结合上下文信息和卷积注意力模块(CBAM),提出了一种改进的视盘分割模型,包括:(1)使用实例-批处理归一化(IBN)模块与注意力机制改进主干网络ResNet34,提升分割模型的泛化性和图像通道特征的提取能力;(2)提出一种多层次上下文信息提取(MCE)模块处理主干网络输出的特征,融合上下文信息增强分割模型对视盘边缘特征的提取能力;(3)使用Transformer机制替换U-Net中的跳跃连接和上采样,进一步提高视盘多尺度特征和图像通道特征的提取能力。将改进的分割模型与U-Net、U-Net++、DeeplabV3+、FCN和PSPNet分割模型进行视盘分割精度比较,结果表明提出的分割模型具有更好的分割效果,Dice、MIoU、MPA和FPS指标分别为98.18%、96.45%、98.11%和17.56 Img/s。该研究成果可为青光眼的早期诊断提供技术支撑。 展开更多
关键词 视盘分割 青光眼 上下文信息 注意力机制 TRANSFORMER
下载PDF
渐进式深度网络下盲运动图像去模糊方法
17
作者 王晓华 侯佳辉 +2 位作者 张凯兵 程敬 苏泽斌 《西安工程大学学报》 CAS 2023年第3期74-82,共9页
针对盲运动图像去模糊任务中渐进式深度神经网络缺少大范围感受野和难以合理交互各阶段图像特征的问题,提出具有扩张卷积和上下文注意力融合模块(contextual attention fusion module,CAFM)的渐进式深度网络(progressive depth network,... 针对盲运动图像去模糊任务中渐进式深度神经网络缺少大范围感受野和难以合理交互各阶段图像特征的问题,提出具有扩张卷积和上下文注意力融合模块(contextual attention fusion module,CAFM)的渐进式深度网络(progressive depth network,PDNet)恢复清晰图像。该方法包括局部特征提取、图像特征整合和图像恢复3个阶段。其中局部特征提取阶段和图像特征整合阶段利用多分支扩张卷积模块(multi-branch dilated convolution block,MDCB)增加感受野,适应不同程度的运动模糊;在图像特征整合阶段和图像恢复阶段利用CAFM进行不同阶段图像特征的信息交互,以实现渐进式的图像特征增强。通过3个阶段的渐进式增强策略,提出的方法能充分利用局部和全局图像特征引导图像恢复,从而生成清晰的高质量图像。实验结果表明:与SRN等网络相比,提出的PDNet在GoPro数据集和RealBlur-J数据集上得到更好的效果,且峰值信噪比(peak signal to noise ratio,PSNR)平均提升2.9 dB,结构相似度(structural similarity index measure,SSIM)平均提升0.05。 展开更多
关键词 盲运动图像去模糊 上下文注意力融合 渐进式深度网络 扩张卷积
下载PDF
结合多尺度上下文信息的唐卡小样本目标检测
18
作者 胡文瑾 唐慧媛 +1 位作者 乐超洋 宋华飞 《光学精密工程》 EI CAS CSCD 北大核心 2023年第12期1859-1869,共11页
通过对图像中感兴趣的对象进行分类与定位,能够帮助人们理解唐卡图像丰富的语义信息,促进文化传承。针对唐卡图像样本较少,背景复杂,检测目标存在遮挡,检测精度不高等问题,本文提出了一种结合多尺度上下文信息和双注意力引导的唐卡小样... 通过对图像中感兴趣的对象进行分类与定位,能够帮助人们理解唐卡图像丰富的语义信息,促进文化传承。针对唐卡图像样本较少,背景复杂,检测目标存在遮挡,检测精度不高等问题,本文提出了一种结合多尺度上下文信息和双注意力引导的唐卡小样本目标检测算法。首先,构建了一个新的多尺度特征金字塔,学习唐卡图像的多层级特征和上下文信息,提高模型对多尺度目标的判别能力。其次,在特征金字塔末端加入双注意力引导模块,提升模型对关键特征的表征能力,同时降低噪声的影响。最后利用Rank&Sort Loss替换交叉熵分类损失,简化模型训练的复杂度并提升检测精度。实验结果表明,所提出的方法在唐卡数据集和COCO数据集上的10-shot实验中,平均检测精度分别达到了19.7%和11.2%。 展开更多
关键词 唐卡 小样本目标检测 上下文信息 多尺度特征 双注意力机制
下载PDF
结合全局上下文信息的高效人体姿态估计 被引量:2
19
作者 刘豪 吴红兰 房宇轩 《计算机工程》 CAS CSCD 北大核心 2023年第7期102-109,117,共9页
现有的人体姿态估计模型通常使用复杂的网络结构提升关键点检测准确率,忽视了模型参数量和复杂度,使得模型难以部署在资源受限的计算设备上。针对这一问题,构建一个感知全局上下文信息的轻量级人体姿态估计网络模型(GCEHNet)。对HRNet... 现有的人体姿态估计模型通常使用复杂的网络结构提升关键点检测准确率,忽视了模型参数量和复杂度,使得模型难以部署在资源受限的计算设备上。针对这一问题,构建一个感知全局上下文信息的轻量级人体姿态估计网络模型(GCEHNet)。对HRNet进行轻量化改进,使用深度卷积模块代替HRNet结构中的标准3×3残差卷积模块,在保证网络性能的同时大幅度降低模型参数量与复杂度。为了克服卷积神经网络(CNN)在长期语义依赖性建模方面的局限性,使用双支路方法联合CNN与Transformer,将全局位置信息嵌入CNN后期模块,使GCEHNet模型能感知上下文特征信息,从而提升网络性能。设计一种CNN特征与全局位置特征高效融合的策略,通过学习联合特征信息重新分配特征权重,捕获并增强来自不同感受野的特征信息。实验结果表明,GCEHNet模型在MS COCO val2017和test-dev2017数据集上的检测准确率分别达到71.6%和71.3%,相比于HRNet模型,在检测准确率仅损失4.5%的条件下参数量降低了76.4%,在检测准确率和模型复杂度间取得了较好的平衡。 展开更多
关键词 人机交互 人体姿态估计 自注意力机制 全局上下文信息 特征融合
下载PDF
基于上下文注意力的室外点云语义分割方法 被引量:2
20
作者 苏鸣方 胡立坤 黄润辉 《计算机工程》 CAS CSCD 北大核心 2023年第3期248-256,共9页
基于直接点的语义分割方法能够避免因点云结构化处理所造成的信息损失,但未充分利用多尺度上下文特征,导致行人、自行车等小目标的分割精度降低。提出一种基于上下文注意力的点云语义分割方法,其由双向上下文注意力融合和上下文编码-通... 基于直接点的语义分割方法能够避免因点云结构化处理所造成的信息损失,但未充分利用多尺度上下文特征,导致行人、自行车等小目标的分割精度降低。提出一种基于上下文注意力的点云语义分割方法,其由双向上下文注意力融合和上下文编码-通道自注意力模块组成。通过前向注意力通道进行邻近尺度特征融合,从而获得更多的浅层细粒度信息,而反向注意力通道进一步融合高层语义信息,以增强模型的上下文感知能力。为捕获全局上下文信息,设计上下文编码-通道自注意力模块,通过对多尺度特征进行编码,并为特征通道分配不同的权重,使网络更关注特定的通道特征,以减少特征的冗余。在SemanticKITTI和Semantic3D大规模室外点云数据集上的实验结果表明,该方法的平均交并比分别为55.0%和76.4%,其中在SemanticKITTI数据集上,相比基准方法RandLA-Net的行人和自行车交并比分别提高3.0和6.9个百分点,能有效捕获多尺度上下文信息,提高小目标的分割精度。 展开更多
关键词 语义分割 上下文注意力 室外点云 多尺度特征 通道自注意力 点云小目标
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部