期刊文献+
共找到12,671篇文章
< 1 2 250 >
每页显示 20 50 100
基于CNN-Swin Transformer Network的LPI雷达信号识别
1
作者 苏琮智 杨承志 +2 位作者 邴雨晨 吴宏超 邓力洪 《现代雷达》 CSCD 北大核心 2024年第3期59-65,共7页
针对在低信噪比(SNR)条件下,低截获概率雷达信号调制方式识别准确率低的问题,提出一种基于Transformer和卷积神经网络(CNN)的雷达信号识别方法。首先,引入Swin Transformer模型并在模型前端设计CNN特征提取层构建了CNN+Swin Transforme... 针对在低信噪比(SNR)条件下,低截获概率雷达信号调制方式识别准确率低的问题,提出一种基于Transformer和卷积神经网络(CNN)的雷达信号识别方法。首先,引入Swin Transformer模型并在模型前端设计CNN特征提取层构建了CNN+Swin Transformer网络(CSTN),然后利用时频分析获取雷达信号的时频特征,对图像进行预处理后输入CSTN模型进行训练,由网络的底部到顶部不断提取图像更丰富的语义信息,最后通过Softmax分类器对六类不同调制方式信号进行分类识别。仿真实验表明:在SNR为-18 dB时,该方法对六类典型雷达信号的平均识别率达到了94.26%,证明了所提方法的可行性。 展开更多
关键词 低截获概率雷达 信号调制方式识别 Swin transformer网络 卷积神经网络 时频分析
下载PDF
ResoNet:Robust and Explainable ENSO Forecasts with Hybrid Convolution and Transformer Networks 被引量:1
2
作者 Pumeng LYU Tao TANG +4 位作者 Fenghua LING Jing-Jia LUO Niklas BOERS Wanli OUYANG Lei BAI 《Advances in Atmospheric Sciences》 SCIE CAS CSCD 2024年第7期1289-1298,共10页
Recent studies have shown that deep learning(DL)models can skillfully forecast El Niño–Southern Oscillation(ENSO)events more than 1.5 years in advance.However,concerns regarding the reliability of predictions ma... Recent studies have shown that deep learning(DL)models can skillfully forecast El Niño–Southern Oscillation(ENSO)events more than 1.5 years in advance.However,concerns regarding the reliability of predictions made by DL methods persist,including potential overfitting issues and lack of interpretability.Here,we propose ResoNet,a DL model that combines CNN(convolutional neural network)and transformer architectures.This hybrid architecture enables our model to adequately capture local sea surface temperature anomalies as well as long-range inter-basin interactions across oceans.We show that ResoNet can robustly predict ENSO at lead times of 19 months,thus outperforming existing approaches in terms of the forecast horizon.According to an explainability method applied to ResoNet predictions of El Niño and La Niña from 1-to 18-month leads,we find that it predicts the Niño-3.4 index based on multiple physically reasonable mechanisms,such as the recharge oscillator concept,seasonal footprint mechanism,and Indian Ocean capacitor effect.Moreover,we demonstrate for the first time that the asymmetry between El Niño and La Niña development can be captured by ResoNet.Our results could help to alleviate skepticism about applying DL models for ENSO prediction and encourage more attempts to discover and predict climate phenomena using AI methods. 展开更多
关键词 deep learning ENSO CNN transformer
下载PDF
Multiscale Fusion Transformer Network for Hyperspectral Image Classification
3
作者 Yuquan Gan Hao Zhang Chen Yi 《Journal of Beijing Institute of Technology》 EI CAS 2024年第3期255-270,共16页
Convolutional neural network(CNN)has excellent ability to model locally contextual information.However,CNNs face challenges for descripting long-range semantic features,which will lead to relatively low classification... Convolutional neural network(CNN)has excellent ability to model locally contextual information.However,CNNs face challenges for descripting long-range semantic features,which will lead to relatively low classification accuracy of hyperspectral images.To address this problem,this article proposes an algorithm based on multiscale fusion and transformer network for hyperspectral image classification.Firstly,the low-level spatial-spectral features are extracted by multi-scale residual structure.Secondly,an attention module is introduced to focus on the more important spatialspectral information.Finally,high-level semantic features are represented and learned by a token learner and an improved transformer encoder.The proposed algorithm is compared with six classical hyperspectral classification algorithms on real hyperspectral images.The experimental results show that the proposed algorithm effectively improves the land cover classification accuracy of hyperspectral images. 展开更多
关键词 hyperspectral image land cover classification MULTI-SCALE transformer
下载PDF
A Novel Action Transformer Network for Hybrid Multimodal Sign Language Recognition
4
作者 Sameena Javaid Safdar Rizvi 《Computers, Materials & Continua》 SCIE EI 2023年第1期523-537,共15页
Sign language fills the communication gap for people with hearing and speaking ailments.It includes both visual modalities,manual gestures consisting of movements of hands,and non-manual gestures incorporating body mo... Sign language fills the communication gap for people with hearing and speaking ailments.It includes both visual modalities,manual gestures consisting of movements of hands,and non-manual gestures incorporating body movements including head,facial expressions,eyes,shoulder shrugging,etc.Previously both gestures have been detected;identifying separately may have better accuracy,butmuch communicational information is lost.Aproper sign language mechanism is needed to detect manual and non-manual gestures to convey the appropriate detailed message to others.Our novel proposed system contributes as Sign LanguageAction Transformer Network(SLATN),localizing hand,body,and facial gestures in video sequences.Here we are expending a Transformer-style structural design as a“base network”to extract features from a spatiotemporal domain.Themodel impulsively learns to track individual persons and their action context inmultiple frames.Furthermore,a“head network”emphasizes hand movement and facial expression simultaneously,which is often crucial to understanding sign language,using its attention mechanism for creating tight bounding boxes around classified gestures.The model’s work is later compared with the traditional identification methods of activity recognition.It not only works faster but achieves better accuracy as well.Themodel achieves overall 82.66%testing accuracy with a very considerable performance of computation with 94.13 Giga-Floating Point Operations per Second(G-FLOPS).Another contribution is a newly created dataset of Pakistan Sign Language forManual and Non-Manual(PkSLMNM)gestures. 展开更多
关键词 Sign language gesture recognition manual signs non-manual signs action transformer network
下载PDF
CFM-UNet:A Joint CNN and Transformer Network via Cross Feature Modulation for Remote Sensing Images Segmentation 被引量:3
5
作者 Min WANG Peidong WANG 《Journal of Geodesy and Geoinformation Science》 CSCD 2023年第4期40-47,共8页
The semantic segmentation methods based on CNN have made great progress,but there are still some shortcomings in the application of remote sensing images segmentation,such as the small receptive field can not effectiv... The semantic segmentation methods based on CNN have made great progress,but there are still some shortcomings in the application of remote sensing images segmentation,such as the small receptive field can not effectively capture global context.In order to solve this problem,this paper proposes a hybrid model based on ResNet50 and swin transformer to directly capture long-range dependence,which fuses features through Cross Feature Modulation Module(CFMM).Experimental results on two publicly available datasets,Vaihingen and Potsdam,are mIoU of 70.27%and 76.63%,respectively.Thus,CFM-UNet can maintain a high segmentation performance compared with other competitive networks. 展开更多
关键词 remote sensing images semantic segmentation swin transformer feature modulation module
下载PDF
ARoad Segmentation Model Based on Mixture of the Convolutional Neural Network and the Transformer Network 被引量:1
6
作者 Fenglei Xu Haokai Zhao +2 位作者 Fuyuan Hu Mingfei Shen Yifei Wu 《Computer Modeling in Engineering & Sciences》 SCIE EI 2023年第5期1559-1570,共12页
Convolutional neural networks(CNN)based on U-shaped structures and skip connections play a pivotal role in various image segmentation tasks.Recently,Transformer starts to lead new trends in the image segmentation task... Convolutional neural networks(CNN)based on U-shaped structures and skip connections play a pivotal role in various image segmentation tasks.Recently,Transformer starts to lead new trends in the image segmentation task.Transformer layer can construct the relationship between all pixels,and the two parties can complement each other well.On the basis of these characteristics,we try to combine Transformer pipeline and convolutional neural network pipeline to gain the advantages of both.The image is put into the U-shaped encoder-decoder architecture based on empirical combination of self-attention and convolution,in which skip connections are utilized for localglobal semantic feature learning.At the same time,the image is also put into the convolutional neural network architecture.The final segmentation result will be formed by Mix block which combines both.The mixture model of the convolutional neural network and the Transformer network for road segmentation(MCTNet)can achieve effective segmentation results on KITTI dataset and Unstructured Road Scene(URS)dataset built by ourselves.Codes,self-built datasets and trainable models will be available on https://github.com/xflxfl1992/MCTNet. 展开更多
关键词 Image segmentation transformer mix block U-shaped structures
下载PDF
A complementary integrated Transformer network for hyperspectral image classification
7
作者 Diling Liao Cuiping Shi Liguo Wang 《CAAI Transactions on Intelligence Technology》 SCIE EI 2023年第4期1288-1307,共20页
In the past,convolutional neural network(CNN)has become one of the most popular deep learning frameworks,and has been widely used in Hyperspectral image classification tasks.Convolution(Conv)in CNN uses filter weights... In the past,convolutional neural network(CNN)has become one of the most popular deep learning frameworks,and has been widely used in Hyperspectral image classification tasks.Convolution(Conv)in CNN uses filter weights to extract features in local receiving domain,and the weight parameters are shared globally,which more focus on the highfrequency information of the image.Different from Conv,Transformer can obtain the long‐term dependence between long‐distance features through modelling,and adaptively focus on different regions.In addition,Transformer is considered as a low‐pass filter,which more focuses on the low‐frequency information of the image.Considering the complementary characteristics of Conv and Transformer,the two modes can be integrated for full feature extraction.In addition,the most important image features correspond to the discrimination region,while the secondary image features represent important but easily ignored regions,which are also conducive to the classification of HSIs.In this study,a complementary integrated Transformer network(CITNet)for hyperspectral image classification is proposed.Firstly,three‐dimensional convolution(Conv3D)and two‐dimensional convolution(Conv2D)are utilised to extract the shallow semantic information of the image.In order to enhance the secondary features,a channel Gaussian modulation attention module is proposed,which is embedded between Conv3D and Conv2D.This module can not only enhance secondary features,but suppress the most important and least important features.Then,considering the different and complementary characteristics of Conv and Transformer,a complementary integrated Transformer module is designed.Finally,through a large number of experiments,this study evaluates the classification performance of CITNet and several state‐of‐the‐art networks on five common datasets.The experimental results show that compared with these classification networks,CITNet can provide better classification performance. 展开更多
关键词 complementary integrated transformer module convolutional neural network Gaussian modulation transformer
下载PDF
Forecasting Future Trajectories with an Improved Transformer Network
8
作者 Wei Wu Weigong Zhang +2 位作者 Dong Wang Lydia Zhu Xiang Song 《Computers, Materials & Continua》 SCIE EI 2023年第2期3811-3828,共18页
An increase in car ownership brings convenience to people’s life.However,it also leads to frequent traffic accidents.Precisely forecasting surrounding agents’future trajectories could effectively decrease vehicle-ve... An increase in car ownership brings convenience to people’s life.However,it also leads to frequent traffic accidents.Precisely forecasting surrounding agents’future trajectories could effectively decrease vehicle-vehicle and vehicle-pedestrian collisions.Long-short-term memory(LSTM)network is often used for vehicle trajectory prediction,but it has some shortages such as gradient explosion and low efficiency.A trajectory prediction method based on an improved Transformer network is proposed to forecast agents’future trajectories in a complex traffic environment.It realizes the transformation from sequential step processing of LSTM to parallel processing of Transformer based on attentionmechanism.To performtrajectory predictionmore efficiently,a probabilistic sparse self-attention mechanism is introduced to reduce attention complexity by reducing the number of queried values in the attention mechanism.Activate or not(ACON)activation function is adopted to select whether to activate or not,hence improving model flexibility.The proposed method is evaluated on the publicly available benchmarks nextgeneration simulation(NGSIM)and ETH/UCY.The experimental results indicate that the proposed method can accurately and efficiently predict agents’trajectories. 展开更多
关键词 Trajectory prediction transformer attention mechanism ACON activation intelligent perception
下载PDF
基于残差U-Net和自注意力Transformer编码器的磁场预测方法 被引量:1
9
作者 金亮 尹振豪 +2 位作者 刘璐 宋居恒 刘元凯 《电工技术学报》 EI CSCD 北大核心 2024年第10期2937-2952,共16页
利用有限元方法对几何结构复杂的电机和变压器进行磁场分析,存在仿真时间长且无法复用的问题。因此,该文提出一种基于残差U-Net和自注意力Transformer编码器的磁场预测方法。首先建立永磁同步电机(PMSM)和非晶合金变压器(AMT)有限元模型... 利用有限元方法对几何结构复杂的电机和变压器进行磁场分析,存在仿真时间长且无法复用的问题。因此,该文提出一种基于残差U-Net和自注意力Transformer编码器的磁场预测方法。首先建立永磁同步电机(PMSM)和非晶合金变压器(AMT)有限元模型,得到深度学习训练所需的数据集;然后将Transformer模块与U-Net模型结合,并引入短残差机制建立ResUnet-Transformer模型,通过预测图像的像素实现磁场预测;最后通过Targeted Dropout算法和动态学习率调整策略对模型进行优化,解决拟合问题并提高预测精度。计算实例证明,ResUnet-Transformer模型在PMSM和AMT数据集上测试集的平均绝对百分比误差(MAPE)均小于1%,且仅需500组样本。该文提出的磁场预测方法能减少实际工况和多工况下精细模拟和拓扑优化的时间和资源消耗,亦是虚拟传感器乃至数字孪生的关键实现方法之一。 展开更多
关键词 有限元方法 电磁场 深度学习 U-net transformer
下载PDF
基于特征融合Transformer的EfficientNet v2网络对马铃薯叶片病害的识别 被引量:1
10
作者 孙剑明 毕振宇 牛连丁 《江苏农业科学》 北大核心 2024年第8期166-176,共11页
马铃薯叶片病害是影响马铃薯质量和产量的主要因素,为了能够快速准确地识别马铃薯叶片病害并采取对应的防控和救治措施,本研究提出一种新型马铃薯叶片病害识别方法。该方法利用EfficientNet v2网络提取图像特征,通过4个不同尺度的网络... 马铃薯叶片病害是影响马铃薯质量和产量的主要因素,为了能够快速准确地识别马铃薯叶片病害并采取对应的防控和救治措施,本研究提出一种新型马铃薯叶片病害识别方法。该方法利用EfficientNet v2网络提取图像特征,通过4个不同尺度的网络层进行金字塔融合,从而捕捉不同尺度下的图像细节和上下文信息,并在金字塔融合中的每个下采样环节都添加1个CBAM注意力机制模块,且每个CBAM模块后都加入Vision Transformer的Encoder模块进行特征增强,帮助提升所提取特征的丰富性和抽象能力,最后使用softmax进行分类。研究提出的模型识别准确率达到98.26%,相比改进之前提升3.47百分点,且其loss收敛更快,宏平均值与加权平均值都有明显提升。消融试验表明,该模型在各项指标上的表现最优,超过基线模型和融合模型,大幅提高图像分类识别任务模型的性能表现。该方法可有效提高病害区域的识别能力和检测准确率,且能在强干扰的环境下做到高精度识别,具有良好的鲁棒性和适应性,同时能解决病害识别中泛化能力弱、精度低、计算效率低等问题。 展开更多
关键词 农业 马铃薯叶片病害 图像识别 卷积神经网络 特征融合 transformer模型
下载PDF
GFENet:基于Transformer的高效医学图像分割网络
11
作者 孙红 朱江明 +3 位作者 吴一凡 徐广辉 任丽博 杨晨 《小型微型计算机系统》 CSCD 北大核心 2024年第7期1728-1733,共6页
医学图像分割技术在疾病诊断中发挥着重要作用,针对传统网络分割模型中存在参数量大、网络计算效率低等问题,本文提出名为GFENet的高性能低复杂度分割网络,GFENet以金字塔结构的视觉Transformer作为网络主干提取图像特征,分别采用线性... 医学图像分割技术在疾病诊断中发挥着重要作用,针对传统网络分割模型中存在参数量大、网络计算效率低等问题,本文提出名为GFENet的高性能低复杂度分割网络,GFENet以金字塔结构的视觉Transformer作为网络主干提取图像特征,分别采用线性预测模块和渐进式局域解码器对提取出来的低级特征和高级特征进行局部增强处理,最后采用GFE模块中的全局注意力机制将位置信息嵌入高级特征.在Kvasir和CVC-ClinicDB数据集上进行实验验证,GFENet的mDice分别为94.1%和94.6%;其在CVC-ColonDB和ETIS数据集上的泛化性能优于其他对比模型.为验证模型低复杂度的同时保持高分割准确率,本文将GFENet与现有的高性能模型和轻量化模型进行对比,GFENet在CVC-ColonDB数据集上以81.5%的mDice高于其它对比模型,以23.1M的参数量优于其他高性能分割模型. 展开更多
关键词 图像分割 transformer GFEnet 全局注意力机制 息肉分割
下载PDF
BBTUNet:基于上下文Transformer的肝脏肿瘤分割算法研究
12
作者 宋长明 宋蒙 +2 位作者 肖露 梁朝阳 彩朔 《电子设计工程》 2024年第5期190-195,共6页
肝癌是世界范围内最常见的恶性肿瘤之一,严重威胁着人类的生命健康,从计算机断层扫描(Computed Tomography,CT)中精确分割出肝脏肿瘤对后期的临床诊断具有重要的意义。现有的方法虽然实现了肝脏肿瘤的自动化分割,但肝脏肿瘤边界模糊、... 肝癌是世界范围内最常见的恶性肿瘤之一,严重威胁着人类的生命健康,从计算机断层扫描(Computed Tomography,CT)中精确分割出肝脏肿瘤对后期的临床诊断具有重要的意义。现有的方法虽然实现了肝脏肿瘤的自动化分割,但肝脏肿瘤边界模糊、目标较小、容易漏检等问题尚未很好地解决,肝脏肿瘤的精确分割仍旧是一项极具挑战的任务。针对这些问题,该文提出一种新的分割网络BBTUNet。构建基于Transformer的上下文Bridge,重新设计UNet的跳跃连接结构,有效捕捉多尺度特征之间的上下文关系。在Transformer的前馈神经网络中引入可分离的空洞卷积,提出改进的前馈神经网络BFFN,有效融合全局和局部信息,增强边界特征,细化分割边缘。在3DIRCADB数据集上对模型进行训练和测试,实验结果表明,提出的BBTUNet网络的Dice系数为82.1%,ACC为96.4%,相较于UNet网络,分别提升了10.9%、4.6%,且对于小尺寸、低对比度、边界模糊的肿瘤分割具有显著优势。 展开更多
关键词 肝肿瘤分割 Unet transformer 上下文Bridge
下载PDF
融合MobileNet与Contextual Transformer的人脸识别研究 被引量:1
13
作者 陈经纬 熊继平 程汉权 《智能计算机与应用》 2024年第3期61-66,共6页
FaceNet作为人脸识别的一大跨越,以其高精度、低硬件配置等优势被广泛应用于各个人脸识别相关领域。本文开源了首个餐厅支付场景下的中国人脸数据集CN-Face,该数据集拥有13000人的人脸图像,总计100000张。此外,本文以CA-SIA-WebFace作... FaceNet作为人脸识别的一大跨越,以其高精度、低硬件配置等优势被广泛应用于各个人脸识别相关领域。本文开源了首个餐厅支付场景下的中国人脸数据集CN-Face,该数据集拥有13000人的人脸图像,总计100000张。此外,本文以CA-SIA-WebFace作为训练集,利用改进后的MobileNet主干网络,采取不同的注意力机制添加方法,改变激活函数并且融入Contextual Transformer模块,大大降低了参数量和识别速度,显著提升了人脸识别精度。相较于原版FaceNet,在LFW测试集下,准确率达到98.79%,提升了2.74%,在CN-Face数据集中准确率达到95.22%,提升了1.35%。 展开更多
关键词 ECA注意力机制 人脸识别 Facenet 深度学习 Contextual transformer
下载PDF
融合SENet和Transformer的应用层协议识别方法 被引量:1
14
作者 陈乾 洪征 司健鹏 《计算机科学与探索》 CSCD 北大核心 2024年第3期805-817,共13页
协议识别技术在网络通信和信息安全领域具有至关重要的地位和作用。针对现有基于时空特征的协议识别方法提取协议特征不充分、不全面的问题,提出了一种基于SENet和Transformer的应用层协议识别方法。该方法关注协议数据的时空特征,由加... 协议识别技术在网络通信和信息安全领域具有至关重要的地位和作用。针对现有基于时空特征的协议识别方法提取协议特征不充分、不全面的问题,提出了一种基于SENet和Transformer的应用层协议识别方法。该方法关注协议数据的时空特征,由加入SENet注意力的残差网络构成的空间特征提取模块和Trans-former网络编码器构成的时间提取模块组成。空间特征提取阶段,在残差网络结构中加入SE块获取多个卷积通道间的联系,自适应地为通道分配权重,提取不同通道中更加活跃的协议空间特征;时间特征提取阶段,由基于多头注意力机制的Transformer编码器通过堆叠的方式构建时间特征提取模块,利用输入数据的位置信息全面地获取协议数据的时间特征。通过对更加充足的空间特征和更加全面的时间特征的提取和学习,可以获得更有效的协议识别信息,进而提高协议识别性能。在ISCX2012和CSE_CIC_IDS2018混合数据集上的实验结果表明,所提模型的总体识别准确率达到99.20%,F1值达到98.99%,高于对比模型。 展开更多
关键词 SEnet 残差网络 自注意力 transformer 协议识别 网络安全
下载PDF
DRT Net:面向特征增强的双残差Res-Transformer肺炎识别模型
15
作者 周涛 彭彩月 +3 位作者 杜玉虎 党培 刘凤珍 陆惠玲 《光学精密工程》 EI CAS CSCD 北大核心 2024年第5期714-726,共13页
针对肺部X射线图像的病灶区域较小、形状复杂,与正常组织间的边界模糊,使得肺炎图像中的病灶特征提取不充分的问题,提出了一个面向特征增强的双残差Res-Transformer肺炎识别模型,设计3种不同的特征增强策略对模型特征提取能力进行增强... 针对肺部X射线图像的病灶区域较小、形状复杂,与正常组织间的边界模糊,使得肺炎图像中的病灶特征提取不充分的问题,提出了一个面向特征增强的双残差Res-Transformer肺炎识别模型,设计3种不同的特征增强策略对模型特征提取能力进行增强。设计了组注意力双残差模块(GADRM),采用双残差结构进行高效的特征融合,将双残差结构与通道混洗、通道注意力、空间注意力结合,增强模型对于病灶区域特征的提取能力;在网络的高层采用全局局部特征提取模块(GLFEM),结合CNN和Transformer的优势使网络充分提取图像的全局和局部特征,获得高层语义信息的全局特征,进一步增强网络的语义特征提取能力;设计了跨层双注意力特征融合模块(CDAFFM),融合浅层网络的空间信息以及深层网络的通道信息,对网络提取到的跨层特征进行增强。为了验证本文模型的有效性,分别在COVID-19 CHEST X-RAY数据集上进行消融实验和对比实验。实验结果表明,本文所提出网络的准确率、精确率、召回率,F1值和AUC值分别为98.41%,94.42%,94.20%,94.26%和99.65%。DRT Net能够帮助放射科医生使用胸部X光片对肺炎进行诊断,具有重要的临床作用。 展开更多
关键词 肺炎识别 X射线图像 特征增强 双残差结构 transformer
下载PDF
基于多尺度U-Net与Transformer特征融合的航空遥感图像飞机检测方法
16
作者 张善文 邵彧 +1 位作者 李萍 令伟锋 《弹箭与制导学报》 北大核心 2024年第3期51-58,共8页
航空遥感图像(ARSI)飞机检测一直是一个重要且具有挑战性的课题。针对现有ARSI飞机检测方法(ARSIAD)检测目标的边缘模糊、小目标的检测精度低、没有充分利用ARSI的全局上下文信息等问题,提出一种基于多尺度U-Net与Transformer(MSU-Trans... 航空遥感图像(ARSI)飞机检测一直是一个重要且具有挑战性的课题。针对现有ARSI飞机检测方法(ARSIAD)检测目标的边缘模糊、小目标的检测精度低、没有充分利用ARSI的全局上下文信息等问题,提出一种基于多尺度U-Net与Transformer(MSU-Trans)特征融合的ARSIAD方法。通过多尺度卷积模块Inception提取ARSI中多样性目标的分类特征,通过Transformer增强模型的全局语义检测性能,通过特征融合模块整合高层和低层特征,得到航空目标图像完整的边缘和纹理特征。该模型结合多尺度U-Net较强的局部特征提取能力和Transformer较强的全局上下文依存关系提取能力,进而提高MSU-Trans的整体检测性能。在ARSI集上的试验表明,与U-Net、多尺度U-Net、注意力U-Nets相比,MSU-Trans具有较高的检测精度,精度超过95%,该方法为ARSIAD提供一定的技术支撑。 展开更多
关键词 航空遥感图像飞机检测 多尺度U-net transformer 多尺度U-nettransformer
下载PDF
采用融合ResNet和Transformer的U-Net进行疟疾感染红细胞分割
17
作者 刘潇霜 张伟 《中国医学物理学杂志》 CSCD 2024年第2期191-197,共7页
针对疟疾感染红细胞图像分割模型分割性能不高的问题,提出一种改进的U-Net网络模型,融合ResNet和Transformer。首先编码器部分使用ResNet,加深特征提取网络,以提取更深层次的特征;然后将ResNet输出传入Transformer模块进行目标区域特征... 针对疟疾感染红细胞图像分割模型分割性能不高的问题,提出一种改进的U-Net网络模型,融合ResNet和Transformer。首先编码器部分使用ResNet,加深特征提取网络,以提取更深层次的特征;然后将ResNet输出传入Transformer模块进行目标区域特征的加强;最后通过解码器模块进行特征融合并输出结果。在疟疾显微图像数据集上,本文方法的Dice相似系数、平均交并比、类别平均像素准确率均优于U-Net网络,分别达到了87.40%、76.85%、85.28%。本文方法可以提高疟疾感染红细胞图像的分割精度,为疟疾诊断提供更有效和准确的解决方案。 展开更多
关键词 疟疾 U-net transformer 语义分割
下载PDF
基于Transformer增强型U-net的CT图像稀疏重建与伪影抑制
18
作者 樊雪林 文昱齐 乔志伟 《CT理论与应用研究(中英文)》 2024年第1期1-12,共12页
实现低剂量计算机断层成像(CT)的一个有效办法是减少投影角度,但投影角度较少会产生严重的条状伪影,降低图像的临床使用价值。针对该问题,提出一种耦合卷积神经网络(CNN)和多种注意力机制的U型网络(TE-unet)。首先采用U型架构提取多尺... 实现低剂量计算机断层成像(CT)的一个有效办法是减少投影角度,但投影角度较少会产生严重的条状伪影,降低图像的临床使用价值。针对该问题,提出一种耦合卷积神经网络(CNN)和多种注意力机制的U型网络(TE-unet)。首先采用U型架构提取多尺度特征信息;其次提出一个包含CNN和多种注意力的模块提取图像特征;最后在跳跃连接处加入Transformer块过滤信息,抑制不相关特征,突出重要特征。所提网络结合CNN的局部特征提取能力和Transformer的全局信息捕获能力,辅以多种注意力机制,实现了良好的去条状伪影能力。在60个投影角度下,与经典的Uformer网络相比,峰值信噪比(PSNR)高出0.3178 dB,结构相似度(SSIM)高出0.002,均方根误差(RMSE)降低0.0005。实验结果表明,所提TE-unet重建的图像精度更高,图像细节保留的更好,可以更好地压制条状伪影。 展开更多
关键词 稀疏重建 计算机断层成像 transformer 多注意力机制 条状伪影
下载PDF
基于U-Net融合Transformer的肺结节分割方法研究
19
作者 李晓东 丁鹏 《中国医疗设备》 2024年第5期31-36,98,共7页
目的提出肺结节分割模型,实现肺结节分割。方法在U-Net神经网络中加入编码器、空洞卷积以及Swin Transformer模块,提出一个将空洞卷积、编码器和注意力机制相结合的模型,并在LUNA16公共数据集上验证模型性能。结果改进的模型在LUNA16公... 目的提出肺结节分割模型,实现肺结节分割。方法在U-Net神经网络中加入编码器、空洞卷积以及Swin Transformer模块,提出一个将空洞卷积、编码器和注意力机制相结合的模型,并在LUNA16公共数据集上验证模型性能。结果改进的模型在LUNA16公共数据集上进行肺结节分割的准确度(Accuracy,ACC)、特异性(Specificity,SP)、交并比(Intersection Over Union,IOU)和Dice系数(Dice Similarity Coefficient,DSC)分别为0.9651、0.9572、0.8354、0.8971。结论该分割模型在ACC、SP、IOU和DSC方面表现优异,可辅助医生诊断,在临床肺结节分割方面具有一定的参考价值。 展开更多
关键词 肺结节 肺结节分割 U-net神经网络 Swin transformer模块
下载PDF
基于Swin Transformer和UNet的肺结节分割方法
20
作者 裔馥华 张在房 《计量与测试技术》 2024年第1期44-48,共5页
肺结节的准确分割是后续良恶性分析和诊断的关键。由于基于卷积神经网络的分割模型受限于局部特征提取特性,忽略了全局特征。因此,本文提出了一种新的肺结节语义分割框架ST-UNet网络,将Swin Transformer嵌入UNet中,构成一种新颖的Swin T... 肺结节的准确分割是后续良恶性分析和诊断的关键。由于基于卷积神经网络的分割模型受限于局部特征提取特性,忽略了全局特征。因此,本文提出了一种新的肺结节语义分割框架ST-UNet网络,将Swin Transformer嵌入UNet中,构成一种新颖的Swin Transformer和CNN并行的双编码器结构。结果表明:该模型不仅对肺结节的分割具有较好的性能,而且对医生进行肺结节的早期诊断具有重要的临床意义和应用价值。 展开更多
关键词 肺结节分割 Swin transformer Unet
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部