期刊文献+
共找到12,947篇文章
< 1 2 250 >
每页显示 20 50 100
Application of sparse S transform network with knowledge distillation in seismic attenuation delineation
1
作者 Nai-Hao Liu Yu-Xin Zhang +3 位作者 Yang Yang Rong-Chang Liu Jing-Huai Gao Nan Zhang 《Petroleum Science》 SCIE EI CAS CSCD 2024年第4期2345-2355,共11页
Time-frequency analysis is a successfully used tool for analyzing the local features of seismic data.However,it suffers from several inevitable limitations,such as the restricted time-frequency resolution,the difficul... Time-frequency analysis is a successfully used tool for analyzing the local features of seismic data.However,it suffers from several inevitable limitations,such as the restricted time-frequency resolution,the difficulty in selecting parameters,and the low computational efficiency.Inspired by deep learning,we suggest a deep learning-based workflow for seismic time-frequency analysis.The sparse S transform network(SSTNet)is first built to map the relationship between synthetic traces and sparse S transform spectra,which can be easily pre-trained by using synthetic traces and training labels.Next,we introduce knowledge distillation(KD)based transfer learning to re-train SSTNet by using a field data set without training labels,which is named the sparse S transform network with knowledge distillation(KD-SSTNet).In this way,we can effectively calculate the sparse time-frequency spectra of field data and avoid the use of field training labels.To test the availability of the suggested KD-SSTNet,we apply it to field data to estimate seismic attenuation for reservoir characterization and make detailed comparisons with the traditional time-frequency analysis methods. 展开更多
关键词 S transform Deep learning Knowledge distillation Transfer learning Seismic attenuation delineation
下载PDF
Triple-path feature transform network for ring-array photoacoustic tomography image reconstruction
2
作者 Lingyu Ma Zezheng Qin +1 位作者 Yiming Ma Mingjian Sun 《Journal of Innovative Optical Health Sciences》 SCIE EI CSCD 2024年第3期23-40,共18页
Photoacoustic imaging(PAI)is a noninvasive emerging imaging method based on the photoacoustic effect,which provides necessary assistance for medical diagnosis.It has the characteristics of large imaging depth and high... Photoacoustic imaging(PAI)is a noninvasive emerging imaging method based on the photoacoustic effect,which provides necessary assistance for medical diagnosis.It has the characteristics of large imaging depth and high contrast.However,limited by the equipment cost and reconstruction time requirements,the existing PAI systems distributed with annular array transducers are difficult to take into account both the image quality and the imaging speed.In this paper,a triple-path feature transform network(TFT-Net)for ring-array photoacoustic tomography is proposed to enhance the imaging quality from limited-view and sparse measurement data.Specifically,the network combines the raw photoacoustic pressure signals and conventional linear reconstruction images as input data,and takes the photoacoustic physical model as a prior information to guide the reconstruction process.In addition,to enhance the ability of extracting signal features,the residual block and squeeze and excitation block are introduced into the TFT-Net.For further efficient reconstruction,the final output of photoacoustic signals uses‘filter-then-upsample’operation with a pixel-shuffle multiplexer and a max out module.Experiment results on simulated and in-vivo data demonstrate that the constructed TFT-Net can restore the target boundary clearly,reduce background noise,and realize fast and high-quality photoacoustic image reconstruction of limited view with sparse sampling. 展开更多
关键词 Deep learning feature transformation image reconstruction limited-view measurement photoacoustic tomography.
下载PDF
基于残差U-Net和自注意力Transformer编码器的磁场预测方法 被引量:1
3
作者 金亮 尹振豪 +2 位作者 刘璐 宋居恒 刘元凯 《电工技术学报》 EI CSCD 北大核心 2024年第10期2937-2952,共16页
利用有限元方法对几何结构复杂的电机和变压器进行磁场分析,存在仿真时间长且无法复用的问题。因此,该文提出一种基于残差U-Net和自注意力Transformer编码器的磁场预测方法。首先建立永磁同步电机(PMSM)和非晶合金变压器(AMT)有限元模型... 利用有限元方法对几何结构复杂的电机和变压器进行磁场分析,存在仿真时间长且无法复用的问题。因此,该文提出一种基于残差U-Net和自注意力Transformer编码器的磁场预测方法。首先建立永磁同步电机(PMSM)和非晶合金变压器(AMT)有限元模型,得到深度学习训练所需的数据集;然后将Transformer模块与U-Net模型结合,并引入短残差机制建立ResUnet-Transformer模型,通过预测图像的像素实现磁场预测;最后通过Targeted Dropout算法和动态学习率调整策略对模型进行优化,解决拟合问题并提高预测精度。计算实例证明,ResUnet-Transformer模型在PMSM和AMT数据集上测试集的平均绝对百分比误差(MAPE)均小于1%,且仅需500组样本。该文提出的磁场预测方法能减少实际工况和多工况下精细模拟和拓扑优化的时间和资源消耗,亦是虚拟传感器乃至数字孪生的关键实现方法之一。 展开更多
关键词 有限元方法 电磁场 深度学习 U-net transformER
下载PDF
基于特征融合Transformer的EfficientNet v2网络对马铃薯叶片病害的识别 被引量:1
4
作者 孙剑明 毕振宇 牛连丁 《江苏农业科学》 北大核心 2024年第8期166-176,共11页
马铃薯叶片病害是影响马铃薯质量和产量的主要因素,为了能够快速准确地识别马铃薯叶片病害并采取对应的防控和救治措施,本研究提出一种新型马铃薯叶片病害识别方法。该方法利用EfficientNet v2网络提取图像特征,通过4个不同尺度的网络... 马铃薯叶片病害是影响马铃薯质量和产量的主要因素,为了能够快速准确地识别马铃薯叶片病害并采取对应的防控和救治措施,本研究提出一种新型马铃薯叶片病害识别方法。该方法利用EfficientNet v2网络提取图像特征,通过4个不同尺度的网络层进行金字塔融合,从而捕捉不同尺度下的图像细节和上下文信息,并在金字塔融合中的每个下采样环节都添加1个CBAM注意力机制模块,且每个CBAM模块后都加入Vision Transformer的Encoder模块进行特征增强,帮助提升所提取特征的丰富性和抽象能力,最后使用softmax进行分类。研究提出的模型识别准确率达到98.26%,相比改进之前提升3.47百分点,且其loss收敛更快,宏平均值与加权平均值都有明显提升。消融试验表明,该模型在各项指标上的表现最优,超过基线模型和融合模型,大幅提高图像分类识别任务模型的性能表现。该方法可有效提高病害区域的识别能力和检测准确率,且能在强干扰的环境下做到高精度识别,具有良好的鲁棒性和适应性,同时能解决病害识别中泛化能力弱、精度低、计算效率低等问题。 展开更多
关键词 农业 马铃薯叶片病害 图像识别 卷积神经网络 特征融合 transformer模型
下载PDF
GFENet:基于Transformer的高效医学图像分割网络
5
作者 孙红 朱江明 +3 位作者 吴一凡 徐广辉 任丽博 杨晨 《小型微型计算机系统》 CSCD 北大核心 2024年第7期1728-1733,共6页
医学图像分割技术在疾病诊断中发挥着重要作用,针对传统网络分割模型中存在参数量大、网络计算效率低等问题,本文提出名为GFENet的高性能低复杂度分割网络,GFENet以金字塔结构的视觉Transformer作为网络主干提取图像特征,分别采用线性... 医学图像分割技术在疾病诊断中发挥着重要作用,针对传统网络分割模型中存在参数量大、网络计算效率低等问题,本文提出名为GFENet的高性能低复杂度分割网络,GFENet以金字塔结构的视觉Transformer作为网络主干提取图像特征,分别采用线性预测模块和渐进式局域解码器对提取出来的低级特征和高级特征进行局部增强处理,最后采用GFE模块中的全局注意力机制将位置信息嵌入高级特征.在Kvasir和CVC-ClinicDB数据集上进行实验验证,GFENet的mDice分别为94.1%和94.6%;其在CVC-ColonDB和ETIS数据集上的泛化性能优于其他对比模型.为验证模型低复杂度的同时保持高分割准确率,本文将GFENet与现有的高性能模型和轻量化模型进行对比,GFENet在CVC-ColonDB数据集上以81.5%的mDice高于其它对比模型,以23.1M的参数量优于其他高性能分割模型. 展开更多
关键词 图像分割 transformER GFEnet 全局注意力机制 息肉分割
下载PDF
BBTUNet:基于上下文Transformer的肝脏肿瘤分割算法研究
6
作者 宋长明 宋蒙 +2 位作者 肖露 梁朝阳 彩朔 《电子设计工程》 2024年第5期190-195,共6页
肝癌是世界范围内最常见的恶性肿瘤之一,严重威胁着人类的生命健康,从计算机断层扫描(Computed Tomography,CT)中精确分割出肝脏肿瘤对后期的临床诊断具有重要的意义。现有的方法虽然实现了肝脏肿瘤的自动化分割,但肝脏肿瘤边界模糊、... 肝癌是世界范围内最常见的恶性肿瘤之一,严重威胁着人类的生命健康,从计算机断层扫描(Computed Tomography,CT)中精确分割出肝脏肿瘤对后期的临床诊断具有重要的意义。现有的方法虽然实现了肝脏肿瘤的自动化分割,但肝脏肿瘤边界模糊、目标较小、容易漏检等问题尚未很好地解决,肝脏肿瘤的精确分割仍旧是一项极具挑战的任务。针对这些问题,该文提出一种新的分割网络BBTUNet。构建基于Transformer的上下文Bridge,重新设计UNet的跳跃连接结构,有效捕捉多尺度特征之间的上下文关系。在Transformer的前馈神经网络中引入可分离的空洞卷积,提出改进的前馈神经网络BFFN,有效融合全局和局部信息,增强边界特征,细化分割边缘。在3DIRCADB数据集上对模型进行训练和测试,实验结果表明,提出的BBTUNet网络的Dice系数为82.1%,ACC为96.4%,相较于UNet网络,分别提升了10.9%、4.6%,且对于小尺寸、低对比度、边界模糊的肿瘤分割具有显著优势。 展开更多
关键词 肝肿瘤分割 Unet transformER 上下文Bridge
下载PDF
基于CNN-Swin Transformer Network的LPI雷达信号识别
7
作者 苏琮智 杨承志 +2 位作者 邴雨晨 吴宏超 邓力洪 《现代雷达》 CSCD 北大核心 2024年第3期59-65,共7页
针对在低信噪比(SNR)条件下,低截获概率雷达信号调制方式识别准确率低的问题,提出一种基于Transformer和卷积神经网络(CNN)的雷达信号识别方法。首先,引入Swin Transformer模型并在模型前端设计CNN特征提取层构建了CNN+Swin Transforme... 针对在低信噪比(SNR)条件下,低截获概率雷达信号调制方式识别准确率低的问题,提出一种基于Transformer和卷积神经网络(CNN)的雷达信号识别方法。首先,引入Swin Transformer模型并在模型前端设计CNN特征提取层构建了CNN+Swin Transformer网络(CSTN),然后利用时频分析获取雷达信号的时频特征,对图像进行预处理后输入CSTN模型进行训练,由网络的底部到顶部不断提取图像更丰富的语义信息,最后通过Softmax分类器对六类不同调制方式信号进行分类识别。仿真实验表明:在SNR为-18 dB时,该方法对六类典型雷达信号的平均识别率达到了94.26%,证明了所提方法的可行性。 展开更多
关键词 低截获概率雷达 信号调制方式识别 Swin transformer网络 卷积神经网络 时频分析
下载PDF
基于多尺度U-Net与Transformer特征融合的航空遥感图像飞机检测方法
8
作者 张善文 邵彧 +1 位作者 李萍 令伟锋 《弹箭与制导学报》 北大核心 2024年第3期51-58,共8页
航空遥感图像(ARSI)飞机检测一直是一个重要且具有挑战性的课题。针对现有ARSI飞机检测方法(ARSIAD)检测目标的边缘模糊、小目标的检测精度低、没有充分利用ARSI的全局上下文信息等问题,提出一种基于多尺度U-Net与Transformer(MSU-Trans... 航空遥感图像(ARSI)飞机检测一直是一个重要且具有挑战性的课题。针对现有ARSI飞机检测方法(ARSIAD)检测目标的边缘模糊、小目标的检测精度低、没有充分利用ARSI的全局上下文信息等问题,提出一种基于多尺度U-Net与Transformer(MSU-Trans)特征融合的ARSIAD方法。通过多尺度卷积模块Inception提取ARSI中多样性目标的分类特征,通过Transformer增强模型的全局语义检测性能,通过特征融合模块整合高层和低层特征,得到航空目标图像完整的边缘和纹理特征。该模型结合多尺度U-Net较强的局部特征提取能力和Transformer较强的全局上下文依存关系提取能力,进而提高MSU-Trans的整体检测性能。在ARSI集上的试验表明,与U-Net、多尺度U-Net、注意力U-Nets相比,MSU-Trans具有较高的检测精度,精度超过95%,该方法为ARSIAD提供一定的技术支撑。 展开更多
关键词 航空遥感图像飞机检测 多尺度U-net transformER 多尺度U-nettransformer
下载PDF
ResoNet:Robust and Explainable ENSO Forecasts with Hybrid Convolution and Transformer Networks 被引量:1
9
作者 Pumeng LYU Tao TANG +4 位作者 Fenghua LING Jing-Jia LUO Niklas BOERS Wanli OUYANG Lei BAI 《Advances in Atmospheric Sciences》 SCIE CAS CSCD 2024年第7期1289-1298,共10页
Recent studies have shown that deep learning(DL)models can skillfully forecast El Niño–Southern Oscillation(ENSO)events more than 1.5 years in advance.However,concerns regarding the reliability of predictions ma... Recent studies have shown that deep learning(DL)models can skillfully forecast El Niño–Southern Oscillation(ENSO)events more than 1.5 years in advance.However,concerns regarding the reliability of predictions made by DL methods persist,including potential overfitting issues and lack of interpretability.Here,we propose ResoNet,a DL model that combines CNN(convolutional neural network)and transformer architectures.This hybrid architecture enables our model to adequately capture local sea surface temperature anomalies as well as long-range inter-basin interactions across oceans.We show that ResoNet can robustly predict ENSO at lead times of 19 months,thus outperforming existing approaches in terms of the forecast horizon.According to an explainability method applied to ResoNet predictions of El Niño and La Niña from 1-to 18-month leads,we find that it predicts the Niño-3.4 index based on multiple physically reasonable mechanisms,such as the recharge oscillator concept,seasonal footprint mechanism,and Indian Ocean capacitor effect.Moreover,we demonstrate for the first time that the asymmetry between El Niño and La Niña development can be captured by ResoNet.Our results could help to alleviate skepticism about applying DL models for ENSO prediction and encourage more attempts to discover and predict climate phenomena using AI methods. 展开更多
关键词 deep learning ENSO CNN transformER
下载PDF
融合MobileNet与Contextual Transformer的人脸识别研究 被引量:1
10
作者 陈经纬 熊继平 程汉权 《智能计算机与应用》 2024年第3期61-66,共6页
FaceNet作为人脸识别的一大跨越,以其高精度、低硬件配置等优势被广泛应用于各个人脸识别相关领域。本文开源了首个餐厅支付场景下的中国人脸数据集CN-Face,该数据集拥有13000人的人脸图像,总计100000张。此外,本文以CA-SIA-WebFace作... FaceNet作为人脸识别的一大跨越,以其高精度、低硬件配置等优势被广泛应用于各个人脸识别相关领域。本文开源了首个餐厅支付场景下的中国人脸数据集CN-Face,该数据集拥有13000人的人脸图像,总计100000张。此外,本文以CA-SIA-WebFace作为训练集,利用改进后的MobileNet主干网络,采取不同的注意力机制添加方法,改变激活函数并且融入Contextual Transformer模块,大大降低了参数量和识别速度,显著提升了人脸识别精度。相较于原版FaceNet,在LFW测试集下,准确率达到98.79%,提升了2.74%,在CN-Face数据集中准确率达到95.22%,提升了1.35%。 展开更多
关键词 ECA注意力机制 人脸识别 Facenet 深度学习 Contextual transformer
下载PDF
采用融合ResNet和Transformer的U-Net进行疟疾感染红细胞分割
11
作者 刘潇霜 张伟 《中国医学物理学杂志》 CSCD 2024年第2期191-197,共7页
针对疟疾感染红细胞图像分割模型分割性能不高的问题,提出一种改进的U-Net网络模型,融合ResNet和Transformer。首先编码器部分使用ResNet,加深特征提取网络,以提取更深层次的特征;然后将ResNet输出传入Transformer模块进行目标区域特征... 针对疟疾感染红细胞图像分割模型分割性能不高的问题,提出一种改进的U-Net网络模型,融合ResNet和Transformer。首先编码器部分使用ResNet,加深特征提取网络,以提取更深层次的特征;然后将ResNet输出传入Transformer模块进行目标区域特征的加强;最后通过解码器模块进行特征融合并输出结果。在疟疾显微图像数据集上,本文方法的Dice相似系数、平均交并比、类别平均像素准确率均优于U-Net网络,分别达到了87.40%、76.85%、85.28%。本文方法可以提高疟疾感染红细胞图像的分割精度,为疟疾诊断提供更有效和准确的解决方案。 展开更多
关键词 疟疾 U-net transformER 语义分割
下载PDF
融合SENet和Transformer的应用层协议识别方法 被引量:1
12
作者 陈乾 洪征 司健鹏 《计算机科学与探索》 CSCD 北大核心 2024年第3期805-817,共13页
协议识别技术在网络通信和信息安全领域具有至关重要的地位和作用。针对现有基于时空特征的协议识别方法提取协议特征不充分、不全面的问题,提出了一种基于SENet和Transformer的应用层协议识别方法。该方法关注协议数据的时空特征,由加... 协议识别技术在网络通信和信息安全领域具有至关重要的地位和作用。针对现有基于时空特征的协议识别方法提取协议特征不充分、不全面的问题,提出了一种基于SENet和Transformer的应用层协议识别方法。该方法关注协议数据的时空特征,由加入SENet注意力的残差网络构成的空间特征提取模块和Trans-former网络编码器构成的时间提取模块组成。空间特征提取阶段,在残差网络结构中加入SE块获取多个卷积通道间的联系,自适应地为通道分配权重,提取不同通道中更加活跃的协议空间特征;时间特征提取阶段,由基于多头注意力机制的Transformer编码器通过堆叠的方式构建时间特征提取模块,利用输入数据的位置信息全面地获取协议数据的时间特征。通过对更加充足的空间特征和更加全面的时间特征的提取和学习,可以获得更有效的协议识别信息,进而提高协议识别性能。在ISCX2012和CSE_CIC_IDS2018混合数据集上的实验结果表明,所提模型的总体识别准确率达到99.20%,F1值达到98.99%,高于对比模型。 展开更多
关键词 SEnet 残差网络 自注意力 transformER 协议识别 网络安全
下载PDF
DRT Net:面向特征增强的双残差Res-Transformer肺炎识别模型
13
作者 周涛 彭彩月 +3 位作者 杜玉虎 党培 刘凤珍 陆惠玲 《光学精密工程》 EI CAS CSCD 北大核心 2024年第5期714-726,共13页
针对肺部X射线图像的病灶区域较小、形状复杂,与正常组织间的边界模糊,使得肺炎图像中的病灶特征提取不充分的问题,提出了一个面向特征增强的双残差Res-Transformer肺炎识别模型,设计3种不同的特征增强策略对模型特征提取能力进行增强... 针对肺部X射线图像的病灶区域较小、形状复杂,与正常组织间的边界模糊,使得肺炎图像中的病灶特征提取不充分的问题,提出了一个面向特征增强的双残差Res-Transformer肺炎识别模型,设计3种不同的特征增强策略对模型特征提取能力进行增强。设计了组注意力双残差模块(GADRM),采用双残差结构进行高效的特征融合,将双残差结构与通道混洗、通道注意力、空间注意力结合,增强模型对于病灶区域特征的提取能力;在网络的高层采用全局局部特征提取模块(GLFEM),结合CNN和Transformer的优势使网络充分提取图像的全局和局部特征,获得高层语义信息的全局特征,进一步增强网络的语义特征提取能力;设计了跨层双注意力特征融合模块(CDAFFM),融合浅层网络的空间信息以及深层网络的通道信息,对网络提取到的跨层特征进行增强。为了验证本文模型的有效性,分别在COVID-19 CHEST X-RAY数据集上进行消融实验和对比实验。实验结果表明,本文所提出网络的准确率、精确率、召回率,F1值和AUC值分别为98.41%,94.42%,94.20%,94.26%和99.65%。DRT Net能够帮助放射科医生使用胸部X光片对肺炎进行诊断,具有重要的临床作用。 展开更多
关键词 肺炎识别 X射线图像 特征增强 双残差结构 transformer
下载PDF
基于Transformer增强型U-net的CT图像稀疏重建与伪影抑制
14
作者 樊雪林 文昱齐 乔志伟 《CT理论与应用研究(中英文)》 2024年第1期1-12,共12页
实现低剂量计算机断层成像(CT)的一个有效办法是减少投影角度,但投影角度较少会产生严重的条状伪影,降低图像的临床使用价值。针对该问题,提出一种耦合卷积神经网络(CNN)和多种注意力机制的U型网络(TE-unet)。首先采用U型架构提取多尺... 实现低剂量计算机断层成像(CT)的一个有效办法是减少投影角度,但投影角度较少会产生严重的条状伪影,降低图像的临床使用价值。针对该问题,提出一种耦合卷积神经网络(CNN)和多种注意力机制的U型网络(TE-unet)。首先采用U型架构提取多尺度特征信息;其次提出一个包含CNN和多种注意力的模块提取图像特征;最后在跳跃连接处加入Transformer块过滤信息,抑制不相关特征,突出重要特征。所提网络结合CNN的局部特征提取能力和Transformer的全局信息捕获能力,辅以多种注意力机制,实现了良好的去条状伪影能力。在60个投影角度下,与经典的Uformer网络相比,峰值信噪比(PSNR)高出0.3178 dB,结构相似度(SSIM)高出0.002,均方根误差(RMSE)降低0.0005。实验结果表明,所提TE-unet重建的图像精度更高,图像细节保留的更好,可以更好地压制条状伪影。 展开更多
关键词 稀疏重建 计算机断层成像 transformER 多注意力机制 条状伪影
下载PDF
基于U-Net融合Transformer的肺结节分割方法研究
15
作者 李晓东 丁鹏 《中国医疗设备》 2024年第5期31-36,98,共7页
目的提出肺结节分割模型,实现肺结节分割。方法在U-Net神经网络中加入编码器、空洞卷积以及Swin Transformer模块,提出一个将空洞卷积、编码器和注意力机制相结合的模型,并在LUNA16公共数据集上验证模型性能。结果改进的模型在LUNA16公... 目的提出肺结节分割模型,实现肺结节分割。方法在U-Net神经网络中加入编码器、空洞卷积以及Swin Transformer模块,提出一个将空洞卷积、编码器和注意力机制相结合的模型,并在LUNA16公共数据集上验证模型性能。结果改进的模型在LUNA16公共数据集上进行肺结节分割的准确度(Accuracy,ACC)、特异性(Specificity,SP)、交并比(Intersection Over Union,IOU)和Dice系数(Dice Similarity Coefficient,DSC)分别为0.9651、0.9572、0.8354、0.8971。结论该分割模型在ACC、SP、IOU和DSC方面表现优异,可辅助医生诊断,在临床肺结节分割方面具有一定的参考价值。 展开更多
关键词 肺结节 肺结节分割 U-net神经网络 Swin transformer模块
下载PDF
从U-Net到Transformer:深度模型在医学图像分割中的应用综述
16
作者 张玮智 于谦 +2 位作者 苏金善 乎西旦·居马洪 林玲 《计算机应用》 CSCD 北大核心 2024年第S01期204-222,共19页
精准分割医学图像中的病灶对医生探寻病因和制定诊疗方案起关键作用,计算机视觉技术的发展促使深度学习在医学图像分割领域衍生出多种模型架构。U-Net架构以其巧妙的跳跃连接、易于优化的模块设计成为这一领域的基准模型。然而,U-Net以... 精准分割医学图像中的病灶对医生探寻病因和制定诊疗方案起关键作用,计算机视觉技术的发展促使深度学习在医学图像分割领域衍生出多种模型架构。U-Net架构以其巧妙的跳跃连接、易于优化的模块设计成为这一领域的基准模型。然而,U-Net以卷积神经网络(CNN)为主干,在长期建模依赖关系方面只擅长获取局部特征,基于CNN的各项方法在执行分割任务中缺乏对图像长期相关性的解释,无法提取全局特征。为帮助本领域学者了解U-Net的发展历程及研究现状,以问题为导向对2016-2023年U-Net改进工作进行综述。首先,从改进结构位置的角度对U-Net及其各项改进模型进行叙述,探讨各工作的研究目的和创新设计及不足之处;其次,对Transformer与U-Net的结合方式进行分析,从中获取改进工作的研究动向;最后,在Synapse和ACDC数据集上进行对比实验,通过实验分析和可视化结果表明,Transformer方法在分割精度方面有显著优势,特别是混合网络子块的结合方式,在确保模型性能的同时兼顾效率,证明了该类工作有着广阔的发展前景和研究价值。 展开更多
关键词 医学图像分割 U-net 结构改进 transformER 深度神经网络
下载PDF
基于Swin Transformer和UNet的肺结节分割方法
17
作者 裔馥华 张在房 《计量与测试技术》 2024年第1期44-48,共5页
肺结节的准确分割是后续良恶性分析和诊断的关键。由于基于卷积神经网络的分割模型受限于局部特征提取特性,忽略了全局特征。因此,本文提出了一种新的肺结节语义分割框架ST-UNet网络,将Swin Transformer嵌入UNet中,构成一种新颖的Swin T... 肺结节的准确分割是后续良恶性分析和诊断的关键。由于基于卷积神经网络的分割模型受限于局部特征提取特性,忽略了全局特征。因此,本文提出了一种新的肺结节语义分割框架ST-UNet网络,将Swin Transformer嵌入UNet中,构成一种新颖的Swin Transformer和CNN并行的双编码器结构。结果表明:该模型不仅对肺结节的分割具有较好的性能,而且对医生进行肺结节的早期诊断具有重要的临床意义和应用价值。 展开更多
关键词 肺结节分割 Swin transformer Unet
下载PDF
USformer-Net:基于U-Net和Swin Transformer的脑部MRI图像质量评价方法
18
作者 李沛钊 王同罕 +1 位作者 贾惠珍 吴通 《现代电子技术》 北大核心 2024年第7期1-7,共7页
针对现有的脑部MRI图像质量评价方法准确率低、难以应用于实际临床环境中的问题,提出一种基于提取感兴趣区域的脑部MRI图像质量自动评价模型USformer-Net,并创建了带有主观质量评价标签的脑部MRI图像数据集。USformer-Net模型基于U-Net... 针对现有的脑部MRI图像质量评价方法准确率低、难以应用于实际临床环境中的问题,提出一种基于提取感兴趣区域的脑部MRI图像质量自动评价模型USformer-Net,并创建了带有主观质量评价标签的脑部MRI图像数据集。USformer-Net模型基于U-Net和Swin Transformer模型构建并针对脑部MRI图像的特殊性进行了改进。首先,利用轻量化的U-Net网络对具有临床诊断价值的大脑主要区域进行分割,提取出感兴趣区域;其次,利用Swin Transformer的串联窗口自注意力运算(W-MSA)、滑动窗口自注意力运算(SW-MSA)以及其特征融合方式,将特征金字塔(FPN)、兴趣区域匹配(ROI Align)及全连接网络(FC)结合在Swin Transformer骨干特征提取网络中进行图像质量评价。USformer-Net模型能够忽略无关噪声,准确提取出影响诊断的主要区域并进行图像质量评价。实验结果表明,在MRI图像质量评价任务中该模型准确率为87.84%,精度为91.84%,召回率为92.05%,F1-score为91.99%,相较于其他评价方法各项指标均有不同程度提升。最终结果显示该模型能够有效保证脑部MRI图像质量评价的准确性,创建的带有主观质量评价标签的数据集也为该领域的研究提供了更好的数据支持。 展开更多
关键词 图像质量评价 脑部MRI图像 深度学习 图像分割 U-net transformER
下载PDF
Description of martensitic transformation kinetics in Fe-C-X(X = Ni,Cr,Mn,Si) system by a modified model
19
作者 Xiyuan Geng Hongcan Chen +3 位作者 Jingjing Wang Yu Zhang Qun Luo Qian Li 《International Journal of Minerals,Metallurgy and Materials》 SCIE EI CAS CSCD 2024年第5期1026-1036,共11页
Controlling the content of athermal martensite and retained austenite is important to improving the mechanical properties of high-strength steels,but a mechanism for the accurate description of martensitic transformat... Controlling the content of athermal martensite and retained austenite is important to improving the mechanical properties of high-strength steels,but a mechanism for the accurate description of martensitic transformation during the cooling process must be addressed.At present,frequently used semi-empirical kinetics models suffer from huge errors at the beginning of transformation,and most of them fail to exhibit the sigmoidal shape characteristic of transformation curves.To describe the martensitic transformation process accurately,based on the Magee model,we introduced the changes in the nucleation activation energy of martensite with temperature,which led to the varying nucleation rates of this model during martensitic transformation.According to the calculation results,the relative error of the modified model for the martensitic transformation kinetics curves of Fe-C-X(X = Ni,Cr,Mn,Si) alloys reached 9.5% compared with those measured via the thermal expansion method.The relative error was approximately reduced by two-thirds compared with that of the Magee model.The incorporation of nucleation activation energy into the kinetics model contributes to the improvement of its precision. 展开更多
关键词 Fe-C-X system martensitic transformation kinetics curve semi-empirical model nucleation activation energy
下载PDF
ST-LaneNet: Lane Line Detection Method Based on Swin Transformer and LaneNet
20
作者 Yufeng Du Rongyun Zhang +3 位作者 Peicheng Shi Linfeng Zhao Bin Zhang Yaming Liu 《Chinese Journal of Mechanical Engineering》 SCIE EI CAS CSCD 2024年第1期130-145,共16页
The advancement of autonomous driving heavily relies on the ability to accurate lane lines detection.As deep learning and computer vision technologies evolve,a variety of deep learning-based methods for lane line dete... The advancement of autonomous driving heavily relies on the ability to accurate lane lines detection.As deep learning and computer vision technologies evolve,a variety of deep learning-based methods for lane line detection have been proposed by researchers in the field.However,owing to the simple appearance of lane lines and the lack of distinctive features,it is easy for other objects with similar local appearances to interfere with the process of detecting lane lines.The precision of lane line detection is limited by the unpredictable quantity and diversity of lane lines.To address the aforementioned challenges,we propose a novel deep learning approach for lane line detection.This method leverages the Swin Transformer in conjunction with LaneNet(called ST-LaneNet).The experience results showed that the true positive detection rate can reach 97.53%for easy lanes and 96.83%for difficult lanes(such as scenes with severe occlusion and extreme lighting conditions),which can better accomplish the objective of detecting lane lines.In 1000 detection samples,the average detection accuracy can reach 97.83%,the average inference time per image can reach 17.8 ms,and the average number of frames per second can reach 64.8 Hz.The programming scripts and associated models for this project can be accessed openly at the following GitHub repository:https://github.com/Duane 711/Lane-line-detec tion-ST-LaneNet. 展开更多
关键词 Autonomous driving Lane line detection Deep learning Swin transformer
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部