期刊文献+
共找到940,776篇文章
< 1 2 250 >
每页显示 20 50 100
基于Depth-wise卷积和视觉Transformer的图像分类模型 被引量:3
1
作者 张峰 黄仕鑫 +1 位作者 花强 董春茹 《计算机科学》 CSCD 北大核心 2024年第2期196-204,共9页
图像分类作为一种常见的视觉识别任务,有着广阔的应用场景。在处理图像分类问题时,传统的方法通常使用卷积神经网络,然而,卷积网络的感受野有限,难以建模图像的全局关系表示,导致分类精度低,难以处理复杂多样的图像数据。为了对全局关... 图像分类作为一种常见的视觉识别任务,有着广阔的应用场景。在处理图像分类问题时,传统的方法通常使用卷积神经网络,然而,卷积网络的感受野有限,难以建模图像的全局关系表示,导致分类精度低,难以处理复杂多样的图像数据。为了对全局关系进行建模,一些研究者将Transformer应用于图像分类任务,但为了满足Transformer的序列化和并行化要求,需要将图像分割成大小相等、互不重叠的图像块,破坏了相邻图像数据块之间的局部信息。此外,由于Transformer具有较少的先验知识,模型往往需要在大规模数据集上进行预训练,因此计算复杂度较高。为了同时建模图像相邻块之间的局部信息并充分利用图像的全局信息,提出了一种基于Depth-wise卷积的视觉Transformer(Efficient Pyramid Vision Transformer,EPVT)模型。EPVT模型可以实现以较低的计算成本提取相邻图像块之间的局部和全局信息。EPVT模型主要包含3个关键组件:局部感知模块(Local Perceptron Module,LPM)、空间信息融合模块(Spatial Information Fusion,SIF)和“+卷积前馈神经网络(Convolution Feed-forward Network,CFFN)。LPM模块用于捕获图像的局部相关性;SIF模块用于融合相邻图像块之间的局部信息,并利用不同图像块之间的远距离依赖关系,提升模型的特征表达能力,使模型学习到输出特征在不同维度下的语义信息;CFFN模块用于编码位置信息和重塑张量。在图像分类数据集ImageNet-1K上,所提模型优于现有的同等规模的视觉Transformer分类模型,取得了82.6%的分类准确度,证明了该模型在大规模数据集上具有竞争力。 展开更多
关键词 深度学习 图像分类 Depth-wise卷积 视觉transformer 注意力机制
下载PDF
CNN-Transformer特征融合多目标跟踪算法 被引量:3
2
作者 张英俊 白小辉 谢斌红 《计算机工程与应用》 CSCD 北大核心 2024年第2期180-190,共11页
在卷积神经网络(CNN)中,卷积运算能高效地提取目标的局部特征,却难以捕获全局表示;而在视觉Transformer中,注意力机制可以捕获长距离的特征依赖,但会忽略局部特征细节。针对以上问题,提出一种基于CNN-Transformer双分支主干网络进行特... 在卷积神经网络(CNN)中,卷积运算能高效地提取目标的局部特征,却难以捕获全局表示;而在视觉Transformer中,注意力机制可以捕获长距离的特征依赖,但会忽略局部特征细节。针对以上问题,提出一种基于CNN-Transformer双分支主干网络进行特征提取和融合的多目标跟踪算法CTMOT(CNN-transformer multi-object tracking)。使用基于CNN和Transformer双分支并行的主干网络分别提取图像的局部和全局特征。使用双向桥接模块(two-way braidge module,TBM)对两种特征进行充分融合。将融合后的特征输入两组并行的解码器进行处理。将解码器输出的检测框和跟踪框进行匹配,完成多目标跟踪任务。在多目标跟踪数据集MOT17、MOT20、KITTI以及UADETRAC上进行评估,CTMOT算法的MOTP和IDs指标在四个数据集上均达到了SOTA效果,MOTA指标分别达到了76.4%、66.3%、92.36%和88.57%,在MOT数据集上与SOTA方法效果相当,在KITTI数据集上达到SOTA效果。由于同时完成目标检测和关联,能够端到端进行目标跟踪,跟踪速度可达35 FPS,表明CTMOT算法在跟踪的实时性和准确性上达到了较好的平衡,具有较大潜力。 展开更多
关键词 多目标跟踪 transformER 特征融合
下载PDF
基于残差U-Net和自注意力Transformer编码器的磁场预测方法 被引量:1
3
作者 金亮 尹振豪 +2 位作者 刘璐 宋居恒 刘元凯 《电工技术学报》 EI CSCD 北大核心 2024年第10期2937-2952,共16页
利用有限元方法对几何结构复杂的电机和变压器进行磁场分析,存在仿真时间长且无法复用的问题。因此,该文提出一种基于残差U-Net和自注意力Transformer编码器的磁场预测方法。首先建立永磁同步电机(PMSM)和非晶合金变压器(AMT)有限元模型... 利用有限元方法对几何结构复杂的电机和变压器进行磁场分析,存在仿真时间长且无法复用的问题。因此,该文提出一种基于残差U-Net和自注意力Transformer编码器的磁场预测方法。首先建立永磁同步电机(PMSM)和非晶合金变压器(AMT)有限元模型,得到深度学习训练所需的数据集;然后将Transformer模块与U-Net模型结合,并引入短残差机制建立ResUnet-Transformer模型,通过预测图像的像素实现磁场预测;最后通过Targeted Dropout算法和动态学习率调整策略对模型进行优化,解决拟合问题并提高预测精度。计算实例证明,ResUnet-Transformer模型在PMSM和AMT数据集上测试集的平均绝对百分比误差(MAPE)均小于1%,且仅需500组样本。该文提出的磁场预测方法能减少实际工况和多工况下精细模拟和拓扑优化的时间和资源消耗,亦是虚拟传感器乃至数字孪生的关键实现方法之一。 展开更多
关键词 有限元方法 电磁场 深度学习 U-Net transformER
下载PDF
基于遥感多参数和CNN-Transformer的冬小麦单产估测 被引量:2
4
作者 王鹏新 杜江莉 +3 位作者 张悦 刘峻明 李红梅 王春梅 《农业机械学报》 EI CAS CSCD 北大核心 2024年第3期173-182,共10页
为了提高冬小麦单产估测精度,改善估产模型存在的高产低估和低产高估等现象,以陕西省关中平原为研究区域,选取旬尺度条件植被温度指数(VTCI)、叶面积指数(LAI)和光合有效辐射吸收比率(FPAR)为遥感特征参数,结合卷积神经网络(CNN)局部特... 为了提高冬小麦单产估测精度,改善估产模型存在的高产低估和低产高估等现象,以陕西省关中平原为研究区域,选取旬尺度条件植被温度指数(VTCI)、叶面积指数(LAI)和光合有效辐射吸收比率(FPAR)为遥感特征参数,结合卷积神经网络(CNN)局部特征提取能力和基于自注意力机制的Transformer网络的全局信息提取能力,构建CNN-Transformer深度学习模型,用于估测关中平原冬小麦产量。与Transformer模型(R^(2)为0.64,RMSE为465.40 kg/hm^(2),MAPE为8.04%)相比,CNN-Transformer模型具有更高的冬小麦单产估测精度(R^(2)为0.70,RMSE为420.39 kg/hm^(2),MAPE为7.65%),能够从遥感多参数中提取更多与产量相关的信息,且对于Transformer模型存在的高产低估和低产高估现象均有所改善。基于5折交叉验证法和留一法进一步验证了CNN-Transformer模型的鲁棒性和泛化能力。此外,基于CNN-Transformer模型捕获冬小麦生长过程的累积效应,分析逐步累积旬尺度输入参数对产量估测的影响,评估模型对于冬小麦不同生长阶段的累积过程的表征能力。结果表明,模型能有效捕捉冬小麦生长的关键时期,3月下旬至5月上旬是冬小麦生长的关键时期。 展开更多
关键词 冬小麦 作物估产 遥感多参数 卷积神经网络 transformer模型
下载PDF
Dual-Path Vision Transformer用于急性缺血性脑卒中辅助诊断
5
作者 张桃红 郭学强 +4 位作者 郑瀚 罗继昌 王韬 焦力群 唐安莹 《电子科技大学学报》 EI CAS CSCD 北大核心 2024年第2期307-314,共8页
急性缺血性脑卒中是由于脑组织血液供应障碍导致的脑功能障碍,数字减影脑血管造影(DSA)是诊断脑血管疾病的金标准。基于患者的正面和侧面DSA图像,对急性缺血性脑卒中的治疗效果进行分级评估,构建基于Vision Transformer的双路径图像分... 急性缺血性脑卒中是由于脑组织血液供应障碍导致的脑功能障碍,数字减影脑血管造影(DSA)是诊断脑血管疾病的金标准。基于患者的正面和侧面DSA图像,对急性缺血性脑卒中的治疗效果进行分级评估,构建基于Vision Transformer的双路径图像分类智能模型DPVF。为了提高辅助诊断速度,基于EdgeViT的轻量化设计思想进行了模型的构建;为了使模型保持轻量化的同时具有较高的精度,提出空间-通道自注意力模块,促进Transformer模型捕获更全面的特征信息,提高模型的表达能力;此外,对于DPVF的两分支的特征融合,构建交叉注意力模块对两分支输出进行交叉融合,促使模型提取更丰富的特征,从而提高模型表现。实验结果显示DPVF在测试集上的准确率达98.5%,满足实际需求。 展开更多
关键词 急性缺血性脑卒中 视觉transformer 双分支网络 特征融合
下载PDF
SVMD-PE-BP-Transformer短期光伏功率预测
6
作者 王瑞 靳鑫鑫 逯静 《电网与清洁能源》 CSCD 北大核心 2024年第8期141-150,共10页
考虑到光伏功率受气象因素变化影响而波动性大难以预测的问题,将逐次变分模态分解SVMD-排列熵PE与BPTransformer相结合,给出了一种组合预测方法,以下简称SPBT模型。在去除非相关因子的基础上,利用SOM聚类方法,对全年光伏数据进行3种类... 考虑到光伏功率受气象因素变化影响而波动性大难以预测的问题,将逐次变分模态分解SVMD-排列熵PE与BPTransformer相结合,给出了一种组合预测方法,以下简称SPBT模型。在去除非相关因子的基础上,利用SOM聚类方法,对全年光伏数据进行3种类型的分类;针对光伏发电初始时序中所蕴含的重要信息,利用SVMD自适应K值的方法,对其进行分解。再利用PE方法计算各个子序列的熵值,即序列的起伏复杂程度,根据熵的大小,对频率接近的成分进行重构,将其分为两个区间:复杂度低的部分和复杂度高的部分。最后利用BP网络与Transformer分别对其进行预测,并对预测输出进行综合处理。该文以江苏省一光伏电站观测的气象与功率数据为例,通过比较试验验证了该模型的优势,该模型具有较低的预测误差,有助于提高预测精度。 展开更多
关键词 逐次变分模态分解 排列熵 transformER 功率预测
下载PDF
FMA-DETR:一种无编码器的Transformer目标检测方法
7
作者 周全 倪英豪 +2 位作者 莫玉玮 康彬 张索非 《信号处理》 CSCD 北大核心 2024年第6期1160-1170,共11页
DETR是第一个将Transformer应用于目标检测的视觉模型。在DETR结构中,Transformer编码器对已高度编码的图像特征进行再编码,这在一定程度上导致了网络功能的重复。此外,由于Transformer编码器具有多层深度堆叠的结构和巨大的参数量,导... DETR是第一个将Transformer应用于目标检测的视觉模型。在DETR结构中,Transformer编码器对已高度编码的图像特征进行再编码,这在一定程度上导致了网络功能的重复。此外,由于Transformer编码器具有多层深度堆叠的结构和巨大的参数量,导致网络优化变得困难,模型收敛速度缓慢。本文设计了一种无编码器的Transformer目标检测网络模型。由于不需要引入Transformer编码器,本文的模型比DETR参数量更小、计算量更低、模型收敛速度更快。但是,直接去除Transformer编码器将降低网络的表达能力,导致Transformer解码器无法从数量庞大的图像特征中关注到包含目标的图像特征,从而使检测性能大幅降低。为了缓解这个问题,本文提出了一种混合特征注意力(fusion-feature mixing attention,FMA)机制,它通过自适应特征混合和通道交叉注意力弥补检测网络特征表达能力的下降,将其应用于Transformer解码器可以减轻由于去除Transformer编码器带来的性能降低。在MS-COCO数据集上,本文网络模型(称为FMA-DETR)实现了与DETR相近的性能表现,同时本文的模型拥有更快的收敛速度、更小的参数量以及更低的计算量。本文还进行了大量消融实验来验证所提出方法的有效性。 展开更多
关键词 目标检测 transformER 编码器 DETR 混合注意力
下载PDF
Transformer-CNN特征跨注意力融合学习的行人重识别
8
作者 项俊 张金城 +1 位作者 江小平 侯建华 《计算机工程与应用》 CSCD 北大核心 2024年第16期94-104,共11页
卷积神经网络(convolutional neural network,CNN)关注局部特征,难以获得全局结构信息,Transformer网络建模长距离的特征依赖,但易忽略局部特征细节。提出了一种跨注意力融合学习的行人重识别算法,利用CNN和Transformer特征学习网络的特... 卷积神经网络(convolutional neural network,CNN)关注局部特征,难以获得全局结构信息,Transformer网络建模长距离的特征依赖,但易忽略局部特征细节。提出了一种跨注意力融合学习的行人重识别算法,利用CNN和Transformer特征学习网络的特点,在丰富行人局部特征的同时改善特征的全局表达能力。该模型由三个部分构成:CNN分支主要提取局部细节信息;Transformer分支侧重于关注全局特征信息;跨注意力融合分支通过自注意力机制计算上述两个分支特征的相关性,进而实现特征融合,最终提高模型的表征能力。剥离实验以及在Market1501和DukeMTMC-reID数据集的实验结果证明了所提方法的有效性。 展开更多
关键词 行人重识别 卷积神经网络(CNN) transformER 跨注意力融合学习
下载PDF
CNN-Transformer结合对比学习的高光谱与LiDAR数据协同分类
9
作者 吴海滨 戴诗语 +2 位作者 王爱丽 岩堀祐之 于效宇 《光学精密工程》 EI CAS CSCD 北大核心 2024年第7期1087-1100,共14页
针对高光谱图像(hyperspectral images,HSI)与LiDAR数据多模态分类任务中的跨模态信息表达和特征对齐等问题,提出一种基于对比学习CNN-Transformer高光谱和LiDAR数据协同分类网络(Contrastive Learning based CNNTransformer Network,CL... 针对高光谱图像(hyperspectral images,HSI)与LiDAR数据多模态分类任务中的跨模态信息表达和特征对齐等问题,提出一种基于对比学习CNN-Transformer高光谱和LiDAR数据协同分类网络(Contrastive Learning based CNNTransformer Network,CLCT-Net)。CLCT-Net通过由ConvNeXt V2 Block构成的共有特征提取模块,获得不同模态间的共性特征,解决异构传感器数据之间语义对齐的问题。构建了包含空间-通道分支和光谱上下文分支的双分支HSI编码器,以及结合频域自注意力机制的LiDAR编码器,以获取更丰富的特征表示。利用集成对比学习进行分类,进一步提升多模态数据协同分类的精度。在Houston 2013和Trento数据集上的实验结果表明,相较于其他高光谱图像和Li‐DAR数据分类模型,本文所提模型获得了更高的地物分类精度,分别达到了92.01%和98.90%,实现了跨模态数据特征的深度挖掘和协同提取。 展开更多
关键词 高光谱图像 激光雷达数据 transformER 卷积神经网络 对比学习
下载PDF
基于MTF-Swin Transformer的风机齿轮箱故障诊断
10
作者 张彬桥 雷钧 万刚 《可再生能源》 CAS CSCD 北大核心 2024年第5期627-633,共7页
针对风机齿轮箱实际工况复杂多变及含有强噪声,传统故障诊断方法对风机齿轮箱故障诊断识别准确率较低的问题,文章提出了MTF-Swin Transformer风机齿轮箱故障诊断模型。首先,采用马尔科夫变迁场(MTF)图形编码方法将原始一维振动时序信号... 针对风机齿轮箱实际工况复杂多变及含有强噪声,传统故障诊断方法对风机齿轮箱故障诊断识别准确率较低的问题,文章提出了MTF-Swin Transformer风机齿轮箱故障诊断模型。首先,采用马尔科夫变迁场(MTF)图形编码方法将原始一维振动时序信号转化为具有关联时间信息的二维特征图谱;然后,将特征图谱作为Swin Transformer模型的输入,基于自注意力机制进行自动特征提取;最后,实现对不同故障类型的分类。仿真结果表明,该方法对齿轮箱故障诊断准确率达到了99.48%,证明了该方法的有效性和优越性。 展开更多
关键词 马尔科夫变迁场(MTF) Swin transformer 风机齿轮箱 故障诊断
下载PDF
基于INGO-Transformer的模拟电路元件故障预测
11
作者 杜先君 曹磊 《火力与指挥控制》 CSCD 北大核心 2024年第10期158-166,共9页
针对模拟电路元件易受外部环境影响发生故障、故障特征提取困难、无法准确预测及诊断元件故障等问题,基于Transformer模型提出改进INGO-Transformer方法。采用小波包分解(WPD)对原始数据进行特征提取,使用特征向量之间的三角距离来表征... 针对模拟电路元件易受外部环境影响发生故障、故障特征提取困难、无法准确预测及诊断元件故障等问题,基于Transformer模型提出改进INGO-Transformer方法。采用小波包分解(WPD)对原始数据进行特征提取,使用特征向量之间的三角距离来表征模拟电路中元件的退化状态,使用INGO优化Transformer的训练超参数构建预测模型。以Sallen-Key带通滤波电路与镜像电流源电路为预测实验对象进行故障预测实验,采用MAE与MSE作为故障预测模型评价指标,两组实验电路10次实验平均MAE、MSE结果分别为4.2162e-04、4.1906e-07和0.0017、1.9625e-05。仿真结果表明,所提方法在模拟电路单一元件故障预测中具有较高的准确性与较强的泛化能力。 展开更多
关键词 模拟电路 故障预测 小波包分解 transformER 优化算法
下载PDF
基于IWOA-Transformer的磨煤机故障预警
12
作者 罗毅 段明达 《动力工程学报》 CAS CSCD 北大核心 2024年第6期939-946,共8页
提出了一种基于改进鲸鱼算法优化Transformer网络超参数(IWOA-Transformer)的故障预警方法。该方法利用非线性收敛系数和高斯变异对鲸鱼算法(WOA)进行改进,以提高WOA的收敛速度和避免其陷入局部最优;再采用改进鲸鱼算法(IWOA)优化Transf... 提出了一种基于改进鲸鱼算法优化Transformer网络超参数(IWOA-Transformer)的故障预警方法。该方法利用非线性收敛系数和高斯变异对鲸鱼算法(WOA)进行改进,以提高WOA的收敛速度和避免其陷入局部最优;再采用改进鲸鱼算法(IWOA)优化Transformer的超参数,建立磨煤机故障预警模型;然后,通过预测值和实际值的相似度函数确定自适应阈值,结合专家系统判断故障类型并提出解决方案,实现磨煤机故障预警;最后,以某350 MW热电机组中速磨煤机为例进行故障预警试验。结果表明:所提IWOA-Transformer模型可显著提高预警速度和准确率,具有工程实用价值。 展开更多
关键词 transformer神经网络 鲸鱼优化算法 磨煤机 故障预警 专家系统
下载PDF
基于改进Transformer-BiLSTM的人体活动识别模型
13
作者 孙巍伟 毛亦鹏 +1 位作者 郑家春 梁毅玮 《电子测量技术》 北大核心 2024年第17期54-61,共8页
针对可穿戴传感器采集的时间序列往往具有维度高、噪声大等缺点导致活动识别方法准确率下降的问题,提出了基于改进Transformer-BiLSTM的人体活动识别模型。模型采用了Transformer编码器在处理长距离依赖和并行化计算方面的优势来提高序... 针对可穿戴传感器采集的时间序列往往具有维度高、噪声大等缺点导致活动识别方法准确率下降的问题,提出了基于改进Transformer-BiLSTM的人体活动识别模型。模型采用了Transformer编码器在处理长距离依赖和并行化计算方面的优势来提高序列特征提取的效率;随后将特征传递给添加了跳跃残差连接的双向长短期记忆网络,两次残差连接代替大量卷积层的同时保留了有效信息;提出了一种集成有时间信息编码的注意力层增强了模型的表达能力和对时序数据的理解能力。实验结果表明,该模型在公开数据集上的准确率达到了98.38%,有效提高了人体活动识别的准确率。 展开更多
关键词 步态识别 深度学习 transformER 双向长短期记忆网络 特征融合
下载PDF
基于Transformer-GRU并行网络的滚动轴承剩余寿命预测
14
作者 唐贵基 刘叔杭 +3 位作者 陈锦鹏 徐振丽 田寅初 徐鑫怡 《机床与液压》 北大核心 2024年第19期188-195,共8页
为有效描述滚动轴承性能退化趋势和准确预测其剩余寿命,提出一种基于多域特征融合的Transformer-GRU并行网络的滚动轴承剩余寿命预测方法。建立评价指标对滚动轴承振动信号的时域、频域和时频域等多域特征进行筛选,得到评分高的敏感特征... 为有效描述滚动轴承性能退化趋势和准确预测其剩余寿命,提出一种基于多域特征融合的Transformer-GRU并行网络的滚动轴承剩余寿命预测方法。建立评价指标对滚动轴承振动信号的时域、频域和时频域等多域特征进行筛选,得到评分高的敏感特征,获得退化特征集。利用自编码对退化特征集进行降维,减少数据复杂度和冗余度,得到滚动轴承的退化曲线。最后,利用Transformer-GRU并行网络进行剩余寿命预测,并将该方法运用到公开的轴承数据集分析中。结果表明:Transformer-GRU并行网络不仅可以高效准确地捕捉输入序列中的长期依赖关系,还能更好地处理时间序列之间的特征;该方法可以有效地预测滚动轴承剩余寿命,相比LSTM、GRU等经典方法更具优越性和泛化性。 展开更多
关键词 滚动轴承 剩余寿命预测 多域特征融合 transformER GRU
下载PDF
基于自适应噪声完全集合经验模态分解与BiLSTM-Transformer的锂离子电池剩余使用寿命预测
15
作者 刘斌 吉春霖 +2 位作者 曹丽君 武欣雅 段云凤 《电力系统保护与控制》 EI CSCD 北大核心 2024年第15期167-177,共11页
锂离子电池剩余使用寿命(remaining useful life,RUL)是使用者十分关心的问题,其涉及电池的更换时间和安全。针对锂离子电池的电容量非线性变化趋势,提出了一种基于自适应噪声完全集合经验模态分解与双向长短期记忆网络-Transformer的... 锂离子电池剩余使用寿命(remaining useful life,RUL)是使用者十分关心的问题,其涉及电池的更换时间和安全。针对锂离子电池的电容量非线性变化趋势,提出了一种基于自适应噪声完全集合经验模态分解与双向长短期记忆网络-Transformer的锂离子电池剩余使用寿命预测方法。首先,利用自适应噪声完全集合经验模态分解方法对锂离子电池电容量数据进行分解。其次,使用串联的双向长短期记忆神经网络和Transformer网络对分解后得到的残差序列和本征模态分量序列进行建模预测。最后,将预测的若干本征模态分量序列和残差序列进行求和,并对求和之后的最终预测数据与原始数据进行RUL预测。采用NASA公开的电池数据集对所提方法进行验证,结果表明,所提方法的平均绝对误差、均方根误差、平均绝对百分比误差和绝对误差控制分别控制在0.0173、0.0231、1.2084%和3个循环周期以内,能够有效地提高锂离子电池RUL的预测精度。 展开更多
关键词 锂离子电池 剩余使用寿命预测 transformer网络 双向长短期记忆网络 完全集合经验模态分解
下载PDF
基于Transformer-LSTM的闽南语唇语识别
16
作者 曾蔚 罗仙仙 王鸿伟 《泉州师范学院学报》 2024年第2期10-17,共8页
针对端到端句子级闽南语唇语识别的问题,提出一种基于Transformer和长短时记忆网络(LSTM)的编解码模型.编码器采用时空卷积神经网络及Transformer编码器用于提取唇读序列时空特征,解码器采用长短时记忆网络并结合交叉注意力机制用于文... 针对端到端句子级闽南语唇语识别的问题,提出一种基于Transformer和长短时记忆网络(LSTM)的编解码模型.编码器采用时空卷积神经网络及Transformer编码器用于提取唇读序列时空特征,解码器采用长短时记忆网络并结合交叉注意力机制用于文本序列预测.最后,在自建闽南语唇语数据集上进行实验.实验结果表明:模型能有效地提高唇语识别的准确率. 展开更多
关键词 唇语识别 闽南语 transformER 长短时记忆网络(LSTM) 用时空卷积神经网络 注意力机制 端到端模型
下载PDF
结合CSWin-Transformer和门卷积的壁画图像修复方法
17
作者 徐志刚 杨欣宇 《计算机工程与应用》 CSCD 北大核心 2024年第21期215-224,共10页
敦煌壁画是珍贵的文化遗产,但现存壁画存在着大量破损现象。针对现有图像修复方法在处理敦煌壁画时面临着计算复杂度高、纹理模糊和特征提取不足等问题,提出了一种结合CSWin-Transformer(cross stripe window-Transformer)和门卷积的壁... 敦煌壁画是珍贵的文化遗产,但现存壁画存在着大量破损现象。针对现有图像修复方法在处理敦煌壁画时面临着计算复杂度高、纹理模糊和特征提取不足等问题,提出了一种结合CSWin-Transformer(cross stripe window-Transformer)和门卷积的壁画图像修复方法。构建由全局层网络和局部层门卷积残差密集网络组成的并行网络,利用条纹窗口增强图像特征提取能力,并通过门卷积残差块提升结构纹理修复的准确性。设计全局-局部特征融合模块来融合全局层和局部层输出的特征图像,以保持修复结果整体的一致性。通过建立共享注意力机制实现全局层和局部层之间的信息交互,同时为了完成破损壁画的修复,采用谱归一化马尔科夫判别模型进行对抗训练。通过对真实破损壁画的修复实验,结果表明,所提方法在主客观指标上均优于所对比的方法。 展开更多
关键词 深度学习 壁画修复 门卷积 CSWin-transformer 全局-局部特征融合
下载PDF
LNG-Transformer:基于多尺度信息交互的图像分类网络 被引量:1
18
作者 王文杰 杨燕 +2 位作者 敬丽丽 王杰 刘言 《计算机科学》 CSCD 北大核心 2024年第2期189-195,共7页
鉴于Transformer的Self-Attention机制具有优秀的表征能力,许多研究者提出了基于Self-Attention机制的图像处理模型,并取得了巨大成功。然而,基于Self-Attention的传统图像分类网络无法兼顾全局信息和计算复杂度,限制了Self-Attention... 鉴于Transformer的Self-Attention机制具有优秀的表征能力,许多研究者提出了基于Self-Attention机制的图像处理模型,并取得了巨大成功。然而,基于Self-Attention的传统图像分类网络无法兼顾全局信息和计算复杂度,限制了Self-Attention的广泛应用。文中提出了一种有效的、可扩展的注意力模块Local Neighbor Global Self-Attention(LNG-SA),该模块在任意时期都能进行局部信息、邻居信息和全局信息的交互。通过重复级联LNG-SA模块,设计了一个全新的网络,称为LNG-Transformer。该网络整体采用层次化结构,具有优秀的灵活性,其计算复杂度与图像分辨率呈线性关系。LNG-SA模块的特性使得LNG-Transformer即使在早期的高分辨率阶段,也可以进行局部信息、邻居信息和全局信息的交互,从而带来更高的效率、更强的学习能力。实验结果表明,LNG-Transformer在图像分类任务中具有良好的性能。 展开更多
关键词 图像分类 自注意力机制 多尺度 transformER
下载PDF
基于Transformer-CNN的轻量级图像超分辨率重建网络 被引量:3
19
作者 陈豪 夏振平 +2 位作者 程成 林李兴 张博文 《计算机应用》 CSCD 北大核心 2024年第1期292-299,共8页
针对现有超分辨率重建网络具有较高的计算复杂度和存在大量内存消耗的问题,提出了一种基于Transformer-CNN的轻量级图像超分辨率重建网络,使超分辨率重建网络更适合应用于移动平台等嵌入式终端。首先,提出了一个基于Transformer-CNN的... 针对现有超分辨率重建网络具有较高的计算复杂度和存在大量内存消耗的问题,提出了一种基于Transformer-CNN的轻量级图像超分辨率重建网络,使超分辨率重建网络更适合应用于移动平台等嵌入式终端。首先,提出了一个基于Transformer-CNN的混合模块,从而增强网络捕获局部−全局深度特征的能力;其次,提出了一个改进的倒置残差块来特别关注高频区域的特征,以提升特征提取能力和减少推理时间;最后,在探索激活函数的最佳选择后,采用GELU(Gaussian Error Linear Unit)激活函数来进一步提高网络性能。实验结果表明,所提网络可以在图像超分辨率性能和网络复杂度之间取得很好的平衡,而且在基准数据集Urban100上4倍超分辨率的推理速度达到91 frame/s,比优秀网络SwinIR(Image Restoration using Swin transformer)快11倍,表明所提网络能够高效地重建图像的纹理和细节,并减少大量的推理时间。 展开更多
关键词 图像超分辨率 深度学习 transformER 卷积神经网络 轻量级
下载PDF
基于小波变换和CNN-Transformer模型的测井储层流体识别
20
作者 龚安 张恒 《西安石油大学学报(自然科学版)》 CAS 北大核心 2024年第4期108-116,共9页
针对具有复杂储集空间和极强的非均质性的低孔低渗储层,常规测井响应特征不够明显,使用传统解释手段难以有效识别储层流体的问题,提出了一种基于小波变换和CNN-Transformer混合模型的储层流体识别方法。首先,使用小波变换将测井信号从... 针对具有复杂储集空间和极强的非均质性的低孔低渗储层,常规测井响应特征不够明显,使用传统解释手段难以有效识别储层流体的问题,提出了一种基于小波变换和CNN-Transformer混合模型的储层流体识别方法。首先,使用小波变换将测井信号从时域扩展到时频域,并生成时频谱图以增强信号特征,然后使用滑动时窗沿着测井曲线深度方向滑动采样,获取代表解释深度处地层信息的频谱特征图,最后,通过训练CNN-transformer模型深度挖掘特征图信息,实现储层流体识别。混合模型在利用储层对应深度处测井数据的同时,又兼顾测井曲线随深度的变化趋势和地层前后信息的关联性,挖掘时频谱图的局部细节和全局特征表示,自动识别流体类型。将模型应用于大港油田22口实测测井资料中,并与CNN和BiLSTM等多个模型的流体识别效果进行对比分析,基于小波变换和CNN-Transformer模型识别效果明显优于其他方法,在测试集上识别准确率达到了92.7%。研究结果表明该方法可以作为低孔渗油藏常规测井资料识别储层流体的有效手段,为流体评价提供了新思路。 展开更多
关键词 流体识别 测井曲线 小波变换 CNN-transformer
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部