期刊文献+
共找到17,099篇文章
< 1 2 250 >
每页显示 20 50 100
结合LSTM自编码器与集成学习的井漏智能识别方法 被引量:2
1
作者 孙伟峰 冯剑寒 +3 位作者 张德志 李威桦 刘凯 戴永寿 《石油钻探技术》 CAS CSCD 北大核心 2024年第3期61-67,共7页
为了解决传统的井漏智能识别模型因井漏样本数量受限导致其识别准确率低的问题,提出了一种长短期记忆(long short-term memory,LSTM)网络与自编码器(auto-encoder,AE)相结合、集成LSTM-AE的井漏智能识别方法。首先,采用正常样本训练多... 为了解决传统的井漏智能识别模型因井漏样本数量受限导致其识别准确率低的问题,提出了一种长短期记忆(long short-term memory,LSTM)网络与自编码器(auto-encoder,AE)相结合、集成LSTM-AE的井漏智能识别方法。首先,采用正常样本训练多个包含不同隐藏层神经元数目的LSTM-AE模型,利用重构得分筛选出识别效果较好的几个模型作为基识别器;然后,采用集成学习对多个基识别器的识别结果进行加权融合,解决单一模型因对样本局部特征过度学习导致的误报与漏报问题,提高模型的识别准确率。从某油田18口井的钻井数据中选取了6000组正常钻进状态下的立压、出口流量、池体积数据,对集成LSTM-AE模型进行训练和测试,结果表明,提出方法的识别准确率达到了94.7%,优于其他常用的智能模型的识别结果,为井漏识别提供了一种新的技术途径。 展开更多
关键词 井漏识别 长短期记忆网络 自编码器 集成学习
下载PDF
基于BE-MCNN模型的新闻评论情感分析方法 被引量:1
2
作者 李文书 管平 《软件导刊》 2024年第3期1-7,共7页
实时新闻评论具有文本短、信息丰富、结构复杂等特点,情感分析难以准确捕捉其真实的情感倾向。为增强语义的特征信息,减少模型过拟合问题,提高新闻评论情感分析的准确性,提出一种融合BERT模型、Transformer En⁃coder与多尺度CNN模型的... 实时新闻评论具有文本短、信息丰富、结构复杂等特点,情感分析难以准确捕捉其真实的情感倾向。为增强语义的特征信息,减少模型过拟合问题,提高新闻评论情感分析的准确性,提出一种融合BERT模型、Transformer En⁃coder与多尺度CNN模型的新闻评论情感分析算法。首先,针对新闻评论长度较短、表达情绪观点内容较多的特点,使用BERT模型对新闻评论文本进行预训练,获得具有上下文信息的特征向量;其次,为解决模型过拟合问题,在BERT模型下游添加一层Transformer编码器;最后使用四通道双层CNN模型,通过组合不同大小尺寸的卷积核来提升模型分析新闻评论情感的性能。实验结果表明,该方法在两个新闻评论数据集上的准确率分别达到93.0%与96.4%;与不同模型的比较实验进一步证明了所提方法的有效性。 展开更多
关键词 情感分析 BERT模型 Transformer Encoder 多尺度CNN 新闻评论
下载PDF
基于映射空间编码的高速运动轨道图像去模糊研究 被引量:1
3
作者 鄢化彪 刘词波 +1 位作者 黄绿娥 赵恒 《铁道科学与工程学报》 EI CAS CSCD 北大核心 2024年第2期812-825,共14页
针对轨道缺陷检测系统因镜头抖动或相机快速移动而导致所采集图像较为模糊的问题,提出一种基于最大后验概率估计思想的映射空间编码的高速运动轨道图像去模糊算法。首先,该算法使用深度编解码器和残差网络分别对数据集中清晰图像到模糊... 针对轨道缺陷检测系统因镜头抖动或相机快速移动而导致所采集图像较为模糊的问题,提出一种基于最大后验概率估计思想的映射空间编码的高速运动轨道图像去模糊算法。首先,该算法使用深度编解码器和残差网络分别对数据集中清晰图像到模糊图像的映射关系和模糊核进行编码,为了保证编码时频率信息的完整性,算法在传统的残差模块上引入快速傅里叶变换通道构成双通道残差网络,以补偿多次特征提取带来的频率损失;其次,算法采用深度图像先验(Deep Image Prior,DIP)将潜在的清晰图像和模糊核进行参数化,再利用先验得到的模糊核和清晰图像来调用编码空间中的映射关系;最后,通过交替优化潜在的清晰图像和模糊核,从而去逼近一个真实未知的映射,进而实现真实场景下高速运动轨道图像的去模糊。实验结果表明,双通道残差模块提取的特征图频率信息分量强度普遍高于传统的残差模块,相较于使用传统残差模块实现该算法,采用双通道残差模块可使峰值信噪比(Peak Signal-to-Noise Ratio,PSNR)提升0.84 dB,结构相似性(Structural Similarity,SSIM)提高0.025 1。与现有的深度学习去模糊算法相比,提出的去模糊算法对高速轨道检测系统所采集图像的去模糊效果更佳,在性能方面相较于最好的去模糊算法,PSNR提高了1.84 dB,SSIM提升了0.017 3,显著提升了采集图像的质量。研究结果可为下一步识别轨道部件是否存在缺陷提供清晰图像。 展开更多
关键词 运动去模糊 编码-解码器 映射空间 深度图像先验 残差网络
下载PDF
新一代通用视频编码标准H.266/VVC:现状与发展 被引量:1
4
作者 万帅 霍俊彦 +1 位作者 马彦卓 杨付正 《西安交通大学学报》 EI CAS CSCD 北大核心 2024年第4期1-17,共17页
相比于上一代标准,新一代通用视频编码标准(H.266/VVC)在同等质量下能够节省大约50%的码率,且适用于多种多样的视频应用场景。论文从H.266/VVC的关键技术出发,对标准的现状、实现和应用发展进行深入探讨。H.266/VVC沿用既往标准中的双... 相比于上一代标准,新一代通用视频编码标准(H.266/VVC)在同等质量下能够节省大约50%的码率,且适用于多种多样的视频应用场景。论文从H.266/VVC的关键技术出发,对标准的现状、实现和应用发展进行深入探讨。H.266/VVC沿用既往标准中的双层码流体系和混合编码框架,针对帧内预测、帧间预测、变换、量化、环路滤波等所有主要编码模块进行了技术革新,并为屏幕内容视频等应用提供了高效的专用编码工具。H.266/VVC标准目前已处于实用化阶段,官方参考软件VTM和开源编解码器VVenC/VVdeC是目前最具代表性的软件编解码实现。对H.266/VVC的性能分析可以看出:H.266/VVC针对高分辨率视频取得的编码增益更为突出;主要编码工具对性能的贡献通常以复杂度为代价,但也有部分编码工具在提升编码性能的同时可降低整体编码复杂度。H.266/VVC的硬件实现面临诸多挑战,发展明显滞后于软件实现,现有研究主要集中在对具体编码模块的硬件加速方面。H.266/VVC标准发布之后,下一代视频编码标准的发展目前仍围绕混合编码框架进行探索,聚焦在两大方向:超越VVC的增强压缩关注更为先进的、非神经网络的编码工具,基于神经网络的视频编码则探索采用神经网络的编码工具。除此之外,部分或完全跳出现有混合编码框架的端到端视频编码也在飞速发展,未来视频编码标准与神经网络结合成为趋势,但面临着计算资源依赖和稳定结构两方面的考验。 展开更多
关键词 H.266/VVC标准 视频编码标准 编码模块 编解码器 神经网络
下载PDF
MUSE DWI和常规DWI在乳腺良恶性病变中的研究 被引量:1
5
作者 夏琬君 贾艺璇 +1 位作者 赵敏 张勇 《中国CT和MRI杂志》 2024年第4期80-81,共2页
目的探讨MUSE DWI和常规DWI在乳腺良恶性疾病中的应用价值。方法对我院进行乳腺磁共振检查并有病理结果的91例患者进行研究,每位患者均进行MUSE DWI和常规DWI扫描。结果MUSE DWI图像质量高,伪影减少,对病变细节显示的更好,MUSE ADC与常... 目的探讨MUSE DWI和常规DWI在乳腺良恶性疾病中的应用价值。方法对我院进行乳腺磁共振检查并有病理结果的91例患者进行研究,每位患者均进行MUSE DWI和常规DWI扫描。结果MUSE DWI图像质量高,伪影减少,对病变细节显示的更好,MUSE ADC与常规ADC,均与病理结果有一致性。结论MUSE DWI弥补DWI的缺点,对乳腺良恶性病变有较高的诊断价值。 展开更多
关键词 高分辨率扩散成像 乳腺病变
下载PDF
MFFNet:多级特征融合图像语义分割网络 被引量:1
6
作者 王燕 南佩奇 《计算机科学与探索》 CSCD 北大核心 2024年第3期707-717,共11页
在图像语义分割任务中,大多数方法未将不同尺度、不同层次的特征充分利用就直接进行上采样,会造成一些有效信息被当成冗余信息而被摒弃,从而降低对某些细小类别和相似类别分割的准确性和敏感性。为此,提出一个多级特征融合网络(MFFNet)... 在图像语义分割任务中,大多数方法未将不同尺度、不同层次的特征充分利用就直接进行上采样,会造成一些有效信息被当成冗余信息而被摒弃,从而降低对某些细小类别和相似类别分割的准确性和敏感性。为此,提出一个多级特征融合网络(MFFNet)。MFFNet采用编码器-解码器结构,在编码阶段,通过上下文信息提取路径和空间信息提取路径分别获取上下文信息与空间细节信息,增强像素间关联性与边界准确性;解码阶段设计一条多级特征融合路径,利用混合双边融合模块融合上下文信息;利用高低特征融合模块融合深层信息与空间信息;利用全局通道融合模块获取不同通道之间的联系,实现不同尺度信息的全局融合。MFFNet网络在PASCAL VOC 2012和Cityscapes验证集上的平均交互比(MIoU)分别为80.70%和76.33%,取得了较好的分割结果。 展开更多
关键词 编码器-解码器 上下文信息 空间信息 特征融合
下载PDF
基于数据驱动的配电网无功优化 被引量:4
7
作者 蔡昌春 程增茂 +2 位作者 张关应 李源佳 储云迪 《电网技术》 EI CSCD 北大核心 2024年第1期373-382,共10页
传统无功电压控制由于分布式电源、储能以及柔性负荷的接入面临计算速度和精度上的挑战。该文提出了一种基于数据驱动的配电网无功电压优化方法,通过跟踪实际系统的运行参数,实现无功电压的主动控制。在极限学习机中引入自动编码器构建... 传统无功电压控制由于分布式电源、储能以及柔性负荷的接入面临计算速度和精度上的挑战。该文提出了一种基于数据驱动的配电网无功电压优化方法,通过跟踪实际系统的运行参数,实现无功电压的主动控制。在极限学习机中引入自动编码器构建深度学习机制,利用自动编码器建立极限学习机输入-输出的直接耦合关系,实现无监督学习和有监督学习有机结合,缩短训练模型的迭代过程;利用蒙特卡洛法基于分布式电源、负荷预测信息构建配电网运行场景,利用深度极限学习机挖掘运行场景优化运行与无功调压设备状态间的内在联系,建立电网运行场景与系统无功调压策略的映射关系。该文提出的基于数据驱动的无功优化方法不依赖实际系统潮流计算,能够实现配电网运行状态的跟踪和无功调节设备的优化调度,为配电网无功电压的主动控制打下基础。 展开更多
关键词 数据驱动 无功优化 深度极限学习机 自动编码器 主动控制
下载PDF
基于形象学的秦腔剧本英译中民族形象的建构 被引量:1
8
作者 管晓蕾 谢芬芬 《华北理工大学学报(社会科学版)》 2024年第2期97-102,120,共7页
秦腔作为中国传统戏剧的瑰宝之一,其剧本具有很强的英译研究价值。形象学帮助人们认识译本构筑的翻译形象,探究其建构的翻译策略。在形象学的框架下,概括总结秦腔剧本中蕴含的主流思想,分析秦腔剧本英译中民族形象建构的策略,以期推动... 秦腔作为中国传统戏剧的瑰宝之一,其剧本具有很强的英译研究价值。形象学帮助人们认识译本构筑的翻译形象,探究其建构的翻译策略。在形象学的框架下,概括总结秦腔剧本中蕴含的主流思想,分析秦腔剧本英译中民族形象建构的策略,以期推动中国传统戏剧秦腔“走出去”,同时助力民族形象的国际塑造。 展开更多
关键词 形象学 秦腔剧本英译 民族形象建构
下载PDF
基于NVAE和OB-Mix的小样本数据增强方法 被引量:1
9
作者 杨玮 钟名锋 +3 位作者 杨根 侯至丞 王卫军 袁海 《计算机工程与应用》 CSCD 北大核心 2024年第2期103-112,共10页
由于深度学习模型对海量标注数据的依赖性较高,导致目前许多前沿性目标检测理论难以适用于工业检测领域。为此,提出一种基于NVAE图像生成和OB-Mix数据增强的小样本数据扩充方法。具体方法是通过NVAE构建检测目标的数据分布模型,再通过... 由于深度学习模型对海量标注数据的依赖性较高,导致目前许多前沿性目标检测理论难以适用于工业检测领域。为此,提出一种基于NVAE图像生成和OB-Mix数据增强的小样本数据扩充方法。具体方法是通过NVAE构建检测目标的数据分布模型,再通过采样潜变量的方式生成与真实目标图像属于同一分布的全新目标图像。在得到生成目标图像后,提出了OB-Mix数据增强策略,将生成目标图像与背景图像进行随机位置融合以构建出新的图像数据,从而提高网络的定位能力及泛化能力。方法在仅使用474张标注图像以及400张无检测目标的背景图像情况下,使YOLOv5的检测精确率达到95.86%,相比于不使用该方法的结果提高了17.60个百分点。 展开更多
关键词 数据增强 小样本 数据生成 新派变分自编码器(NVAE) 表面缺陷检测 深度学习
下载PDF
基于Transformer的多尺度遥感语义分割网络 被引量:1
10
作者 邵凯 王明政 王光宇 《智能系统学报》 CSCD 北大核心 2024年第4期920-929,共10页
为了提升遥感图像语义分割效果,本文针对分割目标类间方差小、类内方差大的特点,从全局上下文信息和多尺度语义特征2个关键点提出一种基于Transformer的多尺度遥感语义分割网络(muliti-scale Transformer network,MSTNet)。其由编码器... 为了提升遥感图像语义分割效果,本文针对分割目标类间方差小、类内方差大的特点,从全局上下文信息和多尺度语义特征2个关键点提出一种基于Transformer的多尺度遥感语义分割网络(muliti-scale Transformer network,MSTNet)。其由编码器和解码器2个部分组成,编码器包含基于Transformer改进的视觉注意网络(visual attention network,VAN)主干和基于空洞空间金字塔池化(atrous spatial pyramid pooling, ASPP)结构改进的多尺度语义特征提取模块(multi-scale semantic feature extraction module, MSFEM)。解码器采用轻量级多层感知器(multi-layer perception,MLP)配合编码器设计,充分分析所提取的包含全局上下文信息和多尺度表示的语义特征。MSTNet在2个高分辨率遥感语义分割数据集ISPRS Potsdam和LoveDA上进行验证,平均交并比(mIoU)分别达到79.50%和54.12%,平均F1-score(m F1)分别达到87.46%和69.34%,实验结果验证了本文所提方法有效提升了遥感图像语义分割的效果。 展开更多
关键词 遥感图像 语义分割 卷积神经网络 TRANSFORMER 全局上下文信息 多尺度感受野 编码器 解码器
下载PDF
仿真模拟及“公案剧本穿越”在刑事诉讼法教学中的应用 被引量:1
11
作者 蒋若薇 叶扬 《河北法律职业教育》 2024年第7期14-19,共6页
剧本杀是当下年轻人较为流行的娱乐方式,将中华优秀传统法律文化与学生“剧本穿越”进行耦合作为刑事诉讼法教学的新范式,有助于增强学生参与的积极性,促进学习的主动性。基于教与学步调一致的目标,可考虑建立动态教学检验与评价机制、... 剧本杀是当下年轻人较为流行的娱乐方式,将中华优秀传统法律文化与学生“剧本穿越”进行耦合作为刑事诉讼法教学的新范式,有助于增强学生参与的积极性,促进学习的主动性。基于教与学步调一致的目标,可考虑建立动态教学检验与评价机制、加强校校教学联动、实现启发式学习的课后保障等,推动仿真模拟及“公案剧本穿越”教学模式的深度发展。 展开更多
关键词 刑事诉讼 仿真模拟 剧本穿越 课程思政
下载PDF
论“书同文”政策对“屦/履”历时更替的影响——基于出土资料与传世文献的综合考察
12
作者 胡波 《语言科学》 CSSCI 北大核心 2024年第3期325-336,共12页
战国“履”的字形和{屦}的用字存在文字异形问题,受“书同文”政策的影响,这一问题在秦王政时期得到了解决。考察先秦至西汉早期出土资料与传世文献可知,同样是受“书同文”政策的影响,至迟在秦朝{履}最终替换{屦}而成为表示“鞋”义的... 战国“履”的字形和{屦}的用字存在文字异形问题,受“书同文”政策的影响,这一问题在秦王政时期得到了解决。考察先秦至西汉早期出土资料与传世文献可知,同样是受“书同文”政策的影响,至迟在秦朝{履}最终替换{屦}而成为表示“鞋”义的常用词。这表明“书同文”政策确实对汉语用词的变化产生过重要的影响。 展开更多
关键词 “书同文”政策 常用词 历时更替
下载PDF
基于改进VGG16的自编码器视频异常检测算法 被引量:1
13
作者 杨大为 刘志权 《计算机技术与发展》 2024年第4期95-100,共6页
在使用自编码器结构的神经网络处理视频异常检测任务时,U-Net风格的自编码器由于编码器层数深度过浅,导致在面对复杂的数据集时,不能充分抽取更多有用的特征信息。同时,在训练模型时使用MSE(均方误差),仅考虑了预测帧与真实帧之间的像... 在使用自编码器结构的神经网络处理视频异常检测任务时,U-Net风格的自编码器由于编码器层数深度过浅,导致在面对复杂的数据集时,不能充分抽取更多有用的特征信息。同时,在训练模型时使用MSE(均方误差),仅考虑了预测帧与真实帧之间的像素级相似性,对于复杂场景,像素级相似性可能无法准确判断预测帧与真实帧之间的相似性。针对以上问题,对基于U-Net风格的自编码器进行改进,提出了一种使用改进的VGG16作为编码器的视频异常检测算法,同时在均方误差的基础上添加结构相似性(SSIM)损失函数。改进的VGG16去掉了全连接层,并加入了残差连接防止特征退化,添加SSIM在计算像素级相似性的同时计算图像的亮度、对比度和结构等方面的相似性来优化网络。实验结果表明,改进后的算法,在Ped2数据集上检测效果达到95.91%,在Avenue数据集上检测效果达到84.89%,与改进前的方法相比分别提高了0.80%和0.19%,验证了所提方法的有效性。 展开更多
关键词 自编码器 U-Net 特征提取 VGG16 残差连接 结构相似性
下载PDF
基于深度SSDAE网络的刀具磨损状态识别 被引量:1
14
作者 郭润兰 尉卫卫 +1 位作者 王广书 黄华 《振动.测试与诊断》 EI CSCD 北大核心 2024年第2期305-312,410,411,共10页
针对刀具磨损状态识别过程中采集数据量大、干扰信号复杂且需人为选择特征参数的问题,为提高刀具磨损状态识别模型的鲁棒性与泛化性,提出了一种数据驱动下深度堆叠稀疏降噪自编码(stacking sparse denoising auto-encoder,简称SSDAE)网... 针对刀具磨损状态识别过程中采集数据量大、干扰信号复杂且需人为选择特征参数的问题,为提高刀具磨损状态识别模型的鲁棒性与泛化性,提出了一种数据驱动下深度堆叠稀疏降噪自编码(stacking sparse denoising auto-encoder,简称SSDAE)网络的刀具磨损状态识别方法,实现隐藏在数据中深层次的数据特征自动挖掘。首先,将原始振动信号分解为一系列固有模态分量(intrinsic mode function,简称IMF),并采用皮尔逊相关系数法选取了最优固有模态来组合一个新的信号;其次,采用SSDAE网络自适应提取特征后对刀具磨损阶段进行了状态识别,识别精度达到98%;最后,对网络模型进行实验验证,并与最常用的刀具磨损状态识别方法进行了对比。实验结果表明,所提出的方法能够很好地处理非平稳振动信号,对不同刀具磨损阶段状态的识别效果良好,并具有较好的泛化性能和可靠性。 展开更多
关键词 深度堆叠稀疏自编码网络 变分模态分解 K-最近邻分类器 自适应特征提取 状态识别
下载PDF
融合改进自编码器和残差网络的入侵检测模型 被引量:1
15
作者 陈虹 王瀚文 金海波 《计算机工程》 CAS CSCD 北大核心 2024年第2期188-195,共8页
互联网中存在大量隐私数据,因此防止网络入侵成为保护网络安全的关键问题。为提高网络入侵检测的准确率并解决其收敛慢问题,设计一种改进的堆叠自动编码器和残差网络(ISAE-ResNet)入侵检测模型。融合栈式自编码器和残差网络,首先将预处... 互联网中存在大量隐私数据,因此防止网络入侵成为保护网络安全的关键问题。为提高网络入侵检测的准确率并解决其收敛慢问题,设计一种改进的堆叠自动编码器和残差网络(ISAE-ResNet)入侵检测模型。融合栈式自编码器和残差网络,首先将预处理后的数据输入到改进的栈式自编码器中,该栈式自编码器由2个副编码器和1个主编码器组成,数据经过副编码器和主编码器训练后重构出新的特征来防止过拟合问题;然后将解码层的权重捆绑到编码层进行优化,使模型参数减半来进行降维,提高模型的收敛速度;最后将处理过的数据输入到改进的残差网络中,并基于改进的ResNet网络设计一种加入软阈值函数的残差模块,通过降低数据中的噪声来提高模型准确率。在CIC-IDS-2017数据集上的实验结果表明,该模型准确率为98.67%,真正例率为95.93%,误报率为0.37%,损失函数值快速收敛至0.042,在准确率、真正例率、误报率和收敛速度方面均超过对比入侵检测模型,具有较高的有效性和可行性。 展开更多
关键词 网络入侵检测 深度学习 栈式自编码器 残差网络 CIC-IDS-2017数据集
下载PDF
面向风格多样化的多对多语音情感转换
16
作者 周健 罗翔宇 +2 位作者 王华彬 郑文明 陶亮 《声学学报》 EI CAS CSCD 北大核心 2024年第6期1297-1303,共7页
针对现有基于生成对抗网络的语音情感转换仍然存在情感分离不明显,且转换后的语音情感缺乏多样性问题,提出了一种面向风格多样化的多对多语音情感转换方法。该方法基于一个双生成器结构的生成对抗网络模型,通过对不同生成器的中间编码... 针对现有基于生成对抗网络的语音情感转换仍然存在情感分离不明显,且转换后的语音情感缺乏多样性问题,提出了一种面向风格多样化的多对多语音情感转换方法。该方法基于一个双生成器结构的生成对抗网络模型,通过对不同生成器的中间编码进行一致性损失约束确保语音内容和说话人特征具有一致性,以提升转换后语音情感与目标情感的相似性。此外,该方法通过情感映射网络和情感特征编码器为生成器提供同类情感的多样化情感表征。实验结果表明,所提情感语音转换方法得到的语音情感更接近目标情感,且情感样式更加丰富。 展开更多
关键词 情感语音转换 风格多样化 生成对抗网络 情感编码
下载PDF
FMA-DETR:一种无编码器的Transformer目标检测方法
17
作者 周全 倪英豪 +2 位作者 莫玉玮 康彬 张索非 《信号处理》 CSCD 北大核心 2024年第6期1160-1170,共11页
DETR是第一个将Transformer应用于目标检测的视觉模型。在DETR结构中,Transformer编码器对已高度编码的图像特征进行再编码,这在一定程度上导致了网络功能的重复。此外,由于Transformer编码器具有多层深度堆叠的结构和巨大的参数量,导... DETR是第一个将Transformer应用于目标检测的视觉模型。在DETR结构中,Transformer编码器对已高度编码的图像特征进行再编码,这在一定程度上导致了网络功能的重复。此外,由于Transformer编码器具有多层深度堆叠的结构和巨大的参数量,导致网络优化变得困难,模型收敛速度缓慢。本文设计了一种无编码器的Transformer目标检测网络模型。由于不需要引入Transformer编码器,本文的模型比DETR参数量更小、计算量更低、模型收敛速度更快。但是,直接去除Transformer编码器将降低网络的表达能力,导致Transformer解码器无法从数量庞大的图像特征中关注到包含目标的图像特征,从而使检测性能大幅降低。为了缓解这个问题,本文提出了一种混合特征注意力(fusion-feature mixing attention,FMA)机制,它通过自适应特征混合和通道交叉注意力弥补检测网络特征表达能力的下降,将其应用于Transformer解码器可以减轻由于去除Transformer编码器带来的性能降低。在MS-COCO数据集上,本文网络模型(称为FMA-DETR)实现了与DETR相近的性能表现,同时本文的模型拥有更快的收敛速度、更小的参数量以及更低的计算量。本文还进行了大量消融实验来验证所提出方法的有效性。 展开更多
关键词 目标检测 TRANSFORMER 编码器 DETR 混合注意力
下载PDF
基于门控位置编码的壁画图像多级色彩还原
18
作者 徐志刚 张创 《计算机应用》 CSCD 北大核心 2024年第9期2931-2937,共7页
近年来,壁画图像的色彩还原研究已成为壁画文物保护和展示领域的一个热点问题。针对壁画色彩还原面临的整体特征信息难以有效提取和保持,局部色彩还原易出现假色以及色彩溢出等问题,提出基于门控位置编码的壁画图像多级色彩还原方法。首... 近年来,壁画图像的色彩还原研究已成为壁画文物保护和展示领域的一个热点问题。针对壁画色彩还原面临的整体特征信息难以有效提取和保持,局部色彩还原易出现假色以及色彩溢出等问题,提出基于门控位置编码的壁画图像多级色彩还原方法。首先,构建基于全局特征约束的编码器网络,并通过改进的多核多值池化算法提取图像的全局特征梯度作为下采样取值标准以建立壁画图像特征金字塔,从而减少壁画图像在特征编码过程中的整体特征损失;其次,为准确还原壁画图像的局部色彩信息,设计基于门控位置编码的色彩迁移模块,该模块通过约束空间域中内容特征与色彩特征之间相似性核的学习,构建色彩特征在待还原壁画图像中的准确映射,从而减少还原图像中的假色现象与色彩溢出。实验结果表明,该方法所生成的壁画还原图像相较于AdaIN(Adaptive Instance Normalization)、AST(ArbitraryStyleTransfer)等对比方法所生成的壁画还原图像,NIQE(NaturalImageQuality Evaluator)和PIQE(Perception based Image Quality Evaluator)都取得了最优的结果。可见,所提方法能有效还原壁画色彩信息并保持待还原壁画图像的整体结构纹理特征。 展开更多
关键词 编码器-解码器网络 壁画图像 色彩还原 全局特征 位置编码
下载PDF
基于注意力时间卷积网络的农产品期货分解集成预测 被引量:1
19
作者 张大斌 黄均杰 +1 位作者 凌立文 林锐斌 《南京信息工程大学学报》 CAS 北大核心 2024年第3期311-320,共10页
针对农产品期货时间序列数据受多方面因素影响,非线性、非平稳数据特征难以提取而导致预测准确性不高的问题,基于“分解-集成”的预测思想,本文提出一种基于自适应噪声完备经验模态分解(CEEMDAN)与Transformer-Encoder-TCN的农产品期货... 针对农产品期货时间序列数据受多方面因素影响,非线性、非平稳数据特征难以提取而导致预测准确性不高的问题,基于“分解-集成”的预测思想,本文提出一种基于自适应噪声完备经验模态分解(CEEMDAN)与Transformer-Encoder-TCN的农产品期货预测方法.首先,使用CEEMDAN将时间序列分解为多尺度多频率的本征模态分量(IMF)与残差,降低了序列建模复杂度;其次,使用融合多阶段自注意力单元Transformer-Encoder的时间卷积网络(TCN)对各个分量子序列进行特征提取与预测,优化了序列显著特征建模权重;最后,将各个子序列预测值线性相加集成得到最终预测结果.以南华期货公司农产品指数中的大豆期货指数为研究对象,采用时序交叉验证与参数迁移的方式进行模型重训练,消融和对比实验结果表明,提出的新模型在RMSE、MAE和DS三个评价指标上具有良好的效果,验证了该模型对农产品期货预测的有效性. 展开更多
关键词 农产品期货 自适应噪声完备经验模态分解 自注意力机制 Transformer-Encoder 时间卷积网络
下载PDF
基于动态位置编码和注意力增强的目标跟踪算法
20
作者 熊昌镇 郭传玺 王聪 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2024年第12期2427-2437,共11页
为了充分利用模板和搜索区域之间的位置信息以及提高融合特征的表征能力,提出使用动态位置编码和多域注意力特征增强的方法.在注意力模块内部嵌入带有卷积操作的位置编码模块,随注意力计算更新位置编码,提高自身空间结构信息的利用率.... 为了充分利用模板和搜索区域之间的位置信息以及提高融合特征的表征能力,提出使用动态位置编码和多域注意力特征增强的方法.在注意力模块内部嵌入带有卷积操作的位置编码模块,随注意力计算更新位置编码,提高自身空间结构信息的利用率.引入多域注意力增强模块,在空间维度上使用不同空洞率和步长的平行卷积进行采样,以应对不同大小的目标物,并聚合通道注意力增强后的特征.在解码器中加入空间域注意力增强模块,为预测头提供更精确的分类回归特征.本算法在GOT-10K数据集上的平均重叠度(AO)为73.9%;在TrackingNet、UAV123和OTB100数据集上分别取得了82.7%、69.3%和70.9%的曲线下面积(AUC).与主流算法的对比结果表明,融合了动态位置编码和通道、空间注意力增强的跟踪模型可以有效提升模板和搜索区域间的信息交互,提高跟踪的精度. 展开更多
关键词 TRANSFORMER 注意力机制 目标跟踪模型 位置编码 孪生网络
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部