期刊文献+
共找到12,202篇文章
< 1 2 250 >
每页显示 20 50 100
基于Multi-WHFPN与SimAM注意力机制的版面分割
1
作者 杨陈慧 周小亮 +2 位作者 张恒 孙政 业宁 《电子测量技术》 北大核心 2024年第1期159-168,共10页
作为OCR的预处理工作,版面分割技术越来越受到学术界和工业界重视。针对版面分割中遇到的检测速度慢、目标区域边界不准确以及细小目标易遗漏等问题,提出了YOLOv7-MSY模型。此模型首先借鉴残差连接思想,提出了Multi-WHFPN网络结构。它... 作为OCR的预处理工作,版面分割技术越来越受到学术界和工业界重视。针对版面分割中遇到的检测速度慢、目标区域边界不准确以及细小目标易遗漏等问题,提出了YOLOv7-MSY模型。此模型首先借鉴残差连接思想,提出了Multi-WHFPN网络结构。它采用可训练的权重参数,突出特征融合过程中特征重要性,并添加了小目标检测头,从而提升对小目标的检测性能;其次,引入SimAM注意力机制,可以在不增加额外参数的基础上在3D维度评估特征权重,以增强重要特征,抑制无效特征;最后,使用YEIOU来代替原模型中的定位损失函数,提升了模型的收敛速度与回归精度。在江苏省档案馆提供的数据集上进行实验对比,YOLOv7-MSY对目标区域边界检测更加敏感,对细小目标的检测效果更好。YOLOv7-MSY的mAP@.5达到了0.871,相较于原YOLOv7模型提高了7.84%。该模型的版面分割的效果优于其他类型的版面分割算法,具有良好的泛化性能,并且版面分割速度处于较高水平。 展开更多
关键词 版面分割 YOLOv7-MSY Multi-WHFPN simam注意力机制 YEIOU
下载PDF
基于SimAM注意力机制的轴承故障迁移诊断模型
2
作者 包从望 朱广勇 +1 位作者 邹旺 郭灏 《机电工程》 CAS 北大核心 2024年第5期862-869,893,共9页
针对轴承故障在跨工况迁移诊断时,其域不变特征难以提取,易出现模型过拟合这一问题,提出了一种基于无参数注意力模块(SimAM)的轴承故障迁移诊断方法。首先,以一维卷积神经网络作为基本框架,利用自适应批量归一化(AdaBN)对各输出层进行... 针对轴承故障在跨工况迁移诊断时,其域不变特征难以提取,易出现模型过拟合这一问题,提出了一种基于无参数注意力模块(SimAM)的轴承故障迁移诊断方法。首先,以一维卷积神经网络作为基本框架,利用自适应批量归一化(AdaBN)对各输出层进行了归一化处理,经两层卷积层和两层池化层后,对输出特征进行了随机节点失活操作;然后,利用改进后的参数化修正线性单元(PReLU)激活函数自适应提取负值输入权值系数,分别以交叉熵损失函数监督训练有标签的源域数据,以均方对数误差(MSLE)作为损失函数训练无标签的目标数据;最后,利用自制实验台数据和凯斯西储轴承公开数据对模型进行了验证,分别以不同的单一工况作为源域,其余工况作为目标域进行了迁移诊断任务研究。研究结果表明:基于SimAM的轴承故障迁移诊断方具有较好的域不变特征提取的性能,且所提特征具有较好的聚类效果;自制实验台中的平均迁移精度在89.1%以上,最高均值可达97.85%,CWRU数据集中的平均迁移精度达98.68%。该成果可为后续轴承故障由实验向工业现场的迁移诊断奠定基础。 展开更多
关键词 轴承故障诊断 迁移学习 无参数注意力机制 自适应批量归一化 参数化修正线性单元 均方对数误差 卷积神经网络
下载PDF
融合SimAM注意力机制和双向ConvLSTM的异常检测方法 被引量:4
3
作者 袁红春 张文凤 《小型微型计算机系统》 CSCD 北大核心 2023年第8期1777-1784,共8页
由于传统的监控视频异常检测和定位往往存在特征选择困难、特征学习不足、泛化性差等问题,本文提出一种融合SimAM注意力机制(A Simple,Parameter-Free Attention Module)和双向ConvLSTM(bidirectional convolutional long short-term me... 由于传统的监控视频异常检测和定位往往存在特征选择困难、特征学习不足、泛化性差等问题,本文提出一种融合SimAM注意力机制(A Simple,Parameter-Free Attention Module)和双向ConvLSTM(bidirectional convolutional long short-term memory,BiConvLSTM)的深度残差时空自编码器模型(SimAM Based Residual BiConvLSTM Autoencoder,RS-BCAE)用于捕获视频异常.使用堆叠卷积和双向ConvLSTM捕获时空特征,利用交替反卷积和卷积的特征图增强方法优化网络结构.本文设计一种融合R-STAE(Residual Spatiotemporal Autoencoder)残差模块和SimAM注意力机制的残差网络,SimAM注意力机制无需添加额外参数,利用能量函数为特征图生成三维注意力权重,使CNN(Convolutional Neural Network)专注于提取视频帧序列的显著区域特征.为了联合全局特征和关键特征,本文为残差模块引入跳跃连接.实验结果表明,RS-BCAE在数据集UCSD-Ped1和UCSD-Ped2上的帧级准确率分别为86.5%和94%,优于最新的重构模型精度. 展开更多
关键词 异常检测 视频监控 自编码器 残差网络 注意力机制
下载PDF
基于SimAM注意力机制的近岸船舶检测方法 被引量:6
4
作者 郭玲 于海雁 周志权 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2023年第5期14-21,共8页
基于视觉图像的船舶目标检测中由于图像背景复杂,无关干扰较多,导致船舶目标检测的难度增大。并且多类别船舶检测数据集现有数量较少且存在样本不均衡的问题使得船舶目标检测性能较低。针对复杂背景干扰检测,本文通过引入SimAM注意力机... 基于视觉图像的船舶目标检测中由于图像背景复杂,无关干扰较多,导致船舶目标检测的难度增大。并且多类别船舶检测数据集现有数量较少且存在样本不均衡的问题使得船舶目标检测性能较低。针对复杂背景干扰检测,本文通过引入SimAM注意力机制对YOLOv3模型进行改进,利用该机制加强船舶目标在提取特征中的权重并抑制背景干扰权重,从而提升模型检测性能;同时,采用强实时数据增强以改善样本尺度分布不均衡的问题,结合迁移学习提升在样本数量受限情况下的船舶检测精度。提取特征的可视化结果显示改进模型对无关背景特征干扰进行了抑制,增强了模型对于船舶特征的提取能力。在SeaShips数据集上,提出的改进模型在不引入额外可学习参数的情况下mAP.5、mAP.75分别达到了96.93%、71.49%,检测速度达到了66 frame/s,在检测精度与运行效率方面保持了均衡。与Saliency-aware CNN、eYOLOv3相比更有效地优化了目标特征,使得mAP.5分别提高了9.53%、9.19%。改进模型在新加坡海事数据集上在船舶类型目标检测的mAP.5达到了81.81%,验证了模型具有较好的泛化能力。 展开更多
关键词 船舶检测 注意力机制 数据增强 改进YOLOv3 迁移学习
下载PDF
基于SimAM注意力机制的遥感图像场景分类
5
作者 林华燕 陈其兵 +1 位作者 陈伊平 杨静 《北京测绘》 2023年第7期933-937,共5页
针对遥感图像地形、地势复杂以及现有遥感图像分类方法准确率较差等问题,本文提出一种具有通道和空间注意机制的深度学习遥感图像分类模型。首先,使用残差网络作为特征提取主干网络;然后,对主干网络添加三维注意力机制模块,使模型不仅... 针对遥感图像地形、地势复杂以及现有遥感图像分类方法准确率较差等问题,本文提出一种具有通道和空间注意机制的深度学习遥感图像分类模型。首先,使用残差网络作为特征提取主干网络;然后,对主干网络添加三维注意力机制模块,使模型不仅可学习通道信息还可学习空间信息;最后,在公开遥感图像数据集中训练并验证所提模型优越性。实验表明:所提方法在每个类别航拍图像的分类准确率均高于残差网络,整体分类准确率相较残差网络提高3.38%,高达89.27%,表明所提模型可以广泛应用于航拍图像分类场景中。 展开更多
关键词 遥感图像场景分类 残差网络 通道和空间注意力机制
下载PDF
融合SimAM注意力机制的实时多目标跟踪算法
6
作者 程之星 杨帆 《电子测量技术》 北大核心 2023年第17期94-101,共8页
多目标跟踪中的JDE算法首次将目标检测与重识别进行联合学习,极大提升了跟踪速度,但由于复杂背景干扰和遮挡导致跟踪准确度下降。为了解决跟踪速度与准确度的平衡问题,本文提出了SAM-JDE,该模型融合了SimAM注意力机制、多尺度融合等思想... 多目标跟踪中的JDE算法首次将目标检测与重识别进行联合学习,极大提升了跟踪速度,但由于复杂背景干扰和遮挡导致跟踪准确度下降。为了解决跟踪速度与准确度的平衡问题,本文提出了SAM-JDE,该模型融合了SimAM注意力机制、多尺度融合等思想,通过增强特征提取能力提高目标跟踪的准确性。使用CIoU_Loss作为回归损失函数,通过准确地构建目标框和预测框之间的位置关系来提升定位精度。关联匹配部分使用卡尔曼滤波预测运动信息,匈牙利匹配算法完成时序维度上的目标关联。在MOT16-test数据集上进行测试,MOTA达到66.4%,跟踪速度为20.6 FPS,在保证实时性的基础上跟踪准确度较JDE算法提升2.3%,较好地优化了准确度与速度的平衡问题。 展开更多
关键词 机器视觉 多目标跟踪 注意力机制 实时跟踪
下载PDF
基于改进卷积注意力机制的触觉图像识别 被引量:2
7
作者 熊鹏文 陈志远 +1 位作者 廖俊杰 宋爱国 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第1期175-182,共8页
为了改善传统轻量化网络对触觉图像全局特征提取能力差的问题,提出一种基于轻量化网络提高触觉图像感知分类的新算法,通过将卷积块注意力模块(CBAM)引入坐标注意力机制(CA)来增强特征信息表达能力.利用CA采取空间全局信息并嵌入通道注意... 为了改善传统轻量化网络对触觉图像全局特征提取能力差的问题,提出一种基于轻量化网络提高触觉图像感知分类的新算法,通过将卷积块注意力模块(CBAM)引入坐标注意力机制(CA)来增强特征信息表达能力.利用CA采取空间全局信息并嵌入通道注意中,使卷积网络能够在较全面的区域捕获注意力权重.结果表明:所提算法优于现有轻量化网络算法;该算法对GelSight数据集、多模态传感器数据集2种触觉图像进行分类识别测试,在分类表现中分辨正确率分别达到了88.2%和94.4%;相比于传统的CBAM注意力模型、自注意力模型(SENet)和仅有LeNet的神经网络,该算法对触觉图像的识别能力在GelSight数据集上分别提高了8.7%、8.7%和3.0%,在多模态传感器数据集上分别提高了13.3%、13.4%和4.8%. 展开更多
关键词 触觉图像 轻量化 注意力机制 坐标注意力
下载PDF
融合CNN-BiGRU和注意力机制的网络入侵检测模型 被引量:1
8
作者 杨晓文 张健 +1 位作者 况立群 庞敏 《信息安全研究》 CSCD 北大核心 2024年第3期202-208,共7页
为提高网络入侵检测模型特征提取能力和分类准确率,提出了一种融合双向门控循环单元(CNN-BiGRU)和注意力机制的网络入侵检测模型.使用CNN有效提取流量数据集中的非线性特征;双向门控循环单元(BiGRU)提取数据集中的时序特征,最后融合注... 为提高网络入侵检测模型特征提取能力和分类准确率,提出了一种融合双向门控循环单元(CNN-BiGRU)和注意力机制的网络入侵检测模型.使用CNN有效提取流量数据集中的非线性特征;双向门控循环单元(BiGRU)提取数据集中的时序特征,最后融合注意力机制对不同类型流量数据通过加权的方式进行重要程度的区分,从而整体提高该模型特征提取与分类的性能.实验结果表明:其整体精确率比双向长短期记忆网络(BiLSTM)模型提升了2.25%.K折交叉验证结果表明:该模型泛化性能良好,避免了过拟合现象的发生,印证了该模型的有效性与合理性. 展开更多
关键词 网络入侵检测 卷积神经网络 双向门控循环单元 注意力机制 深度学习
下载PDF
基于混合注意力机制的管道漏磁缺陷分类实验 被引量:1
9
作者 张璐莹 卞雨辰 +2 位作者 周立娇 蒋鹏 刘英 《实验技术与管理》 CAS 北大核心 2024年第1期100-107,共8页
该文将管道漏磁缺陷分类任务设计成应用型教学实验。该实验使用迁移学习的方法,调用预训练模型ResNet50,并插入主流的注意力机制(SE、CA、ECA、CBAM)进行对比分析。同时,利用Grad-CAM++可解释算法对模型内部的识别逻辑进行可视化,以便... 该文将管道漏磁缺陷分类任务设计成应用型教学实验。该实验使用迁移学习的方法,调用预训练模型ResNet50,并插入主流的注意力机制(SE、CA、ECA、CBAM)进行对比分析。同时,利用Grad-CAM++可解释算法对模型内部的识别逻辑进行可视化,以便帮助学生更好地理解模型。实验结果显示,插入注意力机制的最优模型准确率达99.7%,能够有效识别管道中的正常情况和分类缺陷情况。该实验依托高性能计算机硬件和最新的Pytorch2.0软件包搭建了深度学习平台,有助于培养学生的创新意识和科研能力,也是对多学科交叉融合人才培养模式的探索和实践。 展开更多
关键词 实验设计 深度学习 神经网络 注意力机制 漏磁缺陷检测
下载PDF
基于融合注意力机制LSTM网络的地下水位自适应鲁棒预测 被引量:2
10
作者 佃松宜 厉潇滢 +2 位作者 杨丹 芮胜阳 郭斌 《工程科学与技术》 EI CAS CSCD 北大核心 2024年第1期54-64,共11页
地下水水位是旱天污水管网地下水入渗量的重要影响因素,快速精准地预测地下水水位能有效提升旱天污水管网地下水入渗量估算准确度,辅助优化管网病害治理与维护策略。针对目前城市复杂水文预测存在的准确度低、灵敏度低、泛化能力弱等问... 地下水水位是旱天污水管网地下水入渗量的重要影响因素,快速精准地预测地下水水位能有效提升旱天污水管网地下水入渗量估算准确度,辅助优化管网病害治理与维护策略。针对目前城市复杂水文预测存在的准确度低、灵敏度低、泛化能力弱等问题,本文提出了一种新的鲁棒自适应水位预测算法。首先,对水文数据进行预处理,解决了数据时间跨度大、噪声多、缺失及异常、非平稳等问题。其次,针对不同输入特征对预测指标的影响,在模型训练阶段提出一种新的空间变量注意机制,可快速识别与水位关联的关键变量,并对输入特征赋予不同的影响权重。然后,针对不同序列长度对预测效果的影响,还设计了自适应时间注意力机制,帮助网络自适应地找出与不同时间序列长度预测指标相关的编码器隐藏状态,以更好地捕捉时间上的依赖关系。在此基础上,以上下文向量作为输入,提出一种融合注意力机制的长短时记忆网络水文预测算法。最后,通过意大利Petrignano水文数据验证了所提算法的有效性,并与GRU、Elman、LSTM、VA–LSTM和S–LSTM等方法进行预测性能比较。结果表明,基于融合注意力机制的LSTM网络在面临大规模、噪点多的复杂数据时有优于其它几种算法的预测效果,表明该算法具有强自适应性和鲁棒性。本文研究结果可以为市政排水策略合理调整、及时控制提供参考。 展开更多
关键词 地下水位预测 时间与空间注意力机制 LSTM网络 自适应预测 鲁棒预测
下载PDF
基于注意力机制和特征融合的股票预测方法 被引量:1
11
作者 范辉 朱勇丞 李晋江 《山东工商学院学报》 2024年第1期57-68,76,共13页
基于人工智能在金融数据中的应用,提出了一种新的股票预测方法,称为AFG。AFG使用位置编码和时间编码获取股票数据的位置信息和时间信息,然后通过门控循环单元和多头自注意力机制对股票数据分别进行特征提取。在将两类股票特征融合之后,... 基于人工智能在金融数据中的应用,提出了一种新的股票预测方法,称为AFG。AFG使用位置编码和时间编码获取股票数据的位置信息和时间信息,然后通过门控循环单元和多头自注意力机制对股票数据分别进行特征提取。在将两类股票特征融合之后,由全连接层导出最终的股票预测曲线。 展开更多
关键词 股票预测 门控循环单元 多头自注意力机制 位置编码 时间编码
下载PDF
基于局部-邻域图信息与注意力机制的会话推荐
12
作者 党伟超 吴非凡 +2 位作者 高改梅 刘春霞 白尚旺 《计算机工程与设计》 北大核心 2024年第3期925-931,共7页
针对基于匿名用户的会话推荐忽略了不同会话之间可能存在的协作信息,以及未考虑所预测的目标项与历史行为的相关性问题,提出一种基于局部-邻域图信息与注意力机制的会话推荐模型(SR-LNG-AM)。从当前会话和邻域会话构建的图结构中分别学... 针对基于匿名用户的会话推荐忽略了不同会话之间可能存在的协作信息,以及未考虑所预测的目标项与历史行为的相关性问题,提出一种基于局部-邻域图信息与注意力机制的会话推荐模型(SR-LNG-AM)。从当前会话和邻域会话构建的图结构中分别学习两种类型的项目转换信息,将其融合得到项目嵌入。使用软注意力机制生成全局嵌入,使用目标注意力机制针对不同的目标项自适应生成不同的目标嵌入。结合局部嵌入,进行预测。在两个真实数据集上与多个基线方法进行实验对比,实验指标均有提高,验证了该方法的有效性。 展开更多
关键词 会话推荐 注意力机制 图信息 邻域会话 协作信息 目标注意力 目标嵌入
下载PDF
基于注意力机制和CNN的多标签文本分类模型 被引量:1
13
作者 杨春霞 吴佳君 +1 位作者 瞿涛 姚思诚 《计算机应用与软件》 北大核心 2024年第3期156-162,共7页
针对目前多标签文本分类模型存在无法充分提取文本语义与标签的相互关系,提出一种基于注意力机制和卷积神经网络(CNN)的多标签文本分类模型。通过多头注意力机制和CNN对文本进行建模表示,充分挖掘文本全局和局部的语义特征;结合标签与... 针对目前多标签文本分类模型存在无法充分提取文本语义与标签的相互关系,提出一种基于注意力机制和卷积神经网络(CNN)的多标签文本分类模型。通过多头注意力机制和CNN对文本进行建模表示,充分挖掘文本全局和局部的语义特征;结合标签与文本信息进行交互注意力计算,捕捉结合文本内容后标签间的相互关系;使用一种自适应融合策略进一步提取两者语义信息。实验结果表明,该模型相比于其他主流模型能有效提升多标签文本分类效果。 展开更多
关键词 多标签文本分类 注意力机制 卷积神经网络 文本表示
下载PDF
基于双重注意力机制生成对抗网络的偏振图像融合
14
作者 陈广秋 尹文卿 +2 位作者 温奇璋 张晨洁 段锦 《电子测量与仪器学报》 CSCD 北大核心 2024年第4期140-150,共11页
针对单一强度图像缺少偏振信息,在恶劣天气条件下无法提供充足场景信息的问题,本文提出了一种基于双重注意力机制生成对抗网络用于强度图像和偏振度图像进行融合。算法网络由一个包含编码器、融合模块和解码器的生成器和一个鉴别器组成... 针对单一强度图像缺少偏振信息,在恶劣天气条件下无法提供充足场景信息的问题,本文提出了一种基于双重注意力机制生成对抗网络用于强度图像和偏振度图像进行融合。算法网络由一个包含编码器、融合模块和解码器的生成器和一个鉴别器组成。首先源图像输入到生成器的编码器中,经过一个卷积层和密集块进行特征提取,然后通过含有注意力机制的纹理增强融合模块中进行特征融合,最后通过解码器得到融合图像。鉴别器主要由两个卷积模块和两个注意力模块组成,在网络训练过程中,通过不断博弈,迭代优化生成器网络参数,使生成器输出既保留偏振度图像的稀疏特征又不损失强度图像信息的高质量融合图像。实验表明,该方法得到的融合图像在主观上纹理信息更丰富,更符合人眼的视觉感受,并且在客观评价指标中SD提升约18.5%,VIF提升约22.4%。 展开更多
关键词 图像融合 偏振图像 生成对抗网络 注意力机制
下载PDF
基于注意力机制LSTM的电离层TEC预测
15
作者 刘海军 雷东兴 +6 位作者 袁静 乐会军 单维锋 李良超 王浩然 李忠 袁国铭 《地球物理学报》 SCIE EI CAS CSCD 北大核心 2024年第2期439-451,共13页
电离层总电子含量(Total Electron Content,TEC)的监测与预报是空间环境研究的重要内容,对卫星通讯和导航定位等有重要意义.TEC值影响因素较多,很难确定精确物理模型来对其进行预测.本文设计了基于注意力机制的LSTM模型(Att-LSTM),采用... 电离层总电子含量(Total Electron Content,TEC)的监测与预报是空间环境研究的重要内容,对卫星通讯和导航定位等有重要意义.TEC值影响因素较多,很难确定精确物理模型来对其进行预测.本文设计了基于注意力机制的LSTM模型(Att-LSTM),采用过去24小时TEC观测数据对未来TEC进行预测.选择北半球东经100°上,每2.5°纬度选择一个位置,共计36个位置来验证本文提出模型的性能,并与主流的深度学习模型如DNN、RNN、LSTM进行对比实验.取得了如下成果:(1)在选定的36个地区未来2小时单点预测上,基于本文的Att-LSTM模型的TEC预测性能明显优于其他对比模型;(2)讨论了纬度对Att-LSTM预测未来2小时TEC值时性能的影响,发现在北纬0°到60°之间,Att-LSTM预测性能随着纬度的升高而略有降低,在北纬62.5°~87.5°之间,模型预测性能出现扰动,预测效果略差;(3)讨论了磁暴期和磁静期模型的预测性能,发现无论是磁暴期还是磁静期,本文模型预测性能均较好;(4)还讨论了对未来多时点预测效果,实验结果表明,本文所提出的模型对未来2、4个小时的预测拟合度R-Square均超过0.95,预测结果比较可靠,对未来6、8、10个小时预测拟合度最高为0.7934,预测拟合度R-Square下降迅速,预测结果不可靠. 展开更多
关键词 注意力机制 长短期记忆神经网络 电离层 总电子含量
下载PDF
基于注意力机制和迁移学习的服装分类方法
16
作者 陈金广 黄晓菊 马丽丽 《西安工程大学学报》 CAS 2024年第3期109-116,共8页
针对服装图像分类效率低、准确率不高等问题,提出了一种基于注意力机制和迁移学习的服装图像分类方法。主要采用预训练的ResNet50网络模型在服装数据集上进行迁移学习,以降低对数据集的依赖,并减少网络训练时间;通过几何变换和颜色抖动... 针对服装图像分类效率低、准确率不高等问题,提出了一种基于注意力机制和迁移学习的服装图像分类方法。主要采用预训练的ResNet50网络模型在服装数据集上进行迁移学习,以降低对数据集的依赖,并减少网络训练时间;通过几何变换和颜色抖动2种数据增强手段处理数据集,提高模型的泛化能力;以ResNet50为基础网络,加入卷积注意力机制模块(convolutional block attention module, CBAM),依次从通道和空间2个维度提高对服装不同区域的关注度,增强了特征表达能力。在CD和IDFashion两类背景干扰信息不同的数据集上进行验证,实验结果表明:所提出的模型能够提取更多服装特征信息,在IDFashion数据集的平均分类准确率为95.60%,分别高于ResNet50、ResNet50+STN和ResNet50+ECA模型6.65%、6.69%、6.62%,一定程度上提高了服装图像分类的准确率和效率。 展开更多
关键词 服装图像分类 ResNet50 卷积注意力机制模块(CBAM) 注意力机制 迁移学习
下载PDF
基于多维度注意力机制和复数Conformer的单通道语音增强方法
17
作者 高盛祥 莫尚斌 +2 位作者 余正涛 董凌 王文君 《重庆邮电大学学报(自然科学版)》 CSCD 北大核心 2024年第2期393-403,共11页
为提高被噪声干扰的语音的可理解性和语音质量,针对用于语音增强的深度复数网络对语音复数谱中关键声学特征提取不充分、关联信息建模不合理的问题,提出了基于多维度注意力机制和复数Conformer的单通道语音增强方法(SE-MDACC)。在复数U-... 为提高被噪声干扰的语音的可理解性和语音质量,针对用于语音增强的深度复数网络对语音复数谱中关键声学特征提取不充分、关联信息建模不合理的问题,提出了基于多维度注意力机制和复数Conformer的单通道语音增强方法(SE-MDACC)。在复数U-Net架构下引入复数Conformer,对语音幅度和相位的相关性进行建模;利用多维度注意力机制,构造更加丰富的特征来增强卷积层的表示能力;在残差连接中加入注意力门控机制强化重构语音的细节信息。实验结果显示,相比于深度复数卷积递归网络,SE-MDACC的客观评价指标语音质量感知评估和短时客观可懂度分别提升15.299%、1.462%,表明SE-MDACC可充分提取语音声学特征并对幅度和相位相关性进行合理建模,有效提升语音质量和可理解性。 展开更多
关键词 深度复数网络 声学特征 关联信息 多维度注意力机制 语音增强
下载PDF
基于集群辨识和卷积神经网络-双向长短期记忆-时序模式注意力机制的区域级短期负荷预测 被引量:1
18
作者 陈晓梅 肖徐东 《现代电力》 北大核心 2024年第1期106-115,共10页
为了解决区域级短期电力负荷预测时输入特征过多和负荷时序性较强的问题,提出一种基于集群辨识和卷积神经网络(convolutional neural networks,CNN)-双向长短期记忆网络(bi-directional long short-term memory,BiLSTM)-时序模式注意力... 为了解决区域级短期电力负荷预测时输入特征过多和负荷时序性较强的问题,提出一种基于集群辨识和卷积神经网络(convolutional neural networks,CNN)-双向长短期记忆网络(bi-directional long short-term memory,BiLSTM)-时序模式注意力机制(temporal pattern attention,TPA)的预测方法。首先,将用电模式和天气作为影响因素,基于二阶聚类算法对区域内的负荷节点进行集群辨识,再从每个集群中挑选代表特征作为深度学习模型的输入,这样既能减少输入特征维度,降低计算复杂度,又能综合考虑预测区域的整体特征,提升预测精度。然后,针对区域电力负荷时序性的特点,用CNN-BiLSTM-TPA模型完成训练和预测,该模型能提取输入数据的双向信息生成隐状态矩阵,并对隐状态矩阵的重要特征加权,从多时间步上捕获双向时序信息用于预测。最后,在美国加利福尼亚州实例上分析验证了所提方法的有效性。 展开更多
关键词 短期电力负荷预测 双向长短期记忆网络 时序模式注意力机制 集群辨识 卷积神经网络
下载PDF
融合Res3D、BiLSTM和注意力机制的羊只行为识别方法
19
作者 袁洪波 曹润柳 程曼 《农业机械学报》 EI CAS CSCD 北大核心 2024年第4期221-230,共10页
识别动物行为可以为疾病预防和合理喂养提供重要依据,从而有助于更好地关注动物的健康和福利。本文提出了一种融合三维残差卷积神经网络、双向长短期记忆网络和注意力机制的深度学习网络模型(AdRes3D-BiLSTM)。AdRes3D-BiLSTM模型可以... 识别动物行为可以为疾病预防和合理喂养提供重要依据,从而有助于更好地关注动物的健康和福利。本文提出了一种融合三维残差卷积神经网络、双向长短期记忆网络和注意力机制的深度学习网络模型(AdRes3D-BiLSTM)。AdRes3D-BiLSTM模型可以直接针对视频流进行识别,在AdRes3D部分引入了深度可分离卷积和注意力机制,不但减少了浮点运算量,提升了网络轻量化程度,还提高了时间和空间两个维度的特征提取能力;提取的特征被输入BiLSTM模块后,从前后2个方向对时序特征向量进行筛选和更新,最后对羊只行为进行准确识别。试验结果表明,AdRes3D-BiLSTM对羊只站立、躺卧、进食、行走和反刍5种行为的综合识别准确率达到了98.72%,帧速率达到52.79 f/s,模型内存占用量为28.03 MB。研究结果为基于视频流的动物行为识别提供了新的方法和思路。 展开更多
关键词 羊只 行为识别 视频流 Res3D BiLSTM 注意力机制
下载PDF
基于注意力机制语义增强的文档级关系抽取
20
作者 柳先辉 吴文达 +1 位作者 赵卫东 侯文龙 《同济大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第5期822-828,共7页
文档级关系抽取旨在从文档中抽取出多个实体对之间的关系,具有较高的复杂性。针对文档级关系抽取中的多实体、关系相关性、关系分布不平衡等问题,提出了一种基于注意力机制(Attention)语义增强的文档级关系抽取方法,能够实现实体对之间... 文档级关系抽取旨在从文档中抽取出多个实体对之间的关系,具有较高的复杂性。针对文档级关系抽取中的多实体、关系相关性、关系分布不平衡等问题,提出了一种基于注意力机制(Attention)语义增强的文档级关系抽取方法,能够实现实体对之间关系的推理。具体来说,首先在数据编码模块改进编码策略,引入更多实体信息,通过编码网络捕获文档的语义特征,获得实体对矩阵;然后,设计了一个基于Attention门控机制的U-Net网络,对实体对矩阵进行局部信息捕获和全局信息汇总,实现语义增强;最后,使用自适应焦点损失函数缓解关系分布不平衡的问题。在4个公开的文档级关系抽取数据集(DocRED、CDR、GDA和DWIE)上评估了Att-DocuNet模型并取得了良好的实验结果。 展开更多
关键词 文档级关系抽取 注意力机制 语义增强 焦点损失
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部