期刊文献+
共找到52篇文章
< 1 2 3 >
每页显示 20 50 100
计及电价和Attention机制的LSTM短期负荷预测模型 被引量:6
1
作者 冯荣强 赵磊 +3 位作者 杨勇 李宽宏 陈蕾 郑伟彦 《科技通报》 2020年第11期57-62,68,共7页
为了提高电力市场环境下短期负荷预测精度,利用互信息法和电价负荷曲线验证电价与负荷的关系,考虑电价对负荷预测的影响,从而提出一种基于Attention-LSTM(attention long short-term memory,Attention-LSTM)网络的短期负荷预测模型。首... 为了提高电力市场环境下短期负荷预测精度,利用互信息法和电价负荷曲线验证电价与负荷的关系,考虑电价对负荷预测的影响,从而提出一种基于Attention-LSTM(attention long short-term memory,Attention-LSTM)网络的短期负荷预测模型。首先将考虑电价波动因素的特征向量从输入层放入LSTM模型隐藏层中进行训练,然后将训练后得到的特征向量作为Attention层的输入,生成权重向量,最后将特征向量和权重向量合并得到新的向量,通过全连接层的训练得到预测结果值。运用江苏某地市数据进行实验验证,结果表明所提方法具有更高的负荷预测精度。 展开更多
关键词 电力市场 负荷预测 互信息 LSTM attention
下载PDF
基于自注意力融合的不完整多视图聚类算法
2
作者 李顺勇 李师毅 +1 位作者 胥瑞 赵兴旺 《计算机应用》 CSCD 北大核心 2024年第9期2696-2703,共8页
基于不完整数据的多视图聚类任务已经成为无监督学习领域的研究热点之一。然而大多数基于“浅层”模型的多视图聚类算法通常在面对大规模高维数据时难以提取和刻画视图内的潜在特征结构;同时,堆叠或求平均的多视图信息融合方式忽视了视... 基于不完整数据的多视图聚类任务已经成为无监督学习领域的研究热点之一。然而大多数基于“浅层”模型的多视图聚类算法通常在面对大规模高维数据时难以提取和刻画视图内的潜在特征结构;同时,堆叠或求平均的多视图信息融合方式忽视了视图之间的差异性,没有充分考虑各视图对构建公共一致表示的不同贡献。针对以上问题,提出一种基于自注意力融合的不完整多视图聚类算法(IMVCSAF)。首先,基于深度自编码器提取各视图的潜在特征,并采用对比学习的方式最大化各视图间的一致性信息;其次,采用自注意力机制对各视图的潜在表示进行重新编码和融合,并全面考虑和挖掘不同视图之间的内在因果性和特征互补性;再次,基于公共一致表示对缺失实例样本的潜在表示进行预测和恢复,从而完整地实现多视图聚类的过程。在Scene-15、LandUse-21、Caltech101-20和NoisyMNIST数据集上的实验结果表明,IMVCSAF在满足收敛性要求的前提下得到的准确率均高于其他对比算法,而在50%缺失率的Noisy-MNIST数据集上,IMVCSAF的准确率比次优的COMPLETER(inCOMPlete muLti-view clustEring via conTrastivE pRediction)算法提高了6.58个百分点。 展开更多
关键词 多视图聚类 自注意力 互信息 表示学习 深度学习
下载PDF
Rmcvit:一种融合卷积与自注意力的轻量级图像识别算法
3
作者 孙红 吴一凡 +2 位作者 徐广辉 田鑫驰 朱江明 《小型微型计算机系统》 CSCD 北大核心 2024年第8期1929-1934,共6页
为了解决目前基于Transformer的模型需要较大的参数量而无法有效应用在资源受限的移动端设备中,提出一种融合卷积与Transformer两者优势的轻量级混合模型.模型中Rmcvit Block将输入张量分成多个通道组,利用深度可分离卷积和跨通道维度... 为了解决目前基于Transformer的模型需要较大的参数量而无法有效应用在资源受限的移动端设备中,提出一种融合卷积与Transformer两者优势的轻量级混合模型.模型中Rmcvit Block将输入张量分成多个通道组,利用深度可分离卷积和跨通道维度的互协方差注意力来增加感受野并融合多尺度特征,并融合unflod模块在保证其空间顺序的前提下,降低每个向量序列(token)送入自注意力模块后的计算消耗.基于整理后的Imagenet数据集的对比实验,RmcVit-M以5.81M的参数量大小达到了85.2%的准确率,其模型相关变体性能超过了参数量相似的Transformer模型和卷积神经网络.结果表明,Rmcvit能够有效结合卷积神经网络与Transformer的优势,达到了以较少的模型参数获得更高准确率的目的. 展开更多
关键词 卷积神经网络 互协方差注意力 轻量级混合模型 深度可分离卷积 多尺度
下载PDF
基于层内双分支互增强注意力的伪装目标检测算法
4
作者 苏嘉文 周之平 莫燕 《南昌航空大学学报(自然科学版)》 CAS 2024年第2期10-17,48,共9页
伪装目标检测的任务是找到因颜色、纹理等相似特征而与背景混合的目标,而现有方法没有充分考虑边缘特征对检测性能的影响,存在漏检、错分等情况,检测精度仍需提升。为了克服以上不足,提出一种基于层内双分支相互增强注意力的伪装目标检... 伪装目标检测的任务是找到因颜色、纹理等相似特征而与背景混合的目标,而现有方法没有充分考虑边缘特征对检测性能的影响,存在漏检、错分等情况,检测精度仍需提升。为了克服以上不足,提出一种基于层内双分支相互增强注意力的伪装目标检测方法,该方法在现有多监督机制的基础上,引入对象边缘的预测模块,使模型的检测性能得到提升。为增强模型对物体的空间定位和识别能力,以Swin Transformer模型作为主干网络,设计了一种新型的层内双分支相互增强注意力模块,该模块包含双注意力增强模块和简单互增强模块。在CAMO、COD10K、NC4K等3个主流基准数据集上开展实验评估模型的性能,并将其与现有18种典型算法进行比较。结果表明:该模型具有优越的性能,在S_(α)、αE、ωF、MAE 4个性能指标上显著地优于现有18种先进的方法。 展开更多
关键词 伪装目标检测 双注意力增强 融合互增强 注意力机制
下载PDF
Knowledge Graph based Mutual Attention for Machine Reading Comprehension over Anti-Terrorism Corpus 被引量:1
5
作者 Feng Gao Jin Hou +1 位作者 Jinguang Gu Lihua Zhang 《Data Intelligence》 EI 2023年第3期685-706,共22页
Machine reading comprehension has been a research focus in natural language processing and intelligence engineering.However,there is a lack of models and datasets for the MRC tasks in the anti-terrorism domain.Moreove... Machine reading comprehension has been a research focus in natural language processing and intelligence engineering.However,there is a lack of models and datasets for the MRC tasks in the anti-terrorism domain.Moreover,current research lacks the ability to embed accurate background knowledge and provide precise answers.To address these two problems,this paper first builds a text corpus and testbed that focuses on the anti-terrorism domain in a semi-automatic manner.Then,it proposes a knowledge-based machine reading comprehension model that fuses domain-related triples from a large-scale encyclopedic knowledge base to enhance the semantics of the text.To eliminate knowledge noise that could lead to semantic deviation,this paper uses a mixed mutual ttention mechanism among questions,passages,and knowledge triples to select the most relevant triples before embedding their semantics into the sentences.Experiment results indicate that the proposed approach can achieve a 70.70%EM value and an 87.91%F1 score,with a 4.23%and 3.35%improvement over existing methods,respectively. 展开更多
关键词 Machine reading comprehension Anti-terrorism domain Knowledge embedding Knowledge attention mutual attention
原文传递
基于注意力机制的DM-BCNN鲨鱼种群细粒度分类方法
6
作者 蒋飞 李皞 +2 位作者 李雅琴 肖松宴 刘天玮 《渔业现代化》 CSCD 北大核心 2024年第5期90-101,共12页
为提高鲨鱼种群细粒度分类的准确率,解决数据集图像干扰因素多、图像局部关键特征提取不足、通道语义关联欠缺等问题,提出了一种基于改进双线性卷积神经网络B-CNN模型的DM-BCNN鲨鱼种群细粒度分类模型。首先,引入可变形卷积将原模型中... 为提高鲨鱼种群细粒度分类的准确率,解决数据集图像干扰因素多、图像局部关键特征提取不足、通道语义关联欠缺等问题,提出了一种基于改进双线性卷积神经网络B-CNN模型的DM-BCNN鲨鱼种群细粒度分类模型。首先,引入可变形卷积将原模型中的特征提取部分替换为DRAM_ResNet网络结构,提升模型对复杂非规则形状和局部结构的检测能力;然后在此基础上采用NAM注意力机制,加强模型对关键特征的识别提取能力;最后引入互通道损失函数,增强鲨鱼图像不同通道间的语义关联性,使得模型可以更全面地捕捉图像不同方面的信息。结果显示:改进模型DM-BCNN在Top-1准确率达到了96.12%,相较于原模型提升了2.51个百分点。研究表明,改进模型相比原模型在细粒度图像分类上的表现更加出色,对鲨鱼种群的细粒度分类识别更加有效。 展开更多
关键词 鲨鱼 细粒度图像 注意力机制 可变形卷积 互通道损失
下载PDF
融入互注意力的风险领域实体关系抽取研究 被引量:3
7
作者 杨美芳 杨波 《小型微型计算机系统》 CSCD 北大核心 2023年第5期991-1001,共11页
风险领域实体关系抽取是扩充现有知识图谱与泛化知识工程应用的关键问题.当前特定领域实体关系抽取面临人工标注语料的严重依赖、实体间关系的交叉互联以及远程监督标注存在噪声数据等核心难题,简单的解决方案是运用风险领域已有的知识... 风险领域实体关系抽取是扩充现有知识图谱与泛化知识工程应用的关键问题.当前特定领域实体关系抽取面临人工标注语料的严重依赖、实体间关系的交叉互联以及远程监督标注存在噪声数据等核心难题,简单的解决方案是运用风险领域已有的知识图谱作为指导.然而,相比通用领域知识图谱,风险领域知识图谱的规模往往较小,难以满足当前领域实体关系抽取的知识需求.因此,本文既要利用已有的风险领域知识图谱,又要充分挖掘蕴含于领域文本数据中规律性的风险知识.本文提出基于知识图谱与文本互注意力的风险领域实体关系抽取方案.首先,根据已有的知识图谱抽象出风险领域实体关系及其约束条件;其次,运用少量高质的实体关系与大规模风险领域语料训练知识图谱与文本的互注意力机制模型,并融合文本表示学习与深度神经网络的方法进行风险领域实体关系的抽取.最后,针对给定的领域文本数据,综合关系约束与关系抽取结果得出风险领域实体关系类型.本文以风险领域数据为例,仅用少量的领域知识,即可获取较好的实体关系抽取效果. 展开更多
关键词 领域实体关系 互注意力机制 关系抽取 知识图谱
下载PDF
基于多尺度互注意力的遥感图像语义分割网络 被引量:4
8
作者 刘春娟 乔泽 +3 位作者 闫浩文 吴小所 王嘉伟 辛钰强 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2023年第7期1335-1344,共10页
为了解决在遥感图像语义分割任务中存在的目标物体之间巨大尺度差异和丢失空间细节信息导致分割精度下降的问题,提出多尺度互注意力与指导上采样网络.利用多尺度互注意力模块获得不同尺度图像之间的像素关系,平衡不同尺度物体的权重,提... 为了解决在遥感图像语义分割任务中存在的目标物体之间巨大尺度差异和丢失空间细节信息导致分割精度下降的问题,提出多尺度互注意力与指导上采样网络.利用多尺度互注意力模块获得不同尺度图像之间的像素关系,平衡不同尺度物体的权重,提高小尺度物体的分割性能.编码指导上采样模块利用编码结构中的信息,指导图像上采样的过程,融合空间细节信息,提升目标物体边界像素的分类效果.在Potsdam数据集和Jiage数据集上的m IoU得分分别为85.52%和86.59%,较次优网络分别提升了1.32%和1.46%. 展开更多
关键词 遥感图像 语义分割 多尺度互注意力 小尺度物体 编码指导上采样
下载PDF
融入句法结构和摘要信息的文本蕴含识别模型
9
作者 钟茂生 孙磊 +1 位作者 罗贤增 王明文 《计算机技术与发展》 2023年第10期120-127,共8页
文本蕴含识别旨在推断两个句子之间的语义关系,通常分为蕴含、矛盾和中立三种类别。目前,大多数文本蕴含识别方法都是通过互注意力的方法,判定句子之间的语义关系,这种方法只能捕捉局部交互信息,弱化了全局交互信息。据此,提出了融入句... 文本蕴含识别旨在推断两个句子之间的语义关系,通常分为蕴含、矛盾和中立三种类别。目前,大多数文本蕴含识别方法都是通过互注意力的方法,判定句子之间的语义关系,这种方法只能捕捉局部交互信息,弱化了全局交互信息。据此,提出了融入句法结构和摘要信息的文本蕴含识别模型,通过结合自注意力和互注意力机制的方式,从句子的全局和局部交互信息考虑,并融入句子的句法结构信息,从而更准确地推测句子之间的语义关系;收集和整理了公务员试题的部分选择题,之后,将该模型和文本蕴含识别的思想应用于这部分试题,在试题中,使用摘要信息抽取的方法,解决公务员试题中题目冗长和答案简短导致的长度不对称问题。实验结果表明,该模型在公共数据集和公务员试题上的表现,超越了多个基准模型。 展开更多
关键词 文本蕴含识别 摘要信息抽取 句法结构 互注意力 自注意力
下载PDF
结合注意力转移与特征融合算法的在线知识蒸馏
10
作者 梁兴柱 徐慧 胡干 《湖北理工学院学报》 2023年第1期31-35,共5页
为构建一个强大的在线集成教师指导各子网络学习的在线知识蒸馏模型,提升模型准确率,提出了一种结合注意力与特征融合的在线知识蒸馏方法(KD-ATFF),在各子网络输出处利用特征融合模块融合各分支最后一个block学习到的知识,从而构建强大... 为构建一个强大的在线集成教师指导各子网络学习的在线知识蒸馏模型,提升模型准确率,提出了一种结合注意力与特征融合的在线知识蒸馏方法(KD-ATFF),在各子网络输出处利用特征融合模块融合各分支最后一个block学习到的知识,从而构建强大的教师模型,指导各分支训练,同时利用所提的CL模块将深层神经元的注意力转移到浅层网络进行互学习,以增加各block的多样性,进一步提升单个子网络的性能。在CIFAR10/100数据集上进行实验,KD-ATFF与baseline方法相比错误率降低了约30%,于DML相比错误率最大降低了1.76%,验证了算法的有效性。 展开更多
关键词 在线知识蒸馏 注意力转移 特征融合 互学习
下载PDF
高阶互信息最大化与伪标签指导的深度聚类 被引量:1
11
作者 刘超 孔兵 +3 位作者 杜国王 周丽华 陈红梅 包崇明 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2023年第2期299-309,共11页
针对现有聚类方法未充分探索图的拓扑结构和节点关系,且无法受益于模型预测的不精确标签的问题,提出一种高阶互信息最大化与伪标签指导的深度聚类模型HMIPDC.该模型采用高阶互信息最大化策略来最大化图的全局表示、节点表示、节点属性... 针对现有聚类方法未充分探索图的拓扑结构和节点关系,且无法受益于模型预测的不精确标签的问题,提出一种高阶互信息最大化与伪标签指导的深度聚类模型HMIPDC.该模型采用高阶互信息最大化策略来最大化图的全局表示、节点表示、节点属性信息之间的互信息.通过一种结合多跳邻近矩阵的自注意力机制更加合理地提取节点的低维表征.使用基于深度散度的聚类损失函数(DDC)迭代优化聚类目标,抽取高置信度的预测标签对低维表征的学习进行监督.在4个基准数据集上的聚类任务、实验时间分析和聚类可视化分析充分表明,HMIPDC的聚类性能始终优于大多数的深度聚类方法.通过消融研究和参数敏感性分析验证了该模型的有效性和稳定性. 展开更多
关键词 自监督学习 深度聚类 自注意力机制 高阶互信息 伪标签
下载PDF
基于时间模式注意力机制的GRU短期负荷预测 被引量:5
12
作者 乔石 王磊 +2 位作者 张鹏超 闫群民 余帆 《电力系统及其自动化学报》 CSCD 北大核心 2023年第10期49-58,共10页
针对新能源时代负荷数据随机性更强及负荷预测误差较大的问题,提出一种基于时间模式注意力机制的门控循环单元神经网络短期负荷预测方法。首先,采用自适应白噪声的完整经验模态分解对负荷数据进行处理,得到若干个频率范围不同的本征模... 针对新能源时代负荷数据随机性更强及负荷预测误差较大的问题,提出一种基于时间模式注意力机制的门控循环单元神经网络短期负荷预测方法。首先,采用自适应白噪声的完整经验模态分解对负荷数据进行处理,得到若干个频率范围不同的本征模函数。其次,通过最大互信息系数进行相关性分析筛选特征,优化输入数据的特征维度。然后,构建基于时间模式注意力机制的门控循环单元神经网络预测模型进行负荷预测,采用自回归算法优化线性特征提取能力,得到预测结果。最后,通过实例分析证明了所提模型有助于负荷预测精度的提升。 展开更多
关键词 短期负荷预测 最大互信息系数 自适应白噪声的完整经验模态分解 TPA-GRU神经网络
下载PDF
基于细粒度特征与注意力机制的机载图像匹配 被引量:1
13
作者 俞心蕊 姚竹贤 +1 位作者 连思铭 丁祝顺 《航天控制》 CSCD 北大核心 2023年第2期47-52,共6页
针对多视图多视角机载图像匹配问题,提出一种基于细粒度特征和互注意力机制的图像匹配方法。该方法在使用卷积神经网络来提取局部细粒度特征的基础上,通过自注意力机制挖掘全局信息并融入细粒度特征表达,再利用互注意力机制增强匹配图... 针对多视图多视角机载图像匹配问题,提出一种基于细粒度特征和互注意力机制的图像匹配方法。该方法在使用卷积神经网络来提取局部细粒度特征的基础上,通过自注意力机制挖掘全局信息并融入细粒度特征表达,再利用互注意力机制增强匹配图像间的相似性细粒度特征。然后计算每个细粒度特征的注意力得分,按其大小对特征分割对齐。最后用改进后的三重损失对整个模型进行约束,使模型在多视图多视角的数据上更具有鲁棒性。在University-1652公开数据集上的实验结果表明,本文方法的匹配性能优于目前先进方法。 展开更多
关键词 细粒度特征 互注意力机制 全局特征融合 三重损失 图像匹配
下载PDF
基于互通道损失数据增强网络的细粒度图像分类 被引量:1
14
作者 胡晓斌 彭太乐 《江汉大学学报(自然科学版)》 2023年第6期63-71,共9页
寻找与细微特征对应的区别性局部区域是解决细粒度图像分类问题的关键。近年来,通过弱监督数据增强网络(WS-DAN)进行细粒度分类取得了优异的效果,但其单一的交叉熵损失(CE-Loss)使得网络专注于全局判别性区域,而遗漏了一些局部判别性区... 寻找与细微特征对应的区别性局部区域是解决细粒度图像分类问题的关键。近年来,通过弱监督数据增强网络(WS-DAN)进行细粒度分类取得了优异的效果,但其单一的交叉熵损失(CE-Loss)使得网络专注于全局判别性区域,而遗漏了一些局部判别性区域。针对这一问题,提出基于互通道损失(MC-Loss)的数据增强网络(MC-DAN),互通道损失能强制属于同一类别的特征通道更具有区分性。其次,引入反事实注意力机制(CAL),通过反事实干预来鼓励网络学习更多的注意力信息。此外,提出一种空间注意力和通道注意力相结合的注意力模块,以更好地关注图像中的对象区域。在3个公共数据集上的综合实验表明,该方法能有效实现分类。 展开更多
关键词 细粒度图像分类 互通道损失 反事实注意力学习 数据增强
下载PDF
结合新颖的互注意力和门控机制的图像标题生成
15
作者 胡卫兵 米金鹏 +2 位作者 吴旭明 刘丹 杨芳艳 《小型微型计算机系统》 CSCD 北大核心 2023年第8期1785-1791,共7页
图像标题生成是通过机器产生描述图像的语句,属于多模态领域的重要研究方向之一,现有的工作大多数有两点不足:1)采用单一的图像特征,导致在非结构化场景中无法完全描述图像中更加细粒度的内容信息;2)模型大多数完全依赖图像的特征生成句... 图像标题生成是通过机器产生描述图像的语句,属于多模态领域的重要研究方向之一,现有的工作大多数有两点不足:1)采用单一的图像特征,导致在非结构化场景中无法完全描述图像中更加细粒度的内容信息;2)模型大多数完全依赖图像的特征生成句子,而没有引入外部知识作为辅助信息.针对上述两点,提出一种互注意力和门控机制的方法.在MSCOCO2014数据集上和Flickr30k数据集上分别进行实验,结果在各项指标上相较于主流模型均有一定的提升,表明该方法对图像内容的理解更加全面且生成的句子更加丰富. 展开更多
关键词 图像标题生成 外部知识 互注意力 门控机制
下载PDF
互信息与多条元路径融合的异质网络表示学习方法 被引量:1
16
作者 贾霄生 赵中英 +2 位作者 李超 栾文静 梁永全 《软件学报》 EI CSCD 北大核心 2023年第7期3256-3271,共16页
异质信息网络能够对真实世界的诸多复杂应用场景进行建模,其表示学习研究也得到了众多学者的广泛关注.现有的异质网络表示学习方法大多基于元路径来捕获网络中的结构和语义信息,已经在后续的网络分析任务中取得很好的效果.然而,此类方... 异质信息网络能够对真实世界的诸多复杂应用场景进行建模,其表示学习研究也得到了众多学者的广泛关注.现有的异质网络表示学习方法大多基于元路径来捕获网络中的结构和语义信息,已经在后续的网络分析任务中取得很好的效果.然而,此类方法忽略了元路径的内部节点信息和不同元路径实例的重要性;仅能捕捉到节点的局部信息.因此,提出互信息与多条元路径融合的异质网络表示学习方法.首先,利用一种称为关系旋转编码的元路径内部编码方式,基于相邻节点和元路径上下文节点捕获异质信息网络的结构和语义信息,采用注意力机制来建模各元路径实例的重要性;然后,提出一种互信息最大化与多条元路径融合的无监督异质网络表示学习方法,使用互信息捕获全局信息以及全局信息和局部信息之间的联系.最后,在两个真实数据集上进行实验,并与当前主流的算法进行比较分析.结果表明,所提方法在节点分类和聚类任务上性能都有提升,甚至和一些半监督算法相比也表现出强劲性能. 展开更多
关键词 异质网络表示学习 元路径 注意力机制 互信息 无监督学习
下载PDF
结合注意力互斥正则的细粒度图像分类 被引量:1
17
作者 陆靖桥 宾炜 +3 位作者 卢永锵 麦广柱 陈银 伍雁雄 《计算机应用》 CSCD 北大核心 2023年第S01期224-228,共5页
细粒度图像分类(FGVC)具有类间差异小、类内差异大等特点,提升该任务效果的关键在于识别目标的判别性部位。目前基于注意力机制的方法一般会识别一个或者两个判别性部位,效果不佳。为此,提出一种注意力互斥正则机制的细粒度模型(AMEM),... 细粒度图像分类(FGVC)具有类间差异小、类内差异大等特点,提升该任务效果的关键在于识别目标的判别性部位。目前基于注意力机制的方法一般会识别一个或者两个判别性部位,效果不佳。为此,提出一种注意力互斥正则机制的细粒度模型(AMEM),通过限制注意力图的不同通道关注不同目标部位,引导模型关注目标的多个判别性部位。在CUB-200-2011、FGVC-Aircraft、Stanford Cars和Stanford Dogs等4个公开数据集上进行评测,实验表明AMEM取得了90.5%、94.3%、95.5%和93.2%的准确率,效果优于对比实验中的其他细粒度模型;此外热力图显示可以识别出指定数目的判别性部位。AMEM在提升预测性能的同时,也能提供一定程度的预测可解释性。 展开更多
关键词 细粒度图像分类 注意力机制 互斥正则 深度学习
下载PDF
融合多层次特征及互注意力机制的视差估计 被引量:1
18
作者 韩坤昊 贾振堂 《国外电子测量技术》 北大核心 2023年第10期35-42,共8页
提出一种端到端的基于互注意力机制并融合多级特征的视差估计算法,利用多级特征图像产生多个视差代价空间,以当前视差对这些代价空间进行检索,将检索结果融合后形成代价特征;同时利用左特征图构建内容特征。代价特征和内容特征在互注意... 提出一种端到端的基于互注意力机制并融合多级特征的视差估计算法,利用多级特征图像产生多个视差代价空间,以当前视差对这些代价空间进行检索,将检索结果融合后形成代价特征;同时利用左特征图构建内容特征。代价特征和内容特征在互注意力模块中多次相互作用后输出综合特征,并据此拟合视差。互注意力模块可多次迭代,以进一步优化视差。与RAFT-Stereo算法相比,算法的网络参量降低了23%,运算速度提高了76.2%,并在KITTI 2015数据集上的终点误差(EPE)降低了0.15,验证了该方法的有效性。 展开更多
关键词 视差估计 互注意力机制 余弦相似度 多级融合 深度学习
下载PDF
特征挖掘与区域增强的弱监督时序动作定位
19
作者 王静 王传旭 《计算机应用研究》 CSCD 北大核心 2023年第8期2555-2560,共6页
弱监督时序动作定位旨在定位视频中行为实例的起止边界及识别相应的行为。现有方法尽管取得了很大进展,但依然存在动作定位不完整及短动作的漏检问题。为此,提出了特征挖掘与区域增强(FMRE)的定位方法。首先,通过基础分支计算视频片段... 弱监督时序动作定位旨在定位视频中行为实例的起止边界及识别相应的行为。现有方法尽管取得了很大进展,但依然存在动作定位不完整及短动作的漏检问题。为此,提出了特征挖掘与区域增强(FMRE)的定位方法。首先,通过基础分支计算视频片段之间的相似分数,并以此分数聚合上下文信息,得到更具有区别性的段分类分数,实现动作的完整定位;然后,添加增强分支,对基础分支定位中持续时间较短的动作提案沿时间维度进行动态上采样,进而采用多头自注意机制对动作提案间的时间结构显式建模,促进具有时间依赖关系的动作定位且防止短动作的漏检;最后,在两个分支之间构建伪标签互监督,逐步改进在训练过程中生成动作提案的质量。该算法在THUMOS14和ActivityNet1.3数据集上分别取得了70.3%和40.7%的检测性能,证明了所提算法的有效性。 展开更多
关键词 时序动作定位 逆变换 动态采样 伪标签互监督 多头自注意
下载PDF
交叉注意互学习的跨领域重识别实验设计
20
作者 云霄 褚菲 +1 位作者 张晓光 汪群群 《实验科学与技术》 2023年第3期19-28,共10页
针对视频智能监控中跨领域行人重识别的研究热点,将交叉注意互学习的无监督跨领域行人重识别设计为研究性实验现场硬件教学项目,观察重要区域特征关注度和网络伪标签互监督两方面对模型跨领域能力的影响。设计多尺度交叉组合注意力机制... 针对视频智能监控中跨领域行人重识别的研究热点,将交叉注意互学习的无监督跨领域行人重识别设计为研究性实验现场硬件教学项目,观察重要区域特征关注度和网络伪标签互监督两方面对模型跨领域能力的影响。设计多尺度交叉组合注意力机制,分析其在通道和空间上对重要区域特征关注度的增强,以及对区分度不高特征关注度的减少。在此基础上设计多尺度交叉组合注意力互学习实验网络,采用硬标签互学习的方式更新训练过程,消除错误伪标签对模型性能的影响。教学实践表明,该实验项目有助于提升学生动手能力和独立思考问题的能力,为科研成果转化为教学实验提供了借鉴。 展开更多
关键词 行人重识别 无监督学习 跨领域自适应 注意力机制 互学习
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部