期刊文献+
共找到177篇文章
< 1 2 9 >
每页显示 20 50 100
融合GAT与QA提取范式的事件抽取方法
1
作者 潘成胜 陈星雨 +1 位作者 王建伟 施建锋 《计算机工程与设计》 北大核心 2024年第10期3081-3088,共8页
针对传统抽取方法中事件标签语义与事件关系信息利用率低的问题,提出一种融合GAT(图注意力网络)与QA(问题-回答)提取范式的事件抽取方法。将事件类型与论元角色作为查询语句,根据不同事件类型之间的关联构建事件关系图,通过图注意力网... 针对传统抽取方法中事件标签语义与事件关系信息利用率低的问题,提出一种融合GAT(图注意力网络)与QA(问题-回答)提取范式的事件抽取方法。将事件类型与论元角色作为查询语句,根据不同事件类型之间的关联构建事件关系图,通过图注意力网络优化事件类型表示,使用注意力机制获取文本与标签的丰富语义,获取事件触发词与事件论元角色。该方法在DuEE数据集上的实验结果表明,触发词识别和论元角色识别的F1值比传统的BERT_QA_Arg模型分别提升4.49%和10.02%,验证了其有效性。 展开更多
关键词 图注意力网 问答任务 标签语义 事件抽取 注意力机制 查询语句 事件关系图
下载PDF
基于Attention-BiLSTM网络的车辆换道意图识别 被引量:1
2
作者 黄开启 罗涛 《浙江工业大学学报》 CAS 北大核心 2023年第3期264-270,共7页
针对换道意图识别方法仅考虑车辆历史状态信息,未充分利用车辆连续性和时序性特征的问题,提出了一种基于Attention-BiLSTM网络的换道意图识别方法。首先,分析行驶车辆之间的交互行为,采用双向长短期记忆网络学习换道意图特征编码信息;其... 针对换道意图识别方法仅考虑车辆历史状态信息,未充分利用车辆连续性和时序性特征的问题,提出了一种基于Attention-BiLSTM网络的换道意图识别方法。首先,分析行驶车辆之间的交互行为,采用双向长短期记忆网络学习换道意图特征编码信息;其次,通过引入模拟人脑推理行为的注意力机制进行网络权重自适应分配,提高网络捕捉重要状态信息能力;最后,利用HighD车辆轨迹数据集对模型进行训练和评估。试验结果表明:所提出的Attention-BiLSTM模型与LSTM模型相比,其准确率和F1分数分别提高了13.2%和10.5%,有效提升网络对周围车辆换道意图的识别性能。 展开更多
关键词 换道意图识别 双向长短期记忆网络 注意力机制 交互行为
下载PDF
基于门控循环单元和Transformer的车辆轨迹预测方法
3
作者 王庆荣 谭小泽 +1 位作者 朱昌锋 李裕杰 《汽车技术》 CSCD 北大核心 2024年第7期1-8,共8页
为增强自动驾驶车辆对动态环境的理解能力及其道路行驶安全性,提出基于门控循环单元(GRU)和Transformer的车辆轨迹预测模型STGTF,使用GRU提取车辆的历史轨迹特征,通过双层多头注意力(MHA)机制提取车辆的时空交互特征,生成预测轨迹。试... 为增强自动驾驶车辆对动态环境的理解能力及其道路行驶安全性,提出基于门控循环单元(GRU)和Transformer的车辆轨迹预测模型STGTF,使用GRU提取车辆的历史轨迹特征,通过双层多头注意力(MHA)机制提取车辆的时空交互特征,生成预测轨迹。试验结果表明,预测结果的均方根误差(RMSE)平均降低7.3%,STGTF在短期预测和长期预测方面均有不同程度的提升,验证了模型的有效性。 展开更多
关键词 车辆轨迹预测 门控循环单元 TRaNSFORMER 车辆交互 多头注意力机制
下载PDF
基于人工智能SGRN-Trans框架预测温胆汤中成分-靶点相互作用的研究
4
作者 王艳菁 李治琦 +2 位作者 魏冬青 徐威 谭红胜 《重庆医科大学学报》 CAS CSCD 北大核心 2024年第8期1002-1011,共10页
目的:以温胆汤为例,构建基于知识图谱和注意力机制的深度学习模型(SGRN-Trans)预测中医经典名方中药效成分与靶点的相互作用,评价其预测效果。方法:首次提出SGRN-Trans(Self-weighted Graph Relational Network-Transformer)预测模型,... 目的:以温胆汤为例,构建基于知识图谱和注意力机制的深度学习模型(SGRN-Trans)预测中医经典名方中药效成分与靶点的相互作用,评价其预测效果。方法:首次提出SGRN-Trans(Self-weighted Graph Relational Network-Transformer)预测模型,结合多生物数据源构建中医经典名方温胆汤知识图谱(Wendan Decoction Knowledge Graph,WDKG),利用图神经网络学习知识图谱中每个实体的低维嵌入表示,引入中药成分和靶点各自的结构特征,搭载基于注意力机制的Transformer模型进行药效成分-靶点相互作用的预测,结合分子对接及文献调研进行验证。结果:WDKG包含10个类型共14292个实体,可用于深度学习模型的研究。SGRN-Trans预测模型与TransE、TransR、ComplEx、DistMult、ConvKB等其他知识图谱嵌入模型的性能相比,效果最优。将预测排序前20组的药效成分与靶点分别进行分子对接和可视化呈现,其中8组的结合能提示其药效成分与靶点有潜在的相互作用。以温胆汤中半夏的有效成分soya-cerebroside(大豆脑苷脂)与低密度脂蛋白受体(low density lipoprotein receptor,LDLR)相互作用为例,结合研究文献进行讨论,可能是温胆汤治疗动脉粥样硬化的机制之一。结论:本研究提出基于知识图谱和注意力机制的模型SGRN-Trans,可推广用于预测中医药经典名方复杂网络体系中成分与靶点的相互作用,为阐明经典名方的药效物质基础和作用机制提供新的工具。 展开更多
关键词 温胆汤 药物-靶点相互作用 知识图谱 图神经网络 注意力机制
下载PDF
基于MHSA和GCN的方面级情感分析模型
5
作者 杨乾 艾山·吾买尔 +1 位作者 孙伟伟 古文霞 《东北师大学报(自然科学版)》 CAS 北大核心 2024年第2期69-74,共6页
针对目前大多数现有的基于图卷积网络的模型只考虑了特定方面和上下文之间的交互关系,忽略了方面之间的交互情感特征的问题,本文提出了一种利用预训练BERT和多头自注意力机制(MHSA)结合图卷积网络的模型(MHSAGCN-BERT).用方面词与上下... 针对目前大多数现有的基于图卷积网络的模型只考虑了特定方面和上下文之间的交互关系,忽略了方面之间的交互情感特征的问题,本文提出了一种利用预训练BERT和多头自注意力机制(MHSA)结合图卷积网络的模型(MHSAGCN-BERT).用方面词与上下文的句法依赖和方面之间的相互情感关系来推导出特定方面的情感极性,以此增强模型学习特征能力.在Restaurant14、Restaurant15、Restaurant16公开数据集上进行了实验,结果表明,本文模型与其他方面级情感分析模型相比有较明显的提升. 展开更多
关键词 方面级情感分析 多头自注意力机制 图卷积网络 方面交互 句法依赖树
下载PDF
基于自注意力机制的蛋白质-RNA相互作用预测方法
6
作者 李大伟 胡春玲 +3 位作者 邵鸣义 朱冠雨 胡瑞捷 胡昭龙 《合肥大学学报》 2024年第5期102-109,共8页
尽管已有利用lncRNA和蛋白质的信息来预测lncRPI的方法,但仅利用蛋白质和RNA的序列特征来进行预测相互作用仍然是一个挑战,并且模型预测的准确性有待提高。因此,本文提出了一种融合卷积神经网路和自注意力机制的预测模型LPI-Attention(L... 尽管已有利用lncRNA和蛋白质的信息来预测lncRPI的方法,但仅利用蛋白质和RNA的序列特征来进行预测相互作用仍然是一个挑战,并且模型预测的准确性有待提高。因此,本文提出了一种融合卷积神经网路和自注意力机制的预测模型LPI-Attention(Long non-coding RNA based on self-attention mechanism),该模型采用了k-mer方法来编码RNA和蛋白质序列特征作为模型的输入,这种方法可以同时考虑两种序列的信息,从而提高了预测的准确性。此外,在密集型卷积模块中,使用两种尺度的特征提取,更好地捕捉局部和全局的信息。最后,将得到的特征输入自注意力循环网络层中,更好地处理序列数据的长期依赖关系,将得到的RNA、蛋白质二者特征信息融合成新的特征放入全连接层进行预测。实验结果表明,该模型不仅扩展了生物特征预测领域,而且可以学习RNA序列与蛋白质序列之间更多的相互作用关系,在预测RPIs方面表现优于大多数同类方法,在数据集RPIs1446、RPIs1807、RPIs488上的准确率分别达到91.7%、96.6%、91.6%。 展开更多
关键词 蛋白质-RNa相互作用 序列特征 自注意力机制 卷积神经网络 特征融合
下载PDF
一种基于视觉注意力机制的深度循环Q网络模型 被引量:20
7
作者 刘全 翟建伟 +3 位作者 钟珊 章宗长 周倩 章鹏 《计算机学报》 EI CSCD 北大核心 2017年第6期1353-1366,共14页
由现代强化学习和深度学习相结合形成的深度强化学习方法是目前人工智能领域一个新的研究热点,已经在各种需要感知高维度原始输入数据和决策控制的任务中取得了实质性的突破.尤其是一种被称为深度Q网络的模型在处理诸如Atari 2600游戏... 由现代强化学习和深度学习相结合形成的深度强化学习方法是目前人工智能领域一个新的研究热点,已经在各种需要感知高维度原始输入数据和决策控制的任务中取得了实质性的突破.尤其是一种被称为深度Q网络的模型在处理诸如Atari 2600游戏这类趋于真实环境的复杂问题时表现出了和人类玩家相媲美的水平.然而,当存在有延迟的奖赏而导致需要长时间步规划才能优化策略的情形中,深度Q网络的表现就会急剧下降.这说明深度Q网络并不擅长解决战略性深度强化学习任务.针对此问题,文中使用带视觉注意力机制的循环神经网络改进了传统的深度Q网络模型,提出了一种较为完善的深度强化学习模型.新模型的关键思想有两点:一是使用双层门限循环单元构成的循环神经网络模块来记忆较长时间步内的历史信息.这使得Agent能够及时使用有延迟的反馈奖赏来正确地指导下一步的动作选择;二是通过视觉注意力机制自适应地将注意力集中于面积较小但更具价值的图像区域,从而使得Agent能够更加高效地学习近似最优策略.该文通过选取一些经典的Atari 2600战略性游戏作为实验对象来评估新模型的有效性.实验结果表明,与传统的深度强化学习模型相比,新模型在一些战略性任务上具有很好的性能表现和较高的稳定性. 展开更多
关键词 深度学习 强化学习 深度强化学习 深度q学习 循环神经网络 视觉注意力机制 人工智能
下载PDF
基于Transformer-ESIM注意力机制的多模态情绪识别 被引量:2
8
作者 徐志京 高姗 《计算机工程与应用》 CSCD 北大核心 2022年第10期132-138,共7页
为了提高语音和文本融合的情绪识别准确率,提出一种基于Transformer-ESIM(Transformer-enhanced sequential inference model)注意力机制的多模态情绪识别方法。传统循环神经网络在语音和文本序列特征提取时存在长期依赖性,其自身顺序... 为了提高语音和文本融合的情绪识别准确率,提出一种基于Transformer-ESIM(Transformer-enhanced sequential inference model)注意力机制的多模态情绪识别方法。传统循环神经网络在语音和文本序列特征提取时存在长期依赖性,其自身顺序属性无法捕获长距离特征,因此采用Transformer编码层的多头注意力机制对序列进行并行化处理,解决了序列距离限制,能充分提取序列内的情感语义信息,获取语音和文本序列的深层情感语义编码,同时提高处理速度;通过ESIM交互注意力机制计算语音和文本之间的相似特征,实现语音和文本模态的对齐,解决了多模态特征直接融合而忽视的模态间交互问题,提高模型对情感语义的理解和泛化能力。该方法在IEMOCAP数据集上进行实验测试,实验结果表明,情绪识别分类准确率可达72.6%,和其他主流的多模态情绪识别方法相比各项指标都得到了明显的提升。 展开更多
关键词 多模态情绪识别 Transformer编码层 多头注意力机制 交互注意力
下载PDF
基于BiGCN和IAM的方面级情感分类模型 被引量:4
9
作者 杨春霞 瞿涛 吴佳君 《计算机工程与应用》 CSCD 北大核心 2022年第11期178-186,共9页
目前基于神经网络的方面级情感分类模型很少会考虑上下文单词与方面词之间的句法依存关系,可能会错误地将与方面词语法无关的上下文单词作为方面词的情感特征;另一方面大多数方法也忽略了上下文与方面词之间的交互信息。针对这两个问题... 目前基于神经网络的方面级情感分类模型很少会考虑上下文单词与方面词之间的句法依存关系,可能会错误地将与方面词语法无关的上下文单词作为方面词的情感特征;另一方面大多数方法也忽略了上下文与方面词之间的交互信息。针对这两个问题,提出了基于双向图卷积网络(BiGCN)和交互注意力机制(IAM)的方面级情感分类模型(BiGCN-IAM),该模型在句法依存树上使用双向图卷积网络提取上下文单词和方面词之间的句法依存关系,然后使用掩码层得到特定的方面词表示;最后使用交互注意力机制学习上下文与方面词之间的交互信息,同时提取了上下文中的重要情感特征和方面词中对分类有贡献的特征。通过在五个公开数据集上的实验证明,该模型效果优于基线模型。 展开更多
关键词 方面级情感分类 交互注意力机制 双向图卷积神经网络 句法依存树
下载PDF
基于Transformer模型的问句语义相似度计算 被引量:3
10
作者 丁邱 迟海洋 +2 位作者 严馨 徐广义 邓忠莹 《计算机工程与设计》 北大核心 2023年第3期887-893,共7页
针对现有方法准确率不高、不能充分捕捉句子深层次语义特征的问题,提出一种基于Transformer编码器网络的问句相似度计算方法。在获取句子语义特征前引入交互注意力机制比较句子间词粒度的相似性,通过注意力矩阵和句子矩阵相互生成彼此... 针对现有方法准确率不高、不能充分捕捉句子深层次语义特征的问题,提出一种基于Transformer编码器网络的问句相似度计算方法。在获取句子语义特征前引入交互注意力机制比较句子间词粒度的相似性,通过注意力矩阵和句子矩阵相互生成彼此注意力加权后的新的句子表示矩阵,将获取的新矩阵同原始矩阵拼接融合,丰富句子特征信息;将拼接后的句子特征矩阵作为Transformer编码器网络的输入,由Transformer编码器分别对其进行深层次语义编码,获得句子的全局语义特征;通过全连接网络和Softmax函数对特征进行权重调整,得到句子相似度。在中文医疗健康问句数据集上模型取得了90.2%的正确率,较对比模型提升了将近4.2%,验证了该方法可以有效提高句子的语义表示能力和语义相似度的准确性。 展开更多
关键词 自然语言处理 Transformer编码器 交互注意力机制 特征融合 语义相似度 语义编码 句子表示
下载PDF
CNN A-BLSTM network的双人交互行为识别 被引量:3
11
作者 赵挺 曹江涛 姬晓飞 《电子测量与仪器学报》 CSCD 北大核心 2021年第11期100-107,共8页
关节点数据结合卷积神经网络用于双人交互行为识别存在图像化过程中对交互信息表达不充分且不能有效建模时序关系问题,而结合循环神经网络中存在侧重于对时间信息的表示却忽略了双人交互空间结构信息构建的问题。为此提出一种新的卷积... 关节点数据结合卷积神经网络用于双人交互行为识别存在图像化过程中对交互信息表达不充分且不能有效建模时序关系问题,而结合循环神经网络中存在侧重于对时间信息的表示却忽略了双人交互空间结构信息构建的问题。为此提出一种新的卷积神经网络结合加入注意机制的双向长短时期记忆网络(CNN A-BLSTM)模型。首先对每个人的关节点采用基于遍历树结构进行排列,然后对视频中的每一帧数据构建交互矩阵,矩阵的中的数值为排列后双人之间所有的关节点坐标间的欧氏距离,将矩阵进行灰度图像编码后所得图像依次送入CNN中提取深层次特征得到特征序列,然后将所得序列送入A-BLSTM网络中进行时序建模,最后送入Softmax分类器得到识别结果。将新模型用于NTU RGB D数据集中的11类双人交互行为的识别,其准确率为90%,高于目前的双人交互行为识别算法,验证了该模型的有效性和良好的泛化性能。 展开更多
关键词 双人交互行为识别 深度学习 卷积神经网络 双向长短时期记忆网络 注意机制
下载PDF
基于AWI和GCN的方面级情感分类模型 被引量:1
12
作者 王泽 孔韦韦 +2 位作者 薛佳伟 平稳 李龙 《计算机工程与应用》 CSCD 北大核心 2023年第3期135-142,共8页
目前大多数方面级情感分类研究都忽略了方面词的建模,以及方面词与上下文之间的交互信息,并且难以体现语法上与方面词有直接联系上下文单词的重要程度。针对上述问题,提出基于方面词交互(aspect word interaction,AWI)和图卷积网络(grap... 目前大多数方面级情感分类研究都忽略了方面词的建模,以及方面词与上下文之间的交互信息,并且难以体现语法上与方面词有直接联系上下文单词的重要程度。针对上述问题,提出基于方面词交互(aspect word interaction,AWI)和图卷积网络(graph convolutional network,GCN)的方面级情感分类模型(AWI-GCN)。使用双向长短期记忆网络(bi-directional long short-term memory,Bi-LSTM)分别提取方面词和上下文的特征;采用GCN根据句法依存树进一步提取与方面词有直接语法联系的上下文情感特征;利用注意力机制学习方面词与上下文的交互信息,同时提取上下文中为方面词情感分类做出重要贡献的情感特征。针对3个公开数据集上的仿真实验结果表明,AWI-GCN模型相比当前代表模型取得了更好的情感分类效果。 展开更多
关键词 方面级情感分类 方面词交互 图卷积网络 注意力机制 句法依存树
下载PDF
CAN:Effective Cross Features by Global Attention Mechanism and Neural Network for Ad Click Prediction 被引量:1
13
作者 Wenjie Cai Yufeng Wang +1 位作者 Jianhua Ma Qun Jin 《Tsinghua Science and Technology》 SCIE EI CAS CSCD 2022年第1期186-195,共10页
Online advertising click-through rate(CTR) prediction is aimed at predicting the probability of a user clicking an ad,and it has undergone considerable development in recent years.One of the hot topics in this area is... Online advertising click-through rate(CTR) prediction is aimed at predicting the probability of a user clicking an ad,and it has undergone considerable development in recent years.One of the hot topics in this area is the construction of feature interactions to facilitate accurate prediction.Factorization machine provides second-order feature interactions by linearly multiplying hidden feature factors.However,real-world data present a complex and nonlinear structure.Hence,second-order feature interactions are unable to represent cross information adequately.This drawback has been addressed using deep neural networks(DNNs),which enable high-order nonlinear feature interactions.However,DNN-based feature interactions cannot easily optimize deep structures because of the absence of cross information in the original features.In this study,we propose an effective CTR prediction algorithm called CAN,which explicitly exploits the benefits of attention mechanisms and DNN models.The attention mechanism is used to provide rich and expressive low-order feature interactions and facilitate the optimization of DNN-based predictors that implicitly incorporate high-order nonlinear feature interactions.The experiments using two real datasets demonstrate that our proposed CAN model performs better than other cross feature-and DNN-based predictors. 展开更多
关键词 click-through rate prediction global attention mechanism feature interaction neural network
原文传递
基于BERT-Bi-IAN的方面级情感分析模型
14
作者 何旭 杨柳 黄宇 《河南工程学院学报(自然科学版)》 2023年第1期65-70,共6页
为进一步提高情感识别的准确率,提出了一种基于BERT预训练模型的交互式情感分析模型——BERT-Bi-IAN模型。首先利用BERT预训练模型分别动态表示评价对象及其上下文,然后通过Bi-LSTM网络提取二者的语义信息,随后输入交互式注意力模块,得... 为进一步提高情感识别的准确率,提出了一种基于BERT预训练模型的交互式情感分析模型——BERT-Bi-IAN模型。首先利用BERT预训练模型分别动态表示评价对象及其上下文,然后通过Bi-LSTM网络提取二者的语义信息,随后输入交互式注意力模块,得到二者的交互关系与提取到的语义信息重组评价对象及其上下文的最终表示。模型在中英文数据集中的实验表现证明了与现有经典模型相比,其准确率和F1值有所提升,表明该模型有较大的适用领域。 展开更多
关键词 方面级情感分析 深度学习 交互式注意力机制 BERT预训练模型 BERT-Bi-IaN模型
下载PDF
一种基于Interactive KeyPoints的目标检测算法
15
作者 王志达 丁胜夺 韩亮 《计算机与数字工程》 2021年第12期2589-2594,共6页
目标检测是计算机视觉中的研究热点,小目标检测精度低一直是难点。论文采用关键点的预测方式和回归方法,建立一种基于交互关键点(Interactive KeyPoints)的无锚检测模型(ITKP)。该模型采用自适应采样方法获取一组表示对象的空间范围和... 目标检测是计算机视觉中的研究热点,小目标检测精度低一直是难点。论文采用关键点的预测方式和回归方法,建立一种基于交互关键点(Interactive KeyPoints)的无锚检测模型(ITKP)。该模型采用自适应采样方法获取一组表示对象的空间范围和具有重大语义意义的局部区域的关键点集后,通过自注意力(self-attention)机制建立关键点之间的联系以更好地匹配关键点和实现细粒度的定位。另外使用自注意力层代替卷积层来获取特征的全局上下文信息,设计了一个交互的特征金字塔,实现了更精确的识别和定位。论文提出的检测模型计算复杂度低,在基于关键点检测的无锚检测方法中,检测性能和小目标检测效果有较大的提升。同时保持实时的检测速度,为嵌入式或边缘设备的应用提供理论支持。 展开更多
关键词 自适应采样 自注意力机制 交互的特征金字塔 全局上下文信息
下载PDF
基于复合跨模态交互网络的时序多模态情感分析 被引量:1
16
作者 杨力 钟俊弘 +1 位作者 张赟 宋欣渝 《计算机科学与探索》 CSCD 北大核心 2024年第5期1318-1327,共10页
针对多模态情感分析中存在的不同模态间语义特征差异性导致模态融合不充分、交互性弱等问题,通过研究分析不同模态之间存在的潜在关联性,搭建一种基于复合跨模态交互网络的时序多模态情感分析(CCIN-SA)模型。该模型首先使用双向门控循... 针对多模态情感分析中存在的不同模态间语义特征差异性导致模态融合不充分、交互性弱等问题,通过研究分析不同模态之间存在的潜在关联性,搭建一种基于复合跨模态交互网络的时序多模态情感分析(CCIN-SA)模型。该模型首先使用双向门控循环单元和多头注意力机制提取具有上下文语义信息的文本、视觉和语音模态时序特征;然后,设计跨模态注意力交互层,利用辅助模态的低阶信号不断强化目标模态,使得目标模态学习到辅助模态的信息,捕获模态间的潜在适应性;再将增强后的特征输入到复合特征融合层,通过条件向量进一步捕获不同模态间的相似性,增强重要特征的关联程度,挖掘模态间更深层次的交互性;最后,利用多头注意力机制将复合跨模态强化后的特征与低阶信号做拼接融合,提高模态内部重要特征的权重,保留初始模态独有的特征信息,将得到的多模态融合特征进行最终的情感分类任务。在CMU-MOSI和CMUMOSEI数据集上进行模型评估,结果表明,CCIN-SA模型相比其他现有模型在准确率和F1指标上均有提高,能够有效挖掘不同模态间的关联性,做出更加准确的情感判断。 展开更多
关键词 跨模态交互 注意力机制 特征融合 复合融合层 多模态情感分析
下载PDF
面向目标交互图神经网络的多模态方面级情感分析
17
作者 张丽霞 汪凯旋 +1 位作者 庞梓超 梁云 《计算机工程与应用》 CSCD 北大核心 2024年第23期136-145,共10页
对于多模态方面级情感分析任务,除了需要提取出文本和图像的表示,还需要将它们与方面语义信息相结合处理。然而,以往的相关方法对方面与文本和图像信息之间的交互处理不够充分,即使使用注意力机制建立起模态全局之间的关联,也难以在细... 对于多模态方面级情感分析任务,除了需要提取出文本和图像的表示,还需要将它们与方面语义信息相结合处理。然而,以往的相关方法对方面与文本和图像信息之间的交互处理不够充分,即使使用注意力机制建立起模态全局之间的关联,也难以在细粒度表达出它们的交互。为了充分进行多模态之间细粒度上的信息交互,提出一种面向目标交互图神经网络,围绕文本、图像和方面三者的关系建模,采用交叉注意力获取面向方面目标的文本和图像全局表示;建立多模态交互图,以连接不同模态的局部及全局表示节点;使用图注意力网络在粗细两个粒度上充分融合特征。在两个基准数据集上进行实验,结果表明该模型相比于仅使用注意力机制的模型,具有更佳的情感分类效果。 展开更多
关键词 多模态方面级情感分析 注意力机制 交叉注意力 面向目标交互 图注意力网络
下载PDF
局部注意力引导下的全局池化残差分类网络
18
作者 姜文涛 董睿 张晟翀 《光电工程》 CAS CSCD 北大核心 2024年第7期107-124,共18页
大部分注意力机制虽然能增强图像特征,但没有考虑局部特征的关联性影响特征整体的问题。针对以上问题,本文提出局部注意力引导下的全局池化残差分类网络(MSLENet)。MSLENet的基线网络为ResNet34,首先改变首层结构,保留图像重要信息;其... 大部分注意力机制虽然能增强图像特征,但没有考虑局部特征的关联性影响特征整体的问题。针对以上问题,本文提出局部注意力引导下的全局池化残差分类网络(MSLENet)。MSLENet的基线网络为ResNet34,首先改变首层结构,保留图像重要信息;其次提出多分割局部增强注意力机制(MSLE)模块,MSLE模块将图像整体分割成多个小图像,增强每个小图像的局部特征,通过特征组交互的方式将局部重要特征引导到全局特征中;最后提出池化残差(PR)模块来处理ResNet残差结构丢失信息的问题,提高各层之间的信息利用率。实验结果表明,MSLENet通过增强局部特征的关联性,在多个数据集上均有良好的效果,有效地提高了网络的表达能力。 展开更多
关键词 图像分类 注意力机制 残差结构 局部特征 全局特征 关联性
下载PDF
基于结构功能交叉神经网络的多模态医学图像融合
19
作者 邸敬 郭文庆 +2 位作者 任莉 杨燕 廉敬 《光学精密工程》 EI CAS CSCD 北大核心 2024年第2期252-267,共16页
针对多模态医学图像融合中存在纹理细节模糊和对比度低的问题,提出了一种结构功能交叉神经网络的多模态医学图像融合方法。首先,根据医学图像的结构信息和功能信息设计了结构功能交叉神经网络模型,不仅有效地提取解剖学和功能学医学图... 针对多模态医学图像融合中存在纹理细节模糊和对比度低的问题,提出了一种结构功能交叉神经网络的多模态医学图像融合方法。首先,根据医学图像的结构信息和功能信息设计了结构功能交叉神经网络模型,不仅有效地提取解剖学和功能学医学图像的结构信息和功能信息,而且能够实现这两种信息之间的交互,从而很好地提取医学图像的纹理细节信息。其次,利用交叉网络通道和空间特征变化构造了一种新的注意力机制,通过不断调整结构信息和功能信息权重来融合图像,提高了融合图像的对比度和轮廓信息。最后,设计了一个从融合图像到源图像的分解过程,由于分解图像的质量直接取决于融合结果,因此分解过程可以使融合图像包含更多的细节信息。通过与近年来提出的7种高水平方法相比,本文方法的AG,EN,SF,MI,QAB/F和CC客观评价指标分别平均提高了22.87%,19.64%,23.02%,12.70%,6.79%,30.35%,说明本文方法能够获得纹理细节更清晰、对比度更好的融合结果,在主观视觉和客观指标上都优于其他对比算法。 展开更多
关键词 多模态医学图像融合 结构功能信息交叉网络 注意力机制 分解网络
下载PDF
一种融合注意力机制与3D双流卷积网络的动态头势识别方法
20
作者 张波涛 朱鑫悦 +1 位作者 谢佳龙 吕强 《传感技术学报》 CAS CSCD 北大核心 2024年第10期1734-1745,共12页
头势能够传递丰富的情绪和意图信息,属于重要的人机交互方式之一。然而,目前基于穿戴式传感器的头势识别方法虽然具有较高的识别率,但缺乏经济性和便捷性,而基于机器视觉的方法普遍存在准确率低、泛化性差、算力成本较高的问题,因此目... 头势能够传递丰富的情绪和意图信息,属于重要的人机交互方式之一。然而,目前基于穿戴式传感器的头势识别方法虽然具有较高的识别率,但缺乏经济性和便捷性,而基于机器视觉的方法普遍存在准确率低、泛化性差、算力成本较高的问题,因此目前的头势识别方法仍难以部署于移动机器人。针对以上问题,提出了一种融合注意力机制与3D双流卷积的动态头势识别方法。该方法从动态头势视频帧中提取RGB信号和光流特征,在注意力机制的启发下,从通道域和空间域进行动作特征提取和增强,从而对关键特征进行准确提取,然后对特征进行融合与分类。实验结果表明,所提方法能够有效提取头势中关键的通道域和空间域信息,可显著提高头势识别的准确率及泛化能力,可在有限算力下实现较高的准确率与实时性。其后,将所提方法应用于助老机器人,在实际示范应用中进行了验证,结果表明本方法适于移动机器人等算力受限的移动机载计算平台。 展开更多
关键词 移动机器人 人机交互 注意力机制 动态头势 动作识别
下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部