期刊文献+
共找到339篇文章
< 1 2 17 >
每页显示 20 50 100
Exploiting multi-context analysis in semantic image classification
1
作者 田永鸿 黄铁军 高文 《Journal of Zhejiang University-Science A(Applied Physics & Engineering)》 SCIE EI CAS CSCD 2005年第11期1268-1283,共16页
As the popularity of digital images is rapidly increasing on the Internet, research on technologies for semantic image classification has become an important research topic. However, the well-known content-based image... As the popularity of digital images is rapidly increasing on the Internet, research on technologies for semantic image classification has become an important research topic. However, the well-known content-based image classification methods do not overcome the so-called semantic gap problem in which low-level visual features cannot represent the high-level semantic content of images. Image classification using visual and textual information often performs poorly since the extracted textual features are often too limited to accurately represent the images. In this paper, we propose a semantic image classification ap- proach using multi-context analysis. For a given image, we model the relevant textual information as its multi-modal context, and regard the related images connected by hyperlinks as its link context. Two kinds of context analysis models, i.e., cross-modal correlation analysis and link-based correlation model, are used to capture the correlation among different modals of features and the topical dependency among images induced by the link structure. We propose a new collective classification model called relational support vector classifier (RSVC) based on the well-known Support Vector Machines (SVMs) and the link-based cor- relation model. Experiments showed that the proposed approach significantly improved classification accuracy over that of SVM classifiers using visual and/or textual features. 展开更多
关键词 Image classification multi-context analysis Cross-modal correlation analysis Link-based correlation model Linkage semantic kernels Relational support vector classifier
下载PDF
基于多尺度骨架图和局部视觉上下文融合的驾驶员行为识别方法
2
作者 胡宏宇 黎烨宸 +3 位作者 张争光 曲优 何磊 高镇海 《汽车工程》 EI CSCD 北大核心 2024年第1期1-8,28,共9页
识别非驾驶行为是提高驾驶安全性的重要手段之一。目前基于骨架序列和图像的融合识别方法具有计算量大和特征融合困难的问题。针对上述问题,本文提出一种基于多尺度骨架图和局部视觉上下文融合的驾驶员行为识别模型(skeleton-image base... 识别非驾驶行为是提高驾驶安全性的重要手段之一。目前基于骨架序列和图像的融合识别方法具有计算量大和特征融合困难的问题。针对上述问题,本文提出一种基于多尺度骨架图和局部视觉上下文融合的驾驶员行为识别模型(skeleton-image based behavior recognition network,SIBBR-Net)。SIBBR-Net通过基于多尺度图的图卷积网络和基于局部视觉及注意力机制的卷积神经网络,充分提取运动和外观特征,较好地平衡了模型表征能力和计算量间的关系。基于手部运动的特征双向引导学习策略、自适应特征融合模块和静态特征空间上的辅助损失,使运动和外观特征间互相引导更新并实现自适应融合。最终在Drive&Act数据集进行算法测试,SIBBR-Net在动态标签和静态标签条件下的平均正确率分别为61.78%和80.42%,每秒浮点运算次数为25.92G,较最优方法降低了76.96%。 展开更多
关键词 驾驶员行为识别 多尺度骨架图 局部视觉上下文 多模态数据自适应融合
下载PDF
双注意力随机选择全局上下文细粒度识别网络
3
作者 徐胜军 荆扬 +3 位作者 段中兴 李明海 李海涛 刘福友 《液晶与显示》 CAS CSCD 北大核心 2024年第4期506-521,共16页
针对细粒度图像识别任务中易忽视微小潜在性特征且外观差异细微等问题,提出一种基于双注意力随机选择全局上下文细粒度识别网络。首先,使用ConvNeXt作为主干网络,提出双注意力随机选择模块,对不同阶段提取到的特征进行通道随机选择和空... 针对细粒度图像识别任务中易忽视微小潜在性特征且外观差异细微等问题,提出一种基于双注意力随机选择全局上下文细粒度识别网络。首先,使用ConvNeXt作为主干网络,提出双注意力随机选择模块,对不同阶段提取到的特征进行通道随机选择和空间随机选择,使网络能够关注到其他潜在微小判别性特征;其次,利用全局上下文注意力模块将深层特征的语义信息融合到中间层,增强中间层定位微小特征的能力;最后,提出一种多分支损失,对中间层、深层和拼接层特征引入分类损失,结合不同分支提取到的特征,诱导网络获得多样性的判别特征。所提网络在Stanford-cars、CUB-200-2011、FGVC-Aircraft 3个公开细粒度数据集和真实场景下车型数据集VMRURS上分别达到了95.2%、92.1%、94.0%和97.0%的识别准确率,其性能相比其他对比方法有较大幅度提升。 展开更多
关键词 细粒度识别 ConvNeXt 双注意力随机选择 全局上下文注意力 多分支损失
下载PDF
脑电情感识别中多上下文向量优化的卷积递归神经网络
4
作者 晁浩 封舒琪 刘永利 《计算机应用》 CSCD 北大核心 2024年第7期2041-2046,共6页
目前的脑电(EEG)情感识别模型忽略了不同时段情感状态的差异性,未能强化关键的情感信息。针对上述问题,提出一种多上下文向量优化的卷积递归神经网络(CR-MCV)。首先构造脑电信号的特征矩阵序列,通过卷积神经网络(CNN)学习多通道脑电的... 目前的脑电(EEG)情感识别模型忽略了不同时段情感状态的差异性,未能强化关键的情感信息。针对上述问题,提出一种多上下文向量优化的卷积递归神经网络(CR-MCV)。首先构造脑电信号的特征矩阵序列,通过卷积神经网络(CNN)学习多通道脑电的空间特征;然后利用基于多头注意力的递归神经网络生成多上下文向量进行高层抽象特征提取;最后利用全连接层进行情感分类。在DEAP(Database for Emotion Analysis using Physiological signals)数据集上进行实验,CR-MCV在唤醒和效价维度上分类准确率分别为88.09%和89.30%。实验结果表明,CR-MCV在利用电极空间位置信息和不同时段情感状态显著性特征基础上,能够自适应地分配特征的注意力并强化情感状态显著性信息。 展开更多
关键词 多通道脑电信号 情感识别 多上下文向量 卷积递归神经网络 多头注意力
下载PDF
多元艺术语境下数码影像艺术形态应用的新认知
5
作者 吕悦宁 《丝网印刷》 2024年第8期99-101,共3页
探讨数码影像艺术在多元艺术语境背景下的新认知,分析这一视觉表达方式在当代艺术领域内独特的艺术价值和文化意义,提出数码影像艺术在多媒体、互联网和虚拟现实技术支持下,突破传统艺术形态局限的创新应用方向,为数码影像艺术与跨学科... 探讨数码影像艺术在多元艺术语境背景下的新认知,分析这一视觉表达方式在当代艺术领域内独特的艺术价值和文化意义,提出数码影像艺术在多媒体、互联网和虚拟现实技术支持下,突破传统艺术形态局限的创新应用方向,为数码影像艺术与跨学科融合提供创新思路。 展开更多
关键词 多元艺术语境 数码影像 艺术形态 新认知
下载PDF
融合时序关系和上下文信息的时间动作检测方法
6
作者 王猛 杨观赐 《贵州大学学报(自然科学版)》 2024年第6期78-84,90,共8页
时间动作检测是视频理解领域中具有挑战性的任务。先前的时间动作检测模型主要关注视频帧的分类,而忽略视频帧之间的时序关系,导致时间动作检测模型的性能下降。为此,提出融合时序关系和上下文信息的时间动作检测方法(temporal action d... 时间动作检测是视频理解领域中具有挑战性的任务。先前的时间动作检测模型主要关注视频帧的分类,而忽略视频帧之间的时序关系,导致时间动作检测模型的性能下降。为此,提出融合时序关系和上下文信息的时间动作检测方法(temporal action detection based on enhanced temporal relationship and context information,ETRD)。首先,设计了基于增强局部时序关系注意力机制的全局特征编码器,关注相邻帧的时序关系;其次,构建基于上下文信息的时序特征增强模块,融合上下文信息;最后,通过头部输出分类和回归结果。实验结果表明,所提出的ETRD模型在THUMOS14和ActivityNet1.3数据集上的平均mAP(mean average precision,平均精度均值)分别达到了67.5%和36.0%。相比于Actionformer模型的66.8%和35.6%,ETRD模型的平均mAP分别提升了0.7%和0.4%。利用视觉传感器,所提出的模型可检测出行为类别和持续时间。同时,结合心率等生理信号,可实现个体健康状态管理,为远程医疗、智能监控等提供了一种解决方案。 展开更多
关键词 时间动作检测 时序关系 上下文信息 多头注意力机制 视频动作理解
下载PDF
融合知识和约束图的远程监督关系抽取方法
7
作者 刘琼昕 牛文涛 王佳升 《北京理工大学学报》 EI CAS CSCD 北大核心 2024年第7期731-739,共9页
远程监督关系抽取通过自动标注数据减少人工标注成本,但存在句子标签噪声和关系长尾分布两个问题.为解决上述问题,提出一种融合知识图中实体信息以及实体和关系间约束的关系抽取方法.该方法对目标实体和其邻居实体的属性进行编码,对目... 远程监督关系抽取通过自动标注数据减少人工标注成本,但存在句子标签噪声和关系长尾分布两个问题.为解决上述问题,提出一种融合知识图中实体信息以及实体和关系间约束的关系抽取方法.该方法对目标实体和其邻居实体的属性进行编码,对目标实体和邻居实体构成的邻居图进行编码,对实体类型和关系间约束进行编码,并通过多源融合注意力模块进行信息整合,构建关系抽取模型.该方法在NYT-10数据集上的AUC值为0.524,P@100值为94.8%,长尾指标Hits@K较之前最先进模型均有提升,取得了优异表现,表明该方法融合实体信息和约束信息解决远程监督关系抽取两个主要问题的有效性. 展开更多
关键词 远程监督关系抽取 知识上下文 约束图 多源融合注意力
下载PDF
结合混合卷积和多尺度注意力的视频异常检测算法
8
作者 杨大为 刘志权 王红霞 《液晶与显示》 CAS CSCD 北大核心 2024年第8期1128-1137,共10页
基于U-net风格的无监督视频异常检测模型有着较好的检测效果,但由于普通卷积运算使用固有的局部特性,使U-Net风格的编码器无法有效地提取全局上下文信息,并且使用简单的跳跃连接无法获得有效的特征信息,使用的L2损失函数是仅考虑了像素... 基于U-net风格的无监督视频异常检测模型有着较好的检测效果,但由于普通卷积运算使用固有的局部特性,使U-Net风格的编码器无法有效地提取全局上下文信息,并且使用简单的跳跃连接无法获得有效的特征信息,使用的L2损失函数是仅考虑了像素级别的差异而无法捕捉图像的结构特征。对此提出了结合混合卷积和多尺度注意力的视频异常检测算法,并加入结构相似性损失函数(SSIM)优化模型。具体来说,在编码器最后一层添加混合卷积模块,混合空间和位置的特征来提取全局上下文信息。在编码器和解码器之间的跳跃连接中添加多尺度注意力模块,使模型能提取更有价值的特征,实现有效的跳跃连接。使用参数约束结构相似性损失函数与L2损失函数的权重,从而更准确地优化模型。实验结果表明,所提算法在UCSD-Ped2和CUHK Avenue公开数据集上的AUC指标达到96.7%和86.1%,与改进前的模型相比提高了1.6%和1.4%,证明了所提模型的有效性。 展开更多
关键词 上下文信息 跳跃连接 混合卷积 多尺度注意力 结构相似性
下载PDF
基于多尺度上下文的英文作文自动评分研究 被引量:1
9
作者 于明诚 党亚固 +2 位作者 吴奇林 吉旭 毕可鑫 《计算机工程》 CAS CSCD 北大核心 2024年第3期259-266,共8页
目前作文自动评分模型缺乏对不同尺度上下文语义特征的提取,未能从句子级别计算与作文主题关联程度的特征。提出基于多尺度上下文的英文作文自动评分研究方法MSC。采用XLNet英文预训练模型提取原始作文文本单词嵌入和句嵌入,避免在处理... 目前作文自动评分模型缺乏对不同尺度上下文语义特征的提取,未能从句子级别计算与作文主题关联程度的特征。提出基于多尺度上下文的英文作文自动评分研究方法MSC。采用XLNet英文预训练模型提取原始作文文本单词嵌入和句嵌入,避免在处理长序列文本时无法准确捕捉到符合上下文语境的向量嵌入,提升动态向量语义表征质量,解决一词多义问题,并通过一维卷积模块提取不同尺度的短语级别嵌入。多尺度上下文网络通过结合内置自注意力简单循环单元和全局注意力机制,分别捕捉单词、短语和句子级别的作文高维潜在上下文语义关联关系,利用句向量与作文主题计算语义相似度提取篇章主题层次特征,将所有特征输入融合层通过线性层得到自动评分结果。在公开的标准英文作文评分数据集ASAP上的实验结果表明,MSC模型平均二次加权的Kappa值达到了80.5%,且在多个子集上取得了最佳效果,优于实验对比的深度学习自动评分模型,证明了MSC在英文作文自动评分任务上的有效性。 展开更多
关键词 英文作文自动评分 预训练模型 多尺度上下文 全局注意力 主题层次特征
下载PDF
面向城市复杂场景的多尺度监督融合变化检测
10
作者 潘建平 谢鹏 +2 位作者 郭志豪 林娜 张慧娟 《遥感信息》 CSCD 北大核心 2024年第4期23-32,共10页
城市复杂场景中,地物形状多样,光照和成像角度变化大会导致变化检测结果受到干扰。为解决这些问题,文章提出了一种双上下文多尺度监督融合的网络模型(dual context multi-scale supervised fusion network model,DCMSFNet)。首先,在编... 城市复杂场景中,地物形状多样,光照和成像角度变化大会导致变化检测结果受到干扰。为解决这些问题,文章提出了一种双上下文多尺度监督融合的网络模型(dual context multi-scale supervised fusion network model,DCMSFNet)。首先,在编码部分使用双上下文增强模块获得地物丰富的全局上下文信息。在解码部分,采用级联的方法组合特征,然后通过自适应注意力模块捕捉不同尺度的变化关系,设计多尺度监督融合模块,增强深度网络融合,获得具有更高辨别能力的变化区域特征,将不同层级的输出结果与主网络的重构变化图融合形成最终的变化检测结果。该模型在LEVIR-CD和SYSU-CD变化检测数据集取得了较好的结果,F1-score分别提高了1.58%和2.17%,可更加精确识别复杂场景的变化区域,进一步减少无关因素引起的误检和漏检,且对目标地物边缘的检测更加平滑。 展开更多
关键词 深度学习 变化检测 双上下文增强 自适应注意力模块 多尺度监督融合
下载PDF
基于条形卷积和上下文感知的近海水产养殖提取方法 被引量:1
11
作者 吴婷 陈红梅 +1 位作者 罗冬莲 陈芸芝 《福州大学学报(自然科学版)》 CAS 北大核心 2024年第1期37-44,共8页
利用中等分辨率遥感影像,针对近海养殖区边界模糊、筏式和网箱养殖存在类间干扰等现象,以ResUnet模型为基础,提出一种带有条形卷积模块和上下文感知单元的MSUResUnet模型,以提高模型的特征提取能力,改善近海水产养殖提取任务中出现的漏... 利用中等分辨率遥感影像,针对近海养殖区边界模糊、筏式和网箱养殖存在类间干扰等现象,以ResUnet模型为基础,提出一种带有条形卷积模块和上下文感知单元的MSUResUnet模型,以提高模型的特征提取能力,改善近海水产养殖提取任务中出现的漏提和粘连等问题.模型中利用条形池化模块增强编码层与解码层信息的交互,引入条形卷积模块增强对水产养殖线性特征的捕捉能力,通过增加上下文感知单元获取水产养殖区丰富的多尺度上下文信息.在Sentinel-2 MSI数据上的实验结果表明,参与比对的6个模型中,MSUResUnet模型精度最优,其Kappa系数、 MIoU、 OA和F1分数分别达到了89.17%、 84.33%、 96.38%和91.19%;MSUResUnet在养殖较密集的兴化湾、三沙湾和罗源湾附近海域均获得较高精度,具有较强的特征提取和抗干扰能力,能够满足高精度的大范围中等分辨率影像近海水产养殖信息提取需求. 展开更多
关键词 筏式和网箱养殖 深度学习 ResUnet模型 多方向条形卷积 上下文感知单元
下载PDF
A Visual Analysis Approach for Community Detection of Multi-Context Mobile Social Networks 被引量:3
12
作者 马昱欣 徐佳逸 +5 位作者 彭帝超 张婷 金呈哲 屈华民 陈为 彭群生 《Journal of Computer Science & Technology》 SCIE EI CSCD 2013年第5期797-809,共13页
The problem of detecting community structures of a social network has been extensively studied over recent years, but most existing methods solely rely on the network structure and neglect the context information of t... The problem of detecting community structures of a social network has been extensively studied over recent years, but most existing methods solely rely on the network structure and neglect the context information of the social relations. The main reason is that a context-rich network offers too much flexibility and complexity for automatic or manual modulation of the multifaceted context in the analysis process. We address the challenging problem of incorporating context information into the community analysis with a novel visual analysis mechanism. Our approach consists of two stages: interactive discovery of salient context, and iterative context-guided community detection. Central to the analysis process is a context relevance model (CRM) that visually characterizes the influence of a given set of contexts on the variation of the detected communities, and discloses the community structure in specific context configurations. The extracted relevance is used to drive an iterative visual reasoning process, in which the community structures are progressively discovered. We introduce a suite of visual representations to encode the community structures, the context as well as the CRM. In particular, we propose an enhanced parallel coordinates representation to depict the context and community structures, which allows for interactive data exploration and community investigation. Case studies on several datasets demonstrate the efficiency and accuracy of our approach. 展开更多
关键词 visual analysis community detection multi-context
原文传递
基于多头指针的司法事件检测方法
13
作者 张小丽 黄辉 +2 位作者 黄瑞章 秦永彬 陈艳平 《广西科学》 CAS 北大核心 2024年第2期335-345,共11页
针对如何解决中文司法事件检测中触发词与上下文关系不足以判定事件实例、案件触发词表述相似以及同一个案件中多个触发词识别和分类模糊的问题,本研究提出一种基于多头指针的司法事件检测方法。首先,该方法将上下文信息和罪名特征融合... 针对如何解决中文司法事件检测中触发词与上下文关系不足以判定事件实例、案件触发词表述相似以及同一个案件中多个触发词识别和分类模糊的问题,本研究提出一种基于多头指针的司法事件检测方法。首先,该方法将上下文信息和罪名特征融合作为输入,使用双向长短期记忆(Bi-directional Long Short-Term Memory,BiLSTM)网络捕获数据依赖关系,深入提取特征;然后,使用多头指针网络对字符间的依赖关系进行建模,有效捕捉句子中的触发词;最后,利用指针标注技术抽取触发词,实现司法事件的有效检测。在公开司法数据集LEVEN上实验验证该方法的有效性,其中微平均和宏平均的F1指标达到了87.53%和78.05%,优于现有模型。该方法不仅显著提高了事件触发词的识别精度,而且也增强了对复杂司法文本中事件上下文关系的把握能力。 展开更多
关键词 司法事件检测 触发词 上下文关系 罪名特征 多头指针
下载PDF
用于多器官分割的多尺度聚合网络研究
14
作者 高学敏 杜晓刚 +2 位作者 张学军 王营博 雷涛 《陕西科技大学学报》 北大核心 2024年第2期189-197,共9页
多器官分割在病理分析、手术方案制定以及临床诊断上都具有重要的应用价值.但是,一些器官形变较大、尺寸较小且组织边缘模糊,导致分割效果较差.为了解决该问题,提出了一种用于多器官分割的多尺度聚合网络(MSANet).MSANet有两个优势:首先... 多器官分割在病理分析、手术方案制定以及临床诊断上都具有重要的应用价值.但是,一些器官形变较大、尺寸较小且组织边缘模糊,导致分割效果较差.为了解决该问题,提出了一种用于多器官分割的多尺度聚合网络(MSANet).MSANet有两个优势:首先,设计了多尺度边界提取模块,使用多尺度卷积核提取多个特征图,将不同尺度的特征图互相结合,从而聚合全局上下文信息,并提取不同器官的边界和细节信息;其次,设计了聚焦式注意力模块,通过学习的注意力权重来调节特征图的重要性,从而聚焦感兴趣的多器官区域并捕捉不同器官的关键特征,进一步提高分割性能.在两个公开数据集CHAOS和MS-CMRSeg上进行了大量实验.实验结果表明:MSANet在两个数据集上的分割效果均优于当前主流的多器官分割方法,显著提高了多器官分割精度. 展开更多
关键词 多器官分割 多尺度聚合网络 上下文信息 注意力机制
下载PDF
全局情境约束和局部多因素融合的对话情感识别
15
作者 曹卫 赵新元 薛煜阳 《新疆师范大学学报(自然科学版)》 2024年第3期11-20,共10页
文本对话情感识别是自然语言处理领域中的一项重要研究任务,旨在自动识别对话文本各语句情感。然而,现有研究多侧重于对话语句的语义表征或对话人关系建模,忽略了对话交互过程中情感动态演变的影响因素。文章提出一种全局情境约束和局... 文本对话情感识别是自然语言处理领域中的一项重要研究任务,旨在自动识别对话文本各语句情感。然而,现有研究多侧重于对话语句的语义表征或对话人关系建模,忽略了对话交互过程中情感动态演变的影响因素。文章提出一种全局情境约束和局部多因素融合的对话文本情感识别方法,该模型不仅考虑了对话全局语义,还深入挖掘和建模了对话情感演变的多影响因素。在公开数据集上的实验结果表明该方法识别对话情感的有效性。 展开更多
关键词 对话情感识别 全局情境 局部多因素融合
下载PDF
反向加权融合多尺度特征的X射线图像违禁品检测
16
作者 马昌嵩 裴晓芳 +2 位作者 周磊 周进 杨继海 《国外电子测量技术》 2024年第4期170-180,共11页
针对现阶段违禁品检测方法存在的混叠效应以及在类内变化显著的场景下检测精度较低等问题,提出一种反向加权融合多尺度特征的X射线图像违禁品检测算法,通过反向自适应地引导融合多尺度上下文特征来实现准确的违禁品目标检测。首先,使用... 针对现阶段违禁品检测方法存在的混叠效应以及在类内变化显著的场景下检测精度较低等问题,提出一种反向加权融合多尺度特征的X射线图像违禁品检测算法,通过反向自适应地引导融合多尺度上下文特征来实现准确的违禁品目标检测。首先,使用多尺度场景感知模块获取从局部到全局的目标表征信息,帮助处理显著的类内变化。其次,利用反向加权融合结构采用特征引导加权的方式,高效融合蕴含丰富上下文特征的多级特征,缓解融合过程中易出现的混叠效应。最后,设计了一种Focal-SIOU损失函数,用于平衡不同质量违禁品目标预测框之间的贡献差异,并结合角度和边长损失进一步提升预测框的收敛速度和回归精度。本文方法在SIXray、OPIXray、PIDray等3个非常具有挑战性的基准数据集上进行了广泛的评测实验,平均精度均值(mAP)分别达到93.2%、90.7%和85.1%。实验结果充分表明,方法相比于最新方法性能更优,并且能够满足实时目标检测的实际应用需求。 展开更多
关键词 违禁品检测 多尺度融合 上下文特征 损失函数
下载PDF
一种用于道路场景分割的轻量级特征融合网络
17
作者 李富华 吴陈 《计算机与数字工程》 2024年第8期2329-2335,共7页
道路场景的语义分割存在着实时性和准确性相冲突的矛盾,融合多层次特征和多尺度上下文信息可以提升分割模型的性能。但是复杂的特征融合将消耗较多的计算资源,并且现有的方法在分割过程中常常忽略位置信息,导致分割效果不理想。为了解... 道路场景的语义分割存在着实时性和准确性相冲突的矛盾,融合多层次特征和多尺度上下文信息可以提升分割模型的性能。但是复杂的特征融合将消耗较多的计算资源,并且现有的方法在分割过程中常常忽略位置信息,导致分割效果不理想。为了解决以上问题,使用了一种高效的轻量级特征融合网络(LFFNet)进行道路场景分割,具体来说就是使用了一个多层次特征融合模块,通过在注意机制中嵌入空间位置信息来增强多层次特征之间的语义一致性,以便在捕获远距离依赖关系的同时保留准确的位置信息。此外还使用了一种轻量语义金字塔模块,通过深度可分离卷积提取多尺度上下文信息。实验结果表明,LFFNet与现有的方法相比FLOPs减少了2.3倍,速度提高了1.7倍,在分割精度和计算效率上有较好的平衡。 展开更多
关键词 特征融合 坐标注意力 多尺度上下文信息 深度可分离卷积 语义分割
下载PDF
基于上下文方面记忆网络的方面级情感分析
18
作者 王亚新 王亮 王军 《计算机工程与设计》 北大核心 2024年第2期443-451,共9页
基于深度记忆网络在方面级情感分析中的优势及针对相关工作中忽略上下文词与方面之间位置信息的不足,提出一种基于上下文方面记忆网络的方面级情感分析方法。不同记忆网络层关注上下文记忆不同部分,获取丰富方面感知上下文信息。为充分... 基于深度记忆网络在方面级情感分析中的优势及针对相关工作中忽略上下文词与方面之间位置信息的不足,提出一种基于上下文方面记忆网络的方面级情感分析方法。不同记忆网络层关注上下文记忆不同部分,获取丰富方面感知上下文信息。为充分利用方面间信息,设计方面记忆网络更新模块,为所需方面生成邻近方面的语义和关系信息,在多计算层中的多头注意力机制输入采用两种策略计算上下文和方面词的相关性。在3个基准数据集上的实验结果表明,所提模型在性能评价指标的准确率和Macro-F1-score上与相关工作比较有一定提升。 展开更多
关键词 细粒度 方面级情感分析 深度记忆网络 双向长短期记忆网络 多注意力机制 上下文 方面记忆网络
下载PDF
改进多头注意力机制的车道检测方法
19
作者 葛泽坤 陶发展 +1 位作者 付主木 宋书中 《计算机工程与应用》 CSCD 北大核心 2024年第2期264-271,共8页
针对基于卷积神经网络(convolution neural network,CNN)的车道线检测方法存在的网络处理效率低和对车道线细长结构的建模能力不佳的问题,提出一种基于改进多头注意力机制(multi-head self-attention,MHSA)的轻量级车道检测方法。引入MH... 针对基于卷积神经网络(convolution neural network,CNN)的车道线检测方法存在的网络处理效率低和对车道线细长结构的建模能力不佳的问题,提出一种基于改进多头注意力机制(multi-head self-attention,MHSA)的轻量级车道检测方法。引入MHSA,融合Fuse MBConv、MBConv模块与特征压缩模块,降低模型的参数,同时利用上下文信息嵌入模块,建立兼顾检测精度和推理速度的全局注意力网络;利用Transformer的编码和解码器以及前向反馈网络将车道线参数化,结合匈牙利拟合损失函数提高所提出方法对车道线细长结构的建模能力。在TuSimple数据集对所提出的方法进行验证,结果表明,所提出的方法识别精度达到96.3%,推理速度达到95帧/s,同时在Apollo无人驾驶平台上的运行速度达到60帧/s,能够满足实时检测的要求。 展开更多
关键词 多头注意力机制 上下文信息 轻量级车道检测方法 无人驾驶平台
下载PDF
基于多模态联合语义感知的零样本目标检测
20
作者 段立娟 袁蓥 +1 位作者 王文健 梁芳芳 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2024年第2期368-375,共8页
零样本目标检测借助语义嵌入作为引导信息,将未见过的物体的视觉特征与类别语义嵌入映射到同一空间,根据其在映射空间的距离进行分类,但由于语义信息获取的单一性,视觉信息缺乏可靠表示,易混淆背景信息和未见过对象信息,使得视觉和语义... 零样本目标检测借助语义嵌入作为引导信息,将未见过的物体的视觉特征与类别语义嵌入映射到同一空间,根据其在映射空间的距离进行分类,但由于语义信息获取的单一性,视觉信息缺乏可靠表示,易混淆背景信息和未见过对象信息,使得视觉和语义之间很难无差别对齐。基于此,借助视觉上下文模块捕捉视觉特征的上下文信息,并通过语义优化模块对文本上下文和视觉上下文信息进行交互融合,增加视觉表达的多样化,使模型感知到前景的辨别性语义,从而有效地实现零样本目标检测。在MS-COCO的2个划分数据集上进行实验,在零样本目标检测和广义零样本目标检测的准确率和召回率上取得了提升,结果证明了所提方法的有效性。 展开更多
关键词 目标检测 零样本目标检测 多模态 上下文感知 语义优化
下载PDF
上一页 1 2 17 下一页 到第
使用帮助 返回顶部