期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
跨模态语义时空动态交互情感分析研究
1
作者 屈立成 郤丽媛 +2 位作者 刘紫君 魏思 董哲为 《计算机工程与应用》 CSCD 北大核心 2024年第1期165-173,共9页
针对传统情感分析中存在的模态间交互性差、时空特征融合度低的问题,建立了一种跨模态的语义时空动态交互网络。通过引入双向长短期记忆网络挖掘各模态的时间序列特征,加入自注意力机制强化模态内特征的权重赋值,将自动筛选出的特征矩... 针对传统情感分析中存在的模态间交互性差、时空特征融合度低的问题,建立了一种跨模态的语义时空动态交互网络。通过引入双向长短期记忆网络挖掘各模态的时间序列特征,加入自注意力机制强化模态内特征的权重赋值,将自动筛选出的特征矩阵送入图卷积神经网络进行语义交互。然后以时间戳为基础进行特征聚合,计算聚合层的相关系数,获得融合后的联合特征,实现跨模态空间交互,最终完成情感极性的分类与预测。使用公开数据集对所提出的模型进行评估验证,实验结果表明,多模态时间序列提取和跨模态语义空间交互机制可以实现模态内和模态间特征的全动态融合,有效地提升了情感分类的准确率和F1值,在CMU-MOSEI数据集上分别提高了1.7%~13.5%和2.1%~14.0%,表现出良好的健壮性和先进性。 展开更多
关键词 模态情感分析 语义交互 时空交互 双向长短期记忆网络 图卷积网络
下载PDF
基于自监督学习的文本行人检索 被引量:1
2
作者 冀中 胡峻华 +1 位作者 丁学文 李晟嘉 《天津大学学报(自然科学与工程技术版)》 EI CAS CSCD 北大核心 2023年第2期169-176,共8页
基于文本的行人检索任务旨在以文本为查询在大规模数据库中检索出目标行人的图像,在处理社会公共安全问题中具有较高的实用价值.不同于常规的跨模态检索任务,该任务中所有的类别都是行人,不同行人之间的外观差异较小,难以辨别;此外由于... 基于文本的行人检索任务旨在以文本为查询在大规模数据库中检索出目标行人的图像,在处理社会公共安全问题中具有较高的实用价值.不同于常规的跨模态检索任务,该任务中所有的类别都是行人,不同行人之间的外观差异较小,难以辨别;此外由于拍摄条件的限制图像质量通常较差,因此如何有效地提取更鲁棒、更具有判别性的视觉特征是该任务的一项重要挑战.为了应对这一挑战,设计了一种基于自监督学习的文本行人检索算法,以多任务学习的形式将自监督学习与基于文本的行人检索任务相结合,对两种任务同时进行训练,共享模型参数.其中,自监督任务作为辅助任务,旨在为行人检索任务学习到更鲁棒、更具有判别性的视觉特征.具体来说,首先提取视觉和文本特征,并以图像修复作为自监督任务,旨在学习更丰富的语义信息,且对遮挡数据具有更好的鲁棒性;基于行人图像的特殊性,进一步设计了一种镜像翻转预测任务,通过训练网络预测图像是否经过了镜像翻转学习具有判别性的细节信息,以帮助行人检索任务更好地区分难分样本.在公开数据集上进行的大量实验证明了该算法的先进性和有效性,将行人检索的Top-1准确率提升了2.77%,并且实验结果显示两种自监督任务存在一定的互补性,同时使用可以实现更好的检索性能. 展开更多
关键词 行人检索 跨模态分析 自监督学习 多任务学习
下载PDF
基于多路语义图网络的图像自动问答
3
作者 乔有田 张海军 路明 《计算机应用研究》 CSCD 北大核心 2023年第2期383-387,共5页
基于视觉特征与文本特征融合的图像问答已经成为自动问答的热点研究方向之一。现有的大部分模型都是通过注意力机制来挖掘图像和问题语句之间的关联关系,忽略了图像区域和问题词在同一模态之中以及不同视角的关联关系。针对该问题,提出... 基于视觉特征与文本特征融合的图像问答已经成为自动问答的热点研究方向之一。现有的大部分模型都是通过注意力机制来挖掘图像和问题语句之间的关联关系,忽略了图像区域和问题词在同一模态之中以及不同视角的关联关系。针对该问题,提出一种基于多路语义图网络的图像自动问答模型(MSGN),从多个角度挖掘图像和问题之间的语义关联。MSGN利用图神经网络模型挖掘图像区域和问题词细粒度的模态内模态间的关联关系,进而提高答案预测的准确性。模型在公开的图像问答数据集上的实验结果表明,从多个角度挖掘图像和问题之间的语义关联可提高图像问题答案预测的性能。 展开更多
关键词 图像问答 多头注意力 自动问答 特征融合 跨模态分析
下载PDF
基于群智数据的情境关联旅游路线推荐 被引量:5
4
作者 郭斌 李智敏 +1 位作者 张靖 於志文 《郑州大学学报(理学版)》 CAS 北大核心 2020年第2期22-28,共7页
针对基于不同出行需求的景区内路线规划问题,首先运用卷积-循环神经网络(CNN-RNN)对游记中图像与文本进行联合嵌入,将数据按照景点进行分类识别,然后使用基于图模型的PhotoRank算法优选出具有多样性、代表性的图片,最后采用关联规则挖... 针对基于不同出行需求的景区内路线规划问题,首先运用卷积-循环神经网络(CNN-RNN)对游记中图像与文本进行联合嵌入,将数据按照景点进行分类识别,然后使用基于图模型的PhotoRank算法优选出具有多样性、代表性的图片,最后采用关联规则挖掘得到针对不同出行人群的特定需求情境的推荐路线。以8个热门景点为例,对马蜂窝中采集的游记数据进行实验,结果表明提出的基于群智数据的跨模态分析和情境关联旅游路线推荐方法能够从多角度真实地刻画景点,并且所推荐的情境关联路线可满足不同人群的特定游玩需求。 展开更多
关键词 群智数据 跨模态分析 PhotoRank算法 旅游路线推荐 情境关联推荐
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部