期刊文献+
共找到54篇文章
< 1 2 3 >
每页显示 20 50 100
ALBERT with Knowledge Graph Encoder Utilizing Semantic Similarity for Commonsense Question Answering 被引量:1
1
作者 Byeongmin Choi YongHyun Lee +1 位作者 Yeunwoong Kyung Eunchan Kim 《Intelligent Automation & Soft Computing》 SCIE 2023年第4期71-82,共12页
Recently,pre-trained language representation models such as bidirec-tional encoder representations from transformers(BERT)have been performing well in commonsense question answering(CSQA).However,there is a problem th... Recently,pre-trained language representation models such as bidirec-tional encoder representations from transformers(BERT)have been performing well in commonsense question answering(CSQA).However,there is a problem that the models do not directly use explicit information of knowledge sources existing outside.To augment this,additional methods such as knowledge-aware graph network(KagNet)and multi-hop graph relation network(MHGRN)have been proposed.In this study,we propose to use the latest pre-trained language model a lite bidirectional encoder representations from transformers(ALBERT)with knowledge graph information extraction technique.We also propose to applying the novel method,schema graph expansion to recent language models.Then,we analyze the effect of applying knowledge graph-based knowledge extraction techniques to recent pre-trained language models and confirm that schema graph expansion is effective in some extent.Furthermore,we show that our proposed model can achieve better performance than existing KagNet and MHGRN models in CommonsenseQA dataset. 展开更多
关键词 Commonsense reasoning question answering knowledge graph language representation model
下载PDF
基于知识图谱多跳推理的中文矿物知识问答方法与系统 被引量:1
2
作者 季晓慧 董雨航 +3 位作者 杨中基 杨眉 何明跃 王玉柱 《地学前缘》 EI CAS CSCD 北大核心 2024年第4期37-46,共10页
已有相关矿物数据库用于存储和查询相关矿物知识,常用的搜索引擎也可以对矿物知识进行查询,但无法回答用自然语言进行提问的矿物问题,查询返回的答案需要进一步筛选。亦有基于知识图谱进行矿物知识问答的相关研究,但只能回答涉及知识图... 已有相关矿物数据库用于存储和查询相关矿物知识,常用的搜索引擎也可以对矿物知识进行查询,但无法回答用自然语言进行提问的矿物问题,查询返回的答案需要进一步筛选。亦有基于知识图谱进行矿物知识问答的相关研究,但只能回答涉及知识图谱中一个三元组的简单问题,无法回答涉及多个三元组的多跳复杂问题。为此,本文提出基于知识图谱多跳推理的矿物复杂知识问答方法,采用ComplEx模型将矿物实体、关系和问句表示为复数向量,以更好地获取相互之间的语义及推理关系。输入矿物问句后,通过Bert-LSTM-CRF获取其中心词,采用基于编辑距离及分词的方法获得中心词的候选实体集合,然后采用全连接网络确定最相关的实体作为推理起点,与矿物问句拼接后通过全连接网络获得当前跳的最相关关系。根据当前跳的起始实体及最相关关系,在矿物知识图谱中获得另一实体作为下一跳的推理起点,并将下一跳的问句更新为原问句,与当前跳最相关关系拼接,以将当前跳的推理信息带入到下一跳推理中,直到获得的最相关推理关系为预定义的结束标识符,推理结束,返回最后一跳的实体为答案,并给出推理路径。采用Python语言,在Tensorflow框架下实现了本文提出的矿物复杂知识问答并与相关模型进行对比,证明了本文方法的有效性。采用前后端分离架构,使用RESTful API、React、Ajax、echarts和Flask等框架和技术,开发了基于知识图谱多跳推理的矿物复杂知识问答系统,为矿物知识获取及相关地质研究提供了平台和工具。 展开更多
关键词 矿物 问答系统 知识图谱 多跳推理
下载PDF
基于层次结构图的多跳知识图谱问答模型
3
作者 刘昀抒 申彦明 +1 位作者 齐恒 尹宝才 《计算机工程》 CSCD 北大核心 2024年第1期101-109,共9页
知识图谱问答(KBQA)旨在理解用户的自然语言问句,在结构化的知识图谱中通过检索、推理等手段来获取答案实体。近年来,多跳KBQA备受关注,然而,复杂问句中通常存在多个关系意图,已有KBQA方法大多忽视了推理关系链的关系顺序问题。为此,提... 知识图谱问答(KBQA)旨在理解用户的自然语言问句,在结构化的知识图谱中通过检索、推理等手段来获取答案实体。近年来,多跳KBQA备受关注,然而,复杂问句中通常存在多个关系意图,已有KBQA方法大多忽视了推理关系链的关系顺序问题。为此,提出一种基于层次结构图的多跳知识图谱问答模型(HSG-KBQA),建模自然语言问句的关系层次顺序,指导模型在每个推理步选择合理的关系意图。设计一种层次结构图,显式地体现问句中关系的层次距离,利用LSTM-BiGCN编码层将词语间的依存信息编码到问句中;提出虚拟节点的概念,利用图池化技术过滤不重要的节点,学习推理过程中知识图谱的状态;设计基于注意力机制和层次权重的解码器来优化指令生成,使推理指令更匹配问句中的关系链顺序。实验结果表明,HSG-KBQA在WebQuestionsSP数据集上取得了71.3%的Hits@1分数,在PathQuestions数据集上取得了97.3%(PQ-2H)和89.7%(PQ-3H)的Hits@1分数,均优于对照基准模型,表明HSG-KBQA模型在KBQA任务中具有更好的性能。 展开更多
关键词 知识图谱问答 问答系统 多跳问答 图神经网络 动态推理
下载PDF
基于多模态知识主动学习的视频问答方案
4
作者 刘明阳 王若梅 +1 位作者 周凡 林格 《计算机研究与发展》 EI CSCD 北大核心 2024年第4期889-902,共14页
视频问答是人工智能领域的一个热点研究问题.现有方法在特征提取方面缺乏针对视觉目标运动细节的获取,从而会导致错误因果关系的建立.此外,在数据融合与推理过程中,现有方法缺乏有效的主动学习能力,难以获取特征提取之外的先验知识,影... 视频问答是人工智能领域的一个热点研究问题.现有方法在特征提取方面缺乏针对视觉目标运动细节的获取,从而会导致错误因果关系的建立.此外,在数据融合与推理过程中,现有方法缺乏有效的主动学习能力,难以获取特征提取之外的先验知识,影响了模型对多模态内容的深度理解.针对这些问题,首先,设计了一种显性多模态特征提取模块,通过获取图像序列中视觉目标的语义关联以及与周围环境的动态关系来建立每个视觉目标的运动轨迹.进一步通过动态内容对静态内容的补充,为数据融合与推理提供了更加精准的视频特征表达.其次,提出了知识自增强多模态数据融合与推理模型,实现了多模态信息理解的自我完善和逻辑思维聚焦,增强了对多模态特征的深度理解,减少了对先验知识的依赖.最后,提出了一种基于多模态知识主动学习的视频问答方案.实验结果表明,该方案的性能优于现有最先进的视频问答算法,大量的消融和可视化实验也验证了方案的合理性. 展开更多
关键词 视频问答 数据融合与推理 多模态主动学习 视频细节描述提取 深度学习
下载PDF
面向遥感视觉问答的尺度引导融合推理网络
5
作者 赵恩源 宋宁 +3 位作者 聂婕 王鑫 郑程予 魏志强 《软件学报》 EI CSCD 北大核心 2024年第5期2133-2149,共17页
遥感视觉问答(remote sensing visual question answering,RSVQA)旨在从遥感图像中抽取科学知识.近年来,为了弥合遥感视觉信息与自然语言之间的语义鸿沟,涌现出许多方法.但目前方法仅考虑多模态信息的对齐和融合,既忽略了对遥感图像目... 遥感视觉问答(remote sensing visual question answering,RSVQA)旨在从遥感图像中抽取科学知识.近年来,为了弥合遥感视觉信息与自然语言之间的语义鸿沟,涌现出许多方法.但目前方法仅考虑多模态信息的对齐和融合,既忽略了对遥感图像目标中的多尺度特征及其空间位置信息的深度挖掘,又缺乏对尺度特征的建模和推理的研究,导致答案预测不够全面和准确.针对以上问题,提出一种多尺度引导的融合推理网络(multi-scale guided fusion inference network,MGFIN),旨在增强RSVQA系统的视觉空间推理能力.首先,设计基于Swin Transformer的多尺度视觉表征模块,对嵌入空间位置信息的多尺度视觉特征进行编码;其次,在语言线索的引导下,使用多尺度关系推理模块以尺度空间为线索学习跨多个尺度的高阶群内对象关系,并进行空间层次推理;最后,设计基于推理的融合模块来弥合多模态语义鸿沟,在交叉注意力基础上,通过自监督范式、对比学习方法、图文匹配机制等训练目标来自适应地对齐融合多模态特征,并辅助预测最终答案.实验结果表明,所提模型在两个公共RSVQA数据集上具有显著优势. 展开更多
关键词 遥感视觉问答 多模态智能融合 多模态推理 多尺度表征
下载PDF
可解释的视觉问答研究进展 被引量:1
6
作者 张一飞 孟春运 +2 位作者 蒋洲 栾力 Ernest Domanaanmwi Ganaa 《计算机应用研究》 CSCD 北大核心 2024年第1期10-20,共11页
在视觉问答(VQA)任务中,“可解释”是指在特定的任务中通过各种方法去解释模型为什么有效。现有的一些VQA模型因为缺乏可解释性导致模型无法保证在生活中能安全使用,特别是自动驾驶和医疗相关的领域,将会引起一些伦理道德问题,导致无法... 在视觉问答(VQA)任务中,“可解释”是指在特定的任务中通过各种方法去解释模型为什么有效。现有的一些VQA模型因为缺乏可解释性导致模型无法保证在生活中能安全使用,特别是自动驾驶和医疗相关的领域,将会引起一些伦理道德问题,导致无法在工业界落地。主要介绍视觉问答任务中的各种可解释性实现方式,并分为了图像解释、文本解释、多模态解释、模块化解释和图解释五类,讨论了各种方法的特点并对其中的一些方法进行了细分。除此之外,还介绍了一些可以增强可解释性的视觉问答数据集,这些数据集主要通过结合外部知识库、标注图片信息等方法来增强可解释性。对现有常用的视觉问答可解释方法进行了总结,最后根据现有视觉问答任务中可解释性方法的不足提出了未来的研究方向。 展开更多
关键词 视觉问答 视觉推理 可解释性 人工智能 自然语言处理 计算机视觉
下载PDF
融入软掩码机制增强数值表示的表格-文本混合问答
7
作者 张腾勋 许鸿飞 +2 位作者 约瑟夫·范·吉纳比斯 熊德意 昝红英 《小型微型计算机系统》 CSCD 北大核心 2024年第6期1292-1300,共9页
表格-文本混合问答需要从异质数据中进行数值推理得到答案,当前的研究将问题、表格、文本拼接作为输入,但其中包含太多不相关的数值和文本会降低模型的性能.使用硬掩码机制将噪音去除以增强正确的数值表示会产生错误传播问题,本文提出... 表格-文本混合问答需要从异质数据中进行数值推理得到答案,当前的研究将问题、表格、文本拼接作为输入,但其中包含太多不相关的数值和文本会降低模型的性能.使用硬掩码机制将噪音去除以增强正确的数值表示会产生错误传播问题,本文提出一种新的软掩码机制对原始输入表示进行缩放,从而增强正确的数值表示,同时减轻错误传播问题,并且该机制可以灵活地运用到各种模型以及任务中.本文在FinQA、ConvFinQA和MultiHiertt数据集上进行实验,结果表明通过软掩码机制增强数值表示可显著提升模型的性能(+1.27/+1.65Exe/Prog Acc、+3.09/+2.96Exe/Prog Acc和+5.29/+3.45EM/F1).本文还通过消融实验分析软掩码相对于硬掩码的优势,以及不同软掩码向量的影响,并讨论了当前表格-文本混合问答的局限性与未来方向. 展开更多
关键词 自然语言处理 表格-文本问答 软掩码 数值推理
下载PDF
基于图神经网络的问答系统
8
作者 冯雨溪 张燮弛 +1 位作者 黄正结 王琳琳 《计算机工程与设计》 北大核心 2024年第5期1351-1358,共8页
针对目前问答模型对文本语义理解能力不足、缺少常识性知识,且无法有效利用现存海量文本信息的现状,研究一种基于图神经网络的问答系统。通过预训练技术和图注意力算法的有效结合,融合来自常识知识库中的结构化知识,通过准确的知识推理... 针对目前问答模型对文本语义理解能力不足、缺少常识性知识,且无法有效利用现存海量文本信息的现状,研究一种基于图神经网络的问答系统。通过预训练技术和图注意力算法的有效结合,融合来自常识知识库中的结构化知识,通过准确的知识推理获得对文本深层次语义的理解,最终作出正确的回答。在对话文本和抽象语义文本等数据集上进行的一系列对比实验验证了该问答系统的有效性,表明其具备在对话文本及抽象语义概念上的理解能力。 展开更多
关键词 图神经网络 预训练范式 知识增强模块 知识推理 问答系统 机器阅读理解 自然语言处理
下载PDF
基于知识表示学习的KBQA答案推理重排序算法
9
作者 晋艳峰 黄海来 +1 位作者 林沿铮 王攸妙 《计算机应用研究》 CSCD 北大核心 2024年第7期1983-1991,共9页
现有的知识库问答(KBQA)研究通常依赖于完善的知识库,忽视了实际应用中知识图谱稀疏性这一关键问题。为了弥补该不足,引入了知识表示学习方法,将知识库转换为低维向量,有效摆脱了传统模型中对子图搜索空间的依赖,并实现了对隐式关系的推... 现有的知识库问答(KBQA)研究通常依赖于完善的知识库,忽视了实际应用中知识图谱稀疏性这一关键问题。为了弥补该不足,引入了知识表示学习方法,将知识库转换为低维向量,有效摆脱了传统模型中对子图搜索空间的依赖,并实现了对隐式关系的推理,这是以往研究所未涉及到的。其次,针对传统KBQA在信息检索中常见的问句语义理解错误对下游问答推理的错误传播,引入了一种基于知识表示学习的答案推理重排序机制。该机制使用伪孪生网络分别对知识三元组和问句进行表征,并融合上游任务核心实体关注度评估阶段的特征,以实现对答案推理结果三元组的有效重排序。最后,为了验证所提算法的有效性,在中国移动RPA知识图谱问答系统与英文开源数据集下分别进行了对比实验。实验结果显示,相比现有的同类模型,该算法在hits@n、准确率、F_(1)值等多个关键评估指标上均表现更佳,证明了基于知识表示学习的KBQA答案推理重排序算法在处理稀疏知识图谱的隐式关系推理和KBQA答案推理方面的优越性。 展开更多
关键词 知识库问答 知识图谱 知识表示学习 答案推理
下载PDF
基于逻辑推理的机器阅读理解综述
10
作者 李晴 李艳玲 +2 位作者 董杰 葛凤培 林民 《计算机科学与探索》 CSCD 北大核心 2024年第8期1998-2013,共16页
机器阅读理解是自然语言处理领域中的核心任务之一,该任务目标是使机器能够理解自然语言文本,并正确回答关于文本内容的问题。随着自然语言处理相关方法和模型的发展,研究者们开始关注机器阅读理解中更具挑战性的推理型问题,这些问题通... 机器阅读理解是自然语言处理领域中的核心任务之一,该任务目标是使机器能够理解自然语言文本,并正确回答关于文本内容的问题。随着自然语言处理相关方法和模型的发展,研究者们开始关注机器阅读理解中更具挑战性的推理型问题,这些问题通常要求模型不仅理解文本中的浅层信息,还要能够在逻辑上进行思考和推理,以回答更加复杂的问题。对基于逻辑推理的机器阅读理解相关的最新成果进行全面的归纳。介绍基于逻辑推理的机器阅读理解任务。介绍该任务的相关方法,并根据侧重点的不同将这些方法分成四类:基于符号神经网络的方法、基于图神经网络的方法、基于预训练的方法和基于大模型的微调策略。重点描述四类方法的代表性工作。在LogiQA和ReClor两个逻辑推理主流数据集上探讨方法的优缺点,并总结基于逻辑推理的机器阅读理解任务的未来研究方向。 展开更多
关键词 机器阅读理解 逻辑推理 智能问答
下载PDF
知识库问答研究进展与展望 被引量:3
11
作者 曹书林 史佳欣 +1 位作者 侯磊 李涓子 《计算机学报》 EI CAS CSCD 北大核心 2023年第3期512-539,共28页
基于知识库的问答(Question Answeringover Knowledge Base,KBQA)是问答系统的重要组成部分,要求计算机正确理解自然语言问题的语义,并从知识库中提取问题的答案.早期研究主要关注仅涉及到单个关系三元组的简单问答,近年来,随着以深度... 基于知识库的问答(Question Answeringover Knowledge Base,KBQA)是问答系统的重要组成部分,要求计算机正确理解自然语言问题的语义,并从知识库中提取问题的答案.早期研究主要关注仅涉及到单个关系三元组的简单问答,近年来,随着以深度学习为代表的表示学习技术在简单问答任务的成功应用,研究重点逐渐转移到需要复杂推理能力的推理问答上.本文将对现有知识库问答的研究进展进行综述,先总结简单问答和推理问答两类任务各自的问题和挑战,然后对近年来与知识库问答相关的数据集进行多维度的分析和比较,接下来对两类任务的代表性方法进行系统性归纳介绍并分析各类方法的优缺点,最后对未来的研究方向进行展望. 展开更多
关键词 知识库 问答系统 机器推理 可解释性 人工智能
下载PDF
面向多跳问答的多视图语义推理网络 被引量:1
12
作者 龙欣 赵容梅 +1 位作者 孙界平 琚生根 《工程科学与技术》 EI CSCD 北大核心 2023年第2期285-297,共13页
由于多跳知识图谱问答任务的复杂性,现有研究大多通过堆叠多层图神经网络以捕捉更大范围的高阶邻居信息。这种做法将多阶信息融合在一起,以损失节点判别性为代价获取更全局的信息,存在过平滑问题;并且,由于离节点越近的邻居置信度越高,... 由于多跳知识图谱问答任务的复杂性,现有研究大多通过堆叠多层图神经网络以捕捉更大范围的高阶邻居信息。这种做法将多阶信息融合在一起,以损失节点判别性为代价获取更全局的信息,存在过平滑问题;并且,由于离节点越近的邻居置信度越高,将多阶邻居信息融合在一起的做法会忽略邻居的置信度。此外,多跳知识图谱问答存在许多数据集通常没有给定中间路径的监督信息的弱监督问题,会使模型在进行路径推理时缺乏有效的指导信息,导致模型推理能力降低。为了解决以上问题,论文提出了一种多视图语义推理网络,该网络利用全局和局部两种视图的信息共同进行推理。全局视图信息是指节点的多阶邻居信息,能够为推理提供更丰富的证据;局部视图信息则只关注节点的1阶邻居信息,更具有判别性,能够缓解全局视图信息存在的过平滑问题。同时,该网络将问题分解为多个子问题作为中间路径推理的指导信息,并从问题语义构成的均匀性和一致性出发,设计了一种新颖的损失函数以提升问题分解的质量,以提高模型中间路径推理的能力。论文方法在3个真实数据集上进行了大量实验,实验结果表明,多视图的语义信息能够为推理提供更加全面的证据,将问题分解为子问题的做法能够提高中间路径推理的准确性,证明了论文方法的有效性。 展开更多
关键词 多跳知识图谱问答 图神经网络 多视图 语义推理 弱监督
下载PDF
面向知识图谱约束问答的强化学习推理技术 被引量:1
13
作者 毕鑫 聂豪杰 +2 位作者 赵相国 袁野 王国仁 《软件学报》 EI CSCD 北大核心 2023年第10期4565-4583,共19页
知识图谱问答任务通过问题分析与知识图谱推理,将问题的精准答案返回给用户,现已被广泛应用于智能搜索、个性化推荐等智慧信息服务中.考虑到关系监督学习方法人工标注的高昂代价,学者们开始采用强化学习等弱监督学习方法设计知识图谱问... 知识图谱问答任务通过问题分析与知识图谱推理,将问题的精准答案返回给用户,现已被广泛应用于智能搜索、个性化推荐等智慧信息服务中.考虑到关系监督学习方法人工标注的高昂代价,学者们开始采用强化学习等弱监督学习方法设计知识图谱问答模型.然而,面对带有约束的复杂问题,现有方法面临两大挑战:(1)多跳长路径推理导致奖励稀疏与延迟;(2)难以处理约束问题推理路径分支.针对上述挑战,设计了融合约束信息的奖励函数,能够解决弱监督学习面临的奖励稀疏与延迟问题;设计了基于强化学习的约束路径推理模型COPAR,提出了基于注意力机制的动作选择策略与基于约束的实体选择策略,能够依据问题约束信息选择关系及实体,缩减推理搜索空间,解决了推理路径分支问题.此外,提出了歧义约束处理策略,有效解决了推理路径歧义问题.采用知识图谱问答基准数据集对COPAR的性能进行了验证和对比.实验结果表明:与现有先进方法相比,在多跳数据集上性能相对提升了2%-7%,在约束数据集上性能均优于对比模型,准确率提升7.8%以上. 展开更多
关键词 知识图谱 约束路径推理 约束问答 强化学习
下载PDF
基于深度学习的视觉问答研究综述
14
作者 李祥 范志广 +3 位作者 李学相 张卫星 杨聪 曹仰杰 《计算机科学》 CSCD 北大核心 2023年第5期177-188,共12页
视觉问答是计算机视觉和自然语言处理的交叉领域。在视觉问答的任务中,机器首先需要对图像、文本这两种模态数据进行编码,进而学习这两种模态之间的映射,实现图像特征和文本特征的融合,最后给出答案。视觉问答任务考验模型对图像的理解... 视觉问答是计算机视觉和自然语言处理的交叉领域。在视觉问答的任务中,机器首先需要对图像、文本这两种模态数据进行编码,进而学习这两种模态之间的映射,实现图像特征和文本特征的融合,最后给出答案。视觉问答任务考验模型对图像的理解能力以及对答案的推理能力。视觉问答是实现跨模态人机交互的重要途径,具有广阔的应用前景。最近相继涌现出了众多新兴技术,如基于场景推理的方法、基于对比学习的方法和基于三维点云的方法。但是,视觉问答模型普遍存在推理能力不足、缺乏可解释性等问题,值得进一步地探索与研究。文中对视觉问答领域的相关研究和新颖方法进行了深入的调研和总结。首先介绍了视觉问答的背景;其次分析了视觉问答的研究现状并对相关算法的和数据集进行了归纳总结;最后根据当前模型存在的问题对视觉问答的未来研究方向进行了展望。 展开更多
关键词 视觉问答 跨模态 人机交互 推理能力 可解释性
下载PDF
Meta-path reasoning of knowledge graph for commonsense question answering
15
作者 Miao ZHANG Tingting HE Ming DONG 《Frontiers of Computer Science》 SCIE EI 2024年第1期49-59,共11页
Commonsense question answering(CQA)requires understanding and reasoning over QA context and related commonsense knowledge,such as a structured Knowledge Graph(KG).Existing studies combine language models and graph neu... Commonsense question answering(CQA)requires understanding and reasoning over QA context and related commonsense knowledge,such as a structured Knowledge Graph(KG).Existing studies combine language models and graph neural networks to model inference.However,traditional knowledge graph are mostly concept-based,ignoring direct path evidence necessary for accurate reasoning.In this paper,we propose MRGNN(Meta-path Reasoning Graph Neural Network),a novel model that comprehensively captures sequential semantic information from concepts and paths.In MRGNN,meta-paths are introduced as direct inference evidence and an original graph neural network is adopted to aggregate features from both concepts and paths simultaneously.We conduct sufficient experiments on the CommonsenceQA and OpenBookQA datasets,showing the effectiveness of MRGNN.Also,we conduct further ablation experiments and explain the reasoning behavior through the case study. 展开更多
关键词 question answering knowledge graph graph neural network meta-path reasoning
原文传递
基于子问题渐进式推理的3D视觉问答
16
作者 李长健 杨昱威 +1 位作者 肖枭 雷印杰 《计算机应用研究》 CSCD 北大核心 2023年第4期987-990,995,共5页
3D视觉问答可以帮助人们理解空间信息,在幼儿教育等方面具有广阔的应用前景。3D场景信息复杂,现有方法大多直接进行回答,面对复杂问题时容易忽视上下文细节,从而导致性能下降。针对该问题,提出了一种基于子问题渐进式推理的3D视觉问答方... 3D视觉问答可以帮助人们理解空间信息,在幼儿教育等方面具有广阔的应用前景。3D场景信息复杂,现有方法大多直接进行回答,面对复杂问题时容易忽视上下文细节,从而导致性能下降。针对该问题,提出了一种基于子问题渐进式推理的3D视觉问答方法,通过文本分析为复杂的原始问题构建多个简单的子问题。模型在回答子问题的过程中学习上下文信息,帮助理解复杂问题的含义,最终利用积累的联合信息得出原始问题的答案。子问题与原始问题呈现渐近式推理关系,使得模型具有明确的错误解释性和可追溯性。在现有3D数据集ScanQA上进行的实验表明,所提方法在EM@10和CIDEr两个指标上分别达到了51.49%和61.68%,均超过了现有的其他3D视觉问答方法,证实了该方法的有效性。 展开更多
关键词 3D视觉问答 原始问题 子问题 渐进式推理 上下文信息
下载PDF
问答系统构建及推理研究综述 被引量:1
17
作者 姚奕 尹瑞江 陈朝阳 《计算机技术与发展》 2023年第12期8-16,共9页
近年来对问答系统的研究提高了信息提取的质量,并取得了许多领域内的不错成果。传统方法构建的问答系统满足不了如今的需求,因此结合深度学习模型构建问答系统以提高检索能力成为当前研究的主流。而且面对越来越多限制条件的多跳问题,... 近年来对问答系统的研究提高了信息提取的质量,并取得了许多领域内的不错成果。传统方法构建的问答系统满足不了如今的需求,因此结合深度学习模型构建问答系统以提高检索能力成为当前研究的主流。而且面对越来越多限制条件的多跳问题,问答系统需要具备一定推理能力推导出更多的信息以准确的找到答案。该文讨论了基于语义解析和基于信息检索的两种实现问答系统的方法,这两种方法都可以有效地处理单一约束的简单问题,而且结合深度学习模型,可以更好地解决多约束的复杂问题。此外,针对在知识库中多次跳跃的问答,还讨论了基于图神经网络和强化学习等方法的问答推理技术,这些技术可以在知识库中进行多跳推理,补充问答中的缺失信息完成问答任务。最后,对两种构建方法的优缺点进行了总结,并展望了未来问答系统的发展前景。 展开更多
关键词 问答系统 语义解析 信息检索 问答推理 深度学习
下载PDF
知识型视觉问答研究综述
18
作者 王瑞平 吴士泓 +1 位作者 张美航 王小平 《计算机科学》 CSCD 北大核心 2023年第1期166-175,共10页
视觉问答作为人工智能完备性和视觉图灵测试的重要呈现形式,加上其具有潜在的应用价值,受到了计算机视觉和自然语言处理两个领域的广泛关注。知识在视觉问答中发挥着重要作用,特别是在处理复杂且开放的问题时,推理知识和外部知识对获取... 视觉问答作为人工智能完备性和视觉图灵测试的重要呈现形式,加上其具有潜在的应用价值,受到了计算机视觉和自然语言处理两个领域的广泛关注。知识在视觉问答中发挥着重要作用,特别是在处理复杂且开放的问题时,推理知识和外部知识对获取正确答案极为关键。蕴含知识的问答机制被称为知识型视觉问答,目前还没有针对知识型视觉问答的系统性调查。面向视觉问答中的知识参与方式和表达形式的研究能够有效填补知识型视觉问答体系中在文献综述方面存在的缺口。文中对知识型视觉问答的各组成单元进行了调查,对知识的存在形态进行了研究,提出了知识层级概念。进一步地,针对视觉特征提取、语言特征提取和多模态融合过程中的知识参与方式和表达形式进行了归纳和总结,并对未来发展趋势及研究方向进行了探讨。 展开更多
关键词 视觉问答 知识分层 内部逻辑推理 外部知识库 知识表达形式 知识参与方式
下载PDF
QA-KGNet:一种语言模型驱动的知识图谱问答模型
19
作者 乔少杰 杨国平 +5 位作者 于泳 韩楠 覃晓 屈露露 冉黎琼 李贺 《软件学报》 EI CSCD 北大核心 2023年第10期4584-4600,共17页
基于知识图谱的问答系统可以解析用户问题,已成为一种检索知识、自动回答所询问题的有效途径.知识图谱问答系统通常是利用神经程序归纳模型,将自然语言问题转化为逻辑形式,在知识图谱上执行该逻辑形式能够得到答案.然而,使用预训练语言... 基于知识图谱的问答系统可以解析用户问题,已成为一种检索知识、自动回答所询问题的有效途径.知识图谱问答系统通常是利用神经程序归纳模型,将自然语言问题转化为逻辑形式,在知识图谱上执行该逻辑形式能够得到答案.然而,使用预训练语言模型和知识图谱的知识问答系统包含两个挑战:(1)给定问答(questionanswering, QA)上下文,需要从大型知识图谱(knowledge graph, KG)中识别相关知识;(2)对QA上下文和KG进行联合推理.基于此,提出一种语言模型驱动的知识图谱问答推理模型QA-KGNet,将QA上下文和KG连接起来形成一个工作图,使用语言模型计算给定QA上下文节点与KG节点的关联度,并使用多头图注意力网络更新节点表示.在Commonsense QA、OpenBookQA和Med QA-USMLE真实数据集上进行实验来评估QA-KGNet的性能,实验结果表明:QA-KGNet优于现有的基准模型,表现出优越的结构化推理能力. 展开更多
关键词 知识图谱 预训练语言模型 QA上下文 多头图注意力网络 联合推理
下载PDF
基于门控机制的联合关系推理视觉问答模型
20
作者 胡婷 何利力 《智能计算机与应用》 2023年第12期138-143,共6页
与问题相关的视觉对象提取准确度不够,以及视觉对象之间的关系推理能力不足,是现有视觉问答模型视觉推理能力不足的主要原因。针对这两个方面的问题,本文提出一种基于门控机制的联合关系推理视觉问答模型(VARG)。该模型利用视觉注意力... 与问题相关的视觉对象提取准确度不够,以及视觉对象之间的关系推理能力不足,是现有视觉问答模型视觉推理能力不足的主要原因。针对这两个方面的问题,本文提出一种基于门控机制的联合关系推理视觉问答模型(VARG)。该模型利用视觉注意力机制关注多个与问题相关的区域,通过筛选机制提取与问题最相关的前N个区域,并在此基础上建立视觉关系特征进行视觉关系推理,引入门控选择机制,动态的控制视觉特征和视觉关系特征对于答案的贡献,以此提升模型视觉推理能力。经在VQA V2数据集上进行实验,证明了模型的有效性。 展开更多
关键词 视觉问答 注意力机制 门控机制 视觉关系推理
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部