研究旨在让机器自动生成符合人类提问习惯的阶梯式问句链,辅助智能阅读提问、智能客服、智能医疗问诊等领域对于自然语言理解与生成任务的实际需求,提出一种基于知识图谱关系预测的阶梯式问句链生成模型(stepped question chain generat...研究旨在让机器自动生成符合人类提问习惯的阶梯式问句链,辅助智能阅读提问、智能客服、智能医疗问诊等领域对于自然语言理解与生成任务的实际需求,提出一种基于知识图谱关系预测的阶梯式问句链生成模型(stepped question chain generator based on knowledge graph link prediction,SQCG-KGLP)。SQCG-KGLP模型包括编码和解码两部分,在编码部分,对问句链的问句实体进行特征初始化,并通过特征融合方法获得问句链的融合头实体和待测尾实体的初始向量。将融合头实体和待测尾实体的初始向量送入SQCG-KGLP模型的Graph Attention图表示学习模块中,从而获得融合头实体和待测尾实体的表示向量。在解码部分,将融合头实体以及待测尾实体的表示向量输入到SQCG-KGLP模型的convKB模块中进行链接预测。在自建问句链数据集上进行不同跳数的实验,以MRR、Hits@1、Hits@3、Hits@10作为评测指标。结果表明,SQCG-KGLP算法均优于基线模型。当问句链生成迭代次数增加时,支持关系预测的知识图谱跳数随之增加,下一个节点问句语义信息表达的自然性会随之下降。此外,在现实应用场景中较难获得足量的高跳数问句训练数据集。目前,该研究仅能支持三跳以下的问句链生成。利用知识图谱的语义关联及知识图谱关系预测机制,生成的阶梯式问句链具有层层递进、由易到难、环环相扣的特点,使问句链的阶梯式逻辑质量更优。展开更多
文摘研究旨在让机器自动生成符合人类提问习惯的阶梯式问句链,辅助智能阅读提问、智能客服、智能医疗问诊等领域对于自然语言理解与生成任务的实际需求,提出一种基于知识图谱关系预测的阶梯式问句链生成模型(stepped question chain generator based on knowledge graph link prediction,SQCG-KGLP)。SQCG-KGLP模型包括编码和解码两部分,在编码部分,对问句链的问句实体进行特征初始化,并通过特征融合方法获得问句链的融合头实体和待测尾实体的初始向量。将融合头实体和待测尾实体的初始向量送入SQCG-KGLP模型的Graph Attention图表示学习模块中,从而获得融合头实体和待测尾实体的表示向量。在解码部分,将融合头实体以及待测尾实体的表示向量输入到SQCG-KGLP模型的convKB模块中进行链接预测。在自建问句链数据集上进行不同跳数的实验,以MRR、Hits@1、Hits@3、Hits@10作为评测指标。结果表明,SQCG-KGLP算法均优于基线模型。当问句链生成迭代次数增加时,支持关系预测的知识图谱跳数随之增加,下一个节点问句语义信息表达的自然性会随之下降。此外,在现实应用场景中较难获得足量的高跳数问句训练数据集。目前,该研究仅能支持三跳以下的问句链生成。利用知识图谱的语义关联及知识图谱关系预测机制,生成的阶梯式问句链具有层层递进、由易到难、环环相扣的特点,使问句链的阶梯式逻辑质量更优。