知识库问答(Knowledge Base Question Answering,KBQA)借助知识库中精度高、关联性强的结构化知识,为给定的复杂事实型问句提供准确、简短的答案.语义解析是知识库问答的主流方法之一,该类方法在给定的问句语义表征形式下,将非结构化的...知识库问答(Knowledge Base Question Answering,KBQA)借助知识库中精度高、关联性强的结构化知识,为给定的复杂事实型问句提供准确、简短的答案.语义解析是知识库问答的主流方法之一,该类方法在给定的问句语义表征形式下,将非结构化的问句映射为结构化的语义表征,再将其改写为知识库查询获取答案.目前,面向知识库问答的语义解析方法主要面临三个挑战:首先是如何选择合适的语义表征形式以表达问句的语义,然后是如何解析问句的复杂语义并输出相应的语义表征,最后是如何应对特定领域中数据标注成本高昂、高质量数据匮乏的问题.本文从上述挑战出发,分析了知识库问答中常用的语义表征的特点与不足,然后梳理现有方法并总结分析其如何应对问句的复杂语义,接着介绍了当前方法在标注数据匮乏的低资源场景下的尝试,最后展望并讨论了面向知识库问答的语义解析的未来发展方向.展开更多
事件时序关系抽取是一项重要的自然语言理解任务,可以广泛应用于诸如知识图谱构建、问答系统等任务.已有事件时序关系抽取方法往往将该任务视为句子级事件对的分类问题,而基于有限的局部句子信息导致其抽取的事件时序关系的精度较低,且...事件时序关系抽取是一项重要的自然语言理解任务,可以广泛应用于诸如知识图谱构建、问答系统等任务.已有事件时序关系抽取方法往往将该任务视为句子级事件对的分类问题,而基于有限的局部句子信息导致其抽取的事件时序关系的精度较低,且无法保证整体时序关系的全局一致性.针对此问题,提出一种融合上下文信息的篇章级事件时序关系抽取方法,使用基于双向长短期记忆(bidirectional long short-term memory,Bi-LSTM)的神经网络模型学习文章中事件对的时序关系表示,再利用自注意力机制融入上下文中其他事件对信息,从而得到更丰富的事件对时序关系表示用于时序关系分类.通过TB-Dense(timebank dense)和MATRES(multi-axis temporal relations for start-points)数据集的实验表明:此方法能够取得比当前主流的句子级方法更佳的抽取效果.展开更多
随着信息技术的飞速发展,互联网成为了舆情传播的主要载体.各种舆情事件不断涌现,并在网民的参与下广泛传播,由此可能引发强烈的社会反响.因此,如何实现网络舆情事件快速发现与个性化监测需求的精准推送,成为了当前舆情的重点关注内容....随着信息技术的飞速发展,互联网成为了舆情传播的主要载体.各种舆情事件不断涌现,并在网民的参与下广泛传播,由此可能引发强烈的社会反响.因此,如何实现网络舆情事件快速发现与个性化监测需求的精准推送,成为了当前舆情的重点关注内容.对于舆情场景下用户交互信息稀疏导致的兴趣难以刻画的问题,提出了一种基于层次知识的话题推荐模型.模型通过引入层次知识来扩充语义增加话题之间的潜在信息关联,分别对层次知识、话题和用户建模得到对应的嵌入向量表示,再结合多层感知机匹配模型预测用户点击率.实验结果表明,该模型在与多个基线算法的对比中,在F1(the balanced F score)和AUC(the area under curve)指标的平均值上分别提升了6.7%和4.9%.展开更多
文摘知识库问答(Knowledge Base Question Answering,KBQA)借助知识库中精度高、关联性强的结构化知识,为给定的复杂事实型问句提供准确、简短的答案.语义解析是知识库问答的主流方法之一,该类方法在给定的问句语义表征形式下,将非结构化的问句映射为结构化的语义表征,再将其改写为知识库查询获取答案.目前,面向知识库问答的语义解析方法主要面临三个挑战:首先是如何选择合适的语义表征形式以表达问句的语义,然后是如何解析问句的复杂语义并输出相应的语义表征,最后是如何应对特定领域中数据标注成本高昂、高质量数据匮乏的问题.本文从上述挑战出发,分析了知识库问答中常用的语义表征的特点与不足,然后梳理现有方法并总结分析其如何应对问句的复杂语义,接着介绍了当前方法在标注数据匮乏的低资源场景下的尝试,最后展望并讨论了面向知识库问答的语义解析的未来发展方向.
文摘事件时序关系抽取是一项重要的自然语言理解任务,可以广泛应用于诸如知识图谱构建、问答系统等任务.已有事件时序关系抽取方法往往将该任务视为句子级事件对的分类问题,而基于有限的局部句子信息导致其抽取的事件时序关系的精度较低,且无法保证整体时序关系的全局一致性.针对此问题,提出一种融合上下文信息的篇章级事件时序关系抽取方法,使用基于双向长短期记忆(bidirectional long short-term memory,Bi-LSTM)的神经网络模型学习文章中事件对的时序关系表示,再利用自注意力机制融入上下文中其他事件对信息,从而得到更丰富的事件对时序关系表示用于时序关系分类.通过TB-Dense(timebank dense)和MATRES(multi-axis temporal relations for start-points)数据集的实验表明:此方法能够取得比当前主流的句子级方法更佳的抽取效果.
文摘随着信息技术的飞速发展,互联网成为了舆情传播的主要载体.各种舆情事件不断涌现,并在网民的参与下广泛传播,由此可能引发强烈的社会反响.因此,如何实现网络舆情事件快速发现与个性化监测需求的精准推送,成为了当前舆情的重点关注内容.对于舆情场景下用户交互信息稀疏导致的兴趣难以刻画的问题,提出了一种基于层次知识的话题推荐模型.模型通过引入层次知识来扩充语义增加话题之间的潜在信息关联,分别对层次知识、话题和用户建模得到对应的嵌入向量表示,再结合多层感知机匹配模型预测用户点击率.实验结果表明,该模型在与多个基线算法的对比中,在F1(the balanced F score)和AUC(the area under curve)指标的平均值上分别提升了6.7%和4.9%.