期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
大语言模型驱动的知识图谱实体摘要的次模优化方法
1
作者 张琪 钟昊 《计算机科学与探索》 CSCD 北大核心 2024年第7期1806-1813,共8页
知识图谱的规模不断增加,使得实体摘要成为了研究的热点问题。实体摘要的目标是从描述实体的大规模三元结构事实中得到实体的简洁描述。研究的目的是基于大语言模型提出一种次模优化方法用于实体摘要的提取。首先,基于三元组中实体、关... 知识图谱的规模不断增加,使得实体摘要成为了研究的热点问题。实体摘要的目标是从描述实体的大规模三元结构事实中得到实体的简洁描述。研究的目的是基于大语言模型提出一种次模优化方法用于实体摘要的提取。首先,基于三元组中实体、关系和属性的描述信息,采用大语言模型对它们进行嵌入,能够有效地捕捉三元组的语义信息,生成包含丰富语义信息的嵌入向量。其次,基于大语言模型生成的嵌入向量,定义任意两个描述同一实体的三元组事实之间关联度的刻画方法,任意两个三元组之间的关联度越高,表示这两个三元组之间包含的信息越相似。最后,基于上述定义的三元组关联度的刻画方法,定义正规化且单调非减的次模函数,将实体摘要建模为次模函数最大化问题,那么具有性能保证的贪心算法可以直接用于提取实体的摘要。在三个公共基准数据集上进行测试,采用F1值和归一化折损累计增益(NDCG)两个指标对提取的实体摘要的质量进行评估,实验结果表明该方法显著优于当前最先进的方法。 展开更多
关键词 实体摘要 大语言模型 次模函数 贪心算法
下载PDF
基于压缩实体摘要图的RDF数据关键词查询
2
作者 林晓庆 马宗民 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2017年第1期22-26,共5页
提出一种将关键词查询转换为SPARQL查询的方法来进行RDF数据的搜索.首先,根据RDF本身的关联特点,构建一个压缩实体摘要图;然后,借助关键词与所在实体的索引,将所查询的关键词在该摘要图上进行定位,通过图双向搜索算法找出包含关键词实... 提出一种将关键词查询转换为SPARQL查询的方法来进行RDF数据的搜索.首先,根据RDF本身的关联特点,构建一个压缩实体摘要图;然后,借助关键词与所在实体的索引,将所查询的关键词在该摘要图上进行定位,通过图双向搜索算法找出包含关键词实体的前k子图,获得查询实体之间的关系,再联合最初的关键词及他们的属性,构建SPARQL查询;最后使用SPARQL搜索引擎执行查询.实验结果表明,所提方法较其他方法有更快的响应时间及更高的准确率. 展开更多
关键词 RDF SPARQL OPS索引 压缩实体摘要 双向搜索
下载PDF
实体摘要系统的解释性评测
3
作者 刘庆霞 李俊宥 程龚 《大数据》 2021年第3期15-29,共15页
实体摘要任务是从知识图谱中描述实体的大量三元组中选取最优子集作为摘要。现有实体摘要系统通常以较复杂的方式集成多种摘要技术特征。已开展的评测工作对现有系统进行了总体效果的评测和对比,但未能解释系统所用各摘要特征对最终效... 实体摘要任务是从知识图谱中描述实体的大量三元组中选取最优子集作为摘要。现有实体摘要系统通常以较复杂的方式集成多种摘要技术特征。已开展的评测工作对现有系统进行了总体效果的评测和对比,但未能解释系统所用各摘要特征对最终效果的作用。为此,提出对实体摘要系统开展解释性评测。提出两种新指标:特征效用率和特征显著率,两者分别度量各摘要特征在标准摘要和系统生成摘要中的显示度,两者对比分析的结果在一定程度上可为系统取得的最终效果提供解释。基于3个评测集实现了这种评测新方法,运用6种常见的摘要特征,对9个非监督实体摘要系统和两个有监督实体摘要系统进行了解释性评测,相关代码和数据已开源。 展开更多
关键词 知识图谱 实体摘要 评测集
下载PDF
一种高可读低冗余实体摘要的生成方法
4
作者 刘庆霞 程龚 瞿裕忠 《中国科学:信息科学》 CSCD 北大核心 2020年第6期845-861,共17页
随着万维网的发展,知识图谱数据大量增长,并在面向智能应用的研究中受到广泛关注.知识图谱用RDF (resource description framework)三元组描述实体相关的事实.在知识图谱中,关于一个实体的描述可能包含大量三元组,在一些需要直接呈现实... 随着万维网的发展,知识图谱数据大量增长,并在面向智能应用的研究中受到广泛关注.知识图谱用RDF (resource description framework)三元组描述实体相关的事实.在知识图谱中,关于一个实体的描述可能包含大量三元组,在一些需要直接呈现实体信息的应用中,为了避免用户信息过载,并适应有限的呈现空间,就需要进行实体摘要.实体摘要任务是从实体描述的众多三元组中选出最有代表性的子集作为摘要,以呈现给用户阅读.本文提出一种新的实体摘要方法 ESSTER以生成具备高可读性和低冗余性的实体摘要.该方法结合三元组的结构与文本特征,基于结构特性度量知识图谱中三元组的重要性,基于N元语法和文本语料度量三元组的可读性,基于逻辑推理、数值比较和文本相似判断三元组间的冗余关系.综合这3种技术要素,将实体摘要问题建模为组合优化问题进行求解.本文在两个由人工标注的公开数据集上与6种现有方法进行了对比实验,结果表明本文提出的方法效果达到了当前最佳水平. 展开更多
关键词 知识图谱 实体摘要 冗余性 可读性 组合优化
原文传递
融合多种特征的实体对齐算法 被引量:6
5
作者 乔晶晶 段利国 李爱萍 《计算机工程与设计》 北大核心 2018年第11期3395-3400,共6页
针对单一百科社区实体信息覆盖不全,不同百科社区虽可信息互补但数据异构而且分类体系不同,导致自动抽取知识有歧义、效率低的问题,提出一种融合实体名称、实体摘要关键词集合、实体类别、实体属性-属性值序列等多种特征的百科实体相似... 针对单一百科社区实体信息覆盖不全,不同百科社区虽可信息互补但数据异构而且分类体系不同,导致自动抽取知识有歧义、效率低的问题,提出一种融合实体名称、实体摘要关键词集合、实体类别、实体属性-属性值序列等多种特征的百科实体相似度计算方法,综合运用多种百科社区的知识资源自动对齐同义实体。实验结果表明,在准确率上本文算法优于基于网络语义标签的实体对齐及基于实体属性与上下文主题的实体对齐等算法。 展开更多
关键词 实体对齐 属性标签 类别标签 实体摘要 语义相似度
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部