期刊文献+
共找到134篇文章
< 1 2 7 >
每页显示 20 50 100
Integrating Intra-and Inter-document Evidences for Improving Sentence Sentiment Classification 被引量:6
1
作者 ZHAO Yan-Yan QIN Bing LIU Ting 《自动化学报》 EI CSCD 北大核心 2010年第10期1417-1425,共9页
关键词 数码相机 像素 富士 光学变焦
下载PDF
UNCERTAIN KNOWLEDGE MANAGEMENT IN EXPERT SYSTEMS USING FUZZY METAGRAPHS
2
作者 谭政华 胡光锐 侯嘉骅 《Journal of Shanghai Jiaotong university(Science)》 EI 2000年第2期6-9,共4页
This paper presented a new graph theoretic construct——fuzzy metagraphs and discussed their applications in constructing fuzzy knowledge base. Fuzzy metagraphs describe the relationships between sets of fuzzy element... This paper presented a new graph theoretic construct——fuzzy metagraphs and discussed their applications in constructing fuzzy knowledge base. Fuzzy metagraphs describe the relationships between sets of fuzzy elements but not single fuzzy element and offer some distinct advantages both for visualization of systems, as well as for formal analysis of system structure. In rule based system, a fuzzy metagraph is a unity of the knowledge base and the reasoning engine. Based on the closure of the adjacency matrix of fuzzy metagraphs, this paper presented an optimized inferential mechanism working mainly by an off line approach. It can greatly increase the efficiency of inference. Finally, it was applied in a daignostic expert system and satisfactory results were obtained. 展开更多
关键词 FUZZY KNOWLEDGE base FUZZY INFERENCE FAULT diagnosis graph theory document code:A
下载PDF
基于双粒度图的文档级关系抽取
3
作者 廖涛 张国畅 张顺香 《计算机工程》 CAS CSCD 北大核心 2024年第10期164-173,共10页
文档级关系抽取是指在非结构性文本中抽取实体对之间的关系。针对当前文档级关系抽取方法未能充分利用文档语义信息且难以处理文档的噪声干扰问题,提出一种基于双粒度文档图的关系抽取模型,采用一种新型的构图思路以及降噪方法,分别在... 文档级关系抽取是指在非结构性文本中抽取实体对之间的关系。针对当前文档级关系抽取方法未能充分利用文档语义信息且难以处理文档的噪声干扰问题,提出一种基于双粒度文档图的关系抽取模型,采用一种新型的构图思路以及降噪方法,分别在句间和句内两个层面进行设计。首先,在句间层面使用修辞语篇关系实体提及关系构建修辞语篇关系图RST-graph,采用异步降噪方式生成粗粒度文档图(CGD-graph),缓解了因实体对的句间关系路径长于句内关系路径造成的结构性误剪枝问题。然后,在句内层面采用依存句法关系对文档中的句子进行解析,构造依存句法树(SDT),增强句内语义信息。最后,将SDT和CGD-graph中存在的公共锚点相连接,构造细粒度文档图(FGD-graph)。实验结果表明,与去噪图推理(DGI)模型相比,该模型的lgn F1值和F1值分别提升了0.40和0.51个百分点,并且在实体对的多标签关系上随着标签数量的增多抽取效果提升较为显著。 展开更多
关键词 文档级 关系抽取 双粒度文档图 异步降噪 修辞语篇关系 依存句法关系
下载PDF
河洛历史文献知识图谱建设研究
4
作者 张炜 于晨星 《洛阳师范学院学报》 2024年第9期38-41,共4页
根据国家图书馆的有关要求,洛阳市图书馆拟开发一套古籍知识图谱加工系统。通过基础数据导入、知识标引、知识导出、知识图谱发布与检索等步骤建立知识图谱利用平台,实现了以河洛文化为主要内容的黄河文化知识的高度梳理和关联。平台突... 根据国家图书馆的有关要求,洛阳市图书馆拟开发一套古籍知识图谱加工系统。通过基础数据导入、知识标引、知识导出、知识图谱发布与检索等步骤建立知识图谱利用平台,实现了以河洛文化为主要内容的黄河文化知识的高度梳理和关联。平台突破了使用者原有的认知水平,由人工智能建立使用者此前未曾想象的知识关联角度,同时具备极高的归纳总结能力,可以短时间内对某一类问题实现穷尽式呈现,从而极大节省资料翻阅时间,也可以给予人类新的研究思路,更好地满足读者需求。 展开更多
关键词 河洛 历史文献 知识图谱
下载PDF
基于多粒度阅读器和图注意力网络的文档级事件抽取
5
作者 薛颂东 李永豪 赵红燕 《计算机应用研究》 CSCD 北大核心 2024年第8期2329-2335,共7页
文档级事件抽取面临论元分散和多事件两大挑战,已有工作大多采用逐句抽取候选论元的方式,难以建模跨句的上下文信息。为此,提出了一种基于多粒度阅读器和图注意网络的文档级事件抽取模型,采用多粒度阅读器实现多层次语义编码,通过图注... 文档级事件抽取面临论元分散和多事件两大挑战,已有工作大多采用逐句抽取候选论元的方式,难以建模跨句的上下文信息。为此,提出了一种基于多粒度阅读器和图注意网络的文档级事件抽取模型,采用多粒度阅读器实现多层次语义编码,通过图注意力网络捕获实体对之间的局部和全局关系,构建基于实体对相似度的剪枝完全图作为伪触发器,全面捕捉文档中的事件和论元。在公共数据集ChFinAnn和DuEE-Fin上进行了实验,结果表明提出的方法改善了论元分散问题,提升了模型事件抽取性能。 展开更多
关键词 多粒度阅读器 图注意力网络 文档级事件抽取
下载PDF
融入文档图和事件图的新闻核心事件检测
6
作者 赵庆珏 余正涛 +2 位作者 王剑 黄于欣 朱恩昌 《中文信息学报》 CSCD 北大核心 2024年第5期99-106,共8页
新闻核心事件检测旨在从非结构化的新闻文本中检测出最能代表新闻核心内容的事件。新闻报道的多个事件之间存在着复杂的关联关系,且同一个事件的事件要素分布在不同的句子甚至不同的段落中,传统的方法对事件之间的关联关系以及事件的全... 新闻核心事件检测旨在从非结构化的新闻文本中检测出最能代表新闻核心内容的事件。新闻报道的多个事件之间存在着复杂的关联关系,且同一个事件的事件要素分布在不同的句子甚至不同的段落中,传统的方法对事件之间的关联关系以及事件的全局语义信息建模不充分。因此,该文提出了融入文档图和事件图的新闻核心事件检测方法。该方法首先通过构建文档图和事件图来建模新闻文本的全局语义特征和事件之间的关联特征。然后,通过图卷积神经网络捕获高阶邻域信息,获得文档表征和事件表征。最后,将得到的文档表征和事件表征使用交叉注意力进一步捕获事件全局语义信息。在纽约时报数据集上的实验结果验证了该文方法的有效性,NR@1较基线方法提升2.18%。 展开更多
关键词 核心事件检测 文档图 事件图 交叉注意力机制
下载PDF
基于异构图和关键词的抽取式文本摘要模型 被引量:1
7
作者 朱颀林 王羽 徐建 《电子科技大学学报》 EI CAS CSCD 北大核心 2024年第2期259-270,共12页
抽取式文本摘要使用一定的策略从冗长的文本中选择一些句子组成摘要,其关键在于要尽可能多地利用文本的语义信息和结构信息。为了更好地挖掘这些信息,进而利用它们指导摘要的抽取,提出了一种基于异构图和关键词的抽取式文本摘要模型(HGK... 抽取式文本摘要使用一定的策略从冗长的文本中选择一些句子组成摘要,其关键在于要尽可能多地利用文本的语义信息和结构信息。为了更好地挖掘这些信息,进而利用它们指导摘要的抽取,提出了一种基于异构图和关键词的抽取式文本摘要模型(HGKSum)。该模型首先将文本建模为由句子节点和词语节点构成的异构图,在异构图上使用图注意力网络学习节点的特征,之后将关键词抽取任务作为文本摘要任务的辅助任务,使用多任务学习的方式进行训练,得到候选摘要,最后对候选摘要进行精炼以降低冗余度,得到最终摘要。在基准数据集上的对比实验表明,该模型性能优于基准模型,此外,消融实验也证明了引入异构节点和关键词的必要性。 展开更多
关键词 抽取式文本摘要 异构图 关键词 图注意力网络 多任务学习
下载PDF
基于命名实体识别的铁路应急预案智能管理方法 被引量:1
8
作者 王华 《铁道运输与经济》 北大核心 2024年第4期75-82,共8页
铁路应急预案是应对自然灾害、事故灾难、社会安全等突发事件,快速做出科学决策、组织救援的行动指南。由于应急预案多以非结构化文档存储,针对其结构化及检索过程中信息损失的问题,提出基于命名实体识别的铁路应急预案智能管理方法。首... 铁路应急预案是应对自然灾害、事故灾难、社会安全等突发事件,快速做出科学决策、组织救援的行动指南。由于应急预案多以非结构化文档存储,针对其结构化及检索过程中信息损失的问题,提出基于命名实体识别的铁路应急预案智能管理方法。首先,应用排版样式、编辑语义、文本语义等信息,实现流式文档结构的智能解析、附件识别及时序文档的信息综合;然后,以运维知识图谱中实体及其类别构建实体类别集,嵌入实体类别信息并与字符嵌入拼接生成增强特征,对文本进行实体的命名标识及段属性标识;最后,采用递归神经网络并引入注意力机制构建命名实体层次表达,融合结构和语义因素实现检索结果的智能排序。实验证明,该方法能准确解析文档结构并在低标注下识别命名实体,实现应急预案的智能检索与排序,可有效提高铁路应急预案管理的智能化水平。 展开更多
关键词 铁路 应急预案 命名实体识别 文档结构解析 知识图谱
下载PDF
基于BERT和图注意力网络的篇章级事件论元识别
9
作者 王凯 廖涛 《现代计算机》 2024年第6期14-19,64,共7页
事件论元识别是事件抽取的子任务之一,其目的在于识别文本中与事件相关的论元及论元对应的论元角色。研究表明,句子的依存句法关系有助于事件论元任务识别,然而,在构造篇章的依存句法关系时容易引入不相关的论元产生噪声问题,现有方法... 事件论元识别是事件抽取的子任务之一,其目的在于识别文本中与事件相关的论元及论元对应的论元角色。研究表明,句子的依存句法关系有助于事件论元任务识别,然而,在构造篇章的依存句法关系时容易引入不相关的论元产生噪声问题,现有方法对噪声问题处理不佳。针对该问题,提出了一个基于BERT和图注意力网络的篇章级事件论元识别模型。该模型从两个角度去解决噪声问题,一方面,通过获取充分的篇章语义特征作为辅助,去构建更有效的篇章依存句法特征;另一方面,采用图注意力网络对不同的论元节点分配不同的权重,从而去除掉无效的论元。在RAMS语料库上的实验结果表明,该方法有效解决了篇章依存句法关系中存在的噪声问题,取得了较好的篇章级事件论元识别结果。 展开更多
关键词 篇章级事件论元识别 依存句法关系 BERT 图注意力网络
下载PDF
基于篇章图模型的中文事件时序关系识别
10
作者 李婧 徐昇 李培峰 《中文信息学报》 CSCD 北大核心 2024年第1期107-114,共8页
事件时序关系识别是信息抽取中一项十分重要且极具挑战性的任务。此前大部分工作都集中在句子级别上,忽略了篇章级别(同句、邻句和跨句)的事件时序关系识别。针对此问题,该文提出了一种基于篇章图模型的篇章级事件时序关系识别方法,该... 事件时序关系识别是信息抽取中一项十分重要且极具挑战性的任务。此前大部分工作都集中在句子级别上,忽略了篇章级别(同句、邻句和跨句)的事件时序关系识别。针对此问题,该文提出了一种基于篇章图模型的篇章级事件时序关系识别方法,该方法通过分别构造句法层次和篇章级别的图卷积神经网络将篇章中融合了句法特征的所有事件进行信息交互,以达到丰富特征的目的,进而使得模型可更好地识别篇章级时序关系。该文提出的方法在ACE2005-extended中文事件时序关系语料库上的微平均F1值达到71.81%,比最好的基准系统提升了1.76个百分点。 展开更多
关键词 事件时序关系 篇章级别 图卷积神经网络
下载PDF
城镇燃气管网应急处置知识图谱构建与应用 被引量:1
11
作者 姚卫华 葛悦 +2 位作者 邓兵兵 叶雯静 徐亚博 《科学技术与工程》 北大核心 2024年第10期4343-4351,共9页
标准是一种重要的信息传导工具和知识载体,其为社会经济的持续发展提供了必要的技术支持。当前城市燃气管网领域已具有相对充分的标准资源,但非系统化的燃气标准规范难以满足事故应急响应快速性和精准性查询和匹配要求。聚焦城镇燃气管... 标准是一种重要的信息传导工具和知识载体,其为社会经济的持续发展提供了必要的技术支持。当前城市燃气管网领域已具有相对充分的标准资源,但非系统化的燃气标准规范难以满足事故应急响应快速性和精准性查询和匹配要求。聚焦城镇燃气管网应急标准文献,借助知识图谱构建技术,针对城镇燃气领域的标准文献进行逻辑辨析和整理,构建城镇燃气管网应急处置和救援的知识图谱,通过实例挖掘展现出知识图谱在燃气管网事故应急处置中的决策支持价值以及相关标准化系统自我完善中的纠错工具价值。 展开更多
关键词 燃气管网 标准文献 知识图谱 应急救援 突发事件
下载PDF
两阶段文档筛选和异步多粒度图多跳问答
12
作者 张雪松 李冠君 +3 位作者 聂士佳 张大伟 吕钊 陶建华 《计算机技术与发展》 2024年第1期121-127,共7页
多跳问答旨在通过对多篇文档内容进行推理,来预测问题答案以及针对答案的支撑事实。然而当前的多跳问答方法在文档筛选任务中旨在找到与问题相关的所有文档,未考虑到这些文档是否都对找到答案有所帮助。因此,该文提出一种两阶段的文档... 多跳问答旨在通过对多篇文档内容进行推理,来预测问题答案以及针对答案的支撑事实。然而当前的多跳问答方法在文档筛选任务中旨在找到与问题相关的所有文档,未考虑到这些文档是否都对找到答案有所帮助。因此,该文提出一种两阶段的文档筛选方法。第一阶段通过对文档进行评分且设置较小的阈值来获取尽可能多的与问题相关文档,保证文档的高召回率;第二阶段对问题答案的推理路径进行建模,在第一阶段的基础上再次提取文档,保证文档的高精确率。此外,针对由文档构成的多粒度图,提出一种新颖的异步更新机制来进行答案预测以及支撑事实预测。提出的异步更新机制将多粒度图分为异质图和同质图来进行异步更新以更好地进行多跳推理。该方法在性能上优于目前主流的多跳问答方法,验证了该方法的有效性。 展开更多
关键词 多跳问答 文档筛选 多粒度图 异步更新 答案预测
下载PDF
面向文本实体关系抽取研究综述
13
作者 任安琪 柳林 +1 位作者 王海龙 刘静 《计算机科学与探索》 CSCD 北大核心 2024年第11期2848-2871,共24页
信息抽取是知识图谱构建的基础,关系抽取作为信息抽取的关键流程和核心步骤,旨在从文本数据中定位实体并识别实体间的语义联系。因此提高关系抽取的效率可以有效提升信息抽取的质量,进而影响到知识图谱的构建以及后续的下游任务。关系... 信息抽取是知识图谱构建的基础,关系抽取作为信息抽取的关键流程和核心步骤,旨在从文本数据中定位实体并识别实体间的语义联系。因此提高关系抽取的效率可以有效提升信息抽取的质量,进而影响到知识图谱的构建以及后续的下游任务。关系抽取按照抽取文本长度可以分为句子级关系抽取和文档级关系抽取,两种级别的抽取方法在不同应用场景下各有优缺点。句子级关系抽取适用于较小规模数据集的应用场景,而文档级关系抽取适用于新闻事件分析、长篇报告或文章的关系挖掘等场景。不同于已有的关系抽取,介绍了关系抽取的基本概念以及领域内近年来的发展历程,罗列了两种级别关系抽取所采用的数据集,对数据集的特点进行概述;分别对句子级关系抽取和文档级关系抽取进行了阐述,介绍了不同级别关系抽取的优缺点,并分析了各类方法中代表模型的性能以及局限性;总结了当前研究领域中存在的问题并对关系抽取发展前景进行了展望。 展开更多
关键词 信息抽取 实体关系抽取 句子级关系抽取 文档级关系抽取 知识图谱构建
下载PDF
基于对比图学习的跨文档虚假信息检测
14
作者 廖劲智 赵和伟 +3 位作者 连小童 纪文亮 石海明 赵翔 《计算机科学》 CSCD 北大核心 2024年第3期14-19,共6页
当前,网络上充斥着大量虚假信息,严重阻碍了社会各行业的正常运转,如何精准检测虚假信息成为了亟待解决的问题。现有研究主要从账户特征、文本内容和多模态3个角度开展工作,但大多忽视了虚假信息赖以传播的关键特征(即内容新奇性),仅是... 当前,网络上充斥着大量虚假信息,严重阻碍了社会各行业的正常运转,如何精准检测虚假信息成为了亟待解决的问题。现有研究主要从账户特征、文本内容和多模态3个角度开展工作,但大多忽视了虚假信息赖以传播的关键特征(即内容新奇性),仅是孤立地分析判别目标信息的真实性,未能把握舆论环境的特征。因此,提出了一种基于对比图学习的跨文档虚假信息检测方法(Contrastive Graph Learning,CAL),聚焦于内容新奇性,主要包含两个关键模块:对比学习模块和异构图模块。前者致力于扩大客观事实与虚假信息在向量空间中的表示差异性;后者包含实体、事件、事件集、句子和文档5种类型实体,尽可能向实体表示中注入舆论环境的语义特征。最后,在IED,TL17和Crisis这3个数据集上,在文档级和事件级这两个层次上开展了相关实验,CAL在所有测试中均取得了最优的结果,验证了所提方法的有效性。 展开更多
关键词 跨文档虚假信息检测 对比学习 异构图 事件级检测
下载PDF
基于异质图神经网络预训练的多标签文档分类研究
15
作者 吴家伟 方全 +1 位作者 胡骏 钱胜胜 《计算机科学》 CSCD 北大核心 2024年第1期143-149,共7页
多标签文档分类是一种将文档实例与相关标签相关联的技术,近年来受到越来越多研究者的关注。现有的多标签文档分类方法尝试探索文本之外的信息的融合,如文档元数据或标签结构。然而,这些方法要么简单地利用元数据的语义信息,要么没有考... 多标签文档分类是一种将文档实例与相关标签相关联的技术,近年来受到越来越多研究者的关注。现有的多标签文档分类方法尝试探索文本之外的信息的融合,如文档元数据或标签结构。然而,这些方法要么简单地利用元数据的语义信息,要么没有考虑标签的长尾分布,因此忽略了文档及其元数据之间的高阶关系和标签的分布规律等信息,从而影响到多标签文档分类的准确性。因此,文中提出一种新的基于异质图神经网络预训练的多标签文档分类方法。该方法通过构造文档与其元数据的异质图,采用两种对比学习预训练方法捕获文档与其元数据之间的关系,并通过平衡标签长尾分布的损失函数来提高多标签文档分类的准确性。在基准数据集上的实验结果表明,所提方法的准确率比Transformer提高了8%,比BertXML提高了4.75%,比MATCH提高了1.3%。 展开更多
关键词 多标签文档分类 元数据 异质图神经网络 预训练 长尾分布
下载PDF
公文知识图谱构建与应用
16
作者 李炜卓 周文博 +5 位作者 卢冰洁 高辉 边宇阳 张浩魏 那崇宁 许文杰 《小型微型计算机系统》 CSCD 北大核心 2024年第6期1281-1291,共11页
海量电子公文的高效管理一直是社会服务研究的热门话题.现有的研究工作主要聚焦在公文归档与要素抽取上,但并未提供开源的公文数据集,同时对于公文之间的关联性与时效性缺乏深入分析.文中的工作致力于从多个领域收集公文,构建一个高质... 海量电子公文的高效管理一直是社会服务研究的热门话题.现有的研究工作主要聚焦在公文归档与要素抽取上,但并未提供开源的公文数据集,同时对于公文之间的关联性与时效性缺乏深入分析.文中的工作致力于从多个领域收集公文,构建一个高质量、开源的公文知识图谱,以此来填补上述研究工作存在的鸿沟.文中详细地展示了公文知识图谱的构建框架,包括轻量级本体的设计、面向小样本场景的要素抽取算法以及面向实体对齐的知识融合算法,以此让不同来源的公文能够共享更多的链接.此外,文中进一步讨论了公文知识图谱的潜在应用,并面向公文关联发现场景提出了一种基于要素抽取增强的网络表示学习公文推荐算法.实验表明,所提方法在评估指标Rankmin与MAP上整体效果均好于已有方法. 展开更多
关键词 知识图谱 要素抽取 公文归档 公文推荐 网络表示学习
下载PDF
针对长距离实体的双图路径推理模型
17
作者 祝涛杰 卢记仓 +2 位作者 周刚 皮乾坤 丁肖摇 《信息工程大学学报》 2024年第3期272-277,共6页
文档中句间实体关系往往无法直接获取,现有方法通常利用语法知识及共指、邻接、共现等方式将文档构建为文档图,捕获实体之间的交互。然而图节点和图边数量及类型较多,极大地限制了模型的推理能力。因此,提出一种结构简单且推理效果更好... 文档中句间实体关系往往无法直接获取,现有方法通常利用语法知识及共指、邻接、共现等方式将文档构建为文档图,捕获实体之间的交互。然而图节点和图边数量及类型较多,极大地限制了模型的推理能力。因此,提出一种结构简单且推理效果更好的双图模型。首先,采用启发式规则提取提及交互和证据句,并基于此构建基于证据句的提及图和实体图;其次,利用注意力机制捕获实体图中实体节点之间的推理路径;最后,根据推理路径,采用合适的评分函数预测实体关系事实。在文档级通用领域数据集DocRED中的实验表明,所提模型取得了较好的效果。 展开更多
关键词 文档级关系抽取 图神经网络 注意力机制
下载PDF
基于自适应结构学习的深度文本聚类
18
作者 潘伟 黄瑞章 +1 位作者 任丽娜 薛菁菁 《计算机工程》 CAS CSCD 北大核心 2024年第11期89-97,共9页
近年来,将结构信息应用于深度文本聚类中以提升聚类效果取得了较优的成果。然而,结构信息的构造方法大多只进行简单的距离测算且近邻数量固定,导致构建的图难以获得较精确的文本结构信息。另外,众多方法对近邻文本只进行一阶挖掘,使图... 近年来,将结构信息应用于深度文本聚类中以提升聚类效果取得了较优的成果。然而,结构信息的构造方法大多只进行简单的距离测算且近邻数量固定,导致构建的图难以获得较精确的文本结构信息。另外,众多方法对近邻文本只进行一阶挖掘,使图结构信息未得到完全挖掘,限制了结合结构信息的深度文本聚类性能。为此,提出一种基于自适应结构学习的深度文本聚类模型DCMBS。首先,设计一种阈值构图方法,动态调整近邻文本数量,解决因近邻文本固定存在结构信息不精确的问题;其次,引入一种拓扑探索近邻的方法,对近邻文本进行多阶挖掘,解决以往方法只进行一阶挖掘存在结构信息不完整的问题。此外,设计了1个阈值衰减策略,避免拓扑过程中因拓扑阶数增加导致学习泛化。在4个真实数据集的实验结果表明,DCMBS与现有较好的聚类模型相比,准确度、归一化互信息(NMI)和调整兰德指数(ARI)平均提高了6.83、2.93、6.23个百分点。 展开更多
关键词 阈值 深度文本聚类 文本结构信息 图神经网络 自适应结构学习
下载PDF
基于图神经网络与深度学习的PDF文档检测模型
19
作者 雷靖玮 伊鹏 陈祥 《计算机工程与设计》 北大核心 2024年第2期356-366,共11页
针对传统PDF文档检测误报率过高的问题,提出一种基于图神经网络与深度学习的检测模型DGNN。通过收集文档运行时各线程产生的系统调用数据生成相应的系统调用图,运用所提基于H指数的图采样策略缩减数据规模;采样后的子图作为模型DGNN的输... 针对传统PDF文档检测误报率过高的问题,提出一种基于图神经网络与深度学习的检测模型DGNN。通过收集文档运行时各线程产生的系统调用数据生成相应的系统调用图,运用所提基于H指数的图采样策略缩减数据规模;采样后的子图作为模型DGNN的输入,借助图卷积网络提取关联关系的同时,利用深度学习提取系统调用对的属性特征并完成特征融合,通过系统调用图的性质判别完成检测。实验结果表明,与其它方法相比,该模型特征提取与训练时间短,有效提高了PDF文档的检测效果。 展开更多
关键词 PDF文档检测 图神经网络 深度学习 图采样 特征分析 性能评价 系统调用
下载PDF
基于异构图分层学习的细粒度多文档摘要抽取
20
作者 翁裕源 许柏炎 蔡瑞初 《计算机工程》 CAS CSCD 北大核心 2024年第3期336-344,共9页
抽取的目标是在多个文档中提取共有关键信息,其对简洁性的要求高于单文档摘要抽取。现有的多文档摘要抽取方法通常在句子级别进行建模,容易引入较多的冗余信息。为了解决上述问题,提出一种基于异构图分层学习的多文档摘要抽取框架,通过... 抽取的目标是在多个文档中提取共有关键信息,其对简洁性的要求高于单文档摘要抽取。现有的多文档摘要抽取方法通常在句子级别进行建模,容易引入较多的冗余信息。为了解决上述问题,提出一种基于异构图分层学习的多文档摘要抽取框架,通过层次化构建单词层级图和子句层级图来有效建模语义关系和结构关系。针对单词层级图和子句层级图这2个异构图的学习问题,设计具有不同层次更新机制的两层学习层来降低学习多种结构关系的难度。在单词层级图学习层,提出交替更新机制更新不同的粒度节点,以单词节点为载体通过图注意网络进行语义信息传递;在子句层级图学习层,提出两阶段分步学习更新机制聚合多种结构关系,第一阶段聚合同构关系,第二阶段基于注意力聚合异构关系。实验结果表明,与抽取式基准模型相比,该框架在Multinews数据集上取得了显著的性能提升,ROUGE-1、ROUGE-2和ROUGE-L分别提高0.88、0.23和2.27,消融实验结果也验证了两层学习层及其层次更新机制的有效性。 展开更多
关键词 抽取式多文档摘要 细粒度建模 异构图 分层学习 语义关系 结构关系
下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部