期刊文献+
共找到18,606篇文章
< 1 2 250 >
每页显示 20 50 100
基于双粒度图的文档级关系抽取
1
作者 廖涛 张国畅 张顺香 《计算机工程》 CAS CSCD 北大核心 2024年第10期164-173,共10页
文档级关系抽取是指在非结构性文本中抽取实体对之间的关系。针对当前文档级关系抽取方法未能充分利用文档语义信息且难以处理文档的噪声干扰问题,提出一种基于双粒度文档图的关系抽取模型,采用一种新型的构图思路以及降噪方法,分别在... 文档级关系抽取是指在非结构性文本中抽取实体对之间的关系。针对当前文档级关系抽取方法未能充分利用文档语义信息且难以处理文档的噪声干扰问题,提出一种基于双粒度文档图的关系抽取模型,采用一种新型的构图思路以及降噪方法,分别在句间和句内两个层面进行设计。首先,在句间层面使用修辞语篇关系实体提及关系构建修辞语篇关系图RST-graph,采用异步降噪方式生成粗粒度文档图(CGD-graph),缓解了因实体对的句间关系路径长于句内关系路径造成的结构性误剪枝问题。然后,在句内层面采用依存句法关系对文档中的句子进行解析,构造依存句法树(SDT),增强句内语义信息。最后,将SDT和CGD-graph中存在的公共锚点相连接,构造细粒度文档图(FGD-graph)。实验结果表明,与去噪图推理(DGI)模型相比,该模型的lgn F1值和F1值分别提升了0.40和0.51个百分点,并且在实体对的多标签关系上随着标签数量的增多抽取效果提升较为显著。 展开更多
关键词 文档 关系抽取 双粒度文档 异步降噪 修辞语篇关系 依存句法关系
下载PDF
基于改进自注意力机制和表示学习的分层文档分类方法
2
作者 廖兴滨 钱杨舸 +1 位作者 王乾垒 秦小林 《计算机科学》 CSCD 北大核心 2024年第2期238-244,共7页
文档分类的一项基本工作是研究如何高效地表示输入特征,句子和文档向量表示也可以辅助自然语言处理的下游任务,如文本情感分析和数据泄露预防等。特征表示也逐渐成为文档分类问题的性能瓶颈和模型可解释性的关键之一。针对现有分层模型... 文档分类的一项基本工作是研究如何高效地表示输入特征,句子和文档向量表示也可以辅助自然语言处理的下游任务,如文本情感分析和数据泄露预防等。特征表示也逐渐成为文档分类问题的性能瓶颈和模型可解释性的关键之一。针对现有分层模型面临的大量重复计算以及可解释性缺乏的问题,提出了一种分层文档分类模型,并研究了句子和文档表示方法对文档分类问题的性能影响。所提模型集成了使用改进自注意力机制融合输入特征向量的句子编码器和文档编码器,形成了一个层次结构,以实现对文档级数据的分层处理,在简化计算的同时增强了模型的可解释性。与仅使用预训练语言模型的特殊标记向量作为句子表示的模型相比,所提模型在5个公开文档分类数据集上实现了平均4%的性能提升,比使用词向量矩阵的注意力输出均值的模型提高了2%。 展开更多
关键词 句子表示 文档表示 注意力机制 文档分类 模型可解释性
下载PDF
基于互信息最大化的文档相关性模型
3
作者 陆敏锋 张启飞 +1 位作者 卢成浪 吴菁 《计算机工程与设计》 北大核心 2024年第9期2712-2718,共7页
针对传统的文档相关性识别方法在训练过程中文档信息提取不充分的问题,提出一种互信息最大化框架下的深度学习方法。涉及一个无监督学习过程,使用全局和局部互信息学习文档表示,最大化神经网络的输入表示和输出表示之间的互信息,提取更... 针对传统的文档相关性识别方法在训练过程中文档信息提取不充分的问题,提出一种互信息最大化框架下的深度学习方法。涉及一个无监督学习过程,使用全局和局部互信息学习文档表示,最大化神经网络的输入表示和输出表示之间的互信息,提取更为丰富的文档内容和结构信息,优化模型预测结果。经过在多项任务上的评估,实验结果表明了该方法的可行性和有效性,与一些传统的方法相比,其在准确度上有相当或更好的表现。 展开更多
关键词 互信息 文档表示 文档相关性 最大化 无监督学习 残差网络 全局特征
下载PDF
双周期交互视角下的核电文档连续性管理模式构建研究
4
作者 陈莹 黎安润泽 牛力 《山西档案》 北大核心 2024年第1期116-124,161,共10页
双周期交互是指在文档管理的全过程中,通过业务与文档的双向交流,实现文件生命周期与业务流程生命周期的交互协同。核电文档存量多增量大、来源类型多元、内容知识密集,对核电业务具有重要支撑作用。基于对核电文档管理需求的系统分析,... 双周期交互是指在文档管理的全过程中,通过业务与文档的双向交流,实现文件生命周期与业务流程生命周期的交互协同。核电文档存量多增量大、来源类型多元、内容知识密集,对核电业务具有重要支撑作用。基于对核电文档管理需求的系统分析,提出了双周期交互的核电文档连续性管理模式,旨在实现业务环节连续性与文档数字连续性的协调与统一。从实践机制来看,这一模式的实现依赖于核电文档的一体化管理、全流程管控、风险治理。 展开更多
关键词 双周期交互 核电文档 连续性管理 电子文档
下载PDF
基于注意力机制语义增强的文档级关系抽取
5
作者 柳先辉 吴文达 +1 位作者 赵卫东 侯文龙 《同济大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第5期822-828,共7页
文档级关系抽取旨在从文档中抽取出多个实体对之间的关系,具有较高的复杂性。针对文档级关系抽取中的多实体、关系相关性、关系分布不平衡等问题,提出了一种基于注意力机制(Attention)语义增强的文档级关系抽取方法,能够实现实体对之间... 文档级关系抽取旨在从文档中抽取出多个实体对之间的关系,具有较高的复杂性。针对文档级关系抽取中的多实体、关系相关性、关系分布不平衡等问题,提出了一种基于注意力机制(Attention)语义增强的文档级关系抽取方法,能够实现实体对之间关系的推理。具体来说,首先在数据编码模块改进编码策略,引入更多实体信息,通过编码网络捕获文档的语义特征,获得实体对矩阵;然后,设计了一个基于Attention门控机制的U-Net网络,对实体对矩阵进行局部信息捕获和全局信息汇总,实现语义增强;最后,使用自适应焦点损失函数缓解关系分布不平衡的问题。在4个公开的文档级关系抽取数据集(DocRED、CDR、GDA和DWIE)上评估了Att-DocuNet模型并取得了良好的实验结果。 展开更多
关键词 文档级关系抽取 注意力机制 语义增强 焦点损失
下载PDF
开放式版式文档标准在体检报告管理中的应用实践
6
作者 李志威 王恺 王巍 《中国数字医学》 2024年第6期68-72,共5页
目的:基于开放式版式文档(OFD)标准构建体检报告归档系统,实现体检报告数字化管理,为体检客户提供便捷的体检报告查询服务。方法:分析OFD版式标准的特性,设计体检报告归档系统,将体检报告数据转换成国家标准的OFD版式文档,对文档进行电... 目的:基于开放式版式文档(OFD)标准构建体检报告归档系统,实现体检报告数字化管理,为体检客户提供便捷的体检报告查询服务。方法:分析OFD版式标准的特性,设计体检报告归档系统,将体检报告数据转换成国家标准的OFD版式文档,对文档进行电子签章和数字信封加密,将加密后的OFD文档分布式存储。结果:建设体检报告归档系统,实现了文档分布式存储、文档阅读记录查看、文档分享和接口调用日志查询功能,患者可在线查看、下载、安全分享个人体检报告。结论:基于OFD标准的体检报告归档系统的应用,实现了国家标准OFD在体检报告管理中的应用实践,优化了体检客户领取体检报告的流程,提升了体检中心服务能力和体检客户满意度。 展开更多
关键词 开放式版式文档 体检报告 文档管理
下载PDF
基于多粒度阅读器和图注意力网络的文档级事件抽取
7
作者 薛颂东 李永豪 赵红燕 《计算机应用研究》 CSCD 北大核心 2024年第8期2329-2335,共7页
文档级事件抽取面临论元分散和多事件两大挑战,已有工作大多采用逐句抽取候选论元的方式,难以建模跨句的上下文信息。为此,提出了一种基于多粒度阅读器和图注意网络的文档级事件抽取模型,采用多粒度阅读器实现多层次语义编码,通过图注... 文档级事件抽取面临论元分散和多事件两大挑战,已有工作大多采用逐句抽取候选论元的方式,难以建模跨句的上下文信息。为此,提出了一种基于多粒度阅读器和图注意网络的文档级事件抽取模型,采用多粒度阅读器实现多层次语义编码,通过图注意力网络捕获实体对之间的局部和全局关系,构建基于实体对相似度的剪枝完全图作为伪触发器,全面捕捉文档中的事件和论元。在公共数据集ChFinAnn和DuEE-Fin上进行了实验,结果表明提出的方法改善了论元分散问题,提升了模型事件抽取性能。 展开更多
关键词 多粒度阅读器 图注意力网络 文档级事件抽取
下载PDF
网络共享文档的雨洪灾害“求救”事件时空分析
8
作者 梁明 晏实江 +1 位作者 杨根 黄晴晴 《地理空间信息》 2024年第6期66-70,共5页
城市雨洪灾害频发、急需快速掌握灾害过程中“求救”事件类型、位置,并开展制图。提出了基于“网络共享文档”的文本挖掘方法。为分析不同“求救”事件在时空上分布特征,提出了核密度估计、最近邻分析等方法。以河南雨洪灾害过程中传播... 城市雨洪灾害频发、急需快速掌握灾害过程中“求救”事件类型、位置,并开展制图。提出了基于“网络共享文档”的文本挖掘方法。为分析不同“求救”事件在时空上分布特征,提出了核密度估计、最近邻分析等方法。以河南雨洪灾害过程中传播较为广泛的网络共享文档为例,验证了方案的可行性。结果表明:城市雨洪灾害过程中不同类型的“求救”事件在的扩散规律有较大差异;大多数求救事件在时间和空间尺度上都呈现为聚集的模式;基于网络共享文档的灾害分析和应急制图,能够在时效性、时间粒度等方面弥补传统雨洪灾害监测手段的不足。 展开更多
关键词 网络共享文档 城市雨洪灾害 时空分析 核密度估计
下载PDF
大学生化工设计竞赛文档专项评分分析
9
作者 王枢 陆群 李羿 《广东化工》 CAS 2024年第12期232-233,231,共3页
对全国大学生化工设计竞赛西南赛区近三年决赛的设计文档专项评分进行了详细分析。对文档专项评分各分项,可行性报告、初步设计说明书、设备设计文档的基本情况、得分情况、扣分情况、扣分主要理由、申诉情况进行了分析。有助于参加化... 对全国大学生化工设计竞赛西南赛区近三年决赛的设计文档专项评分进行了详细分析。对文档专项评分各分项,可行性报告、初步设计说明书、设备设计文档的基本情况、得分情况、扣分情况、扣分主要理由、申诉情况进行了分析。有助于参加化工设计竞赛的同学培养创新思维和工程技能,针对文档撰写的常见错误进行修改,提高设计文档的质量。 展开更多
关键词 化工竞赛 设计文档 评分分析 扣分理由 申诉情况
下载PDF
知识关联视角下标准文档的多粒度知识组织方法研究
10
作者 范昊 王一帆 《信息资源管理学报》 2024年第4期133-145,共13页
传统的文档组织方式无法应对标准数字化发展形势,有必要充分发掘标准文档中的多粒度知识单元及其语义关联,探索能够高效运用标准知识的新型组织方法,为优化标准供给提供参考。从知识关联视角出发,提出一种面向标准文档的多粒度、富语义... 传统的文档组织方式无法应对标准数字化发展形势,有必要充分发掘标准文档中的多粒度知识单元及其语义关联,探索能够高效运用标准知识的新型组织方法,为优化标准供给提供参考。从知识关联视角出发,提出一种面向标准文档的多粒度、富语义的通用知识组织方法。首先,基于知识粒度理论,依据标准文档的知识内容和需求特征进行多粒度的知识划分与描述;其次,从知识层级、文档特征、文本逻辑、时空演化等方面认知和发现标准多粒度知识间的语义关联模式与类型;最后,采用本体构建方法实现标准文档的多粒度知识组织,并通过知识实例的添加来实现本体验证与价值阐述。多粒度知识关联的标准组织方法能够完整揭示标准文档中的多粒度知识单元,形成联通广泛的知识层次与关联,有助于标准知识在多种服务场景中被有效获取、共享与重用,既推进了适应数智时代的标准资源建设,又丰富了多粒度知识驱动的文档内容挖掘与利用。 展开更多
关键词 标准文档 知识组织 语义关联 多粒度知识 本体构建
下载PDF
审核评估背景下高校二级学院教学文档管理质量提升机制探索与实践——以某高校二级学院为例
11
作者 周清 杨柳 +1 位作者 陈文波 李大军 《科技风》 2024年第22期122-124,共3页
文章通过对某高校二级学院教学文档管理工作现状和工作特点进行调查、分析,总结目前教学文档资料管理工作中普遍存在的突出问题,就如何有效加强高校教学文档资料工作、提高管理能力和服务水平等提出合理化建议。研究结果对于规范高校教... 文章通过对某高校二级学院教学文档管理工作现状和工作特点进行调查、分析,总结目前教学文档资料管理工作中普遍存在的突出问题,就如何有效加强高校教学文档资料工作、提高管理能力和服务水平等提出合理化建议。研究结果对于规范高校教学管理、强化管理能力、稳定教学文档管理队伍、提高教育教学质量,具有一定的参考和借鉴价值。 展开更多
关键词 高校 审核评估 教学文档 管理质量 提升机制
下载PDF
Python实现Excel文档转换到Word文档的自动化方法
12
作者 刘易 《电脑编程技巧与维护》 2024年第5期45-47,共3页
通过研究开发了一种基于Python语言,实现Excel数据自动转换成Word文档并实现排版功能的方法,为科研工作者、数据分析师或报告撰写人员提供一个方便快捷的工具,帮助他们更高效地完成Excel数据转换成Word并实现排版的任务。
关键词 PYTHON语言 Python-docx库 EXCEL文档 WORD排版
下载PDF
基于腾讯文档的报修系统的探索与实践
13
作者 黄婳 《现代计算机》 2024年第14期107-111,共5页
高校的信息化建设包含了设备报修系统的建设。针对高校信息化过程中专业技术人员有限,资金不足,信息化难题等挑战,提出并实现了一个基于腾讯文档高效的报修系统设计。该系统使用腾讯文档提供的云服务平台收集表功能完成故障报修系统的... 高校的信息化建设包含了设备报修系统的建设。针对高校信息化过程中专业技术人员有限,资金不足,信息化难题等挑战,提出并实现了一个基于腾讯文档高效的报修系统设计。该系统使用腾讯文档提供的云服务平台收集表功能完成故障报修系统的前端设计,然后自动生成完整的数据库,创建了可访问的公开二维码,公布在设备仪器或实训室显眼处,供用户扫码调用系统的前端,完成实时报修的故障任务。与现阶段公开文献检索到的广泛使用基于Web开发技术和数据库技术构建的设备报修系统相比,其设计和实现原理简明扼要、易于实现,不需要操作人员具备高深专业知识及强大技术开发能力来进行前端设计和数据库构建,有效解决人员、资金、信息化问题。该系统可以扩展到企事业单位、小区物业等需要故障报修的任何一个场景。 展开更多
关键词 高校 报修系统 腾讯文档 信息化
下载PDF
炼油化工建设项目文档质量的管理实践
14
作者 孙丽丽 崔丹婷 《机电兵船档案》 2024年第2期3-5,共3页
炼油化工建设项目档案的完整性、准确性与系统性,三者相辅相成,完整性是基础,准确性是核心,系统性是表现。文章从华锦集团建设项目档案管理的具体实践出发,分析完整性、准确性与系统性的具体表现,提出三种操作性强的检查方法,将项目文... 炼油化工建设项目档案的完整性、准确性与系统性,三者相辅相成,完整性是基础,准确性是核心,系统性是表现。文章从华锦集团建设项目档案管理的具体实践出发,分析完整性、准确性与系统性的具体表现,提出三种操作性强的检查方法,将项目文档一体化管理融合到项目管理中,持续提升项目档案管理。 展开更多
关键词 炼油化工项目 文档质量 文档一体化
下载PDF
基于GPT的本地文档智能问答方法及应用研究
15
作者 吴晓蓉 程俊杰 《电脑知识与技术》 2024年第13期91-94,共4页
随着大模型的发展,公开通用的知识得到了广泛的训练和应用。但企业和个人的内部文档仍然没有实现智能化。用户查找内部文档内容时,仍需打开对应文档进行搜索,效率低下,为了提高企业和个人内部文档的智能化访问效率,减少查找时间提高工... 随着大模型的发展,公开通用的知识得到了广泛的训练和应用。但企业和个人的内部文档仍然没有实现智能化。用户查找内部文档内容时,仍需打开对应文档进行搜索,效率低下,为了提高企业和个人内部文档的智能化访问效率,减少查找时间提高工作效率。文章提出了一种基于大模型的本地文档智能问答方法,该方法通过将本地文档分割并调用大模型进行智能问答,以实现高效的文档检索。研究结果表明该方法能够在不耗费大量计算资源的情况下,获得与大模型相媲美的问答效果,为用户提供更快速、智能的内部文档访问体验。 展开更多
关键词 GPT 智能化问答 大模型 文档检索 文档分割
下载PDF
油田海陆电子文档共享系统的设计与实现
16
作者 刘芯伊 《科学与信息化》 2024年第7期16-18,共3页
本文提出一种在多个独立部署的FileNet系统间的文档共享功能的设计思想。基于内容引擎管理方法下结合异步定时任务通过API,在海洋石油企业内让海上作业平台以更高效更便捷的方式获取陆地系统库内的共享文档。
关键词 FileNet 石油企业 海上操作平台 陆地办公文档 企业文档共享 异步定时任务 海陆共享
下载PDF
融入文档图和事件图的新闻核心事件检测
17
作者 赵庆珏 余正涛 +2 位作者 王剑 黄于欣 朱恩昌 《中文信息学报》 CSCD 北大核心 2024年第5期99-106,共8页
新闻核心事件检测旨在从非结构化的新闻文本中检测出最能代表新闻核心内容的事件。新闻报道的多个事件之间存在着复杂的关联关系,且同一个事件的事件要素分布在不同的句子甚至不同的段落中,传统的方法对事件之间的关联关系以及事件的全... 新闻核心事件检测旨在从非结构化的新闻文本中检测出最能代表新闻核心内容的事件。新闻报道的多个事件之间存在着复杂的关联关系,且同一个事件的事件要素分布在不同的句子甚至不同的段落中,传统的方法对事件之间的关联关系以及事件的全局语义信息建模不充分。因此,该文提出了融入文档图和事件图的新闻核心事件检测方法。该方法首先通过构建文档图和事件图来建模新闻文本的全局语义特征和事件之间的关联特征。然后,通过图卷积神经网络捕获高阶邻域信息,获得文档表征和事件表征。最后,将得到的文档表征和事件表征使用交叉注意力进一步捕获事件全局语义信息。在纽约时报数据集上的实验结果验证了该文方法的有效性,NR@1较基线方法提升2.18%。 展开更多
关键词 核心事件检测 文档 事件图 交叉注意力机制
下载PDF
两阶段文档筛选和异步多粒度图多跳问答
18
作者 张雪松 李冠君 +3 位作者 聂士佳 张大伟 吕钊 陶建华 《计算机技术与发展》 2024年第1期121-127,共7页
多跳问答旨在通过对多篇文档内容进行推理,来预测问题答案以及针对答案的支撑事实。然而当前的多跳问答方法在文档筛选任务中旨在找到与问题相关的所有文档,未考虑到这些文档是否都对找到答案有所帮助。因此,该文提出一种两阶段的文档... 多跳问答旨在通过对多篇文档内容进行推理,来预测问题答案以及针对答案的支撑事实。然而当前的多跳问答方法在文档筛选任务中旨在找到与问题相关的所有文档,未考虑到这些文档是否都对找到答案有所帮助。因此,该文提出一种两阶段的文档筛选方法。第一阶段通过对文档进行评分且设置较小的阈值来获取尽可能多的与问题相关文档,保证文档的高召回率;第二阶段对问题答案的推理路径进行建模,在第一阶段的基础上再次提取文档,保证文档的高精确率。此外,针对由文档构成的多粒度图,提出一种新颖的异步更新机制来进行答案预测以及支撑事实预测。提出的异步更新机制将多粒度图分为异质图和同质图来进行异步更新以更好地进行多跳推理。该方法在性能上优于目前主流的多跳问答方法,验证了该方法的有效性。 展开更多
关键词 多跳问答 文档筛选 多粒度图 异步更新 答案预测
下载PDF
基于对比图学习的跨文档虚假信息检测
19
作者 廖劲智 赵和伟 +3 位作者 连小童 纪文亮 石海明 赵翔 《计算机科学》 CSCD 北大核心 2024年第3期14-19,共6页
当前,网络上充斥着大量虚假信息,严重阻碍了社会各行业的正常运转,如何精准检测虚假信息成为了亟待解决的问题。现有研究主要从账户特征、文本内容和多模态3个角度开展工作,但大多忽视了虚假信息赖以传播的关键特征(即内容新奇性),仅是... 当前,网络上充斥着大量虚假信息,严重阻碍了社会各行业的正常运转,如何精准检测虚假信息成为了亟待解决的问题。现有研究主要从账户特征、文本内容和多模态3个角度开展工作,但大多忽视了虚假信息赖以传播的关键特征(即内容新奇性),仅是孤立地分析判别目标信息的真实性,未能把握舆论环境的特征。因此,提出了一种基于对比图学习的跨文档虚假信息检测方法(Contrastive Graph Learning,CAL),聚焦于内容新奇性,主要包含两个关键模块:对比学习模块和异构图模块。前者致力于扩大客观事实与虚假信息在向量空间中的表示差异性;后者包含实体、事件、事件集、句子和文档5种类型实体,尽可能向实体表示中注入舆论环境的语义特征。最后,在IED,TL17和Crisis这3个数据集上,在文档级和事件级这两个层次上开展了相关实验,CAL在所有测试中均取得了最优的结果,验证了所提方法的有效性。 展开更多
关键词 文档虚假信息检测 对比学习 异构图 事件级检测
下载PDF
文档级事件抽取反向推理模型
20
作者 纪婉婷 马宇航 +2 位作者 鲁闻一 王俊陆 宋宝燕 《计算机工程与应用》 CSCD 北大核心 2024年第5期122-129,共8页
事件抽取旨在从非结构化文本中检测事件类型并抽取事件要素。现有方法在处理文档级文本时仍存在局限性。这是因为文档级文本可能由多个事件组成,并且构成某一事件的事件要素通常分散在不同句子中。为应对上述挑战,提出了一种文档级事件... 事件抽取旨在从非结构化文本中检测事件类型并抽取事件要素。现有方法在处理文档级文本时仍存在局限性。这是因为文档级文本可能由多个事件组成,并且构成某一事件的事件要素通常分散在不同句子中。为应对上述挑战,提出了一种文档级事件抽取反向推理模型(reverse inference model for document-level event extraction,RIDEE)。基于无触发词的设计,将文档级事件抽取转化为候选事件要素抽取和事件触发推理两个子任务,并行式抽取事件要素并检测事件类型。此外,设计了一种用于存储历史事件的事件依赖池,使得模型在处理多事件文本时可以充分利用事件之间的依赖关系。公开数据集上的实验结果表明,与现有事件抽取模型相比,RIDEE在进行文档级事件抽取时具有更优的性能。 展开更多
关键词 文档级事件抽取 反向推理 无触发词 事件依赖池
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部