期刊文献+
共找到18,626篇文章
< 1 2 250 >
每页显示 20 50 100
基于双粒度图的文档级关系抽取
1
作者 廖涛 张国畅 张顺香 《计算机工程》 CAS CSCD 北大核心 2024年第10期164-173,共10页
文档级关系抽取是指在非结构性文本中抽取实体对之间的关系。针对当前文档级关系抽取方法未能充分利用文档语义信息且难以处理文档的噪声干扰问题,提出一种基于双粒度文档图的关系抽取模型,采用一种新型的构图思路以及降噪方法,分别在... 文档级关系抽取是指在非结构性文本中抽取实体对之间的关系。针对当前文档级关系抽取方法未能充分利用文档语义信息且难以处理文档的噪声干扰问题,提出一种基于双粒度文档图的关系抽取模型,采用一种新型的构图思路以及降噪方法,分别在句间和句内两个层面进行设计。首先,在句间层面使用修辞语篇关系实体提及关系构建修辞语篇关系图RST-graph,采用异步降噪方式生成粗粒度文档图(CGD-graph),缓解了因实体对的句间关系路径长于句内关系路径造成的结构性误剪枝问题。然后,在句内层面采用依存句法关系对文档中的句子进行解析,构造依存句法树(SDT),增强句内语义信息。最后,将SDT和CGD-graph中存在的公共锚点相连接,构造细粒度文档图(FGD-graph)。实验结果表明,与去噪图推理(DGI)模型相比,该模型的lgn F1值和F1值分别提升了0.40和0.51个百分点,并且在实体对的多标签关系上随着标签数量的增多抽取效果提升较为显著。 展开更多
关键词 文档 关系抽取 双粒度文档 异步降噪 修辞语篇关系 依存句法关系
下载PDF
一个可视化语义文档数据库系统
2
作者 罗雪春 张雯 《情报科学》 CSSCI 北大核心 2002年第7期749-752,763,共5页
随着 Web网应用技术的迅猛发展 ,诸如数字化图书馆的出现 ,用户能从网上搜寻、下载令其感兴趣的文档。于是 ,如何管理和浏览在网上下载的文档便成了颇具挑战性的研究课题之一。本文将阐明可视化语义文档数据库系统的概念 。
关键词 文档数据库 WEB 语义文档 文档聚类 可视化文档搜索 可视性语义 文档浏览器
下载PDF
基于统一文档模型的文档协同编辑系统设计
3
作者 施运梅 刘旭红 唐江 《北京信息科技大学学报(自然科学版)》 2015年第4期15-20,26,共7页
文档协同编辑工具允许身处异地的多个用户通过网络协同编辑共享文档。目前仅有少量的商用软件支持对流式文档的协同编辑,这些工具在存储文档时要么是改变了文档的结构,要么是实现方法不公开,支持的文档类型有限。针对这一现状,构建了一... 文档协同编辑工具允许身处异地的多个用户通过网络协同编辑共享文档。目前仅有少量的商用软件支持对流式文档的协同编辑,这些工具在存储文档时要么是改变了文档的结构,要么是实现方法不公开,支持的文档类型有限。针对这一现状,构建了一个统一的文档模型,该模型抽取了OOXML、UOF和ODF中的公共语义信息,采用树状结构,通过API实现了模型和各流式文档逻辑结构之间的映射。基于模型,设计并实现了一个文档协同编辑系统。结果表明统一文档模型能较好地支持对流式文档的各种操作、修订管理和协同编辑功能。 展开更多
关键词 统一文档模型 文档协同编辑 流式文档 文档格式 文档格式API
下载PDF
一个基于关联规则的多层文档聚类算法 被引量:4
4
作者 宋江春 沈钧毅 宋擒豹 《计算机应用》 CSCD 北大核心 2005年第7期1570-1572,共3页
提出了一种新的基于关联规则的多层文档聚类算法,该算法利用新的文档特征抽取方法构造了文档的主题和关键字特征向量。首先在主题特征向量空间中利用频集快速算法对文档进行初始聚类,然后在基于主题关键字的新的特征向量空间中利用类间... 提出了一种新的基于关联规则的多层文档聚类算法,该算法利用新的文档特征抽取方法构造了文档的主题和关键字特征向量。首先在主题特征向量空间中利用频集快速算法对文档进行初始聚类,然后在基于主题关键字的新的特征向量空间中利用类间距和连接度对初始文档类进行求精,从而得到最终聚类。由于使用了两层聚类方法,使算法的效率和精度都大大提高;使用新的文档特征抽取方法还解决了由于文档关键字过多而导致文档特征向量的维数过高的问题。 展开更多
关键词 文档挖掘 文档聚类 关联规则 文档主题特征向量 文档关键字特征向量
下载PDF
格式信息在文档理解中的作用 被引量:6
5
作者 李宁 梁琦 施运梅 《北京信息科技大学学报(自然科学版)》 2012年第6期1-7,共7页
结合文档内容理解、文档的分类、文档格式的检查与纠错、文档的互操作以及文档的智能处理等多种关键应用领域,讨论了文档格式信息在文档理解中的重要性以及在这一领域的最新研究进展,简要说明了与文档理解关系密切的流式文档格式和版式... 结合文档内容理解、文档的分类、文档格式的检查与纠错、文档的互操作以及文档的智能处理等多种关键应用领域,讨论了文档格式信息在文档理解中的重要性以及在这一领域的最新研究进展,简要说明了与文档理解关系密切的流式文档格式和版式文档格式以及获得格式信息的方法。 展开更多
关键词 文档理解 文档格式 文档语义 文档互操作
下载PDF
跨文档类型的语义元数据支持方法
6
作者 王詠萱 李宁 田英爱 《计算机工程与设计》 北大核心 2024年第11期3507-3513,共7页
针对当前可编辑的流式文档在语义元数据支持方面的不足,设计一种在流式文档中记录语义元数据的方法,允许语义元数据随文档内容的编辑而修改,并与文档内容保持同步。为从流式文档中导出独立的元数据内容,提出一种元数据到文本位置的定位... 针对当前可编辑的流式文档在语义元数据支持方面的不足,设计一种在流式文档中记录语义元数据的方法,允许语义元数据随文档内容的编辑而修改,并与文档内容保持同步。为从流式文档中导出独立的元数据内容,提出一种元数据到文本位置的定位方法,避免数据冗余。为实现元数据的共享,提出一种流式文档到版式文档的元数据支持方法,充分发挥元数据的作用。通过实际系统的构建验证了所述方法的可行性。研究成果对于文档的自动理解和智能化处理具有应用价值。 展开更多
关键词 语义元数据 元数据转换 流式文档 固定版式文档 元数据定位 元数据嵌入 元数据提取
下载PDF
基于改进自注意力机制和表示学习的分层文档分类方法
7
作者 廖兴滨 钱杨舸 +1 位作者 王乾垒 秦小林 《计算机科学》 CSCD 北大核心 2024年第2期238-244,共7页
文档分类的一项基本工作是研究如何高效地表示输入特征,句子和文档向量表示也可以辅助自然语言处理的下游任务,如文本情感分析和数据泄露预防等。特征表示也逐渐成为文档分类问题的性能瓶颈和模型可解释性的关键之一。针对现有分层模型... 文档分类的一项基本工作是研究如何高效地表示输入特征,句子和文档向量表示也可以辅助自然语言处理的下游任务,如文本情感分析和数据泄露预防等。特征表示也逐渐成为文档分类问题的性能瓶颈和模型可解释性的关键之一。针对现有分层模型面临的大量重复计算以及可解释性缺乏的问题,提出了一种分层文档分类模型,并研究了句子和文档表示方法对文档分类问题的性能影响。所提模型集成了使用改进自注意力机制融合输入特征向量的句子编码器和文档编码器,形成了一个层次结构,以实现对文档级数据的分层处理,在简化计算的同时增强了模型的可解释性。与仅使用预训练语言模型的特殊标记向量作为句子表示的模型相比,所提模型在5个公开文档分类数据集上实现了平均4%的性能提升,比使用词向量矩阵的注意力输出均值的模型提高了2%。 展开更多
关键词 句子表示 文档表示 注意力机制 文档分类 模型可解释性
下载PDF
基于互信息最大化的文档相关性模型
8
作者 陆敏锋 张启飞 +1 位作者 卢成浪 吴菁 《计算机工程与设计》 北大核心 2024年第9期2712-2718,共7页
针对传统的文档相关性识别方法在训练过程中文档信息提取不充分的问题,提出一种互信息最大化框架下的深度学习方法。涉及一个无监督学习过程,使用全局和局部互信息学习文档表示,最大化神经网络的输入表示和输出表示之间的互信息,提取更... 针对传统的文档相关性识别方法在训练过程中文档信息提取不充分的问题,提出一种互信息最大化框架下的深度学习方法。涉及一个无监督学习过程,使用全局和局部互信息学习文档表示,最大化神经网络的输入表示和输出表示之间的互信息,提取更为丰富的文档内容和结构信息,优化模型预测结果。经过在多项任务上的评估,实验结果表明了该方法的可行性和有效性,与一些传统的方法相比,其在准确度上有相当或更好的表现。 展开更多
关键词 互信息 文档表示 文档相关性 最大化 无监督学习 残差网络 全局特征
下载PDF
双周期交互视角下的核电文档连续性管理模式构建研究
9
作者 陈莹 黎安润泽 牛力 《山西档案》 北大核心 2024年第1期116-124,161,共10页
双周期交互是指在文档管理的全过程中,通过业务与文档的双向交流,实现文件生命周期与业务流程生命周期的交互协同。核电文档存量多增量大、来源类型多元、内容知识密集,对核电业务具有重要支撑作用。基于对核电文档管理需求的系统分析,... 双周期交互是指在文档管理的全过程中,通过业务与文档的双向交流,实现文件生命周期与业务流程生命周期的交互协同。核电文档存量多增量大、来源类型多元、内容知识密集,对核电业务具有重要支撑作用。基于对核电文档管理需求的系统分析,提出了双周期交互的核电文档连续性管理模式,旨在实现业务环节连续性与文档数字连续性的协调与统一。从实践机制来看,这一模式的实现依赖于核电文档的一体化管理、全流程管控、风险治理。 展开更多
关键词 双周期交互 核电文档 连续性管理 电子文档
下载PDF
基于注意力机制语义增强的文档级关系抽取
10
作者 柳先辉 吴文达 +1 位作者 赵卫东 侯文龙 《同济大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第5期822-828,共7页
文档级关系抽取旨在从文档中抽取出多个实体对之间的关系,具有较高的复杂性。针对文档级关系抽取中的多实体、关系相关性、关系分布不平衡等问题,提出了一种基于注意力机制(Attention)语义增强的文档级关系抽取方法,能够实现实体对之间... 文档级关系抽取旨在从文档中抽取出多个实体对之间的关系,具有较高的复杂性。针对文档级关系抽取中的多实体、关系相关性、关系分布不平衡等问题,提出了一种基于注意力机制(Attention)语义增强的文档级关系抽取方法,能够实现实体对之间关系的推理。具体来说,首先在数据编码模块改进编码策略,引入更多实体信息,通过编码网络捕获文档的语义特征,获得实体对矩阵;然后,设计了一个基于Attention门控机制的U-Net网络,对实体对矩阵进行局部信息捕获和全局信息汇总,实现语义增强;最后,使用自适应焦点损失函数缓解关系分布不平衡的问题。在4个公开的文档级关系抽取数据集(DocRED、CDR、GDA和DWIE)上评估了Att-DocuNet模型并取得了良好的实验结果。 展开更多
关键词 文档级关系抽取 注意力机制 语义增强 焦点损失
下载PDF
开放式版式文档标准在体检报告管理中的应用实践
11
作者 李志威 王恺 王巍 《中国数字医学》 2024年第6期68-72,共5页
目的:基于开放式版式文档(OFD)标准构建体检报告归档系统,实现体检报告数字化管理,为体检客户提供便捷的体检报告查询服务。方法:分析OFD版式标准的特性,设计体检报告归档系统,将体检报告数据转换成国家标准的OFD版式文档,对文档进行电... 目的:基于开放式版式文档(OFD)标准构建体检报告归档系统,实现体检报告数字化管理,为体检客户提供便捷的体检报告查询服务。方法:分析OFD版式标准的特性,设计体检报告归档系统,将体检报告数据转换成国家标准的OFD版式文档,对文档进行电子签章和数字信封加密,将加密后的OFD文档分布式存储。结果:建设体检报告归档系统,实现了文档分布式存储、文档阅读记录查看、文档分享和接口调用日志查询功能,患者可在线查看、下载、安全分享个人体检报告。结论:基于OFD标准的体检报告归档系统的应用,实现了国家标准OFD在体检报告管理中的应用实践,优化了体检客户领取体检报告的流程,提升了体检中心服务能力和体检客户满意度。 展开更多
关键词 开放式版式文档 体检报告 文档管理
下载PDF
基于多粒度阅读器和图注意力网络的文档级事件抽取
12
作者 薛颂东 李永豪 赵红燕 《计算机应用研究》 CSCD 北大核心 2024年第8期2329-2335,共7页
文档级事件抽取面临论元分散和多事件两大挑战,已有工作大多采用逐句抽取候选论元的方式,难以建模跨句的上下文信息。为此,提出了一种基于多粒度阅读器和图注意网络的文档级事件抽取模型,采用多粒度阅读器实现多层次语义编码,通过图注... 文档级事件抽取面临论元分散和多事件两大挑战,已有工作大多采用逐句抽取候选论元的方式,难以建模跨句的上下文信息。为此,提出了一种基于多粒度阅读器和图注意网络的文档级事件抽取模型,采用多粒度阅读器实现多层次语义编码,通过图注意力网络捕获实体对之间的局部和全局关系,构建基于实体对相似度的剪枝完全图作为伪触发器,全面捕捉文档中的事件和论元。在公共数据集ChFinAnn和DuEE-Fin上进行了实验,结果表明提出的方法改善了论元分散问题,提升了模型事件抽取性能。 展开更多
关键词 多粒度阅读器 图注意力网络 文档级事件抽取
下载PDF
网络共享文档的雨洪灾害“求救”事件时空分析
13
作者 梁明 晏实江 +1 位作者 杨根 黄晴晴 《地理空间信息》 2024年第6期66-70,共5页
城市雨洪灾害频发、急需快速掌握灾害过程中“求救”事件类型、位置,并开展制图。提出了基于“网络共享文档”的文本挖掘方法。为分析不同“求救”事件在时空上分布特征,提出了核密度估计、最近邻分析等方法。以河南雨洪灾害过程中传播... 城市雨洪灾害频发、急需快速掌握灾害过程中“求救”事件类型、位置,并开展制图。提出了基于“网络共享文档”的文本挖掘方法。为分析不同“求救”事件在时空上分布特征,提出了核密度估计、最近邻分析等方法。以河南雨洪灾害过程中传播较为广泛的网络共享文档为例,验证了方案的可行性。结果表明:城市雨洪灾害过程中不同类型的“求救”事件在的扩散规律有较大差异;大多数求救事件在时间和空间尺度上都呈现为聚集的模式;基于网络共享文档的灾害分析和应急制图,能够在时效性、时间粒度等方面弥补传统雨洪灾害监测手段的不足。 展开更多
关键词 网络共享文档 城市雨洪灾害 时空分析 核密度估计
下载PDF
大学生化工设计竞赛文档专项评分分析
14
作者 王枢 陆群 李羿 《广东化工》 CAS 2024年第12期232-233,231,共3页
对全国大学生化工设计竞赛西南赛区近三年决赛的设计文档专项评分进行了详细分析。对文档专项评分各分项,可行性报告、初步设计说明书、设备设计文档的基本情况、得分情况、扣分情况、扣分主要理由、申诉情况进行了分析。有助于参加化... 对全国大学生化工设计竞赛西南赛区近三年决赛的设计文档专项评分进行了详细分析。对文档专项评分各分项,可行性报告、初步设计说明书、设备设计文档的基本情况、得分情况、扣分情况、扣分主要理由、申诉情况进行了分析。有助于参加化工设计竞赛的同学培养创新思维和工程技能,针对文档撰写的常见错误进行修改,提高设计文档的质量。 展开更多
关键词 化工竞赛 设计文档 评分分析 扣分理由 申诉情况
下载PDF
知识关联视角下标准文档的多粒度知识组织方法研究
15
作者 范昊 王一帆 《信息资源管理学报》 CSSCI 2024年第4期133-145,共13页
传统的文档组织方式无法应对标准数字化发展形势,有必要充分发掘标准文档中的多粒度知识单元及其语义关联,探索能够高效运用标准知识的新型组织方法,为优化标准供给提供参考。从知识关联视角出发,提出一种面向标准文档的多粒度、富语义... 传统的文档组织方式无法应对标准数字化发展形势,有必要充分发掘标准文档中的多粒度知识单元及其语义关联,探索能够高效运用标准知识的新型组织方法,为优化标准供给提供参考。从知识关联视角出发,提出一种面向标准文档的多粒度、富语义的通用知识组织方法。首先,基于知识粒度理论,依据标准文档的知识内容和需求特征进行多粒度的知识划分与描述;其次,从知识层级、文档特征、文本逻辑、时空演化等方面认知和发现标准多粒度知识间的语义关联模式与类型;最后,采用本体构建方法实现标准文档的多粒度知识组织,并通过知识实例的添加来实现本体验证与价值阐述。多粒度知识关联的标准组织方法能够完整揭示标准文档中的多粒度知识单元,形成联通广泛的知识层次与关联,有助于标准知识在多种服务场景中被有效获取、共享与重用,既推进了适应数智时代的标准资源建设,又丰富了多粒度知识驱动的文档内容挖掘与利用。 展开更多
关键词 标准文档 知识组织 语义关联 多粒度知识 本体构建
下载PDF
审核评估背景下高校二级学院教学文档管理质量提升机制探索与实践——以某高校二级学院为例
16
作者 周清 杨柳 +1 位作者 陈文波 李大军 《科技风》 2024年第22期122-124,共3页
文章通过对某高校二级学院教学文档管理工作现状和工作特点进行调查、分析,总结目前教学文档资料管理工作中普遍存在的突出问题,就如何有效加强高校教学文档资料工作、提高管理能力和服务水平等提出合理化建议。研究结果对于规范高校教... 文章通过对某高校二级学院教学文档管理工作现状和工作特点进行调查、分析,总结目前教学文档资料管理工作中普遍存在的突出问题,就如何有效加强高校教学文档资料工作、提高管理能力和服务水平等提出合理化建议。研究结果对于规范高校教学管理、强化管理能力、稳定教学文档管理队伍、提高教育教学质量,具有一定的参考和借鉴价值。 展开更多
关键词 高校 审核评估 教学文档 管理质量 提升机制
下载PDF
基于Cocoon框架的XML文档转换
17
作者 张宏丽 《内蒙古师范大学学报(自然科学汉文版)》 CAS 2004年第4期396-399,共4页
通过Cocoon架构,将XML文档分别转换成能够被网络浏览器识别的HTML文档,以及能被Acrobatreaders识别的PDF文档和能被手机识别的WML格式文档,给出了文档格式转换的代码.
关键词 XML文档 HTML文档 网络浏览器 文档格式 PDF文档 转换 代码 框架
下载PDF
Python实现Excel文档转换到Word文档的自动化方法
18
作者 刘易 《电脑编程技巧与维护》 2024年第5期45-47,共3页
通过研究开发了一种基于Python语言,实现Excel数据自动转换成Word文档并实现排版功能的方法,为科研工作者、数据分析师或报告撰写人员提供一个方便快捷的工具,帮助他们更高效地完成Excel数据转换成Word并实现排版的任务。
关键词 PYTHON语言 Python-docx库 EXCEL文档 WORD排版
下载PDF
基于腾讯文档的报修系统的探索与实践
19
作者 黄婳 《现代计算机》 2024年第14期107-111,共5页
高校的信息化建设包含了设备报修系统的建设。针对高校信息化过程中专业技术人员有限,资金不足,信息化难题等挑战,提出并实现了一个基于腾讯文档高效的报修系统设计。该系统使用腾讯文档提供的云服务平台收集表功能完成故障报修系统的... 高校的信息化建设包含了设备报修系统的建设。针对高校信息化过程中专业技术人员有限,资金不足,信息化难题等挑战,提出并实现了一个基于腾讯文档高效的报修系统设计。该系统使用腾讯文档提供的云服务平台收集表功能完成故障报修系统的前端设计,然后自动生成完整的数据库,创建了可访问的公开二维码,公布在设备仪器或实训室显眼处,供用户扫码调用系统的前端,完成实时报修的故障任务。与现阶段公开文献检索到的广泛使用基于Web开发技术和数据库技术构建的设备报修系统相比,其设计和实现原理简明扼要、易于实现,不需要操作人员具备高深专业知识及强大技术开发能力来进行前端设计和数据库构建,有效解决人员、资金、信息化问题。该系统可以扩展到企事业单位、小区物业等需要故障报修的任何一个场景。 展开更多
关键词 高校 报修系统 腾讯文档 信息化
下载PDF
炼油化工建设项目文档质量的管理实践
20
作者 孙丽丽 崔丹婷 《机电兵船档案》 2024年第2期3-5,共3页
炼油化工建设项目档案的完整性、准确性与系统性,三者相辅相成,完整性是基础,准确性是核心,系统性是表现。文章从华锦集团建设项目档案管理的具体实践出发,分析完整性、准确性与系统性的具体表现,提出三种操作性强的检查方法,将项目文... 炼油化工建设项目档案的完整性、准确性与系统性,三者相辅相成,完整性是基础,准确性是核心,系统性是表现。文章从华锦集团建设项目档案管理的具体实践出发,分析完整性、准确性与系统性的具体表现,提出三种操作性强的检查方法,将项目文档一体化管理融合到项目管理中,持续提升项目档案管理。 展开更多
关键词 炼油化工项目 文档质量 文档一体化
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部