期刊文献+
共找到617篇文章
< 1 2 31 >
每页显示 20 50 100
Delphi中自动存取MS-Office文档对象应用研究 被引量:1
1
作者 陶以政 何铁宁 《计算机与现代化》 2002年第1期7-11,共5页
简要分析了MS Office中Word、Excel、PowerPoint的ActiveXAutomation接口对象的组成 ,在Delphi中自动存取MS Of fice文档对象的实现技术 ;应用ActiveXAutomation技术实现了Delphi开发的应用软件与MS
关键词 DELPHI ms-office 软件集成 文档对象 应用软件 办公室自动化处理软件 计算机
下载PDF
大亚湾核电厂工作文档结构化实践分析
2
作者 凌丹莉 刘文可 《中国档案》 北大核心 2024年第3期38-39,共2页
大亚湾核电厂工作文档是开展生产活动过程中所使用的文档,它规范了大亚湾核电厂生产活动的技术要求、操作步骤和指导说明等,是工作过程中必须使用的文档,也是记载工作过程中各项数据的文档。随着信息化发展和5G网络的推广,大数据及移动... 大亚湾核电厂工作文档是开展生产活动过程中所使用的文档,它规范了大亚湾核电厂生产活动的技术要求、操作步骤和指导说明等,是工作过程中必须使用的文档,也是记载工作过程中各项数据的文档。随着信息化发展和5G网络的推广,大数据及移动应用逐渐成为核电厂管理升级转型的重要方向,其中工作文档结构化是大数据应用的重要内容。工作原则大亚湾核电厂工作文档结构化确定了一系列工作原则,用以确保在具体的业务需求和技术环境下,工作文档的数字化、结构化应用能够顺利实施并发挥预期的作用。 展开更多
关键词 大亚湾核电厂 大数据应用 移动应用 生产活动过程 结构 升级转型 工作文档 操作步骤
下载PDF
电网OA系统非结构化文档内容自动化识别技术
3
作者 冯光璐 欧阳静 +2 位作者 李然 倪凡 曾路 《信息技术》 2024年第1期104-109,114,共7页
针对电网OA系统内存在大量的非结构化文档难以识别的问题,研究电网OA系统非结构化文档内容自动化识别技术。采用非直接转换方法,将非结构化数据先转换为采用XML文件承载的不完全结构化数据,利用SAX解析工具解析不完全结构化数据,采用Sim... 针对电网OA系统内存在大量的非结构化文档难以识别的问题,研究电网OA系统非结构化文档内容自动化识别技术。采用非直接转换方法,将非结构化数据先转换为采用XML文件承载的不完全结构化数据,利用SAX解析工具解析不完全结构化数据,采用Simhash算法对文本信息进行去重处理;采用TextRank算法提取文本内的关键词,根据关键词识别电网OA系统非结构化文档内容。测试结果显示,在海明距离与相似度阈值分别为10和70的条件下可获取较好的去重效果,关键词提取效果较好,具有推广价值。 展开更多
关键词 结构文档 非直接转换 自动化识别 关键词提取 去重算法
下载PDF
一种通过内容和结构查询文档数据库的方法(英文) 被引量:9
4
作者 王晓玲 文继荣 +2 位作者 栾金锋 马维英 董逸生 《软件学报》 EI CSCD 北大核心 2003年第5期976-983,共8页
文档是有一定逻辑结构的,标题、章节、段落等这些概念是文档的内在逻辑.不同的用户对文档的检索,有不同的需求,检索系统如何提供有意义的信息,一直是研究的中心任务.结合文档的结构和内容,对结构化 文件的检索,提出了一种新的计算相似... 文档是有一定逻辑结构的,标题、章节、段落等这些概念是文档的内在逻辑.不同的用户对文档的检索,有不同的需求,检索系统如何提供有意义的信息,一直是研究的中心任务.结合文档的结构和内容,对结构化 文件的检索,提出了一种新的计算相似度的方法.这种方法可以提供多粒度的文档内容的检索,包括从单词、短语到段落或者章节.基于这种方法实现了一个问题回答系统,测试集是微软的百科全书Encarta,通过与系统方法实验比较,证明通过这种方法检索的文章片断更合理、更有效. 展开更多
关键词 文档数据库 结构查询 结构文档 计算相似度
下载PDF
XML文档的相似测度和结构索引研究 被引量:28
5
作者 郑仕辉 周傲英 张龙 《计算机学报》 EI CSCD 北大核心 2003年第9期1116-1122,共7页
提出了一个可用于定量度量XML文档间差异的方法 (称为XED距离 ) .利用结点间的模拟关系 ,一个XML文档可以表示为一棵精简的、带权重的结构索引树 .两个XML文档间的相似度可以通过计算它们的索引树间的编辑距离来测定 .利用索引树可以大... 提出了一个可用于定量度量XML文档间差异的方法 (称为XED距离 ) .利用结点间的模拟关系 ,一个XML文档可以表示为一棵精简的、带权重的结构索引树 .两个XML文档间的相似度可以通过计算它们的索引树间的编辑距离来测定 .利用索引树可以大大提高判定两个XML文档结构相似度的效率 .XED距离测度可用于XML文档的结构搜索、XML文档聚类、XML文档结构抽取、XML文档的变换检测以及XML视图的增量计算和维护等 . 展开更多
关键词 数据库 XML文档 相似测度 结构索引
下载PDF
非结构化表格文档数据抽取与组织模型研究 被引量:12
6
作者 张元鸣 陈苗 +2 位作者 陆佳炜 徐俊 肖刚 《浙江工业大学学报》 CAS 北大核心 2016年第5期487-494,共8页
针对现有文档数据抽取方法无法抽取多值属性且灵活性不高的问题,提出了一种面向非结构化表格文档的数据抽取方法与组织模型.在分析文档结构特征和数据流特征的基础上,定义了数据流生成基本规则,给出了一个基于规则的数据抽取流程,包括... 针对现有文档数据抽取方法无法抽取多值属性且灵活性不高的问题,提出了一种面向非结构化表格文档的数据抽取方法与组织模型.在分析文档结构特征和数据流特征的基础上,定义了数据流生成基本规则,给出了一个基于规则的数据抽取流程,包括逻辑结构抽取、文档预处理、数据抽取和数据组织等主要步骤,设计实现了单值区域与多值区域数据抽取算法;从文档中抽取的数据被组织成适合于MapReduce分析的结构化数据模型,该模型能够为大数据分析提供模型支持.实验结果表明:该抽取方法具有较高的准确率与召回率,数据组织模型也能够有效地支持大数据分析. 展开更多
关键词 结构化表格文档 数据抽取 结构化数据模型 数据分析
下载PDF
基于PDF文档结构的数字水印算法 被引量:15
7
作者 钟征燕 郭燕慧 徐国爱 《计算机应用》 CSCD 北大核心 2012年第10期2776-2778,2782,共4页
在数字产品日益普及的今天,PDF文档的版权保护问题已成为信息安全领域研究的热点。通过分析PDF文档的结构及相关数字水印算法,针对当前一些大容量文本水印算法存在增加文档大小的缺陷,提出了一种基于PDF文档结构的数字水印算法。该算法... 在数字产品日益普及的今天,PDF文档的版权保护问题已成为信息安全领域研究的热点。通过分析PDF文档的结构及相关数字水印算法,针对当前一些大容量文本水印算法存在增加文档大小的缺陷,提出了一种基于PDF文档结构的数字水印算法。该算法利用行末标识符不会在文档中显示的特性,通过等量替换PDF文档中具有固定格式的交叉引用表的行末标识符,来实现水印信息的间接嵌入。实验结果表明,该算法水印容量能满足数字版权保护的要求,隐蔽性好,能抵抗统计等攻击。 展开更多
关键词 数字水印 PDF文档 文档结构 数字版权保护 行末标识符 信息隐藏
下载PDF
基于HTML文档结构的向量空间模型的改进 被引量:10
8
作者 胡健 陆一鸣 马范援 《情报学报》 CSSCI 北大核心 2005年第4期433-437,共5页
根据HTML文档不同标签域的分布特征和对文档内容的代表能力不同,我们提出了一种改进的向量模型(PFTF),并通过trec12的查询实验,比较了传统向量模型与PFTF模型对单个标签域以及多个文档表示结果的结合的检索性能.实验结果表明,PFTF模型... 根据HTML文档不同标签域的分布特征和对文档内容的代表能力不同,我们提出了一种改进的向量模型(PFTF),并通过trec12的查询实验,比较了传统向量模型与PFTF模型对单个标签域以及多个文档表示结果的结合的检索性能.实验结果表明,PFTF模型对于这两个方面都有提高. 展开更多
关键词 HTML文档结构 信息检索 向量空间模型链接文本TREC 向量空间模型 HTML文档 文档结构 向量模型 分布特征 检索性能 标签
下载PDF
基于行为的结构化文档多级访问控制 被引量:17
9
作者 熊金波 姚志强 +2 位作者 马建峰 李凤华 李琦 《计算机研究与发展》 EI CSCD 北大核心 2013年第7期1399-1408,共10页
针对当前云计算环境中因缺乏多级安全机制而使结构化文档容易产生信息泄露和非授权访问等问题,提出基于行为的多级访问控制(action-based multilevel access control model,AMAC)模型并给出策略的形式化描述.利用信息流中的不干扰理论建... 针对当前云计算环境中因缺乏多级安全机制而使结构化文档容易产生信息泄露和非授权访问等问题,提出基于行为的多级访问控制(action-based multilevel access control model,AMAC)模型并给出策略的形式化描述.利用信息流中的不干扰理论建立AMAC不干扰模型,并证明AMAC模型中多级访问控制策略的安全性.与已有访问控制模型的比较与分析表明,AMAC模型既可以利用角色、上下文和用户访问行为以提高访问控制策略的灵活性,还可以依据用户,用户访问行为和结构化文档的安全等级实现多级安全机制. 展开更多
关键词 多级安全 多级访问控制 结构文档 不干扰理论 云计算 访问行为
下载PDF
VSM模型在文档结构识别中的应用 被引量:10
10
作者 宋昊苏 李宁 张伟 《北京信息科技大学学报(自然科学版)》 2011年第6期66-69,75,共5页
借鉴向量空间模型(VSM),将文档的单元结构映射到特征向量,并对其进行归一化和加权处理,再计算标准文档结构分类特征向量和待查文档单元结构特征向量的相似度,实现对文档结构的识别。测试结果表明,该方法实现了文档格式的向量表示,易于计... 借鉴向量空间模型(VSM),将文档的单元结构映射到特征向量,并对其进行归一化和加权处理,再计算标准文档结构分类特征向量和待查文档单元结构特征向量的相似度,实现对文档结构的识别。测试结果表明,该方法实现了文档格式的向量表示,易于计算,具有较好的扩展性,可在此基础上实现其他特定结构文档格式的自动检查或文档理解。 展开更多
关键词 文档结构识别 向量空间模型 文档格式校验 文档理解
下载PDF
XML文档结构定义规范—XML Schema 被引量:23
11
作者 王茹 宋瀚涛 《计算机应用研究》 CSCD 北大核心 2002年第1期127-129,共3页
介绍了XML文档结构定义规范—XMLSchema规范及其组成部分 ,并通过一个典型示例说明了XMLSchema的特点 。
关键词 XML XML SCHEMA 文档结构定义规范 数据模型
下载PDF
基于信息结构模型的企业文档信息集成与重用技术研究 被引量:4
12
作者 王克明 熊光楞 +1 位作者 谢金崇 范文慧 《中国机械工程》 EI CAS CSCD 北大核心 2003年第4期302-305,共4页
结合企业文档标准化发展趋势 ,提出了基于信息结构模型的文档信息集成与重用技术。通过对文档内部信息结构模型的表达 ,提供了对多层次不同粒度文档信息的验证、存储、维护和重用机制 ,同时支持规范化文档的自动生成。
关键词 信息结构模型 文档管理 信息集成 信息重用 XML
下载PDF
一种结构与内容相结合的XML文档聚类方法 被引量:4
13
作者 谌志群 王小华 王荣波 《情报学报》 CSSCI 北大核心 2009年第5期693-699,共7页
XML(可扩展标记语言)正在成为Web数据交换的标准格式。随着XML格式的半结构数据的大量出现,如何处理和管理XML文档已经成为了一个研究热点。XML文档聚类作为XML数据处理的重要课题,是指将具有类似特征的XML文档聚集成簇。现有的大部... XML(可扩展标记语言)正在成为Web数据交换的标准格式。随着XML格式的半结构数据的大量出现,如何处理和管理XML文档已经成为了一个研究热点。XML文档聚类作为XML数据处理的重要课题,是指将具有类似特征的XML文档聚集成簇。现有的大部分XML文档聚类是基于文档结构特征的。本文提出了一个新的结构与内容相结合的XML文档聚类方法。首先从文档中抽取构件向量,并把文档转换为向量化的表示。然后,在文档相似度计算的基础上,引入一个层次聚类方法对XML文档进行聚类。在DBLPXML记录集上进行的实验表明该方法具有可行性并且性能明显优于已有方法。 展开更多
关键词 XML 文档聚类 结构 内容 层次聚类
下载PDF
超媒体文档库协作写作系统的数据结构设计 被引量:3
14
作者 黄宜华 尤晓白 +2 位作者 纪元 杨文清 张福炎 《软件学报》 EI CSCD 北大核心 1997年第3期170-177,共8页
本文主要讨论了一个面向大容量超媒体中文文档库的分布协作写作系统的数据和结构模型设计,着重介绍了分布式文档库、文档目录树、节点和超链链表、多媒体对象。
关键词 超媒体 文档 数据结构 协作写作系统 多媒体
下载PDF
结构性文档下基于MCPS2的意图维护与undo算法研究 被引量:3
15
作者 王丹 朱思征 +1 位作者 王山山 高丽萍 《小型微型计算机系统》 CSCD 北大核心 2021年第11期2284-2291,共8页
本文在移动平台下基于用户活跃度的结构性文档意图维护算法(MCPS2)研究的基础上,对master转移、节点编辑权限请求、删除操作的等方面执行方式进行优化,并加入支持undo操作的相关算法.此算法中涉及的网络连接模式、文档结构、复制策略延... 本文在移动平台下基于用户活跃度的结构性文档意图维护算法(MCPS2)研究的基础上,对master转移、节点编辑权限请求、删除操作的等方面执行方式进行优化,并加入支持undo操作的相关算法.此算法中涉及的网络连接模式、文档结构、复制策略延用MCPS2中的设计.在标题节点编辑引入arbitrated、readonly和locked等5类操作预设权限,以提升协作站点请求节点的反馈效率;设置master继承机制,副本占比与请求活跃度优先制,提升master转移的合理性;根据结构文档的特性,调整delete操作的执行方式,提高算法可用性;站点设置UHB,结合控制算法,支持站点undo操作.最后给出详细算法复杂度分析,并举例完整描述算法的执行过程,以证明算法的有效性. 展开更多
关键词 结构文档 意图维护 UNDO 节点权限 master转移
下载PDF
半结构化文档集的结构模式提取的研究与实现 被引量:5
16
作者 杨建武 陈晓鸥 《计算机工程》 CAS CSCD 北大核心 2001年第10期19-21,113,共4页
提出了通过结构模式提取,在信息源对缺失信息进行恢复与重构的思想,给出了结构模式提取模型,并讨论了实现该模型的关键步骤与算法,最后结合基于该模型实现的系统对半结构化文档集的结构模式提取及其应用进行了总结。该研究成果已成功应... 提出了通过结构模式提取,在信息源对缺失信息进行恢复与重构的思想,给出了结构模式提取模型,并讨论了实现该模型的关键步骤与算法,最后结合基于该模型实现的系统对半结构化文档集的结构模式提取及其应用进行了总结。该研究成果已成功应用于实际系统中。 展开更多
关键词 结构文档 结构模式提取 WEB INTERNET
下载PDF
云计算环境中结构化文档形式化建模 被引量:2
17
作者 熊金波 姚志强 金彪 《计算机应用》 CSCD 北大核心 2013年第5期1267-1270,共4页
结构化文档是云计算环境中实现信息交互与传播的载体,针对已有研究工作缺乏能够描述这种载体的结构化文档模型的问题,在深入分析云计算环境中结构化文档特征的基础上,对文档元素、原子文档元素、连接、文档片段、复杂文档元素等进行形... 结构化文档是云计算环境中实现信息交互与传播的载体,针对已有研究工作缺乏能够描述这种载体的结构化文档模型的问题,在深入分析云计算环境中结构化文档特征的基础上,对文档元素、原子文档元素、连接、文档片段、复杂文档元素等进行形式化定义,建立能够满足这种特征的结构化文档形式化模型。最后,指出云计算环境中结构化文档进一步的研究方向。 展开更多
关键词 云计算 结构文档模型 形式化方法 文档元素
下载PDF
XML的半结构化数据表示方法及其在医学文档处理中的应用 被引量:18
18
作者 许斗 陈恩红 《计算机工程》 CAS CSCD 北大核心 2002年第1期57-58,191,共3页
可扩展标识语言以其合理的数据组织结构和可扩展的特性,成为各种复杂数据,特别是半结构化数据表示和处理的良好工具。基于一则医学文档管理的实例,详细介绍了使用XML表示和处理半结构化信息内容的方法、思想及特点。
关键词 医学 文档处理 XML 结构化数据表示方法 数据库
下载PDF
CEBX:新一代结构化版式文档技术 被引量:3
19
作者 汤帜 仇睿恒 王毅 《北京信息科技大学学报(自然科学版)》 2010年第S2期11-15,共5页
随着IT技术的发展,越来越多的人习惯于在计算机或移动终端上进行阅读,但传统的版式文档缺乏屏幕自适应特性,不适合在移动终端上阅读,为了提供在不同移动设备上数字内容最佳的阅读体验,需要有更好的文档格式。CEBX是新一代结构化版式文... 随着IT技术的发展,越来越多的人习惯于在计算机或移动终端上进行阅读,但传统的版式文档缺乏屏幕自适应特性,不适合在移动终端上阅读,为了提供在不同移动设备上数字内容最佳的阅读体验,需要有更好的文档格式。CEBX是新一代结构化版式文档技术,该技术实现一次制作、多平台多次利用,既可以原版原式地显示或打印,又可以在移动设备上更好地实现高质量的实时排版和屏幕自适应。此外,CEBX技术在适应移动互联网应用方面提供更好的技术特性,包括减少文档格式的数据量小以提高压缩倍率、减少解析引擎的复杂度以提高解析速度、支持部分加密等灵活的文档对象处理机制等。 展开更多
关键词 版式文档 文档格式 结构信息
下载PDF
基于路径特征的XML文档结构相似性度量 被引量:4
20
作者 张力生 洪小云 雷大江 《计算机应用与软件》 CSCD 2015年第7期39-42,85,共5页
针对现有XML文档结构相似性度量方法大多不能完全反映XML文档的结构特征,相似度计算结果精确度不高,导致聚类效果不够理想的问题,提出一种改进的相似度计算方法 SSPF(Similarity based on Sequence,Position and Frequency)。该方法充... 针对现有XML文档结构相似性度量方法大多不能完全反映XML文档的结构特征,相似度计算结果精确度不高,导致聚类效果不够理想的问题,提出一种改进的相似度计算方法 SSPF(Similarity based on Sequence,Position and Frequency)。该方法充分利用提取的DOM树路径信息,对树路径间序列和位置的相似度计算进行优化,并考虑了路径频率对相似度的影响,使得文档间的相似性更为合理。实验结果表明,SSPF方法具有更加准确的相似度计算结果,聚类的各项评价指标均有所提高。 展开更多
关键词 XML文档 DOM解析 路径特征 结构相似性 评价指标
下载PDF
上一页 1 2 31 下一页 到第
使用帮助 返回顶部