期刊文献+
共找到105篇文章
< 1 2 6 >
每页显示 20 50 100
Automatic Table Recognition and Extraction from Heterogeneous Documents 被引量:1
1
作者 Florence Folake Babatunde Bolanle Adefowoke Ojokoh Samuel Adebayo Oluwadare 《Journal of Computer and Communications》 2015年第12期100-110,共11页
This paper examines automatic recognition and extraction of tables from a large collection of het-erogeneous documents. The heterogeneous documents are initially pre-processed and converted to HTML codes, after which ... This paper examines automatic recognition and extraction of tables from a large collection of het-erogeneous documents. The heterogeneous documents are initially pre-processed and converted to HTML codes, after which an algorithm recognises the table portion of the documents. Hidden Markov Model (HMM) is then applied to the HTML code in order to extract the tables. The model was trained and tested with five hundred and twenty six self-generated tables (three hundred and twenty-one (321) tables for training and two hundred and five (205) tables for testing). Viterbi algorithm was implemented for the testing part. The system was evaluated in terms of accuracy, precision, recall and f-measure. The overall evaluation results show 88.8% accuracy, 96.8% precision, 91.7% recall and 88.8% F-measure revealing that the method is good at solving the problem of table extraction. 展开更多
关键词 Hidden MARKOV Model Table Recognition and EXTRACTION HYPERTEXT markup Language HETEROGENEOUS documentS
下载PDF
Extensible Markup Language Data Mining System Model
2
作者 李炜 宋瀚涛 《Journal of Beijing Institute of Technology》 EI CAS 2003年第1期28-32,共5页
The existing data mining methods are mostly focused on relational databases and structured data, but not on complex structured data (like in extensible markup language(XML)). By converting XML document type descriptio... The existing data mining methods are mostly focused on relational databases and structured data, but not on complex structured data (like in extensible markup language(XML)). By converting XML document type description to the relational semantic recording XML data relations, and using an XML data mining language, the XML data mining system presents a strategy to mine information on XML. 展开更多
关键词 extensible markup language(XML) document type description(DTD) data mining data mining language relational schema
下载PDF
Measuring Qualities of XML Schema Documents
3
作者 Tin Zar Thaw Mie Mie Khin 《Journal of Software Engineering and Applications》 2013年第9期458-469,共12页
The Extensible Markup Language (XML) is becoming a de-facto standard for exchanging information among the web applications. Efficient implementation of web application needs to be efficient implementation of XML and X... The Extensible Markup Language (XML) is becoming a de-facto standard for exchanging information among the web applications. Efficient implementation of web application needs to be efficient implementation of XML and XML schema document. The quality of XML document has great impact on the design quality of its schema document. Therefore, the design of XML schema document plays an important role in web engineering process and needs to have many schema qualities: functionality, extensibility, reusability, understandability, maintainability and so on. Three schema metrics: Reusable Quality metric (RQ), Extensible Quality metric (EQ) and Understandable Quality metric (UQ) are proposed to measure the Reusable, Extensible and Understandable of XML schema documents in web engineering process respectively. The base attributes are selected according to XML Quality Assurance Design Guidelines. These metrics are formulated based on Binary Entropy Function and Rank Order Centroid method. To check the validity of the proposed metrics empirically and analytically, the self-organizing feature map (SOM) and Weyuker’s 9 properties are used. 展开更多
关键词 Extensible markup Language XML SCHEMA documentS Web Engineering Process XML Quality ASSURANCE Design Guidelines SCHEMA Qualities
下载PDF
XML与Web数据集成及技术实现 被引量:15
4
作者 周彦晖 邹显春 张为群 《西南师范大学学报(自然科学版)》 CAS CSCD 北大核心 2001年第3期255-259,共5页
由于HTML缺乏规范的数据表达能力 ,基于Web的数据集成往往很困难 .要使存在于Web上的数量巨大的数据易于共享、处理 ,利用XML (eXtensibleMarkupLanguage)技术可以很好地实现 .现有的XML技术包括XML解析器、文档对象模型、XSL等都可以... 由于HTML缺乏规范的数据表达能力 ,基于Web的数据集成往往很困难 .要使存在于Web上的数量巨大的数据易于共享、处理 ,利用XML (eXtensibleMarkupLanguage)技术可以很好地实现 .现有的XML技术包括XML解析器、文档对象模型、XSL等都可以很好地应用到各种平台下的Web应用程序中 。 展开更多
关键词 数据集成 可扩展标注语言 万维网 文档对象模型
下载PDF
基于三层网络架构及DOM的XML系统模型 被引量:20
5
作者 刘芳珠 潘亦 潘金贵 《小型微型计算机系统》 CSCD 北大核心 2001年第12期1512-1515,共4页
本文阐述如何在三层网络架构上运用 XML以构筑 XML文档支持系统 .提出了基于三层网络架构及 DOM的XML 系统的模型 .该系统与传统的客户 /服务器应用或是采用一般的数据传输方式如 HTML 等系统相比具有减少了网络流量、更有利于检索、可... 本文阐述如何在三层网络架构上运用 XML以构筑 XML文档支持系统 .提出了基于三层网络架构及 DOM的XML 系统的模型 .该系统与传统的客户 /服务器应用或是采用一般的数据传输方式如 HTML 等系统相比具有减少了网络流量、更有利于检索、可从多种不同的数据源集成数据、开放性、可扩充性。 展开更多
关键词 可扩展标记语言 文档类型定义 三层网络架构 文档对象模型 计算机网络
下载PDF
文档编辑与排版系统的设计 被引量:4
6
作者 侯霞 孟飞 杨鸿波 《计算机工程与设计》 CSCD 北大核心 2012年第9期3617-3621,共5页
人工对文档进行排版是一项比较复杂、繁琐的工作。为了提高工作效率,提出了一种文档编辑与排版系统的设计模型,该模型将文档的内容和式样完全分离,分别放置于事先设计好结构的XML容器中,通过转换器将文档内容和式样集成,并自动输出为符... 人工对文档进行排版是一项比较复杂、繁琐的工作。为了提高工作效率,提出了一种文档编辑与排版系统的设计模型,该模型将文档的内容和式样完全分离,分别放置于事先设计好结构的XML容器中,通过转换器将文档内容和式样集成,并自动输出为符合特定文档格式的最终结果文档。给出了一个科技论文编辑与排版原型系统的实现方案,表明了系统模型的设计原理和可行性。 展开更多
关键词 文档格式 可扩展置标语言 格式转换 文档处理 文档排版
下载PDF
一种基于XML的企业知识管理框架 被引量:10
7
作者 郭茂祖 姜俊峰 黄梯云 《计算机工程与应用》 CSCD 北大核心 2001年第19期35-37,103,共4页
描述了基于互联网络上全新的通用描述性语言———可扩展的标识语言XML的企业知识管理框架。利用XML的优点来对企业中如何更为有效地进行知识管理进行了描述,并对知识管理当中的主要对象诸如知识对象、连接对象等进行了提取,描述了其相... 描述了基于互联网络上全新的通用描述性语言———可扩展的标识语言XML的企业知识管理框架。利用XML的优点来对企业中如何更为有效地进行知识管理进行了描述,并对知识管理当中的主要对象诸如知识对象、连接对象等进行了提取,描述了其相关的属性,构建了相应的文档类型声明DTD模板,从而开发了一个基于XML的知识管理框架。 展开更多
关键词 专家系统 知识管理 XML 知识工程 知识对象 企业 Internet
下载PDF
面向置标文档的文档转换技术研究 被引量:1
8
作者 李景春 武港山 +1 位作者 王强 张福炎 《中文信息学报》 CSCD 北大核心 2000年第4期53-58,64,共7页
文档系统间的转换是文档内容共享和协作的必然途径 ,转换根据不同应用目的包括失真 ,不失真和增值三种方式。置标文档是用标签 (Tag)进行文档结构描述的文档。本文介绍了一种面向置标文档的文档转换增值技术 ,给出了一种文档转换描述语... 文档系统间的转换是文档内容共享和协作的必然途径 ,转换根据不同应用目的包括失真 ,不失真和增值三种方式。置标文档是用标签 (Tag)进行文档结构描述的文档。本文介绍了一种面向置标文档的文档转换增值技术 ,给出了一种文档转换描述语言 ,用户可以利用它来定义转换信息从而实现文档间复杂的转换。 展开更多
关键词 失真 置标文档 文档转换技术 文档转换描述语言
下载PDF
从XML模式到关系模式的影射 被引量:4
9
作者 方翔 袁国栋 李伟生 《计算机工程与应用》 CSCD 北大核心 2002年第19期195-197,共3页
XML在关系数据库中的存储问题是XML研究领域中的一个重要问题。该文在总结多种影射方法的基础之上,提出了一个利用DTD文档,在关系数据库中通过多阶段XML文档信息的提取与变换,最终实现XML模式到关系模式的影射。该文对于影射中的一些难... XML在关系数据库中的存储问题是XML研究领域中的一个重要问题。该文在总结多种影射方法的基础之上,提出了一个利用DTD文档,在关系数据库中通过多阶段XML文档信息的提取与变换,最终实现XML模式到关系模式的影射。该文对于影射中的一些难点问题,如集合值的影射、递归元素的影射、关系表的分散等方面提出了解决办法,实现了一个较为完整、高效的影射方案。 展开更多
关键词 XML模式 关系模式 DTD 关系数据库 文档
下载PDF
XML与数据库数据的交互技术研究 被引量:10
10
作者 刘先锋 曹步文 《计算机工程与应用》 CSCD 北大核心 2006年第32期143-146,149,共5页
从XML与关系数据库的特点入手,描述了两者之间的相互转换方法,并且以实例说明了XML与数据库的转换过程。
关键词 XML DTD 关系数据库 转换
下载PDF
关系模式到XML Schema的约束保留映射 被引量:6
11
作者 周竞涛 张树生 +1 位作者 孙宏伟 王明微 《西北工业大学学报》 EI CAS CSCD 北大核心 2003年第3期372-376,共5页
随着 XML逐渐成为网络数据表示和交换的标准 ,将关系数据描述为 XML格式已经成为一种趋势。针对这种情况 ,提出了关系模式到 XML Schema的保留约束映射算法 ,通过对关系模式和 XML Schema数学建模 ,定义模式映射模板 ,将关系模式转化为 ... 随着 XML逐渐成为网络数据表示和交换的标准 ,将关系数据描述为 XML格式已经成为一种趋势。针对这种情况 ,提出了关系模式到 XML Schema的保留约束映射算法 ,通过对关系模式和 XML Schema数学建模 ,定义模式映射模板 ,将关系模式转化为 XML Schema模式的描述 ,实现关系数据到 XML文档的转化。由于在数学建模过程中充分保留了语义约束信息 ,与同类研究相比 ,算法的映射结果可以更完整的描述关系模式的结构和语义信息 。 展开更多
关键词 XML 约束保留映射 XMLSCHEMA 关系模式
下载PDF
城市GML文档三维特征的快速获取与可视化 被引量:2
12
作者 赵伶俐 朱建军 +1 位作者 刘帅 马力 《计算机工程与应用》 CSCD 北大核心 2009年第26期226-229,共4页
随着网络技术的发展,对城市三维数据的需求愈益增加,然而众多的城市三维数据缺乏统一的模型,使数据不能有效地进行共享与交互。开放式地理信息系统协会(Open GIS Consortium,OGC)提出了地理标记语言(Geography Markup Language,GML),城... 随着网络技术的发展,对城市三维数据的需求愈益增加,然而众多的城市三维数据缺乏统一的模型,使数据不能有效地进行共享与交互。开放式地理信息系统协会(Open GIS Consortium,OGC)提出了地理标记语言(Geography Markup Language,GML),城市GML规范定义了城市空间信息模型的标准,有利于三维数据在网络上进行传输、共享。通过分析城市GML文件的结构,提出一种适合一般城市GML文件的数据结构集合,使得在采用DOM接口解析文件后,能够快速获取城市GML文件的3D信息。实验部分使用Java3D编程显示快速获取的3D信息,证明了提出的数据结构集合的有效性。 展开更多
关键词 城市地理标记语言GML 开放式地理信息系统协会 3D特征 可视化
下载PDF
GML数据的Web可视化设计与实现 被引量:6
13
作者 张爱国 邬群勇 王钦敏 《测绘科学》 CSCD 北大核心 2007年第1期140-141,共2页
GML是GIS领域的通用交流语言,然而目前的浏览器并不支持GML,因此GML的Web可视化仍是GML应用需要解决的问题。为此,本论文提出了一种基于组件的可视化策略。该策略采用文档对象模型(DOM)进行GML模式文件和实例文件解析,按地理要素对GML... GML是GIS领域的通用交流语言,然而目前的浏览器并不支持GML,因此GML的Web可视化仍是GML应用需要解决的问题。为此,本论文提出了一种基于组件的可视化策略。该策略采用文档对象模型(DOM)进行GML模式文件和实例文件解析,按地理要素对GML进行数据分流/分层,然后分层可视化的办法,实现了GML数据的Web可视化。实践验证,该方法是切实可行的,且对于GML数据量较大时尤为有效。 展开更多
关键词 地理标记语言 组件 WEB可视化 文档对象模型
下载PDF
基于XML的复合型工程数据库管理系统模型 被引量:3
14
作者 马智亮 朱小羽 《计算机工程与应用》 CSCD 北大核心 2002年第19期192-194,共3页
为了对工程应用中结构复杂、形式多样的数据进行管理,该文建立了将关系型数据库和XML技术结合在一起形成的复合型数据库管理系统模型。然后,介绍了笔者研制的基于该模型的数据库管理系统的原型系统XMLBase。
关键词 XML 复合型工程数据库管理系统模型 文档管理
下载PDF
XAr/T-net:一种用于以业务单据为中心的业务流程建模方法 被引量:1
15
作者 王颖 刘国华 黄震 《计算机集成制造系统》 EI CSCD 北大核心 2013年第8期1935-1941,共7页
为分析业务流程中关键数据的特性及数据之间的交互关系,用可扩展标记语言形式描述业务流程中的数据实体Artifact的结构及其操作,提出一种高级Petri网的变体XAr/T-net,对以Artifact为中心的业务流程进行建模。研究结果表明,XAr/T-net模... 为分析业务流程中关键数据的特性及数据之间的交互关系,用可扩展标记语言形式描述业务流程中的数据实体Artifact的结构及其操作,提出一种高级Petri网的变体XAr/T-net,对以Artifact为中心的业务流程进行建模。研究结果表明,XAr/T-net模型既可以分析各个独立的业务子流程中Artifact的唯一性、可达性和持久性,又可以表达业务流程中各类型Artifact之间的交互。 展开更多
关键词 业务流程 ARTIFACT PETRI网 可扩展标记语言文档 XAr T-net模型
下载PDF
基于XML的施工索赔标记语言CCML的索赔数据分析 被引量:3
16
作者 蔡淑琴 鲍晓莉 李升一 《管理工程学报》 CSSCI 2003年第2期60-64,共5页
工程施工索赔数据的管理是进行索赔决策的前提。根据索赔数据的特点和XML的技术优势 ,分析了创建施工索赔领域的施工索赔标记语言CCML来组织管理索赔数据的适用性 ;具体描述了索赔数据在CCML中的同构变换 ;并以应用实例为基础 ,深入分... 工程施工索赔数据的管理是进行索赔决策的前提。根据索赔数据的特点和XML的技术优势 ,分析了创建施工索赔领域的施工索赔标记语言CCML来组织管理索赔数据的适用性 ;具体描述了索赔数据在CCML中的同构变换 ;并以应用实例为基础 ,深入分析了索赔数据的数据元素和数据结构 ,给出相应的DTD模型。 展开更多
关键词 施工索赔数据 施工索赔标记语言 CCML DTD模型
下载PDF
包含Dewey码的XML文档映射关系数据库策略 被引量:1
17
作者 姚保峰 朱洪浩 +2 位作者 王磊 戚晓明 郭有强 《计算机工程与应用》 CSCD 2012年第27期128-131,179,共5页
目前的XML文档映射关系数据库方法普遍存在生成的数据表较多、查询效率较低等问题,基于模型映射提出一种包含Dewey编码的XML文档映射关系数据库方法。给出了映射的逻辑结构模型、详细设计方案、映射算法和实验结果。实验结果表明,该方... 目前的XML文档映射关系数据库方法普遍存在生成的数据表较多、查询效率较低等问题,基于模型映射提出一种包含Dewey编码的XML文档映射关系数据库方法。给出了映射的逻辑结构模型、详细设计方案、映射算法和实验结果。实验结果表明,该方法生成的数据表结构简单,与传统算法相比在文档解析和数据查询方面具有一定的性能优势。 展开更多
关键词 可扩展标记语言(XML)文档 模型映射 关系数据库 DEWEY编码
下载PDF
文档转换工具的设计与实现 被引量:3
18
作者 项湜伍 曹峰 《计算机工程》 CAS CSCD 北大核心 2008年第21期48-50,共3页
针对在文档开发和管理方面存在的问题,设计与实现基于Docbook规范的文档格式转换工具。该工具将文档中自定义的可扩展标识语言(XML)和HTML文件转换为符合Docbook规范的文件,通过XSLT转换为其他格式的文件,实现将自定义标签的XML文件自... 针对在文档开发和管理方面存在的问题,设计与实现基于Docbook规范的文档格式转换工具。该工具将文档中自定义的可扩展标识语言(XML)和HTML文件转换为符合Docbook规范的文件,通过XSLT转换为其他格式的文件,实现将自定义标签的XML文件自由转换为多种格式的文件,从而提高文档开发和管理的效率。 展开更多
关键词 可扩展标识语言 Docbook规范 文档工具
下载PDF
基于XML格式的配电网地理信息系统接口设计 被引量:7
19
作者 谢宁 吴智韬 《电力系统自动化》 EI CSCD 北大核心 2004年第9期77-80,共4页
地理信息系统(GIS)包含大量基础数据信息,是电力配电网管理系统不可分割的部分。由于无法统一不同GIS提供的数据文件格式,在进行接口设计时对GIS数据的处理工作十分繁杂。文中介绍了一个基于XML格式的配电网GIS接口的设计方法。利用XML... 地理信息系统(GIS)包含大量基础数据信息,是电力配电网管理系统不可分割的部分。由于无法统一不同GIS提供的数据文件格式,在进行接口设计时对GIS数据的处理工作十分繁杂。文中介绍了一个基于XML格式的配电网GIS接口的设计方法。利用XML技术结构、内容和表现分离的特点,无需考虑原始数据文件的格式,只需提取其中的数据,根据文档类型定义(DTD)所定义的结构,通过设计一个XML解析器,将数据导入数据库中。该方法不仅使接口标准统一,大大简化了对GIS数据的处理过程,而且可以根据不同的用户需求以不同的格式描述相同的数据。 展开更多
关键词 配电网 地理信息系统 接口设计 可扩展标志语言 文档类型定义 XML解析器
下载PDF
基于冰冻结构的XML文档聚类研究 被引量:1
20
作者 李巍 孙涛 +2 位作者 叶苑苑 李雄飞 李楠 《吉林大学学报(信息科学版)》 CAS 2009年第6期611-618,共8页
为了挖掘XML(Extensible Markup Language)文档在历史变化过程中不经常发生变化的结构所蕴含的知识,给出了发现冰冻结构的方法,使用一组冰冻结构组成的文档向量模型代表一个XML文档,并使用加权Jaccard系数作为相似度,利用基于XML文档历... 为了挖掘XML(Extensible Markup Language)文档在历史变化过程中不经常发生变化的结构所蕴含的知识,给出了发现冰冻结构的方法,使用一组冰冻结构组成的文档向量模型代表一个XML文档,并使用加权Jaccard系数作为相似度,利用基于XML文档历史变化过程中相对稳定的冰冻结构对XML文档进行聚类。经过实验证明,基于冰冻结构能够将XML进行有效的聚类,聚类后每簇中的XML文档具有相似的不经常变化结构。 展开更多
关键词 XML文档 文档聚类 加权Jaccard系数 冰冻结构
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部