期刊文献+
共找到488篇文章
< 1 2 25 >
每页显示 20 50 100
A Novel Method for Transforming XML Documents to Time Series and Clustering Them Based on Delaunay Triangulation
1
作者 Narges Shafieian 《Applied Mathematics》 2015年第6期1076-1085,共10页
Nowadays exchanging data in XML format become more popular and have widespread application because of simple maintenance and transferring nature of XML documents. So, accelerating search within such a document ensures... Nowadays exchanging data in XML format become more popular and have widespread application because of simple maintenance and transferring nature of XML documents. So, accelerating search within such a document ensures search engine’s efficiency. In this paper, we propose a technique for detecting the similarity in the structure of XML documents;in the following, we would cluster this document with Delaunay Triangulation method. The technique is based on the idea of representing the structure of an XML document as a time series in which each occurrence of a tag corresponds to a given impulse. So we could use Discrete Fourier Transform as a simple method to analyze these signals in frequency domain and make similarity matrices through a kind of distance measurement, in order to group them into clusters. We exploited Delaunay Triangulation as a clustering method to cluster the d-dimension points of XML documents. The results show a significant efficiency and accuracy in front of common methods. 展开更多
关键词 xml Mining document CLUSTERING xml CLUSTERING Schema Matching Similarity Measures DELAUNAY TRIANGULATION Cluster
下载PDF
标准电子文件转XML校验方法
2
作者 王海虹 杨萌 +2 位作者 张劲松 谭笑 罗小强 《中国标准化》 2024年第16期50-58,共9页
本研究关注于标准电子文件转换为XML格式的校验方法,目的是确保转换过程中内容的准确性和一致性。涉及455个国家标准、企业标准和行业标准的PDF文件,转换为Word后再编程为机器可读的XML格式。研究应对转换中出现的内容错乱、标签错误等... 本研究关注于标准电子文件转换为XML格式的校验方法,目的是确保转换过程中内容的准确性和一致性。涉及455个国家标准、企业标准和行业标准的PDF文件,转换为Word后再编程为机器可读的XML格式。研究应对转换中出现的内容错乱、标签错误等问题,强调校验的重要性。采用IntelliJ IDEA、Notepad++和Acrobat Adobe等工具,在初验、复验和终验三个阶段执行校验。通过建立严格的校验标准和检查表,本研究将XML内容错误率控制在万分之五以下,有效支持标准文件的数字化转型。 展开更多
关键词 标准行业 标准电子文件转换 xml格式校验 机器可读标准
下载PDF
Supporting B2B Business Documents in XML Web Services 被引量:3
3
作者 KIM Hyoungdo 《Journal of Electronic Science and Technology of China》 2004年第3期53-57,73,共6页
While XML web services become recognized as a solution to business-to-business transactions, there are many problems that should be solved. For example, it is not easy to manipulate business documents of existing stan... While XML web services become recognized as a solution to business-to-business transactions, there are many problems that should be solved. For example, it is not easy to manipulate business documents of existing standards such as RosettaNet and UN/EDIFACT EDI, traditionally regarded as an important resource for managing B2B relationships. As a starting point for the complete implementation of B2B web services, this paper deals with how to support B2B business documents in XML web services. In the first phase, basic requirements for driving XML web services by business documents are introduced. As a solution, this paper presents how to express B2B business documents in WSDL, a core standard for XML web services. This kind of approach facilitates the reuse of existing business documents and enhances interoperability between implemented web services. Furthermore, it suggests how to link with other conceptual modeling frameworks such as ebXML/UMM, built on a rich heritage of electronic business experience. 展开更多
关键词 business document xml web service EBxml
下载PDF
基于Python+Open XML的毕业设计说明书格式自动检测系统 被引量:1
4
作者 丁烨敏 《科学技术创新》 2023年第20期121-124,共4页
高校毕业设计说明书(论文)的格式检查是一件重复性的繁琐工作。通过使用Python+Open XML开发应用程序,可以对毕业设计说明书(论文)的格式进行自动检测,指出其存在的格式规范错误,高质高效,大大减少学生、老师的工作量。
关键词 Python Open xml 文档格式 自动检测
下载PDF
Measuring Qualities of XML Schema Documents
5
作者 Tin Zar Thaw Mie Mie Khin 《Journal of Software Engineering and Applications》 2013年第9期458-469,共12页
The Extensible Markup Language (XML) is becoming a de-facto standard for exchanging information among the web applications. Efficient implementation of web application needs to be efficient implementation of XML and X... The Extensible Markup Language (XML) is becoming a de-facto standard for exchanging information among the web applications. Efficient implementation of web application needs to be efficient implementation of XML and XML schema document. The quality of XML document has great impact on the design quality of its schema document. Therefore, the design of XML schema document plays an important role in web engineering process and needs to have many schema qualities: functionality, extensibility, reusability, understandability, maintainability and so on. Three schema metrics: Reusable Quality metric (RQ), Extensible Quality metric (EQ) and Understandable Quality metric (UQ) are proposed to measure the Reusable, Extensible and Understandable of XML schema documents in web engineering process respectively. The base attributes are selected according to XML Quality Assurance Design Guidelines. These metrics are formulated based on Binary Entropy Function and Rank Order Centroid method. To check the validity of the proposed metrics empirically and analytically, the self-organizing feature map (SOM) and Weyuker’s 9 properties are used. 展开更多
关键词 Extensible MARKUP Language xml SCHEMA documentS Web Engineering Process xml Quality ASSURANCE Design Guidelines SCHEMA Qualities
下载PDF
XML文档到关系数据库映射方法的研究 被引量:21
6
作者 耿飙 宋余庆 +1 位作者 梁成全 陈健美 《计算机应用研究》 CSCD 北大核心 2010年第3期951-954,共4页
针对现有映射方法对XML文档格式要求过严等不足,在模型映射方法基础上提出一种XML文档映射关系数据库的新方法。通过给XML文档树做标志,将映射算法转换后的数据放到两张预先定义结构的表进行存储。给出了逻辑数据模型、详细设计、映射... 针对现有映射方法对XML文档格式要求过严等不足,在模型映射方法基础上提出一种XML文档映射关系数据库的新方法。通过给XML文档树做标志,将映射算法转换后的数据放到两张预先定义结构的表进行存储。给出了逻辑数据模型、详细设计、映射算法和实验。实验结果表明,该方法能有效地保持XML文档的结构,能够对存储的数据进行语义检索,适用于任何树型数据结构。 展开更多
关键词 可扩展标记语言文档 模型映射 标志 保持结构 树型数据结构
下载PDF
一种并行XML数据库分片策略 被引量:7
7
作者 王国仁 汤南 +2 位作者 于亚新 孙冰 于戈 《软件学报》 EI CSCD 北大核心 2006年第4期770-781,共12页
主要研究XML文档的并行数据分片策略,以便能够并行处理XML查询.为了描述XML数据分片,提出了媒介节点的概念.一组媒介节点的集合可以将一棵XML数据树分割成一棵根树和一组子树的集合:根树将在所有站点中复制;而子树集合则可以根据用户查... 主要研究XML文档的并行数据分片策略,以便能够并行处理XML查询.为了描述XML数据分片,提出了媒介节点的概念.一组媒介节点的集合可以将一棵XML数据树分割成一棵根树和一组子树的集合:根树将在所有站点中复制;而子树集合则可以根据用户查询的工作负载被均匀地分片到各个站点中.对于同一棵XML数据树,会有很多种媒介节点的集合;而不同的媒介节点集合会产生不同的数据分片结果.然后,依据各个数据分片中的用户查询工作量是否均衡,来衡量一个分片的好坏.选择一组最佳的媒介节点集合是一个NP-hard问题.为了解决此问题,设计了一组启发式优化规则.基于这一思想,提出并实现了一种基于媒介节点的XML数据分片算法WIN(workload-awareintermediarynodesdataplacementstrategy).大量实验结果证明:WIN算法的性能要优于以往的并行XML数据分片策略. 展开更多
关键词 并行数据库 xml文档 工作负载 数据分片 媒介节点
下载PDF
基于XML结构相似性的名老中医病例聚类分析 被引量:7
8
作者 班晓娟 宁淑荣 +2 位作者 马骥 尹怡欣 张德政 《计算机应用研究》 CSCD 北大核心 2008年第2期365-367,共3页
针对名老中医病例的结构特点,设计了一种基于模拟退火的聚类算法对数据库中病例聚类进行全局优化。病例聚类时,根据一般意义的树间编辑距离,提出一种用于判断XML描述的病例之间是否相似的度量(称为XML编辑距离)。利用XML编辑距离,可将XM... 针对名老中医病例的结构特点,设计了一种基于模拟退火的聚类算法对数据库中病例聚类进行全局优化。病例聚类时,根据一般意义的树间编辑距离,提出一种用于判断XML描述的病例之间是否相似的度量(称为XML编辑距离)。利用XML编辑距离,可将XML数据间相似性度量的时间复杂度限制在多项式级,且能保持病例的XML描述文档的节点语义信息和节点间的祖孙嵌套关系。最后,在Tamino数据库上进行实验,结果证实了基于模拟退火的病例聚类算法在名老中医数据挖掘实践中的可行性和有效性。 展开更多
关键词 名老中医病例 可扩展标记语言描述文档 可扩展标记语言编辑距离 聚类算法 模拟退火算法
下载PDF
XML文档存取控制研究 被引量:9
9
作者 王德强 许峰 +1 位作者 茅兵 谢立 《计算机研究与发展》 EI CSCD 北大核心 2004年第3期426-435,共10页
提出了一种基于授权树的XML存取控制标记算法 ,通过①避免在每个XML结点上进行授权匹配 ;②避免在每个结点上进行授权冲突解决 ;③避免标记每个结点 ,有效地改善了处理性能 另外 ,提出了一种灵活的、用户可配置的授权冲突解决模式 。
关键词 xml XMI文档树 存取控制 授权冲突解决模式 授权树
下载PDF
XML文档架构与关系数据模型间的映射研究 被引量:10
10
作者 杨健 熊前兴 +1 位作者 陶强 唐国胜 《计算机工程与应用》 CSCD 北大核心 2004年第27期169-172,202,共5页
XML逐渐成为Internet上数据描述和交换的标准。随着Web上大量数据用XML文档表示出来,有必要对这些XML文档进行操纵管理。为了结合关系数据库系统强大的数据操纵能力,论文在对XML文档的逻辑结构进行简要介绍的基础上,就XML文档特别是结构... XML逐渐成为Internet上数据描述和交换的标准。随着Web上大量数据用XML文档表示出来,有必要对这些XML文档进行操纵管理。为了结合关系数据库系统强大的数据操纵能力,论文在对XML文档的逻辑结构进行简要介绍的基础上,就XML文档特别是结构化XML文档与关系数据模型数据之间的互动映射作了深入探讨,特别是在数据结构和数据完整性约束条件的映射关系上作了更深一层的研究,提出了一系列基于XML本身的映射规则。 展开更多
关键词 xml文档 关系数据模型 DTD 关系模式 映射
下载PDF
一种从XML数据中发现关系信息的方法 被引量:10
11
作者 吴扬扬 雷庆 +1 位作者 陈锻生 YOKOTA Harou 《软件学报》 EI CSCD 北大核心 2008年第6期1422-1427,共6页
提出了一种发现蕴藏在不同XML文档嵌套结构中的关系信息及其出现模式的新方法.可根据用户兴趣,发现描述不同实体之间联系的关系信息,抽取关系实例及其在文档中的出现模式.具体解决方案是:首先识别和收集包含用户感兴趣的实体的XML文档片... 提出了一种发现蕴藏在不同XML文档嵌套结构中的关系信息及其出现模式的新方法.可根据用户兴趣,发现描述不同实体之间联系的关系信息,抽取关系实例及其在文档中的出现模式.具体解决方案是:首先识别和收集包含用户感兴趣的实体的XML文档片段:然后根据文档片段标签的语义和文档片段的结构计算文档片段的相似度,并采用自适应阈值方法按相似度聚类文档片段.使得包含同一种关系的文档片段聚集在同一个片段簇:最后从XML文档片段簇中抽取关系实例及其出现模式.实验结果表明,对于包含有意义标签的各种XML文档,该方法能够准确地识别和抽取出描述指定实体之间联系的各种关系信息. 展开更多
关键词 关系信息 xml文档 相似度 聚类 出现模式
下载PDF
基于加权余弦相似度的XML文档聚类研究 被引量:10
12
作者 李巍 孙涛 +2 位作者 陈建孝 罗梓恒 李雄飞 《吉林大学学报(信息科学版)》 CAS 2010年第1期68-76,共9页
在实际应用中,XML(eXtensible Markup Language)文档中的一些结构经常被改变。为了挖掘XML文档在历史变化过程中经常改变的结构所蕴含的知识,提出了发现频繁变化结构的方法。该方法用一组频繁变化结构组成的文档向量模型代表一个XML文档... 在实际应用中,XML(eXtensible Markup Language)文档中的一些结构经常被改变。为了挖掘XML文档在历史变化过程中经常改变的结构所蕴含的知识,提出了发现频繁变化结构的方法。该方法用一组频繁变化结构组成的文档向量模型代表一个XML文档,将频繁变化结构在簇中的出现比例作为权值,使用加权余弦相似度对XML文档进行聚类。经过实验分析,根据XML文档历史变化过程中的频繁变化结构能较好地将XML文档进行聚类。用加权余弦相似度对XML文档进行聚类,其聚类结果的正确率、召回率和簇内部距离均优于使用非加权余弦相似度对XML文档进行聚类得到的结果。 展开更多
关键词 xml文档聚类 加权余弦相似度 频繁变化结构
下载PDF
基于Schema的XML索引方法研究 被引量:7
13
作者 邹为伟 宋余庆 +1 位作者 耿飙 梁成全 《计算机工程》 CAS CSCD 北大核心 2011年第6期74-76,84,共4页
针对XML文档路径查询中无效扫描量大、分支路径连接操作复杂等问题,提出一种基于Schema的XML索引方法。通过Schema与查询路径匹配,确定需要扫描的XML文档。利用编码方法减少结点连接次数。实验结果表明,该方法较已有索引方法有更高的查... 针对XML文档路径查询中无效扫描量大、分支路径连接操作复杂等问题,提出一种基于Schema的XML索引方法。通过Schema与查询路径匹配,确定需要扫描的XML文档。利用编码方法减少结点连接次数。实验结果表明,该方法较已有索引方法有更高的查询效率,具有较好的实用性及可扩展性。 展开更多
关键词 xml文档 Schema模式 xml索引 结点连接
下载PDF
网络化制造中XML文档结构模型与应用研究 被引量:12
14
作者 于庆梅 尹朝万 刘志刚 《计算机集成制造系统-CIMS》 EI CSCD 北大核心 2003年第7期601-607,共7页
针对网络化制造系统中分布式异构环境下产品协同设计制造数据结构化和非结构化的特点,提出了网络化制造中产品设计制造信息资源的XML统一描述,以及XML文档树结构的定义与模型,并将该模型应用于Web结构的产品异地协同设计制造系统,给出了... 针对网络化制造系统中分布式异构环境下产品协同设计制造数据结构化和非结构化的特点,提出了网络化制造中产品设计制造信息资源的XML统一描述,以及XML文档树结构的定义与模型,并将该模型应用于Web结构的产品异地协同设计制造系统,给出了XML样式化接口和映射接口的实现机制。以机加件类零件为例,给出产品文档树型结构模型的模板与映射接口的实例化,不仅实现了Web环境下的产品异地协同设计中信息资源的浏览与交互处理,而且通过数据映射接口,为远程机加件的在线加工后处理提供了有效的数据。 展开更多
关键词 xml 文档树模型 文档模式 网络化制造
下载PDF
针对XML流数据的复杂Twig Pattern查询处理 被引量:9
15
作者 杨卫东 王清明 施伯乐 《软件学报》 EI CSCD 北大核心 2007年第4期893-904,共12页
XML流数据处理在研究领域引起了研究者的广泛兴趣.针对XML流数据的、具有嵌套AND/OR谓词的复杂Twig Pattern查询处理,提出一种新方法.为了提高查询处理性能,将所有Twig Pattern合并为一个共享前缀的查询树,其中,AND/OR谓词被表示为单独... XML流数据处理在研究领域引起了研究者的广泛兴趣.针对XML流数据的、具有嵌套AND/OR谓词的复杂Twig Pattern查询处理,提出一种新方法.为了提高查询处理性能,将所有Twig Pattern合并为一个共享前缀的查询树,其中,AND/OR谓词被表示为单独的抽象语法树,因而能够以文档顺序、单遍地处理复杂Twig Pattern的匹配,并避免了YFilter中对嵌套谓词进行后置处理所产生的中间结果.实验结果表明,该方法能够有效改善Twig Pattern的处理性能,尤其是在处理大文档的情况下.基于已有的研究工作,讨论如何利用DTD(document type definition)的结构和约束信息优化Twig Pattern,即这种优化是在系统运行前进行的预处理. 展开更多
关键词 xml文档流 xPam TWIG PATTERN 查询树 DTD(document type definition)
下载PDF
BTCS:基于二叉遍历的XML文档编码模式 被引量:7
16
作者 肖厚新 唐常杰 +2 位作者 张婷 金朋纬 乔少杰 《四川大学学报(自然科学版)》 CAS CSCD 北大核心 2006年第3期532-537,共6页
XML文档数据的编码模式与索引技术决定了基于纯XML数据库的XML查询效率,在正则路径表达式实现方面有重要意义.基于树遍历的XML文档编码在更新与结构关系判断方面存在不足.为了解决此类问题,作者作了如下工作:(1)提出一种新的基于二叉树... XML文档数据的编码模式与索引技术决定了基于纯XML数据库的XML查询效率,在正则路径表达式实现方面有重要意义.基于树遍历的XML文档编码在更新与结构关系判断方面存在不足.为了解决此类问题,作者作了如下工作:(1)提出一种新的基于二叉树遍历的XML文档编码模式BTCS(Binary Traveling Coding Scheme);(2)实现了BTCS编码算法,支持XML文档更新,提高了编码更新效率;(3)在常数复杂度的时间内快速准确判断XML文档结构树中任意两个结点之间的父子以及祖孙关系,并能计算它们的辈数差(Distance of Genera-tions);(4)通过详细实验证明了BTCS编码模式的良好性能. 展开更多
关键词 xml xml文档结构树 xml编码模式 正则路径表达式 xml查询
下载PDF
基于两阶段查询重写的XML近似查询算法 被引量:6
17
作者 衡星辰 覃征 +2 位作者 邵利平 曹玉辉 高洪江 《电子学报》 EI CAS CSCD 北大核心 2007年第7期1271-1278,共8页
提出了基于两阶段查询重写的XML近似查询算法.该算法不仅能够返回精确查询结果,而且能够返回带有相似度分值的近似结果序列.首先,通过模式重写策略,将原始查询树改写为多种XML DTD(文档类型定义)下的重写查询树,从而解决了XML数据的多... 提出了基于两阶段查询重写的XML近似查询算法.该算法不仅能够返回精确查询结果,而且能够返回带有相似度分值的近似结果序列.首先,通过模式重写策略,将原始查询树改写为多种XML DTD(文档类型定义)下的重写查询树,从而解决了XML数据的多样性带来的查询语义缺失问题,接着,利用基本变异操作得到的变异查询树对XML数据树完成精确嵌入,可将XML近似查询的问题转变为多棵变异查询树的精确查询问题,并给出了基于XML数据统计的相似度计算模型和Top-K问题求解的优化算法.最后,在汽车外形智能化设计的实验中表明该算法优于SSO算法. 展开更多
关键词 xml近似查询 基本变异操作 变异查询树 模式重写 异质xml文档
下载PDF
基于链式结构XML文档的生成方法 被引量:5
18
作者 陈再良 徐德智 +1 位作者 陈学工 沈海澜 《计算机工程》 EI CAS CSCD 北大核心 2006年第20期59-61,共3页
提出了一种基于链式结构的XML文档生成方法,设计了一个利用Java中的streamtokenizer类实现HTML文档解析的算法,将解析得到的元素内容及文本内容生成的结点插入到相应的位置上,同步生成DOM解析树,对DOM解析树进行遍历,将遍历得到的信息... 提出了一种基于链式结构的XML文档生成方法,设计了一个利用Java中的streamtokenizer类实现HTML文档解析的算法,将解析得到的元素内容及文本内容生成的结点插入到相应的位置上,同步生成DOM解析树,对DOM解析树进行遍历,将遍历得到的信息以二叉链表的形式存储,采用改进的先根遍历算法对该二叉链表遍历,提取相应的信息构建DTD,完成整个转换生成的过程。 展开更多
关键词 HTML xml DOM 解析
下载PDF
XML文档到关系数据库的转换研究 被引量:7
19
作者 朱珊娜 李书琴 安福定 《计算机工程与设计》 CSCD 北大核心 2008年第21期5507-5509,5571,共4页
XML作为网络数据交换的标准技术,广泛应用于计算机软件。目前存储数据的主流手段是关系数据库,因此XML文档与关系数据库之间必须进行转换。通过分析XML文档的层次结构,建立了XML文档树模型,并给出结点定义。依据XML的BNF规则给出了元素... XML作为网络数据交换的标准技术,广泛应用于计算机软件。目前存储数据的主流手段是关系数据库,因此XML文档与关系数据库之间必须进行转换。通过分析XML文档的层次结构,建立了XML文档树模型,并给出结点定义。依据XML的BNF规则给出了元素与属性的正规表达式和相对应的状态转换图,设计了识别元素和属性的词法分析程序用于解析XML文档。提出了XML文档树到关系数据库存储的转换思想和算法,并结合实例给出转换后的关系表。 展开更多
关键词 xml文档 xml数据存储 关系数据库 xml解析 模型转换
下载PDF
基于关系数据库的XML数据管理 被引量:16
20
作者 万常选 刘云生 《计算机科学》 CSCD 北大核心 2003年第8期64-68,72,共6页
Currently,there are a great of research topics that focus on storing and querying XML data in an RDBMS,and publishing relational data as XML documents,and querying XML views of relational data. An overview of XMLdata ... Currently,there are a great of research topics that focus on storing and querying XML data in an RDBMS,and publishing relational data as XML documents,and querying XML views of relational data. An overview of XMLdata management based on RDBMS is given in this paper. Some existing technologies of storing and querying XMLdata in relational databases ,publishing relational data as XML documents,and querying XML views of relational dataare sufficiently surveyed ,their advantages ,disadvantages ,and causes are analyzed. 展开更多
关键词 关系数据库 xml 数据管理 数据表示 数据交换 应用程序
下载PDF
上一页 1 2 25 下一页 到第
使用帮助 返回顶部