现有的重复数据删除技术大部分是基于变长分块(content defined chunking,CDC)算法的,不考虑不同文件类型的内容特征.这种方法以一种随机的方式确定分块边界并应用于所有文件类型,已经证明其非常适合于文本和简单内容,而不适合非结构化...现有的重复数据删除技术大部分是基于变长分块(content defined chunking,CDC)算法的,不考虑不同文件类型的内容特征.这种方法以一种随机的方式确定分块边界并应用于所有文件类型,已经证明其非常适合于文本和简单内容,而不适合非结构化数据构成的复合文件.分析了OpenXML标准的复合文件属性,给出了对象提取的基本方法,并提出基于对象分布和对象结构的去重粒度确定算法.目的是对于非结构化数据构成的复合文件,有效地检测不同文件中和同一文件不同位置的相同对象,在文件物理布局改变时也能够有效去重.通过对典型的非结构化数据集合的模拟实验表明,在综合情况下,对象重复数据删除比CDC方法提高了10%左右的非结构化数据的去重率.展开更多
填报型报表是Web报表的常见形式,本文分析目前Web填报报表的格式、逻辑等报表特性,从元模型建模方法的角度来研究Web报表的格式和逻辑建模方法,给出格式元模型和逻辑元模型中关键部分的形式化语言定义。文章结合Microsoft Open XML技术...填报型报表是Web报表的常见形式,本文分析目前Web填报报表的格式、逻辑等报表特性,从元模型建模方法的角度来研究Web报表的格式和逻辑建模方法,给出格式元模型和逻辑元模型中关键部分的形式化语言定义。文章结合Microsoft Open XML技术,提出Web报表整体实现框架,并就其应用进行示范性介绍。展开更多
介绍了XML的概念,以及在SQL Server 2000中,使用SELECT语句可以把查询结果存储为XML文档,使用OPENXML语句提供了在关系数据库表中存储XML文档的功能.分析了XML和SQL Server 2000数据交换的几种方式,并实际实现了SQL Server 2000和XML之...介绍了XML的概念,以及在SQL Server 2000中,使用SELECT语句可以把查询结果存储为XML文档,使用OPENXML语句提供了在关系数据库表中存储XML文档的功能.分析了XML和SQL Server 2000数据交换的几种方式,并实际实现了SQL Server 2000和XML之间的数据转换.展开更多
通过使用存储过程实现了数据在XML和SQL Server 2000之间的相互转换。使用C#程序先将嵌套的XML文件的数据插入数据库中,接着将数据库中的数据取出来保存在XML文件中。操作过程中不仅保持了数据的正确性,而且保持了XML文件的样式。使用...通过使用存储过程实现了数据在XML和SQL Server 2000之间的相互转换。使用C#程序先将嵌套的XML文件的数据插入数据库中,接着将数据库中的数据取出来保存在XML文件中。操作过程中不仅保持了数据的正确性,而且保持了XML文件的样式。使用存储过程可以大大简化程序的规模和对数据库的操作。展开更多
文摘现有的重复数据删除技术大部分是基于变长分块(content defined chunking,CDC)算法的,不考虑不同文件类型的内容特征.这种方法以一种随机的方式确定分块边界并应用于所有文件类型,已经证明其非常适合于文本和简单内容,而不适合非结构化数据构成的复合文件.分析了OpenXML标准的复合文件属性,给出了对象提取的基本方法,并提出基于对象分布和对象结构的去重粒度确定算法.目的是对于非结构化数据构成的复合文件,有效地检测不同文件中和同一文件不同位置的相同对象,在文件物理布局改变时也能够有效去重.通过对典型的非结构化数据集合的模拟实验表明,在综合情况下,对象重复数据删除比CDC方法提高了10%左右的非结构化数据的去重率.
文摘填报型报表是Web报表的常见形式,本文分析目前Web填报报表的格式、逻辑等报表特性,从元模型建模方法的角度来研究Web报表的格式和逻辑建模方法,给出格式元模型和逻辑元模型中关键部分的形式化语言定义。文章结合Microsoft Open XML技术,提出Web报表整体实现框架,并就其应用进行示范性介绍。
文摘介绍了XML的概念,以及在SQL Server 2000中,使用SELECT语句可以把查询结果存储为XML文档,使用OPENXML语句提供了在关系数据库表中存储XML文档的功能.分析了XML和SQL Server 2000数据交换的几种方式,并实际实现了SQL Server 2000和XML之间的数据转换.