期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
基于划分和压缩数据库的改进Apriori算法 被引量:11
1
作者 胡绿慧 任玉兰 何振林 《成都理工大学学报(自然科学版)》 CAS CSCD 北大核心 2015年第1期110-114,共5页
针对Apriori算法在面对大规模数据时效率较低的问题,提出了一种基于划分和压缩数据库的改进方法。该方法首先依据特征数据出现的频率将数据按照升序存储在临时数组中;然后将原始事务数据库分为几个互不相交的事务数据库,使得子数据库能... 针对Apriori算法在面对大规模数据时效率较低的问题,提出了一种基于划分和压缩数据库的改进方法。该方法首先依据特征数据出现的频率将数据按照升序存储在临时数组中;然后将原始事务数据库分为几个互不相交的事务数据库,使得子数据库能够容纳在内存中;最后根据每个子数据库计算出的频繁项集计算整个数据库的频繁项集,从而消除了不必要的冗余数据。通过改进可以将大规模数据集进行有效的划分和压缩,对子数据库进行关联规则挖掘。实验结果表明,改进的Apriori算法在针对海量数据挖掘的执行速度和效率都有很大提高。 展开更多
关键词 数据挖掘 关联规则 压缩数据库
下载PDF
压缩数据库中一种自适应直方图的构建 被引量:3
2
作者 骆吉洲 李建中 王宏志 《软件学报》 EI CSCD 北大核心 2009年第7期1785-1799,共15页
直方图在查询优化过程中起着重要作用.在压缩数据库中利用查询处理的特点构建自适应直方图以便于查询优化或近似回答查询是尚待解决的问题.通过对查询缓冲池内的查询进行调度来追踪热点数据,并用查询结果中的反馈信息构建自适应直方图... 直方图在查询优化过程中起着重要作用.在压缩数据库中利用查询处理的特点构建自适应直方图以便于查询优化或近似回答查询是尚待解决的问题.通过对查询缓冲池内的查询进行调度来追踪热点数据,并用查询结果中的反馈信息构建自适应直方图以加快自适应直方图的收敛速度.另外,还提出一种参数化方法来估计未被任何桶覆盖的区域中元组的个数.该直方图可以增量式地被维护.实验结果表明,这种直方图具有良好的平均精度、更快的收敛速度和更强的自适应能力. 展开更多
关键词 自适应直方图 压缩数据库 参数化方法 收敛速度
下载PDF
压缩数据库中大规模电子信息缓存优化方法 被引量:3
3
作者 孙志勇 《电子设计工程》 2020年第7期95-98,103,共5页
针对现有的压缩数据库中大规模电子信息缓存优化方法存在着缓存效率低、鲁棒性差的缺陷,提出压缩数据库中大规模电子信息缓存优化方法。引入Redis工具搭建大规模电子信息缓存框架,对电子信息的缓存进行优化,对压缩数据库中大规模电子信... 针对现有的压缩数据库中大规模电子信息缓存优化方法存在着缓存效率低、鲁棒性差的缺陷,提出压缩数据库中大规模电子信息缓存优化方法。引入Redis工具搭建大规模电子信息缓存框架,对电子信息的缓存进行优化,对压缩数据库中大规模电子信息缓存路径进行分析,以路径分析结果为依据,构建排队论模型,对大规模电子信息缓存配置进行最优化求解,实现了大规模电子信息的缓存优化。通过测试结果得出,与现有的缓存方法相比,所提的缓存优化方法大幅度提升了缓存效率与鲁棒性,充分说明所提方法具备更好的缓存效果。 展开更多
关键词 压缩数据库 大规模 电子信息 缓存 优化
下载PDF
XML压缩数据库的查询优化
4
作者 刘胜军 仇恒祥 王富海 《电子技术与软件工程》 2017年第6期151-151,共1页
本文首先在ETA代数中引入解压缩操作,将原代数扩展到XML压缩数据库领域。提出了一个新的基于代价估计的查询优化算法,该算法采用动态编程技术,对三种解压缩策略皆适用。
关键词 XML数据库 压缩数据库 查询优化 瞬时解压缩
下载PDF
一种有效的关系数据库压缩方法 被引量:7
5
作者 骆吉洲 李建中 《软件学报》 EI CSCD 北大核心 2005年第2期205-214,共10页
海量关系中经常存在小值域属性,关系不仅在这些属性上的互不相同的值的数量很小,而且在这些属性的组合上的值域也很小.因此,海量关系在这些属性上有很多重复的组合值.一种提高数据库的存储和查询效率的重要方法就是消除这些重复取值.为... 海量关系中经常存在小值域属性,关系不仅在这些属性上的互不相同的值的数量很小,而且在这些属性的组合上的值域也很小.因此,海量关系在这些属性上有很多重复的组合值.一种提高数据库的存储和查询效率的重要方法就是消除这些重复取值.为此,提出了拆分压缩技术,它将海量关系拆分成两种较小的关系,其中一种关系的属性由小值域属性组组成,而另一种关系的属性是海量关系的其他属性.该方法的关键是小值域属性っ髁苏飧鑫侍獾?NP-完全性后,给出了两种在海量关系中识别小值域属性组合的算法,并在此基础上提出了海量关系拆分压缩技术,讨论了压缩关系的查询处理方法.实验结果表明,拆分压缩技术可以取得较好的压缩效果,并可以提高数据库查询处理的整体性能. 展开更多
关键词 海量关系 压缩数据库 小值域属性组 NP-完全问题
下载PDF
面向相似数据集的关系数据库压缩
6
作者 邓文平 朱培栋 卢锡城 《计算机工程》 CAS CSCD 北大核心 2007年第14期69-70,85,共3页
采用关系数据库模型进行建模,对于同一关系框架上的数据定义了相似数据集。对单个数据集,通过关系拆分对数据库模型进行规范化处理,去除了关系内部的数据冗余;对多个数据集之间的压缩提出了一种基于0-1状态标记序列的增量式无损压缩算法... 采用关系数据库模型进行建模,对于同一关系框架上的数据定义了相似数据集。对单个数据集,通过关系拆分对数据库模型进行规范化处理,去除了关系内部的数据冗余;对多个数据集之间的压缩提出了一种基于0-1状态标记序列的增量式无损压缩算法,压缩后的数据可以快速地完全解压缩。试验结果表明,算法可以实现对相似数据集的高效无损压缩和快速查询。 展开更多
关键词 数据库压缩 冗余度 相似数据 无损压缩 压缩
下载PDF
一种对数据库进行压缩的关联规则挖掘算法
7
作者 赵伟 《科技广场》 2005年第10期8-12,共5页
关联规则挖掘算法为了发现事先未知的关联规则,需要用高效的方法计算出数据库中的大项目集。影响数据挖掘效率的两个因素,一个是数据库大小,另一个是算法的效率。本文算法通过将数据库进行高度压缩,使数据库中的数据量大大减少,同时算... 关联规则挖掘算法为了发现事先未知的关联规则,需要用高效的方法计算出数据库中的大项目集。影响数据挖掘效率的两个因素,一个是数据库大小,另一个是算法的效率。本文算法通过将数据库进行高度压缩,使数据库中的数据量大大减少,同时算法采用逻辑运算方法计算项集的支持数,计算效率较高。 展开更多
关键词 数据挖掘 关联规则 大项目集 数据库压缩
下载PDF
基于谓词索引的海量数据压缩存储及数据操作算法 被引量:3
8
作者 赵锴 李建中 骆吉洲 《计算机科学》 CSCD 北大核心 2005年第9期86-90,159,共6页
压缩数据库技术是海量数据管理的重要技术之一。利用海量数据自身及其数据操作的特点,提出了一种海量数据压缩存储结构。该存储结构将第二级和第三级存储器结合起来,以数据操作条件中的谓词为索引,在减少存储空间的同时有效地支持查询... 压缩数据库技术是海量数据管理的重要技术之一。利用海量数据自身及其数据操作的特点,提出了一种海量数据压缩存储结构。该存储结构将第二级和第三级存储器结合起来,以数据操作条件中的谓词为索引,在减少存储空间的同时有效地支持查询、删除和更新等数据操作。理论分析和实验结果表明,这种存储结构可以提高海量数据的存储效率和数据操作的性能。 展开更多
关键词 谓词索引 压缩数据库 海量数据管理 存储结构 存储效率
下载PDF
一种简单压缩技术在数据库中的应用
9
作者 徐衍波 陈维明 《科研信息化技术与应用》 2009年第1期14-19,共6页
检索记录数达数百万以上的化合物名称或文献数据库时,全文检索效率将变得很低。本文介绍了一种可实现数据库内容压缩的词语替换技术,有效地减小了全文索引的大小,并在一定程度上提高了全文检索的效率。
关键词 全文检索 数据库压缩 词语替换
原文传递
飞机油箱燃油量体积特性计算与油量测量仿真 被引量:13
10
作者 苏三买 常伟 王卉 《计算机测量与控制》 CSCD 北大核心 2011年第9期2091-2094,共4页
飞机油箱体积特性数据库是油量测量计算的基础,直接影响油量测量的精度;针对目前将油箱模型离散化为有限规则单元,再进行叠加计算燃油体积方法存在的通用性差与精度低的不足,文章根据飞机油量传感器测量高度、飞行姿态以及三轴加速度信... 飞机油箱体积特性数据库是油量测量计算的基础,直接影响油量测量的精度;针对目前将油箱模型离散化为有限规则单元,再进行叠加计算燃油体积方法存在的通用性差与精度低的不足,文章根据飞机油量传感器测量高度、飞行姿态以及三轴加速度信息,确定出油平面,并以此作为分割平面,通过CATIA二次开发实现油箱燃油体积特性数据库自动生成;根据特性数据库的特点与机载数据要求,采用后向试探法对数据库进行压缩与优化;模拟飞机油量测量过程,设计油量测量仿真软件,仿真结果表明;油量计算的相对误差小于1%,按所采用方法计算的数据库能达到工程要求。 展开更多
关键词 飞机油量测量 体积特性数据库 CATIA二次开发 数据库压缩与优化 油量测量仿真
下载PDF
基于选择标准的Apriori算法改进
11
作者 马良斋 姜滨 摆慧娟 《河西学院学报》 2016年第2期82-84,96,共4页
关联规则挖掘通过发现密切相关项集的方法已经在商业决策中被广泛使用.现针对关联规则挖掘的经典算法Apriori需要重复多次扫描整个数据库导致在空间和时间方面有很大负载的问题,提出了根据研究者所感兴趣的项集作为关联规则的结果,采用... 关联规则挖掘通过发现密切相关项集的方法已经在商业决策中被广泛使用.现针对关联规则挖掘的经典算法Apriori需要重复多次扫描整个数据库导致在空间和时间方面有很大负载的问题,提出了根据研究者所感兴趣的项集作为关联规则的结果,采用对数据库进行类标签压缩来减少迭代次数.通过实验显示该方法可以有效提高Apriori算法的效率. 展开更多
关键词 数据挖掘 关联规则 数据库压缩 APRIORI算法 ARM
下载PDF
使用ILASⅡ系统的经验点滴 被引量:1
12
作者 贾英阁 《中小学图书情报世界》 2004年第4期43-44,共2页
图书馆自动化集成系统(ILAS)是文化部于1988年作为国家重点科技项目下达,由深圳图书馆承担并组织开发出来的一套能适应国内外不同层次、多种规模、各种类型图书馆使用的图书馆自动化集成系统。该系统是在NUIX操作系统环境下,采用图书... 图书馆自动化集成系统(ILAS)是文化部于1988年作为国家重点科技项目下达,由深圳图书馆承担并组织开发出来的一套能适应国内外不同层次、多种规模、各种类型图书馆使用的图书馆自动化集成系统。该系统是在NUIX操作系统环境下,采用图书馆专用数据库管理系统IDBMS平台。 展开更多
关键词 图书馆自动化集成系统 ILASⅡ 统计表格 格式设计 种次号数据库 数据库维护 批号验收 数据备份 数据库压缩
下载PDF
化纤纺丝生产报表的实现
13
作者 魏成广 《纺织机械》 2013年第3期43-45,共3页
介绍了Wincc V6.0和Microsoft Excel联合实现在化纤生产中生成报表的方法。由于人们对Microsoft Excel办公软件都很熟悉,而且操作简单,所以采用它实现生产报表。主要利用Wincc V6.0的归档数据库、数据库接口ADO/OLE-DB和Microsoft Exce... 介绍了Wincc V6.0和Microsoft Excel联合实现在化纤生产中生成报表的方法。由于人们对Microsoft Excel办公软件都很熟悉,而且操作简单,所以采用它实现生产报表。主要利用Wincc V6.0的归档数据库、数据库接口ADO/OLE-DB和Microsoft Excel的宏等关键技术,实现Microsoft Excel从运行中的数据库服务器读取归档变量并处理。 展开更多
关键词 WinccV6 0 数据库接口 ADO OLE-DB 压缩数据库 变量归档
下载PDF
用于OTDR的上位机软件设计 被引量:1
14
作者 朱健琪 于振生 《电子测量技术》 2006年第6期150-152,共3页
本文介绍了OTDR仪器的配套上位机操作软件Toolbox的设计理念和实现方法。利用一套协议机制来实现软件与仪器之间的正常通信,针对软件在进行数据库操作时引起的文件冗余和低效问题,本文提出了一种数据库压缩方法,大大改进了软件对数据库... 本文介绍了OTDR仪器的配套上位机操作软件Toolbox的设计理念和实现方法。利用一套协议机制来实现软件与仪器之间的正常通信,针对软件在进行数据库操作时引起的文件冗余和低效问题,本文提出了一种数据库压缩方法,大大改进了软件对数据库操作的效率。该软件在PC平台上实现了OTDR的部分功能,并扩展了手持OTDR的功能和用途,对指导仪器的研发和配合大规模生产也有其现实意义。 展开更多
关键词 OTDR 通信协议 数据库压缩
下载PDF
Automatic relational database compression scheme design based on swarm evolution 被引量:1
15
作者 HU Tian-lei CHEN Gang +1 位作者 LI Xiao-yan DONG Jin-xiang 《Journal of Zhejiang University-Science A(Applied Physics & Engineering)》 SCIE EI CAS CSCD 2006年第10期1642-1651,共10页
Compression is an intuitive way to boost the performance of a database system. However, compared with other physical database design techniques, compression consumes large amount of CPU power. There is a trade-off bet... Compression is an intuitive way to boost the performance of a database system. However, compared with other physical database design techniques, compression consumes large amount of CPU power. There is a trade-off between the re- duction of disk access and the overhead of CPU processing. Automatic design and adaptive administration of database systems are widely demanded, and the automatic selection of compression schema to compromise the trade-off is very important. In this paper, we present a model with novel techniques to integrate a rapidly convergent agent-based evolution framework, i.e. the SWAF (SWarm Algorithm Framework), into adaptive attribute compression for relational database. The model evolutionally consults statistics of CPU load and IO bandwidth to select compression schemas considering both aspects of the trade-off. We have im- plemented a prototype model on Oscar RDBMS with experiments highlighting the correctness and efficiency of our techniques. 展开更多
关键词 Database compression Automatic physical database design Swarm evolution
下载PDF
Construction and compression of Dwarf 被引量:1
16
作者 向隆刚 冯玉才 桂浩 《Journal of Zhejiang University-Science A(Applied Physics & Engineering)》 SCIE EI CAS CSCD 2005年第6期519-527,共9页
There exists an inherent difficulty in the original algorithm for the construction of Dwarf, which prevents it from constructing true Dwarfs. We explained when and why it introduces suffix redundancies into the Dwarf ... There exists an inherent difficulty in the original algorithm for the construction of Dwarf, which prevents it from constructing true Dwarfs. We explained when and why it introduces suffix redundancies into the Dwarf structure. To solve this problem, we proposed a completely new algorithm called PID. It bottom-up computes partitions of a fact table, and inserts them into the Dwarf structure. If a partition is an MSV partition, coalesce its sub-Dwarf; otherwise create necessary nodes and cells. Our performance study showed that PID is efficient. For further condensing of Dwarf, we proposed Condensed Dwarf, a more com- pressed structure, combining the strength of Dwarf and Condensed Cube. By eliminating unnecessary stores of “ALL” cells from the Dwarf structure, Condensed Dwarf could effectively reduce the size of Dwarf, especially for Dwarfs of the real world, which was illustrated by our experiments. Its query processing is still simple and, only two minor modifications to PID are required for the construction of Condensed Dwarf. 展开更多
关键词 Data cube DWARF Suffix coalescing Prefix path MSV partition Condensed Dwarf
下载PDF
详单查询遇鲜招儿
17
作者 颜军 《微电脑世界》 2004年第12期104-105,共2页
作为中国电信某分公司的IT主管,如何让IT为用户服务并带来增值效益,是笔者经常考虑的一个问题。当前我们面临的一个巨大压力是大量本地市话资料历史清单的详单查询要求,但因复杂度和高成本我们一直没能把这件事做成功。Data... 作为中国电信某分公司的IT主管,如何让IT为用户服务并带来增值效益,是笔者经常考虑的一个问题。当前我们面临的一个巨大压力是大量本地市话资料历史清单的详单查询要求,但因复杂度和高成本我们一直没能把这件事做成功。Datainside的出现,帮助我们从存储角度解决了这一难题。现在,笔者就谈谈我们是如何做的。 展开更多
关键词 详单查询 查询系统 Datainside技术 数据库压缩 电信 采集性能
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部