-
题名数据仓库中CUBE大小估计算法
被引量:2
- 1
-
-
作者
刘宁
宋晔
-
机构
北京理工大学计算机科学工程系
-
出处
《计算机工程与应用》
CSCD
北大核心
2004年第4期193-194,215,共3页
-
基金
用友软件合作项目
-
文摘
文章叙述了数据仓库中Cube估计的三个相关算法,提出了一种优化的估计方法。这种新的优化方法在一定程度上弥补了常用估计方法的缺陷,大大提高了估计值的准确性。Cube的大小估计对于数据仓库进行多维分析是非常重要的。原因是为了提高多维分析的查询速度,要进行一定程度的预计算,这种计算是相当复杂的,而且会占用大量数据库的存储空间,因此预先估计出所需空间大小是非常必要的。
-
关键词
数据仓库
cube
大小估计
-
Keywords
data warehouse,cube,storage's estimation
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于抽样的Cube占用空间预测算法
- 2
-
-
作者
张季
周立柱
蒋旭东
冯建华
-
机构
清华大学计算机科学与技术系
-
出处
《计算机工程与应用》
CSCD
北大核心
2001年第24期104-107,共4页
-
基金
国家973重点基础研究发展项目资助(编号:g1998030414)
-
文摘
在数据仓库的设计中实物化视图的选择有赖于对cube占用存储空间大小的预测,然而传统的基于数据均匀分布的抽样预测算法不能准确地估计cube的大小。文章介绍了一种利用抽样原理预测cube大小的算法,这种算法能够自适应不同程度的数据倾斜,特别适用于数据倾斜程度较大的情况。实验数据表明,该算法对传统的抽样预测算法有明显的改进效果。
-
关键词
cube
数据倾斜
数据仓库
联机分析处理
数据库
空间预测算法
-
Keywords
Sampling,Storage estimation,cube,data bias,data warehouse,Materialized View,On-line Analytical Pro-cessing(OLAP)
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名一种数据仓库数据立方体空间采样估计策略
被引量:2
- 3
-
-
作者
林友芳
李红松
黄厚宽
-
机构
北方交通大学计算机科学与技术系
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2002年第11期1519-1525,共7页
-
基金
铁道部科技研究开发项目基金资助 ( 2 0 0 0 X0 30 -A
2 0 0 1X0 2 2 )
-
文摘
对数据仓库多维视图进行容量估计是数据立方体设计、数据仓库存储规划和实施查询优化的基础 .首先以统计理论为基础 ,提出了一种基于采样的数据仓库数据立方体空间估计策略 .该策略针对不同类型的多维视图 ,对样本统计结果采用不同的空间放大策略 ,确保了估计结果具有较高的准确性 .同时 ,该策略在最大估计的基础上采用一些启发式规则 ,对估计视图集进行有效的约简 ,并在估计过程中采用了样本视图预物化思想 ,根据预物化视图集生成优化的立方体空间估计序列 ,从而大幅缩短了整体估计时间 .
-
关键词
数据仓库
数据立方体
多维视图
视图空间估计
采样
数据库
-
Keywords
data warehouse, data cube, multidimensional view, view size estimation, sampling
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名用于多维数据实视图选择的分布估计算法
被引量:4
- 4
-
-
作者
陈佳
李敏
-
机构
武汉纺织大学数学与计算机学院
-
出处
《计算机工程》
CAS
CSCD
2012年第11期45-47,共3页
-
基金
湖北省教育厅中青年科技基金资助项目(20111613)
-
文摘
在数据仓库中,为选择合适的视图加以实体化,提出一种新的分布估计算法。在解空间随机产生初始群体,根据适应值选择部分好的解集,利用这些优势群体建立概率模型并估计联合概率分布,再从新的概率分布中抽样得到下一代。实验结果表明,该算法能减少查询响应时间和视图维护代价,并且其寻优性能优于经典遗传算法。
-
关键词
立方体
分布估计算法
数据仓库
联机分析处理
视图选择
-
Keywords
cube
estimation of Distribution Algorithm(EDA)
data warehouse
On Line Analytical Processing(OLAP)
view selection
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-