-
题名基于奇异值分解的异常切片挖掘
被引量:6
- 1
-
-
作者
遇辉
马秀莉
谭少华
唐世渭
杨冬青
-
机构
北京大学信息科学技术学院
-
出处
《软件学报》
EI
CSCD
北大核心
2005年第7期1282-1288,共7页
-
基金
国家自然科学基金Nos.60473051
60473072~~
-
文摘
切片操作是联机分析处理的主要功能之一,在决策支持应用中发挥着重要作用.由于人工的切片过程非常低效,且易忽略重要信息,提出了一种自动、智能的异常切片挖掘方法.该方法基于奇异值分解技术来提取切片的数据分布特征,然后在提取出的奇异值特征之上,利用基于距离的孤立点检测技术发现异常的切片.在人工生成的数据和实际应用的切片数据上所作的实验结果都表明了该方法的高效性和可行性.
-
关键词
异常切片挖掘
特征提取
奇异值特征向量
基于距离的孤立点检测
联机分析处理
-
Keywords
Decision support systems
Decomposition
Feature extraction
Processing
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于立方体计算的关键梯度分析
- 2
-
-
作者
遇辉
唐世渭
杨冬青
李囡
-
机构
北京大学信息科学技术学院
-
出处
《计算机科学》
CSCD
北大核心
2005年第9期96-99,107,共5页
-
基金
国家自然科学基金(60473072)
国家自然科学基金(60473051)
-
文摘
梯度分析是数据合库和联机分析处理中的一项重要分析任务,在决策支持中发挥着重要作用。本文根据实际应用的需要,提出了一种新颖的关键梯度分析方法。借助立方体计算中的计数排序和分割策略,通过扩展补充路径,并利用插入排序方法,实现了高效的关键梯度分析算法。在模拟数据上进行了大量的实验,结果证明了算法的高效性和实用性。
-
关键词
关键梯度
梯度分析
立方体计算
数据仓库
联机分析处理
-
Keywords
Significant gradients, Gradient analysis, Cube computation, Data warehousing, Online analytical processing
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名异常分布驱动的数据立方体导航方法
- 3
-
-
作者
遇辉
唐世渭
杨冬青
马秀莉
-
机构
北京大学信息科学技术学院
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2006年第3期516-521,共6页
-
基金
国家自然科学基金项目(60473051
60473072)~~
-
文摘
在基于多维数据的分析中,分析人员面对的经常是庞大的数据立方体.联机分析处理虽然提供了灵活的展现和分析功能,却只能进行假设驱动的探查,很容易忽略重要信息.而已有的发现驱动的探查是基于局部异常的导航,容易受数据噪声的干扰.针对这些问题,提出了一种新的导航方法——异常分布驱动的导航.这是一种有效的辅助探查数据立方体的方法,可以循序渐进地引导用户至信息量大的数据部分.它将维和维成员作为探查数据立方体的脉络,基于数据分布特征为各个维和所有维成员计算奇异度,作为用户探查数据立方体的导航符.实验结果表明此导航方法是实用有效的.
-
关键词
多维数据分析
特征提取
立方体导航
联机分析处理
-
Keywords
multidimensional data analysis
feature extraction
cube navigation
OLAP (on-line analytical processing)
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-