-
题名基于低阶近似的多维数据流相关性分析
被引量:12
- 1
-
-
作者
王永利
徐宏炳
董逸生
钱江波
刘学军
-
机构
东南大学计算机科学与工程系
-
出处
《电子学报》
EI
CAS
CSCD
北大核心
2006年第2期293-300,共8页
-
基金
江苏省2004年度研究生创新计划项目(No.xm04-36)
江苏省高技术项目(No.BG2004034)
-
文摘
目前存在的多数据流相关性分析方法大多只针对于单属性维数据流,无法体现多变量组成的场与场之间真实的相关性.为了在资源受限的环境下快速检测多维数据流之间的相关性,本文提出一种新颖的基于典型相关性分析(CCA)的多维数据流相关性分析算法S treamCCA,针对传统的CCA计算中的性能瓶颈,提出为样本方差阵与协差阵组成的乘积阵降维的高效低价近似方法,在保持分析精度的前提下显著地提高了计算效率.经理论分析和实验证明,S treamCCA能够在线精确地识别两条多维数据流的相关关系,可以作为通用的预报和诊断分析工具广泛应用于数据流挖掘领域.
-
关键词
数据流
典型相关性分析
低阶近似
不等概采样
数据流挖掘
-
Keywords
data streams
canonical correlation analysis
low-rank approximation
non-equal probability sampiing
data streams mining
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名高维数据流的在线相关性分析
被引量:9
- 2
-
-
作者
杨雪梅
董逸生
徐宏炳
刘学军
钱江波
王永利
-
机构
东南大学计算机科学与工程学院
福建中医学院信息管理研究所福州
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2006年第10期1744-1750,共7页
-
基金
江苏省高技术基金项目(BG2004034)
江苏省研究生创新计划基金项目(xm04-36)~~
-
文摘
为了解决在资源受限的计算环境下快速检测高维数据流之间相关性的问题,提出一种新颖的在线典型相关性分析(CCA)算法QuickCCA,针对传统CCA计算中的性能瓶颈,首先采用不等概列采样技术约减流元组的数量,形成概要矩阵;然后在概要矩阵的基础上增量地计算多维数据流之间的前k个典型相关系数.经理论分析和实验证明,QuickCCA能够在线精确地识别同步滑动窗口模式下多维数据流之间的相关性.与已有分析多数据流相关性的算法相比,QuickCCA显著地降低了计算复杂度,并且能够在精度和性能之间折中,可以作为通用的分析工具广泛应用于数据流挖掘领域.
-
关键词
数据流
典型相关性分析
不等概采样
近似
资源受限
-
Keywords
data stream
canonical correlation analysis
non-equal probability sampling
approximation
constrained resources
-
分类号
TP311.138
[自动化与计算机技术—计算机软件与理论]
-