摘要
给出了兴趣子空间的定义,采用基于Chernoff-Hoeffding边界,带回溯的深度优先搜索算法来挖掘最大兴趣子空间,并运用高维真实数据和合成数据检验算法的有效性。高维数据的挖掘面临着数据分布的稀疏性和特征空间的相交性所带来的挑战。
Based on Chemoff-Hoeffding bound, this paper adopts a novel mining algorithm of depth-first search with backtracking to mine interesting subspace, and testfies the effectiveness by using synthetic and real data. High-dimensional data mining faces the challengers of distributed data sparsity and overlapping feature subspace.
出处
《计算机工程》
CAS
CSCD
北大核心
2007年第2期12-14,17,共4页
Computer Engineering
基金
国家"863"计划基金资助项目(2002AA4Z3430)
广西大学基金资助项目
关键词
兴趣子空间
高维数据
聚类
数据挖掘
interesting subspace
High-dimensional data
Clustering
Data mining