-
题名一种适合于科学数据的聚类算法
被引量:3
- 1
-
-
作者
李欣宇
傅彦
-
机构
电子科技大学计算机学院
-
出处
《成都信息工程学院学报》
2006年第3期327-330,共4页
-
基金
国家自然科学基金资助项目(10476006)
-
文摘
聚类是科学数据挖掘中的核心问题。在已提出的聚类算法中大都是基于“距离”的概念,这类算法的缺点在于处理数据量大和维数高的科学数据时不够有效,因此提出迭代网格算法。这个算法与基于距离的损法有根本不同,它抛弃了距离的概念,而采取一种新的思路。它不仅能够自动发现包含有趣知识的子空间,并将里面存在的所有聚类挖掘出来;而且它能很好的处理维数高和数据量大的科学数据。
-
关键词
科学数据挖掘
聚类分析
网格
密度
高维数据
-
Keywords
scientific data mining
cluster analysis
grid
density
high-dimension data
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名用ICA提取高维科学数据的特征
被引量:3
- 2
-
-
作者
聂琨坤
傅彦
-
机构
电子科技大学计算机学院
-
出处
《计算机科学》
CSCD
北大核心
2004年第6期167-168,共2页
-
文摘
独立分量分析(ICA)是基于数据高阶统计特性的一种线性变换手段。目前,已广泛应用于盲信号分离和图像识别。文章将此技术引入到科学数据挖掘领域,以求解决预处理中高维复杂特征的提取问题。提出了ICA结合主成分分析(PCA)的特征提取步骤,并结合科学数据集量大的特点给出了一种快速收敛算法—FastICA。最后指出ICA特征提取技术可以应用于高维科学数据挖掘,并且较传统的特征提取技术有更高的准确率。
-
关键词
独立分量分析
ICA
特征提取
科学数据挖掘
盲信号分离
图像识别
-
Keywords
Independent component analysis (ICA)
Feature extraction
Scientific data mining
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-