题名 一种基于超图模式的高维空间数据聚类方法
被引量:11
1
作者
张蓉
彭宏
机构
广东商学院信息学院
华南理工大学计算机系
出处
《计算机工程》
CAS
CSCD
北大核心
2002年第7期54-55,164,共3页
基金
广东省自然科学基金项目资助()990582
文摘
把一个求解高维空间数据聚类问题转换为一个超图分割寻优问题,提出了一种基于超图模式的高维空间数据聚类方法。该方法不需要减少高维空间数据项的维数,直接用超图模式描述原始数据之间的关系,并通过选择适当的支持度阈值,有效祛除噪声点,保证数据聚类的质量。
关键词
超图模式
高维空间数据
聚类方法
关联规则
模拟退火算法
数据 挖掘
数据 库
Keywords
Data clustering Hypergraph partitioningAssociation rulesSimulated annealing algorithm
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
题名 HGHD:一种基于超图的高维空间数据聚类算法
被引量:2
2
作者
沙金
张翠肖
贾玉锋
胡迎新
机构
石家庄铁道学院计算机系
出处
《微电子学与计算机》
CSCD
北大核心
2006年第6期185-187,共3页
文摘
传统聚类算法无法有效地处理现实世界中存在许多高维空间数据。为此,提出一种基于超图模式的高维空间数据聚类算法HGHD,通过数据集中的数据及其间关系建立超图模型,并应用超图划分进行聚类,从而把一个求解高维空间数据聚类问题转换为一个超图分割寻优问题。该方法采用自底向上的分层思想,相对于传统方法最大的优势是不需要降维,直接用超图模式描述原始数据之间的关系,能产生高质量的聚类结果。
关键词
超图模式
高维空间数据
数据 聚类
Keywords
Hypergraph pattern, High dimensional space data, Data clustering
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
题名 高维空间数据的一种异常检测方法研究
3
作者
刘丽娜
机构
石家庄铁路职业技术学院
出处
《石家庄铁路职业技术学院学报》
2005年第2期83-87,共5页
文摘
就布尔型的高维数据提出了一种异常检测方法,通过定义反映数据稀疏程度的覆盖系数,搜索其低维子空间里的异常模式来检测异常。该方法使用遗传算法来优化搜索过程,并取得了较好的结果。
关键词
异常检测
布尔型
遗传算法
高维空间数据
Keywords
outlier detection high dimensional data bootean genetic alglorithm
分类号
TP274
[自动化与计算机技术—检测技术与自动化装置]
题名 高维空间中的离群点发现
被引量:44
4
作者
魏藜
宫学庆
钱卫宁
周傲英
机构
复旦大学计算机科学与工程系
出处
《软件学报》
EI
CSCD
北大核心
2002年第2期280-290,共11页
基金
国家自然科学基金资助项目(60003016
60003008)
国家重点基础研究发展规划973资助项目(G1998030404)~~
文摘
在许多KDD(knowledge discovery in databases)应用中,如电子商务中的欺诈行为监测,例外情况或离群点的发现比常规知识的发现更有意义.现有的离群点发现大多是针对数值属性的,而且这些方法只能发现离群点不能对其含义进行解释.提出了一种基于超图模型的离群点(outlier)定义,这一定义既体现了“局部”的概念能很好地解释离群点的含义.同时给出了HOT(hypergraph-based outlier test)算法,通过计算每个点的支持度、隶属度和规模偏差来检测离群点.该算法既能够处理数值属性,又能够处理类别属性.分析表明,该算法能有效地发现高维空间数据中的离群点.
关键词
数据 挖掘
离群点
超图模型
聚类
知识发现
高维空间数据 库
Keywords
data mining
outlier
hypergraph model
clustering
分类号
TP392
[自动化与计算机技术—计算机应用技术]
题名 CLIQUE聚类算法的分析研究
被引量:7
5
作者
项响琴
李红
陈圣兵
机构
合肥学院网络与智能信息处理重点实验室
出处
《合肥学院学报(自然科学版)》
2011年第1期54-58,66,共6页
基金
安徽省自然科学基金项目(KJ2009B122)
合肥学院人才科研基金项目(11RC06)资助
文摘
CLIQUE算法是基于密度和网格的一种聚类分析算法,对于大型高维空间数据的聚类分析具有很高的效率,能得到优质的聚类结果.通过分析CLIQUE算法的特点、聚类过程中的关键问题及算法步骤,运用实验数据对算法进行了测试,对聚类结果进行分析讨论,发现算法的不足,说明了改进的思路,为以后研究工作指明了方向.
关键词
聚类分析
高维空间数据
CLIQUE算法
优化分析
Keywords
clustering
high dimensional data
CLIQUE algorithm
optimize analysis
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]