基于中心距序降维的聚类算法被引量：1

Clustering Algorithm Based on Dimension Reduction by Center Distance Order

下载PDF

导出

摘要为提高金融业务数据集上的聚类质量和聚类效率,提出簇的直径、簇间的相似度这2个概念。利用距离尺度降维的中心距序降维法,将多维数据降至一维,在一维上利用自适应排序聚类算法ASC聚类。该算法和传统的Cobweb算法、K-means算法做对比,实验表明该方法能提高簇间相似度,最大提高200%。 Aiming to improve the clustering quality and efficiency on banking services datasets, this paper proposes the concepts of cluster diameter and the similarity measurement between clusters. It modifies multi-dimensional data to one dimension by dimension reduction based on distance order. It clusters the one dimension data with a self-Adaptive Sort Clustering（ASC） algorithm. This paper conducts extensive experiments to show that this algorithm can improve the cluster similarity and reduce the clustering time compared with Cobweb and K-means algorithms. The cluster similarity can be approximately improved by 200%.

作者向剑平唐常杰郑皎凌易树鸿

机构地区遵义师范学院计算机科学系四川大学计算机学院

出处《计算机工程》 CAS CSCD 北大核心 2010年第12期58-60,63,共4页 Computer Engineering

基金国家自然科学基金资助项目(60773169) 贵州省科技厅自然科学基金资助项目(黔科合J字[2010]) 遵义市科技局自然科学基金资助项目(遵市科合社字[2009]27号)

关键词簇直径簇间相似度 ASC算法中心距序降维 cluster diameter cluster similarity self-Adaptive Sort Clustering（ASC） algorithm dimension reduction by center distance order

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献6

1任永功,于戈.一种多维数据的聚类算法及其可视化研究[J].计算机学报,2005,28(11):1861-1865. 被引量：13
2丁艺明,金远平.利用降维排序求多维数据模糊聚类[J].小型微型计算机系统,2001,22(1):66-69. 被引量：3
3单世民,闫妍,张宪超.基于k最相似聚类的子空间聚类算法[J].计算机工程,2009,35(14):4-6. 被引量：8
4Kontkanen P,Petri M,Buntine W,et al.An MDL Framework for Data Clustering[R].Helsinki,Finland:Helsinki Insititute for Information Technology,Tech.Rep.:1458-9478,2004.
5Aggarwal C,Hinneburg A,Keim D.On the Surprising Behavior of Distance Metrics in High Dimensional Space[C] //Proc.of the 8th International Conference on Database Theory.[S.l.] :SpringerVerlag,2001:420-434.
6Olson D,Shi Yong.商业数据挖掘导论[M].吕巍,译.北京:机械工业出版社,2007.

二级参考文献14

1Rakesh A,Johannes G,Dimitrios G,et al.Automatic Subspace Clustering of High Dimensional Data for Data Mining Applications[C]//Proc.of SIGMOD'98.Washington,USA:ACM Press,1998.
2Lance P,Ehtesham H,Huan L.Subspace Clustering for High Dimensional Data:A Review[C]//Proc.of SIAM'04.New York,USA:ACM Press,2004.
3Karin K,Hans-p K,Peer K.Density-connected Subspace Clustering for High Dimensional Data[C]//Proc.of SIAM'04.New York,USA:ACM Press,2004.
4Sudipto G,Rajeev R,Kyuseok S.ROCK:A Robust Clustering Algorithm for Categorical Attributes[C]//Proc.of ICDE'99.[S.1.]:IEEE Computer Society,1999.
5Xu Xiaowei，IEEE Trans Knowledge Engineering，1998年，2卷
6Zhang T，Proc the ACMSIGMOD Conference on Management of Data，1996年
7Keim D.A.. Information virsualization and visual data mining. IEEE Transactions on Visualization and Computer Graphics, 2002, 8(1): 1～8
8Qian Wei-Ning, Gong Xue -Qing, Zhou Ao -Ying. Clustering in very large database based on distance and density. Journal of Computer Science and Technology, 2003, 18(1): 67～76
9Kaufman L., Rousseeuw P.J.. Finding Groups in Data: An Introduction to Cluster Analysis. New York: John Wiley & Sons, 1990
10Ng R., Han J.W.. Efficient and effective clustering method for spatial data mining. In: Proceedings of the 20th Internationa1 Conference on Very Large Data Base. Santiago, Chile, 1994, 144～155

共引文献21

1刘天桢,童恒庆.基于投影寻踪和聚类分析的多维数据可视化[J].福建电脑,2005,21(8):113-114. 被引量：1
2闫光辉,李战怀,党建武.基于多重分形的聚类层次优化算法[J].软件学报,2008,19(6):1283-1300. 被引量：15
3李翠,吕林涛,白晓东.自构形网状聚类算法及应用研究[J].计算机工程与设计,2008,29(13):3448-3450.
4王小乐,刘青宝,陆昌辉,侯东风.一种最小生成树聚类算法[J].小型微型计算机系统,2009,30(5):877-882. 被引量：10
5向剑平,唐常杰,郑皎凌,胡剑.ASCA:一种快速自适应聚类算法[J].微计算机信息,2009,25(18):280-282.
6茅赵阳.图像的聚类和可视化方法研究[J].现代计算机,2009,15(7):71-73. 被引量：1
7李文,叶少珍.多维数据可视化技术及分类器的研究进展[J].福建电脑,2010,26(5):38-39. 被引量：4
8施蓓琦,刘春,陈能,林文鹏.典型地物实测光谱的相似性测度与实验分析[J].同济大学学报（自然科学版）,2011,39(2):292-298. 被引量：6
9关庆,邓赵红,王士同.子空间可能性聚类机制研究[J].计算机工程,2011,37(5):224-226.
10王亮.一种模糊加权软子空间聚类[J].科技致富向导,2011(11):65-66.

同被引文献13

1杨春宇,周杰.一种混合属性数据流聚类算法[J].计算机学报,2007,30(8):1364-1371. 被引量：22
2于剑肖宇.聚类分析.中国计算机学会通讯,2009,1518(8):23-29.
3YU Jian. General c - means clustering model [ J ]. IEEE Transactions on Pattern Analysis and Machine Intelli- gence,2005,27 ( 8 ) : 1 197-1 211.
4FREY B J, DUECK D. Clustering by passing messages between data points [ J ]. Science, 2007,315 ( 5814 ) : 972 -976.
5HEYER L J, KRUGLYAK S, YOOSEPH S. Exploring ex- pression data:Identification and analysis of eoexpressed genes[ J]. Genome Research,9 : 1 106-1 115.
6GIRVAN M, NEWMAN M E J. Community structure in social and biological networks [ J ]. Proc Natl Acxcad Sci USA ,99,2002:7 821-7 826.
7DHILLON I S, MALLELA S, MODHA D S. Information - theoretic co - clustering[ C ]. Proceedings of the 26th Annual International ACM SIGIR Conference on Re- search and Development in Information Retrieval,2003: 89-98.
8David Olson,Yong Shi.商业数据挖掘导论[M].北京:机械工业出版社,2007,44-45.
9向剑平,唐常杰,陈瑜,李川,左劼,胡进军.δ-KCLR:基于优化初始簇的聚类算法及其应用[J].四川大学学报（自然科学版）,2009,46(4):924-928. 被引量：1
10向剑平,唐常杰,陈瑜,胡进军,左劼,易树鸿.基于动力学聚类技术的银行信贷风险挖掘[J].计算机工程与设计,2009,30(14):3478-3480. 被引量：1

引证文献1

1向剑平,乔少杰,胡剑.基于聚类分析的申贷信用等级评价方法[J].云南大学学报（自然科学版）,2011,33(6):639-644. 被引量：1

二级引证文献1

1陈敏娜,梁海华.K-means聚类算法在企业环境效率评价的应用及R语言实现[J].数学的实践与认识,2018,48(2):307-315. 被引量：5

1向剑平,唐常杰,郑皎凌,胡剑.ASCA:一种快速自适应聚类算法[J].微计算机信息,2009,25(18):280-282.
2於实.基于数据挖掘的CRM系统研究[J].煤炭技术,2012,31(1):192-193. 被引量：1
3方杰,张结魁,周军.基于有向带权图的页面聚类算法研究[J].计算机技术与发展,2009,19(9):49-53. 被引量：2
4邓小燕,甘晓玲,唐宜.谱聚类算法在基因表达数据分析中的应用[J].现代计算机,2014,20(6):8-12. 被引量：1
5张鹏,冯欣,周建国.无线传感器网络中基于空间关联性的聚类异常检测算法[J].计算机应用研究,2013,30(5):1370-1372. 被引量：9
6张丽芳.3种聚类算法性能比较分析[J].长江大学学报（自科版）（上旬）,2009,6(2):250-251. 被引量：1
7杨霞玲,聂永红.聚类分析在毕业生就业预测中的应用[J].广西工学院学报,2005,16(4):82-84. 被引量：5
8王萌,徐立臻,冯钧.基于Road R-tree的城市路网索引结构研究[J].计算机应用与软件,2009,26(2):160-162.
9李启元,段立,李亚楠.海战场目标航迹间距离聚类方法[J].计算机与数字工程,2010,38(5):28-30. 被引量：12
10向剑平,乔少杰,胡剑.基于聚类分析的申贷信用等级评价方法[J].云南大学学报（自然科学版）,2011,33(6):639-644. 被引量：1

计算机工程

2010年第12期

浏览历史

内容加载中请稍等...

基于中心距序降维的聚类算法被引量：1

参考文献6

二级参考文献14

共引文献21

同被引文献13

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于中心距序降维的聚类算法 被引量：1

参考文献6

二级参考文献14

共引文献21

同被引文献13

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于中心距序降维的聚类算法被引量：1