基于属性划分和弧形距离的层次聚类算法被引量：1

Hierarchical Clustering Algorithm Based on Attribute Partitioning and Curve Distance

下载PDF

导出

摘要传统k-means初始中心随机选取,在较大范围内,利用以流形距离为相似度测度的参数不能较好地反映数据集的全局一致性。为此,基于属性划分和弧形距离,提出一种层次聚类算法。依据粒计算中属性划分思想和最大最小距离法则选择初始阶段的类代表点,根据k-means进行粗聚类。采用新的距离测度,即弧形距离和反映类内相似度大类间相似度小的准则函数,对初阶段类代表点聚类归类得到期望类代表点。每个数据点依据其类代表点的类标签信息找到自己所属的类标签。实验结果表明,与其他算法相比,该算法较好地体现数据集的全局一致性,减少了运行时间。 Aiming at resolving the problems of the traditional k-means algorithm random selecting of initial clustering centers,having the flaw of the global consistency on the large scale whose parameters are based on manifold distance as the measure of the similarity.A hierarchical clustering algorithm based on attribute partitioning and curve distance is proposed.It is based on the attribute partitioning ideological of granular computing and max-min distance method selects initial cluster centers and makes the crude clustering by k-means to get early stage exemplars.According to new distance measure,that is curve distance and criterion function.The big similarity within class and smaller similarity between class does cluster classification to get expect exemplars.Each data points are assigned through the labels of their corresponding representative exemplars.Experimental results show that the algorithm has the good global consistency to the data set,and the running time is reduced.

作者夏卓群欧慧武志伟范开钦

机构地区长沙理工大学计算机与通信工程学院湖南省国家税务局

出处《计算机工程》 CAS CSCD 北大核心 2015年第8期174-179,共6页 Computer Engineering

基金湖南省自然科学基金资助项目(14JJ7043) 湖南省交通运输厅科技进步与创新基金资助项目(201405)

关键词弧形距离属性划分最大最小距离聚类归类类标签 curve distance attribute partitioning max-min distance cluster classification class lable

分类号 TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献19

1HAN J W,MICHELINE K.数据挖掘概念与技术[M].范明,孟晓峰,译.北京:机械工业出版社,2012.
2Zhou Dengyong,Bouaquet O, Weston J, et al. Learning with Local and Global Consistency [ M], Cambridge, USA : MIT Press ,2004.
3杨瑞瑞,牛建强,孟红飞.基于流形距离的迭代聚类算法路面裂缝提取[J].计算机工程,2011,37(12):212-214. 被引量：4
4魏莱,王守觉.基于流形距离的半监督判别分析[J].软件学报,2010,21(10):2445-2453. 被引量：22
5李阳阳,石洪竺,焦李成,马文萍.基于流形距离的量子进化聚类算法[J].电子学报,2011,39(10):2343-2347. 被引量：16
6Wang Na, Wang Sun' an, Du Haifeng. An Iterative Optimization Clustering Algorithm Based on Manifold Distance [ C ]//Proceedings of the 4th IEEE Conference on Industrial Electronics and Applications. Washington D. C. , USA: IEEE Press ,2009 : 1565-1568.
7陶新民,宋少宇,曹盼东,付丹丹.一种基于流形距离核的谱聚类算法[J].信息与控制,2012,41(3):307-313. 被引量：27
8潘晓英,刘芳,焦李成.密度敏感的多智能体进化聚类算法[J].软件学报,2010,21(10):2420-2431. 被引量：15
9王玲,薄列峰,焦李成.密度敏感的半监督谱聚类[J].软件学报,2007,18(10):2412-2422. 被引量：94
10Gong Maoguo, Jiao Licheng, Wang Ling, et al. Density- sensitive Evolutionary Clustering [ C]//Proceedings of the llth Pacific-Asia Conference on Knowledge Discovery and Data Mining. Berlin, Germany: Springer, 2007:507-514.

二级参考文献94

1刘静,钟伟才,刘芳,焦李成.免疫进化聚类算法[J].电子学报,2001,29(z1):1868-1872. 被引量：43
2沈红斌,王士同,吴小俊.离群模糊核聚类算法[J].软件学报,2004,15(7):1021-1029. 被引量：37
3罗四维,赵连伟.基于谱图理论的流形学习算法[J].计算机研究与发展,2006,43(7):1173-1179. 被引量：76
4Zhu Xiaojin. Semi-supervised Learning Literature Survey[R]. Computer Science Department, University of Wisconsin-Madison, USA, Technical Report: 1530, 2007.
5Zhou Dengyong, Bousquet O, Lal T N, et al. Learning with Local and Global Consistency[C]//Advances in Neural Information Processing Systems. Cambridge, MA, USA: M1T Press, 2004: 321-328.
6Wang Fei, Zhang Changshui. Label Propagation Through Linear Neighborhoods[J]. IEEE Trans. on Knowledge and Data Engineering, 2008, 20(1): 55-67.
7Zhu Xiaojin. Semi-supervised Learning with Graph[D]. Pittsburgh, USA: Carnegie Mellon University, 2005.
8Chapelle O, Zien A. Semi-supervised Classification by Low Density Separation[C]//Proc. of the 10th International Workshop on Artificial Intelligence and Statistics. [S.l.]: IEEE Press, 2005.
9Canny J F. A Computational Approach to Edge Detection[J]. IEEE Trans. on PAMI, 1986, 8(6): 679-698.
10Su M C, Chou C H. A Modified Version of the k-means Algorithm with a Distance Based on Cluster Symmetry[J]. IEEE Trans. on Pattern Analysis and Machine Intelligence, 2001, 23(6): 674-680.

共引文献465

1陶新民,常瑞,沈微,王若彤,李晨曦.基于低密度分割几何距离的半监督KFDA算法[J].软件学报,2020,31(2):493-510. 被引量：3
2Weixing Wang,Mengfei Wang,Hongxia Li,Heng Zhao,Kevin Wang,Changtao He,Jun Wang,Sifan Zheng,Jiabin Chen.Pavement crack image acquisition methods and crack extraction algorithms:A review[J].Journal of Traffic and Transportation Engineering(English Edition),2019,6(6):535-556. 被引量：27
3张峰,陈兵,赵怿平,张南,李岳.基于层次聚类法的航空维修方案分析[J].飞机设计,2019,0(5):35-38.
4常瑞花.基于密集度量元的近邻传播聚类算法[J].微电子学与计算机,2015,32(5):1-5. 被引量：1
5苏盛,K.K.Li,曾祥君,陈超强,陈兴宇.通用变电站操作票生成方法的研究[J].电网技术,2004,28(14):15-18. 被引量：8
6杨公平,曾广周,卢朝霞.迁移工作流系统中停靠站服务器的设计与实现[J].计算机工程与应用,2004,40(19):111-112. 被引量：5
7周远成,乞建勋,张立辉.网络计划优化技术中顺序优化的编程模式与算法设计[J].运筹与管理,2004,13(5):47-50. 被引量：3
8周书葵,许仕荣.城市供水管网水质监测点优化选址的研究[J].南华大学学报（自然科学版）,2004,18(3):62-66. 被引量：9
9吴一民,徐建闽,胡郁葱.一种基于层次图模型的最优路径算法[J].计算机工程与设计,2005,26(2):317-319. 被引量：8
10陈智斌,余永权,杨少敏.基于可拓学的球墨铸铁石墨形态识别[J].中国工程科学,2005,7(3):84-89. 被引量：3

同被引文献11

1王士同,修宇.基于模型的基因表达聚类分析技术研究进展[J].江南大学学报（自然科学版）,2006,5(3):374-378. 被引量：5
2王世卿,张真,陈本华.一种基于概率统计的自适应网格聚类算法[J].微电子学与计算机,2008,25(5):173-175. 被引量：3
3周宗渠,田大钢.改进蝙蝠算法求解置换流水线车间调度问题[J].信息技术,2015,39(5):140-143. 被引量：2
4谢娟英,高红超,谢维信.K近邻优化的密度峰值快速搜索聚类算法[J].中国科学：信息科学,2016,46(2):258-280. 被引量：104
5黎成.新型元启发式蝙蝠算法[J].电脑知识与技术（过刊）,2010,0(23):6569-6572. 被引量：179
6王馨,唐建新.基于特征方程的蝙蝠算法分析及其改进策略[J].兰州理工大学学报,2018,44(3):103-109. 被引量：2
7王海军,门克内木乐,金涛.蝙蝠BP神经网络在图像去噪中的应用研究[J].微电子学与计算机,2018,35(9):121-124. 被引量：6
8高诗莹,周晓锋,李帅.基于密度比例的密度峰值聚类算法[J].计算机工程与应用,2017,53(16):10-17. 被引量：22
9董晓君,程春玲.基于核密度估计的K-CFSFDP聚类算法[J].计算机科学,2018,45(11):244-248. 被引量：13
10薛小娜,高淑萍,彭弘铭,吴会会.基于K近邻和多类合并的密度峰值聚类算法[J].吉林大学学报（理学版）,2019,57(1):111-120. 被引量：10

引证文献1

1吴辰文,刘晓光,魏立鑫.结合蝙蝠算法改进的密度峰值聚类算法[J].西北大学学报（自然科学版）,2019,49(4):597-604. 被引量：2

二级引证文献2

1林楠,刘海琪,杨佳佳,吴梦红,刘翰霖.BA-Adaboost模型的黑土区土壤养分含量高光谱估测[J].光谱学与光谱分析,2020,40(12):3825-3831. 被引量：7
2杨爽爽,石鸿雁.基于改进果蝇优化的密度峰值聚类算法[J].微电子学与计算机,2022,39(9):26-34. 被引量：2

1陈敏,余晓平,左文英.K-means算法的分析及改进[J].佳木斯大学学报（自然科学版）,2015,33(6):872-876.
2夏卓群,欧慧,李平,武志伟,戴傲.基于改进流形距离和人工蜂群的二阶段聚类算法[J].控制与决策,2016,31(3):410-416. 被引量：3
3庞天杰,赵兴旺.一种基于先验信息的混合数据聚类个数确定算法[J].计算机科学,2016,43(2):101-104. 被引量：3
4杜强,孙敏.基于改进聚类分析算法的入侵检测系统研究[J].计算机工程与应用,2011,47(11):106-108. 被引量：27
5王民,尹超,王稚慧,要趁红,高婧.Binary-Positive下的并行化CURE算法[J].计算机工程与应用,2014,50(11):58-61. 被引量：3
6欧慧,夏卓群,武志伟.基于改进流形距离的粗糙集k-means聚类算法[J].计算机工程与应用,2016,52(14):84-89. 被引量：4
7成卫青,卢艳红.一种基于最大最小距离和SSE的自适应聚类算法[J].南京邮电大学学报（自然科学版）,2015,35(2):102-107. 被引量：45
8王留正,何振峰.基于全局性分裂算子的进化K-means算法[J].计算机应用,2012,32(11):3005-3008. 被引量：3
9陈济舟,罗可.基于粒计算与粗糙集的人工鱼群聚类算法[J].计算机工程与应用,2015,51(21):116-120. 被引量：3
10李莎,陶红,高尚.基于属性约简与参数优化的SVM故障诊断研究[J].计算机技术与发展,2012,22(4):175-178. 被引量：1

计算机工程

2015年第8期

浏览历史

内容加载中请稍等...

基于属性划分和弧形距离的层次聚类算法被引量：1

参考文献19

二级参考文献94

共引文献465

同被引文献11

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于属性划分和弧形距离的层次聚类算法 被引量：1

参考文献19

二级参考文献94

共引文献465

同被引文献11

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于属性划分和弧形距离的层次聚类算法被引量：1