一种基于概率的快速聚类算法被引量：2

A Kind of Fast Clustering Algorithm Based on Probability

下载PDF

导出

摘要在聚类算法和特征向量维数确定的模式样本集中,各样本的每一维表示一个对应特征;鉴于此在基于层次算法的基础上,提出了一种基于概率的快速聚类算法;该算法先对各个特征进行分类,然后按照概率准则,每个向量先自成一类,将其对应概率最大的特征向量合并,减少类别数,直至达到要求为止;用UCI中的Iris和Wine数据集对该算法进行仿真实验,实验数据表明:用该算法进行聚类,能获得较好的聚类结果,说明算法具有一定的有效性。 In clustering algorithms,in model samples determined by eigenvector dimensions, every dimension of each sample represents a corresponding feature,based on this, this paper advances a kind of fast clustering algorithm based on probability on the basis of hierarchical algorithm.This algorithm firstly classifies each feature, then according to probability principle, makes each vector become a type, combines the maximum eigenvectors with its corresponding probability to reduce the type number until the requirement is met, and conducts simulation experiment on this algorithm by using Iris and Wine data set in UCI.Experiment data show that better clustering results can be obtained by using this algorithm for clustering ,which illustrates that this algorithm has certain validity.

作者李婧

机构地区重庆师范大学数学学院

出处《重庆工商大学学报（自然科学版）》 2014年第2期61-65,共5页 Journal of Chongqing Technology and Business University:Natural Science Edition

关键词聚类样本特征概率 clustering sample feature probability

分类号 TP349 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献10

1PAN J W,MICHELINE K. Data Mining:Concepts and Techniques[M].San Francisco:Morgan Kaufmann Publishers,2001.412-413.
2KAUFAN L,ROUSSEEUW P. Finding Groups in Data:an Introduction to Cluster Analysis[M].{H}New York:John Wiley and Sons,Inc,1990.
3MUATA K,BRYSO O. Towards Supporting Expert Evaluation of Clustering Results Using a Data Mining Process Model[J].{H}Information Sciences,2010,(03):414-431.
4ESTER M,KRIEGEL H,SANDER J,XU X. A Density Based Algorithm for Discovering Cluster in Large Spatial Databases with Noise[A].Portland:AAAI Press,1996.226-231.
5AGRAWAL R,GEHRKE J,GUNOPOLOS D. Automatic Subspace Clustering of High Dimensional Data for Data Mining Application[A].Seattle:ACM Press,1998.94-105.
6朱明.数据挖掘[M]{H}合肥:中国科学技术大学出版社,2002.
7EISEN M,SPELLMAN P,BROWN P. Cluster Analysis and Display of Genome-wide Expression Data[J].Proceedings of National Academy of Science USA,1988,(95):14863-14868.
8AMADOR J. Sequential Clustering by Statistical Methodology[J].{H}Pattern Recognition Letters,2005,(26):2152-2163.
9李有明.一种基于参考点的快速k-均值算法[J].重庆工商大学学报（自然科学版）,2013,30(6):39-43. 被引量：3
10韩凌波,王强,蒋正锋,郝志强.一种改进的k-means初始聚类中心选取算法[J].计算机工程与应用,2010,46(17):150-152. 被引量：94

二级参考文献9

1袁方,周志勇,宋鑫.初始聚类中心优化的k-means算法[J].计算机工程,2007,33(3):65-66. 被引量：154
2Tan Pang-ning,Steinbaeh M,Kumar V.Introduction to data mining[M]. [S.l.] : Addison Wesley, 2005.
3Han Jia-wei,Kamber M.Data mining:Concepts and techniques[M]. [S.l.]:Morgan Kaufmann Publishers,2001.
4ESTER M, KRIEGEL1 H, SANDER J . A density-based algorithm for discovering clusters in large spatial databases with noise [ c ]//Usama M Fayyad, Padhraic Smyth, Gregory Piatetsky Shapiro, Eds. Proc of 2d International Conference on konwledge Discovery and Data Mining(KDD'96). Porland : ACM press, 1996:226-231.
5赖玉霞,刘建平.K-means算法的初始聚类中心的优化[J].计算机工程与应用,2008,44(10):147-149. 被引量：75
6王晶,夏鲁宁,荆继武.一种基于密度最大值的聚类算法[J].中国科学院研究生院学报,2009,26(4):539-548. 被引量：13
7孙凌燕,杨明,任建斌.一种基于相对密度的快速聚类算法[J].微电子学与计算机,2009,26(12):109-111. 被引量：6
8许虎寅,王治和.一种改进的基于密度的聚类算法[J].微电子学与计算机,2012,29(2):44-47. 被引量：20
9马帅,王腾蛟,唐世渭,杨冬青,高军.一种基于参考点和密度的快速聚类算法[J].软件学报,2003,14(6):1089-1095. 被引量：108

共引文献95

1吴东飞,金玉龙,蒋建国.基于TMS320DM6467和TMS320C6472的高清视频处理系统[J].数据采集与处理,2012,27(S2):227-234.
2杨会锋,曹洁,帅立国.基于改进K-均值聚类算法的背景建模方法[J].电子测量与仪器学报,2010,24(12):1114-1118. 被引量：14
3魏新红,张凯.一种改进的PSO-Means聚类优化算法[J].河南科技大学学报（自然科学版）,2011,32(2):41-43. 被引量：7
4黄敏.聚类算法在教学评价中的应用研究[J].中国电力教育,2011(6):63-64. 被引量：1
5仝雪姣,孟凡荣,王志晓.对k-means初始聚类中心的优化[J].计算机工程与设计,2011,32(8):2721-2723. 被引量：29
6黄敏,何中市,邢欣来,陈英.一种新的k-means聚类中心选取算法[J].计算机工程与应用,2011,47(35):132-134. 被引量：20
7黄芬,朱艳,梁敬东,伍艳莲,姜海燕.优化初始中心点的小麦品质区域聚类[J].计算机工程与应用,2011,47(36):34-37. 被引量：1
8谢娟英,郭文娟,谢维信,高新波.基于样本空间分布密度的初始聚类中心优化K-均值算法[J].计算机应用研究,2012,29(3):888-892. 被引量：53
9陈福集,蒋芳.基于2d-距离改进的K-means聚类算法研究[J].太原理工大学学报,2012,43(2):114-118. 被引量：8
10陈英,何中市,黄敏.一种优化的K-means聚类中心算法研究[J].制造业自动化,2012,34(8):19-22. 被引量：5

同被引文献26

1吴景社,康绍忠,王景雷,黄修桥,宋毅夫.基于主成分分析和模糊聚类方法的全国节水灌溉分区研究[J].农业工程学报,2004,20(4):64-68. 被引量：58
2刘兴洪,汪林林.一种图像边缘保持的改进方向平滑算法[J].计算机科学,2006,33(10):210-212. 被引量：8
3李龙昌,吕宁江,于国平,刘肖军.山东省节水灌溉分区与节水途径浅见[J].灌溉排水,1997,16(3):18-22. 被引量：4
4张淑云,张洪玉.浅议节水灌溉的方法及主要技术措施[J].水利科技与经济,2008,14(3):241-242. 被引量：9
5曹敏格,杨海玲,张文,张治东,孙杨吾,朱元娣.苹果砧木矮化性评价指标的研究[J].中国农业大学学报,2008,13(5):11-18. 被引量：49
6李岳峰,刘汶.论我国农业现代化与农业机械化的内涵及基本特征[J].农业现代化研究,2008,29(5):518-521. 被引量：13
7张燕,张振华,姚付启,冯雪,李清翠.主成分分析与系统聚类法在农业用地优先度评价中的应用[J].农业系统科学与综合研究,2009,25(1):23-26. 被引量：8
8李忠梅,张军.山东省水资源合理配置方案研究[J].人民黄河,2009,31(8):46-47. 被引量：1
9姚於康.浅析中国农业标准化体系建设现状、关键控制点及对策[J].江苏农业学报,2010,26(4):865-869. 被引量：33
10郭四稳,陈伟津.基于多层次模糊增强的图像边缘检测[J].广州大学学报（自然科学版）,2011,10(4):64-67. 被引量：2

引证文献2

1韦梅,刘福胜,赵井辉,刘栋梁,刘波,乔田玲.基于农业标准化的山东省节水灌溉分区研究[J].山东农业大学学报（自然科学版）,2016,47(4):560-564. 被引量：3
2李浩谊,马春庭,朱小龙.一种基于边缘保持的图像增强算法[J].舰船电子工程,2018,38(7):34-37.

二级引证文献3

1王赫生,李燕,张庆,周锴锷.基于农作物与地下水作用试验的灌溉分区研究[J].节水灌溉,2018,0(1):86-89. 被引量：2
2杨蕊,胡贤群,王龙,伍靖伟.基于主成分分析和模糊聚类的云南省农业节水分区[J].节水灌溉,2021(4):92-97. 被引量：8
3朱赫,杨姗姗,刘晗,徐征和.基于主成分分析和聚类分析的山东省农业节水分区[J].济南大学学报（自然科学版）,2022,36(4):391-396. 被引量：2

1陈媛,杨栋.基于信息熵的属性约简算法及应用[J].重庆理工大学学报（自然科学）,2013,27(1):42-46. 被引量：21
2程国,刘亚亚,赵鹏军.基于混沌自适应引力搜索的模糊C均值聚类算法[J].河南科学,2014,32(12):2448-2453.
3陈瑛,黄灿辉.基于改进粒子群算法的K均值聚类算法的研究[J].内蒙古师范大学学报（自然科学汉文版）,2014,43(4):478-482. 被引量：1
4夏红霞,赵杨,曹献媛,钟珞.关联规则层次算法的研究与改进[J].武汉工业大学学报,2000,22(5):79-82. 被引量：1
5陈晓,赵晶玲.大数据处理中混合型聚类算法的研究与实现[J].信息网络安全,2015(4):45-49. 被引量：30
6宋天勇,赵辉,李万龙,王璐,田世元.引入自检策略的进化K-means算法[J].东北师大学报（自然科学版）,2014,46(3):59-63. 被引量：1
7宋小威,王加阳.变精度粗糙集区间约简模型研究[J].模式识别与人工智能,2013,26(11):1010-1018. 被引量：7
8白宁.一种基于k-均值聚类的异常检测技术[J].计算机与现代化,2014(1):93-95. 被引量：5
9樊水莲,孙金玮.概率准则在多传感器数据融合中的应用[J].仪器仪表学报,2002,23(z2):727-728.
10陈妍,许少华.基于多示例多标记的抽油机故障诊断[J].计算机系统应用,2016,25(12):285-288. 被引量：2

重庆工商大学学报（自然科学版）

2014年第2期

浏览历史

内容加载中请稍等...

一种基于概率的快速聚类算法被引量：2

参考文献10

二级参考文献9

共引文献95

同被引文献26

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

一种基于概率的快速聚类算法 被引量：2

参考文献10

二级参考文献9

共引文献95

同被引文献26

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

一种基于概率的快速聚类算法被引量：2