K-means聚类算法的研究被引量：44

Research of K-means Algorithm

下载PDF

导出

摘要为解决原始K-means算法随机选取初始聚类中心对聚类结果的影响较大的不足,提出了改进算法。采取基于采样选取聚类中心距离的规则,进行多次选择决定最终的初始聚类中心,使得改进后的算法受初始聚类中心选择的影响达到最小;同时,在选取初始聚类中心后,对初值进行数据标准化处理。将改进的K-means算法应用于销售行业,结果显示,改进后的算法比原始的算法在效率上得到了提高。 K-means clustering algorithm has a few deficiencies. For instance, the result of the algorithm is affected by initial clustering centre. In this paper an improvement was made in the selection of initial cluster center in K-means algorithm. By adopting the principle of selecting cluster center by sampling, this improved algorithm ultimately defines the initial cluster center after multiple choices, thus minimizing the effect of initial cluster center. Simultaneously, the initial data is standadized once the initial cluster center is selected. On this basis, the improved algorithm was applied to analyze the sell industry data to produce different characteristics of the sell areas. For different sell areas, enterprise can offer differentiated services or products according to the different characteristics of each area.

作者韩晓红胡彧

机构地区太原理工大学计算机与软件学院

出处《太原理工大学学报》 CAS 北大核心 2009年第3期236-239,共4页 Journal of Taiyuan University of Technology

关键词数据挖掘 K—means算法初始聚类中心聚类分析 Clustering algorithm K-Means algorithm sell industry

分类号 TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献4

1孙士保,秦克云.改进的k-平均聚类算法研究[J].计算机工程,2007,33(13):200-201. 被引量：50
2唐立新,杨自厚,王梦光.用遗传算法改进聚类分析中的K-平均算法[J].数理统计与应用概率,1997,12(4):350-356. 被引量：23
3刘少辉,胡斐,贾自艳,史忠植.一种基于Rough集的层次聚类算法[J].计算机研究与发展,2004,41(4):552-557. 被引量：18
4余建桥,张帆.基于数据场改进的PAM聚类算法[J].计算机科学,2005,32(1):165-167. 被引量：15

二级参考文献33

1余建桥,张帆.基于数据场改进的PAM聚类算法[J].计算机科学,2005,32(1):165-167. 被引量：15
2[2]Jianwei Han, M Kamber. Data Mining: Concepts and Techniques. San Francisco: Morgan Kaufmann Publishers, 2000
3[3]J Grabmeier, A Rudolph. Techniques of cluster algorithms in data mining. Data Mining and Knowledge Discovery, 2002, 6(4): 303～360
4[4]A K Jain, M N Murty, P J Flynn. Data clustering: A review. ACM Computing Surveys, 1999, 31(3): 264～323
5[5]J MacQueen. Some methods for classification and analysis of multivariate observations. In: L M Le Cam, J Neyman eds. Proc of the 5th Berkeley Symp on Mathematics, Statics and Probability, Vol 1. Berkeley: Berkeley University of California Press, 1967. 281～298
6[6]J C Bezdek. Pattern Recognition with Fuzzy Objective Function Algorithms. New York: Plenum Press, 1981
7[7]L Kaufman, P J Rousseeuw. Finding Groups in Data: An Introduction to Cluster Analysis. New York: John Wiley & Sons, 1990
8[8]M Ester, H P Kriegel, J Sander et al. A density-based algorithm for discovering clusters in large spatial databases with noise. In: E Simoudis, J Han, U Fayyad eds. Proc of the 2nd Int'l Conf on Knowledge Discovery and Data Mining (KDD-96). Menlo Park: AAAI Press, 1996, 226～231
9[9]M Ankerst, M Breuning, H P Kriegel et al. OPTICS: Ordering points to identify the clustering structure. In: A Delis, C Faloutsos, S Ghandeharizadeh eds. Proc of the 1999 ACM SIGMOD Int'l Conf on Management of Data. New York: ACM Press, 1999. 49～60
10[10]W Wang, J Wang, R Muntz. STING: A statistical information grid approach to spatial data mining. In: M Jarke, M J Carey, K R Dittrich et al eds. Proc of the 23rd IEEE Int'l Conf on Very Large Data Bases. San Francisco: Morgan Kaufmann Publishers, 1997, 186～195

共引文献98

1刘婷,郭海湘,诸克军,高思维.一种改进的遗传k-means聚类算法[J].数学的实践与认识,2007,37(8):104-111. 被引量：22
2万尤宝,褚君浩,于天燕,余丙鲲.铁电晶体铌酸钾锂的二次谐波产生[J].人工晶体学报,2000,29(S1).
3曹树志,项响琴.基于改进的K_Means算法的城市高架桥交通流分析[J].公路交通科技（应用技术版）,2010,6(10):261-264.
4杨清波,张吉卫,李金屏.几种新型扩展集合理论[J].济南大学学报（自然科学版）,2005,19(3):242-246. 被引量：1
5孙国强,卫志农,周封伟.改进迭代自组织数据分析法的不良数据辨识[J].中国电机工程学报,2006,26(11):162-166. 被引量：33
6孙士保,赵文涛,秦克云,王艳丽.基于粗糙集的数据聚类方法研究[J].计算机工程与应用,2006,42(22):140-142. 被引量：3
7刘林,喻国平.基于自组织特征映射(SOM)网络对潜在客户的挖掘[J].南昌大学学报（理科版）,2006,30(5):507-510. 被引量：2
8肖静,胡治球,王学枫,徐辰武.一种基于似然极大的动态聚类方法及其应用[J].作物学报,2007,33(1):70-76. 被引量：2
9李玉鑑.基于最小树切割的自适应聚类方法[J].北京工业大学学报,2007,33(3):331-336. 被引量：2
10冯珺,孙济庆.一种基于知网的K-means聚类算法[J].情报学报,2007,26(3):356-360. 被引量：1

同被引文献393

1陈雪芹.“互联网+”背景下智慧课堂个性化教学模式的构建[J].科教导刊,2022(15):63-65. 被引量：4
2彭开翠.浅论教师的个性化有效教学——适合学生和自己的才是最好的教学[J].成功,2018(23):164-164. 被引量：1
3田地,张西芝,刘小航.一种基于扩展的K-means聚类算法[J].河南教育学院学报（自然科学版）,2007,16(2):26-28. 被引量：3
4刘婷,郭海湘,诸克军,高思维.一种改进的遗传k-means聚类算法[J].数学的实践与认识,2007,37(8):104-111. 被引量：22
5刘靖明,韩丽川.粒子群优化k均值的混合聚类算法研究[J].中国管理科学,2004,12(z1):96-99. 被引量：7
6翟盘茂,潘晓华.中国北方近50年温度和降水极端事件变化[J].地理学报,2003,58(z1):1-10. 被引量：860
7张红荣,张峰.传统的K-means聚类算法的研究与改进[J].咸阳师范学院学报,2010,25(4):59-62. 被引量：4
8陈小瑜.基于多尺度空间聚类的经济区域划分研究[J].重庆师范大学学报（自然科学版）,2011,28(5):81-84. 被引量：5
9江小平,李成华,向文,张新访,颜海涛.k-means聚类算法的MapReduce并行化实现[J].华中科技大学学报（自然科学版）,2011,39(S1):120-124. 被引量：79
10霍光磊,赵立军,李瑞峰,王珂.基于激光传感器的室内环境点线特征识别方法[J].华中科技大学学报（自然科学版）,2013,41(S1):171-174. 被引量：2

引证文献44

1郑攀,庹武.基于K-means聚类算法的女裤弹性面料分类研究[J].国际纺织导报,2014,42(5):71-72. 被引量：1
2曹树志,项响琴.基于改进的K_Means算法的城市高架桥交通流分析[J].公路交通科技（应用技术版）,2010,6(10):261-264.
3钟晓旭,胡学钢.基于数据挖掘的Web招聘信息相关性分析[J].安徽建筑工业学院学报（自然科学版）,2010,18(4):93-96. 被引量：11
4黄美璇.一种基于Kmax的K-means改进算法[J].佛山科学技术学院学报（自然科学版）,2010,28(2):49-52. 被引量：1
5吕奕清,林锦贤.基于MPI的并行PSO混合K均值聚类算法[J].计算机应用,2011,31(2):428-431. 被引量：13
6万博,付桂翠,邹航.航空电子产品可靠性仿真预计数据处理方法研究[J].电子产品可靠性与环境试验,2011,29(1):5-9. 被引量：8
7屈新怀,高万里,丁必荣,李朕.基于聚类数和初始值的K-means算法改进研究[J].组合机床与自动化加工技术,2011(4):42-46. 被引量：6
8徐斌,张玉峰.基于语义准则函数的中文评论性文本极性聚类算法研究[J].情报学报,2011,30(5):451-455. 被引量：1
9孟海东,蔺志举,徐贯东.可视化数据挖掘工具的设计与实现[J].计算机与现代化,2011(6):132-135. 被引量：6
10陈福集,蒋芳.基于2d-距离改进的K-means聚类算法研究[J].太原理工大学学报,2012,43(2):114-118. 被引量：8

二级引证文献248

1郭方,向博文,薄立明,黄尚华,马林,章阳.民族特色村寨建设类型划分方法研究——以湖北省“一州两县”为例[J].华南地理学报,2023(2):62-70.
2周桃义.大数据背景下高职工商管理专业学生岗位需求分析[J].区域治理,2018,0(43):61-61.
3宁建会,刘莉.FHYA—02B型油田管柱智能测长仪的研制[J].测井与射孔,2000(1):71-73.
4张忠厚,赵龙.改进的全局K均值算法及其在啤酒系统中的应用[J].计算机系统应用,2012,21(8):194-196. 被引量：1
5杨萍,郭春阳,李翠明.基于K-means聚类算法的群体机器人聚集队形控制[J].组合机床与自动化加工技术,2012(8):89-92.
6淦创.光电产品的可靠性仿真试验[J].舰船电子工程,2012,32(8):115-117. 被引量：5
7张忠厚,赵龙.改进的FCM算法及其应用[J].计算机系统应用,2012,21(10):126-129.
8闫军印.基于GIS的煤矿井下安全避险集成管理系统的研究与实现[J].煤炭工程,2012,44(11):131-133. 被引量：5
9张蕊,汪凯蔚,沈峥嵘.高可靠电子设备可靠性仿真试验技术应用研究[J].电子产品可靠性与环境试验,2012,30(6):13-19. 被引量：15
10乐洪宇,李朝荣,李永,郭宝录,王艳军.光电产品的可靠性设计与仿真试验[J].激光与红外,2013,43(3):291-296. 被引量：6

1常志玲,周庆敏,杨清莲.基于粗糙集理论的决策树构造算法[J].南京工业大学学报（自然科学版）,2005,27(4):80-83. 被引量：9
2王娟.一种基于遗传算法的K-means聚类算法[J].微型机与应用,2011,30(20):71-73. 被引量：9
3缐崴,孙先仿.摄像机运动参数估计中的8点算法及其改进[J].微计算机信息,2005,21(06X):99-100. 被引量：8
4张建周,哈力木拉提.买买提,陈晓娇.改进的K-means算法在维文连体段聚类中的应用[J].计算机工程与应用,2014,50(14):135-138. 被引量：1
5刘澎.遗传算法在目标跟踪中的传感器分配算法[J].火力与指挥控制,2007,32(1):51-53. 被引量：1
6王兴良,王立宏,李海军.谱聚类中特征向量的Bagging选取方法[J].山东大学学报（工学版）,2013,43(2):35-41. 被引量：2
7姜小光,唐伶俐,王长耀,王成.高光谱数据的光谱信息特点及面向对象的特征参数选择——以北京顺义区为例[J].遥感技术与应用,2002,17(2):59-65. 被引量：19
8徐烨.在PPT中绘制自选图形[J].视窗世界,2004(3):63-63.
9魏凯飞.学区制初探[J].教育管理与艺术,2014(5):30-30.

太原理工大学学报

2009年第3期

浏览历史

内容加载中请稍等...

K-means聚类算法的研究被引量：44

参考文献4

二级参考文献33

共引文献98

同被引文献393

引证文献44

二级引证文献248

相关作者

相关机构

相关主题

浏览历史

K-means聚类算法的研究 被引量：44

参考文献4

二级参考文献33

共引文献98

同被引文献393

引证文献44

二级引证文献248

相关作者

相关机构

相关主题

浏览历史

K-means聚类算法的研究被引量：44