欧氏距离的加权处理对K-means法聚类效果的改进被引量：1

A developed K-means method based on weighted Euclidean distance

下载PDF

导出

摘要目的针对K-means法倾向于产生大小相等的球状类这一缺点,对K-means法进行改进,使其在对方差大小不等的类进行聚类时,可以达到较好的效果。方法以修正后的方差的倒数为权重,对欧氏距离的平方进行加权处理,从而用"相对距离"代替"绝对距离"来计算样品点与类间的相似度。结果在对方差大小不等的2个类进行聚类时,改进K-means法得到的正确率高于传统的K-means法。结论在对方差相差悬殊的两类进行聚类时,改进的K-means法优于传统的K-means法。 Objective The purpose of this dissertation is to propose a developed K-means method, which is more effective than traditional K-means method especially when identifying clusters whose variances are unequal. Methods The relative distance but not absolute distance was used to calculate the distance between the individual and the cluster center. Relative distanee, as what is called, is defined as the ratio between the squared Euclidean distance and the adjusted variance of the cluster. Results When identifying clusters whose variances are unequal, the developed K-means method may lead to a higher accuracy evaluated with actual clusters. Conclusion The developed K-means method is more effective than traditional K-means method when identifying clusters whose variances are unequal.

作者鲁婧婧张晋昕袁向东骆福添古萍张熙薛允莲

机构地区中山大学公共卫生学院广东省人民医院体检中心

出处《中国医院统计》 2008年第1期9-12,共4页 Chinese Journal of Hospital Statistics

基金广东省科技计划项目(2004B33701010)

关键词聚类分析欧氏距离加权 Cluster analysis Euclidean distance Weighting

分类号 R195.1 [医药卫生—卫生统计学]

引文网络
相关文献

参考文献8

1Steinley D. K-means clustering: A half-century synthesis[J]. British Journal of Mathematical and Statistical Psychology ,2006, 59 : 1-34.
2谭勇,荣秋生.一个基于K-means的聚类算法的实现[J].湖北民族学院学报（自然科学版）,2004,22(1):69-71. 被引量：19
3Huang Z. Extensions to the K-Means Algorithm for Clustering Large Data Sets with Categorical Values [ J ]. Data Mining and Knowledge Discovery, 1998,2 : 283-304.
4李飞,薛彬,黄亚楼.初始中心优化的K-Means聚类算法[J].计算机科学,2002,29(7):94-96. 被引量：47
5Yu-fang Zhang, Jia-li Mao Z X. AN EFFICIENT CLUSTERING ALGORITHM[ C ]. Proceedings of the Second International Conference on Machine Learning and Cybernetics, Xi'an, 2003.
6陈慧萍,贺会景,陈岚峰,蒋峰.基于模拟退火思想的优化k-means算法[J].河海大学常州分校学报,2006,20(4):29-32. 被引量：6
7袁方,周志勇,宋鑫.初始聚类中心优化的k-means算法[J].计算机工程,2007,33(3):65-66. 被引量：154
8万志华,欧阳为民,张平庸.一种基于划分的动态聚类算法[J].计算机工程与设计,2005,26(1):177-179. 被引量：16

二级参考文献29

1白莉媛,胡声艳,刘素华.一种基于模拟退火和遗传算法的模糊聚类方法[J].计算机工程与应用,2005,41(9):56-58. 被引量：11
2屈建平,罗文坚,王煦法.基于K-均值聚类的改进非选择算法研究[J].计算机工程与应用,2005,41(28):29-32. 被引量：4
3Bezdek J C, et al. Multiple-Prototype Classifier Design. IEEE Trans Syst Man Cybern, 1998, 24(9):67～79
4Selim S Z. Ismail M A. K-Means-Type Algorithms: A Generalized Convergence Theorem and Characterization of Local Optimality. IEEE Trans Pattern Analysis and Machine Intelligence,1984, PAMI-6(1): 81～87
5Bradley P S, Fayyad U M. Refining Initial Points for K-Means Clustering. Advances in Knowledge Discovery and Data Mining.MIT Press, 1996
6Raymond T. Ng, Han Jiawei. Efficient and Effective Clustering Methods for Spatial Data Mining. In: Proc. of the 20th VLDB Conf. Santiago, Chile, 1994
7Selim S Z,Alsultan K. A Simulated Annealing Algorithms for the Clustering Problem. Pattern Recognition, 1991,24 (10): 1003 ～1008
8HANJia-wei KAMBERM.数据挖掘概念与技术[M].北京：机械工业出版社,2001.1 51-161.
9Jiawei Han, Micheline Kamber.Data Mining: Concepts and Techniques[M].Simon Fraser University, 2000.
10Alsabti K,Ranka S,Singh V. An efficient k-means clustering algorithm, IPPS-98[A].Proceedings of the First Workshop on High Performance Date Mining[C]. Orlando, Florida, USA, 1998.

共引文献231

1赵春丽,王延博,万润之,孙丽平.基于R语言探析中医药治疗哮喘发作期的用药规律[J].世界科学技术-中医药现代化,2023,25(3):1011-1019. 被引量：5
2段桂芹.基于改进密度的簇内均值最小距离聚类算法[J].智能计算机与应用,2021,11(12):82-86. 被引量：1
3李海凉.一种对管制自动化数据记录挖掘进行扇区容量量化对比的方法[J].民航学报,2019,3(5):46-50.
4吕佳,熊浩.一种新城市气温模式分类的聚类算法[J].数学的实践与认识,2007,37(8):55-60.
5黎新伍.医学图像体分割的特征聚类算法[J].清华大学学报（自然科学版）,2008,48(S2):1790-1793. 被引量：1
6柳永念,郭会林.对C均值聚类算法的一些改进[J].广西大学学报（哲学社会科学版）,2007,29(S3):207-208.
7徐君,黄亚楼,李飞.K-Means聚类中序列模式和批量模式的比较研究[J].计算机科学,2004,31(6):156-158. 被引量：5
8侯雪波,田斌,葛少云,路志英.关联规则技术在电力市场营销分析中的应用[J].电力系统及其自动化学报,2005,17(2):67-72. 被引量：23
9陈浩,何婷婷,姬东鸿.基于k-means聚类的无导词义消歧[J].中文信息学报,2005,19(4):10-16. 被引量：16
10张春英,刘保相,刘凤春.基于SPA的动态聚类统计分析及其应用[J].计算机工程与设计,2006,27(20):3947-3948. 被引量：2

同被引文献10

1袁海平,曹平.我国自然崩落法发展现状与应用展望[J].金属矿山,2004,33(8):25-28. 被引量：48
2沈南山,顾晓春,尹升华.国内外自然崩落采矿法技术现状[J].采矿技术,2009,9(4):1-4. 被引量：34
3吴爱祥,武力聪,刘晓辉,王春来,黄武胜,朱权洁.矿山微地震活动时空分布[J].北京科技大学学报,2012,34(6):609-613. 被引量：16
4程爱平,高永涛,梁兴旺,季毛伟,王存文,高艳华.基于未确知聚类法的底板采动破坏深度动态预测[J].采矿与安全工程学报,2014,31(5):739-744. 被引量：10
5徐奴文,戴峰,李彪,朱永国,程丽娟,王琦.猴子岩水电站地下厂房开挖过程微震特征与稳定性评价[J].岩石力学与工程学报,2016,35(A01):3175-3186. 被引量：10
6刘栋,李夕兵,刘志祥,董陇军,周勇勇,陈光辉.基于STSNN聚类算法的用沙坝矿微震事件活动特征研究[J].中国安全生产科学技术,2017,13(2):74-78. 被引量：4
7刘欢,阎镇.基于改进的K-means法的高分辨率遥感影像道路提取[J].计算机与现代化,2017(11):55-61. 被引量：3
8程关文,王悦,马天辉,唐春安,陈通,马克.煤矿顶板岩体微震分布规律研究及其在顶板分带中的应用——以董家河煤矿微震监测为例[J].岩石力学与工程学报,2017,36(A02):4036-4046. 被引量：24
9李彪,徐奴文,戴峰,顾功开,刘科,郭亮,姜鹏.乌东德水电站地下厂房开挖过程微震监测与围岩大变形预警研究[J].岩石力学与工程学报,2017,36(A02):4102-4112. 被引量：10
10陈通,王双明,王悦,程关文.长壁工作面采动引起的微震活动分布规律研究[J].采矿与安全工程学报,2018,35(4):795-800. 被引量：7

引证文献1

1周立云,冯兴隆,林洁.基于K-means法的微震事件活动聚类分析[J].新疆地质,2021,39(3):502-506. 被引量：1

二级引证文献1

1张国华.基于ST-DBSCAN聚类算法的矿井冲击地压微震监测数据时空特性分析[J].能源与环保,2024,46(7):62-70.

1鲁婧婧,张晋昕,袁向东,骆福添,古萍,张熙,薛允莲.各组内变异程度悬殊时传统K-means法的局限性及其改进[J].中国卫生统计,2009,26(1):18-21.
2Slykerman R.F.,Thompson J.M.D.,Becroft D.M.O.,E.A. Mitchell,张振.母乳喂养与学龄前儿童的智力水平[J].世界核心医学期刊文摘（儿科学分册）,2006,0(1):5-5.
3程颖玲,方红,严玉洁,郦伦强,王娜,赵燕萍,刘奕男,姚宝栋.2013年上海闵行区主要慢性病现况及其影响因素分析[J].中国初级卫生保健,2015,29(11):50-52. 被引量：5
4杨心怡,吴珊子,罗爱武.广州市居民糖尿病影响因素分析[J].现代预防医学,2015,42(9):1656-1659. 被引量：9
5杨久松.“吃”的误区[J].农经,1999,0(4):37-37.
6郭晓雷,马吉祥,颜流霞,毕振强,张啸飞,陈希,张吉玉,蔡小宁,鹿子龙,徐爱强.山东省居民食盐摄入量与血压的关系[J].中华预防医学杂志,2014,48(2):119-123. 被引量：16
7马芳,张银娥,靳雅男,田园,杨艺,赵建华.宁夏成年居民膳食摄入状况调查分析[J].宁夏医学杂志,2017,39(2):186-188. 被引量：2
8何宇纳,赵丽云,于冬梅,房红芸,于文涛,郭齐雅,王寻,杨晓光,马冠生.2010--2012年中国成年居民蔬菜和水果摄入状况[J].中华预防医学杂志,2016,50(3):221-224. 被引量：36
9孙敬祥,杨玉芳.应用十二项量化指标全面评价科主任工作[J].中国医院统计,1996,3(4):248-249.
10王亚丽,唐红霞,朱书强.甘肃不同产地当归的比较分类研究[J].中国中药杂志,2009,34(11):1390-1394. 被引量：18

中国医院统计

2008年第1期

浏览历史

内容加载中请稍等...

欧氏距离的加权处理对K-means法聚类效果的改进被引量：1

参考文献8

二级参考文献29

共引文献231

同被引文献10

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

欧氏距离的加权处理对K-means法聚类效果的改进 被引量：1

参考文献8

二级参考文献29

共引文献231

同被引文献10

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

欧氏距离的加权处理对K-means法聚类效果的改进被引量：1