基于加权欧式距离的k_means算法研究被引量：34

Research Based on Euclid Distance with Weights of K_means Algorithm

下载PDF

导出

摘要传统的k_means算法将欧式距离作为最常用的距离度量方法.针对基于欧式距离计算样本点与类间相似度的不足,用"相对距离"代替"绝对距离"可以更好地反映样本的实际分布,提出一种在领域知识未知的情况下基于加权欧式距离的k_means算法.针对公共数据库UCI里的数据实验表明改进后的算法能产生质量较高的聚类结果. Euclid distance is commonly used to measure distance in the traditional k_means algorithm.The k_means algorithm based on weighted Euclid distance is researched and presented to overcome the existing problems of similarity calculation in clustering analysis based on traditional Euclid distance when we have no any domain knowledge about the data objects,the relative distance but not absolute distance is more accurately response to data distribution.Experiments on the standard database UCI show that the proposed method can produce a high accuracy clustering result.

作者张忠林曹志宇李元韬

机构地区兰州交通大学电子与信息工程学院

出处《郑州大学学报（工学版）》 CAS 北大核心 2010年第1期89-92,共4页 Journal of Zhengzhou University（Engineering Science）

基金兰州市企业技术攻关计划资助(2009-1-4) 兰州交通大学"青蓝"人才工程基金资助(QL-05-10A)

关键词 k_means算法聚类加权变异系数 k_means algorithm clustering weight coefficient of variation

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1PANG N T,MICHAEL S,VIPIN K.数据挖掘导论(英文版)[M].北京:人民邮电出版社,2006.
2HAN JW,KAMBER M.数据挖掘概念与技术[M].北京:机械工业出版社,2005.
3沈洁,赵雷,杨季文,李榕.一种基于划分的层次聚类算法[J].计算机工程与应用,2007,43(31):175-177. 被引量：13
4孙吉贵,刘杰,赵连宇.聚类算法研究[J].软件学报,2008(1):48-61. 被引量：1060
5马卫武李念平杨志昂.室内空气品质综合评价权重系数的确定与分析.通风除尘,2004,(11):9-11.

二级参考文献9

1冯兴杰,黄亚楼.增量式CURE聚类算法研究[J].小型微型计算机系统,2004,25(10):1847-1849. 被引量：9
2崔杰,任家东.分布式关联规则挖掘中的聚类分区算法[J].计算机工程,2004,30(23):67-68. 被引量：2
3袁方,孟增辉,于戈.对k-means聚类算法的改进[J].计算机工程与应用,2004,40(36):177-178. 被引量：47
4李洁,高新波,焦李成.基于特征加权的模糊聚类新算法[J].电子学报,2006,34(1):89-92. 被引量：113
5甄彤.基于层次与划分方法的聚类算法研究[J].计算机工程与应用,2006,42(8):178-180. 被引量：8
6Sudipto Guha, Rajeev Rastogi, Kyuseok Shim.CURE: an efficient clustering algorithm for large databases[J].Information Systems,2001, 26( 1 ) : 35-58.
7Han Jia-wei,Kamber M.Data mining:concepts and techniques[M]. [S.l.]:Higher Education Press,Morgan Kaufmann Publishers,2002.
8陈宁,陈安,周龙骧,CHEN Ning.大规模交易数据库的一种有效聚类算法(英文)[J].软件学报,2001,12(4):475-484. 被引量：17
9钱卫宁,宫学庆,周傲英.Clustering in Very Large Databases Based on Distance and Density[J].Journal of Computer Science & Technology,2003,18(1):67-76. 被引量：13

共引文献1073

1丁小军,陈杰,李霖,徐碧通,朱晓姝.一种基于聚类结果稳定性来确定聚类数的方法[J].玉林师范学院学报,2020(3):43-47. 被引量：1
2王玥,李文权,梁爽,余静财.基于改进聚类算法的共享汽车网点选址研究[J].武汉理工大学学报,2021,43(2):79-85.
3林耿堃,盛积良.乡村振兴时代背景下农民消费结构变迁研究[J].农业农村部管理干部学院学报,2021(2):76-81. 被引量：3
4高显义,林欣晖.基于文本聚类的变电工程变更特征识别研究[J].建筑经济,2020,41(S02):200-203. 被引量：2
5毛颖颖,杨新凯.融合拓扑势的自适应层次聚类算法研究[J].计算机应用研究,2020,37(S01):37-39.
6张睿恺,吴克河.基于优化特征集的LeNet-5攻击检测模型的态势感知技术[J].计算机应用研究,2020,37(S01):287-289. 被引量：3
7李对红,王裴岩 ,张桂平,张少阳.基于字簇的多模型中文分词方法研究[J].计算机应用研究,2020,37(2):355-359. 被引量：2
8尧少波,蒋励剑,赵文文,卢铮,吴昌聚,陈伟芳.耦合聚类的数据驱动稀薄流非线性本构计算方法[J].航空学报,2022,43(S02):43-56.
9段桂芹.基于改进密度的簇内均值最小距离聚类算法[J].智能计算机与应用,2021,11(12):82-86. 被引量：1
10何睿,余娜,李淼,张峻巍,王浩杰,赵玉茗.基于单细胞RNA测序数据的细胞类型聚类算法[J].智能计算机与应用,2020,10(7):104-108. 被引量：2

同被引文献263

1马杰,王旭娇,马鹏飞,杨立闯,王楠楠.融合kd tree邻域查询的深度学习点云分类网络[J].深圳大学学报（理工版）,2020,37(1):79-83. 被引量：13
2赵喜春.导弹命中精度综合鉴定方法研究[J].现代防御技术,2008(3):27-30. 被引量：4
3朱颢东,钟勇,赵向辉.一种优化初始中心点的K-Means文本聚类算法[J].郑州大学学报（理学版）,2009,41(2):29-32. 被引量：13
4李曼义,李梅,李君康.实验教学仪器发展的新趋势-智能化网络实验台[J].云南师范大学学报（自然科学版）,2004,24(6):48-51. 被引量：7
5薛巧英.水环境质量评价方法的比较分析[J].环境保护科学,2004,30(4):64-67. 被引量：139
6董卫军,周明全,耿国华,黎晓.基于内容的图像检索技术研究[J].计算机工程,2005,31(10):162-163. 被引量：23
7王俊平,郝跃.基于LS空间的IC真实缺陷图像的分割[J].电子学报,2005,33(5):954-956. 被引量：3
8赵艳玲,胡振琪,王建峰,鲍艳.用模糊ISODATA方法评价重金属污染土壤的研究[J].金属矿山,2005,34(6):53-55. 被引量：9
9马光.提高仿金饰品材料性能的几个途径[J].稀有金属材料与工程,1989,18(5):74-76. 被引量：3
10石陆魁,何丕廉.一种基于密度的高效聚类算法[J].计算机应用,2005,25(8):1824-1826. 被引量：21

引证文献34

1马振,刘凤连,汪日伟.基于子模式下LBP-HOG特征融合的单样本人脸识别方法[J].光电子．激光,2019,30(12):1309-1316. 被引量：8
2李翠,冯冬青.基于改进K-均值聚类的图像分割算法研究[J].郑州大学学报（理学版）,2011,43(1):109-113. 被引量：25
3杨秋,王建涛,张荣,杨承志.一种基于自适应密度阈值的未知雷达信号分选算法[J].电子信息对抗技术,2012,27(1):16-18. 被引量：4
4吴华稳,王富章,陈志荣.铁路信息系统指标权重评价研究[J].铁道运输与经济,2013,35(2):46-51. 被引量：4
5赵艳玲,王亚云,何厅厅,李建华,付馨,曾纪勇,李源.基于组合权区间欧式距离模型的重金属污染评价[J].金属矿山,2013,42(3):132-136. 被引量：5
6李英英,纪昌杰.基于信息熵加权去噪的半监督SVM分类器[J].电脑知识与技术,2013,9(9):5705-5707. 被引量：1
7王方心,潘巍,吴立锋,金声震,李晓娟.结合属性重要度和灰色关联度的数据补齐方法[J].计算机工程与设计,2014,35(1):248-254. 被引量：3
8高永兵,郭文彦,周环宇,聂知秘.基于K-means的私人微博聚类算法改进[J].微型机与应用,2014,33(14):78-81. 被引量：2
9谢忠红,苏坚,郭小清,姬长英.自然场景下树上桃子生长形态的识别[J].西华大学学报（自然科学版）,2015,34(2):6-9. 被引量：2
10杨渺,谢强,王维,徐玮,刘孝富.基于线性变换的水质综合评价方法[J].长江流域资源与环境,2015,24(1):156-161. 被引量：5

二级引证文献125

1刘欣雨.基于弹幕的突发信息安全类事件舆情分析——以“滴滴平台下架”事件为例[J].情报工程,2022,8(4):85-109. 被引量：1
2闫旭,邬建雄.图像处理技术在无人综采系统中的应用研究[J].煤炭科学技术,2022,50(S01):269-276.
3王鸿玺,李飞,林志文,罗义钊,梁海涛,胡建新.基于IK-means的用电行为研究[J].国外电子测量技术,2020,39(1):54-58. 被引量：5
4李绘卓,范勇,唐峻,唐遵烈,熊平,周建勇.一种区域多直方图红外图像增强方法[J].计算机应用研究,2012,29(2):772-774. 被引量：4
5一秀.让“背篓精神”重放异彩——记’99“服务‘三农’,全国农村图书大联展”[J].中国出版,2000(2):34-35.
6李浩,吴雪松.改进K-均值算法在雷达辐射源信号预分选中的应用[J].航空电子技术,2012,43(2):46-50. 被引量：1
7韩海.基于K-means算法的RGB图像色彩聚类[J].江汉大学学报（自然科学版）,2012,40(5):53-55. 被引量：3
8宋平,刘恒.基于聚类与均匀分布的图像显著性检测算法研究[J].微型机与应用,2013,32(3):38-41. 被引量：1
9张艳珠,宋修竹,王艳梅.基于物体材质的X射线安检图像分割算法[J].装备制造技术,2014(4):33-35. 被引量：2
10全卫澎,李卫华,李小春,贾春阳.基于统计与频谱模型特征融合的纹理图像分割[J].科学技术与工程,2014,22(19):106-111. 被引量：3

1郑权,刘循,魏海明.基于学习的霍夫变换线段组物体检测算法[J].计算机技术与发展,2014,24(1):26-30. 被引量：1
2陈庄,罗告成.一种改进的K-means算法在异常检测中的应用[J].重庆理工大学学报（自然科学）,2015,29(5):66-70. 被引量：11
3彭兴璇,唐雪娇,董星.基于改进SIFT算法在图像匹配中的研究[J].微型机与应用,2015,34(20):36-38. 被引量：2
4古孜丽塔吉.乃拜,库尔班.吾布力,卡米力.木依丁,艾斯卡尔.艾木都拉.基于多方向特征融合的维吾尔文笔迹鉴别技术[J].计算机工程与应用,2013,49(3):139-142. 被引量：2
5曹志宇,张忠林,李元韬.快速查找初始聚类中心的K_means算法[J].兰州交通大学学报,2009,28(6):15-18. 被引量：19
6王慧,申石磊.一种改进的特征加权K-means聚类算法[J].微电子学与计算机,2010,27(7):161-163. 被引量：12
7何志永.提升小波在笔迹鉴别中的应用[J].中国新技术新产品,2008(18):1-1.
8秦杰,司群,颜会娟,闫付亮.一种改进的基于混沌理论的木马检测器生成算法[J].微电子学与计算机,2012,29(4):101-103.
9宁顺刚,白万民,喻钧.基于灰度共生矩阵的图像分割方法研究[J].电子科技,2009,22(11):69-71. 被引量：12
10胥素芳,王俞.基于空间绝对距离的机器人自标定研究[J].制造业自动化,2015,37(9):96-98. 被引量：1

郑州大学学报（工学版）

2010年第1期

浏览历史

内容加载中请稍等...

基于加权欧式距离的k_means算法研究被引量：34

参考文献5

二级参考文献9

共引文献1073

同被引文献263

引证文献34

二级引证文献125

相关作者

相关机构

相关主题

浏览历史

基于加权欧式距离的k_means算法研究 被引量：34

参考文献5

二级参考文献9

共引文献1073

同被引文献263

引证文献34

二级引证文献125

相关作者

相关机构

相关主题

浏览历史

基于加权欧式距离的k_means算法研究被引量：34