期刊文献+

基于加权欧式距离的k_means算法研究 被引量:34

Research Based on Euclid Distance with Weights of K_means Algorithm
下载PDF
导出
摘要 传统的k_means算法将欧式距离作为最常用的距离度量方法.针对基于欧式距离计算样本点与类间相似度的不足,用"相对距离"代替"绝对距离"可以更好地反映样本的实际分布,提出一种在领域知识未知的情况下基于加权欧式距离的k_means算法.针对公共数据库UCI里的数据实验表明改进后的算法能产生质量较高的聚类结果. Euclid distance is commonly used to measure distance in the traditional k_means algorithm.The k_means algorithm based on weighted Euclid distance is researched and presented to overcome the existing problems of similarity calculation in clustering analysis based on traditional Euclid distance when we have no any domain knowledge about the data objects,the relative distance but not absolute distance is more accurately response to data distribution.Experiments on the standard database UCI show that the proposed method can produce a high accuracy clustering result.
出处 《郑州大学学报(工学版)》 CAS 北大核心 2010年第1期89-92,共4页 Journal of Zhengzhou University(Engineering Science)
基金 兰州市企业技术攻关计划资助(2009-1-4) 兰州交通大学"青蓝"人才工程基金资助(QL-05-10A)
关键词 k_means算法 聚类 加权 变异系数 k_means algorithm clustering weight coefficient of variation
  • 相关文献

参考文献5

  • 1PANG N T,MICHAEL S,VIPIN K.数据挖掘导论(英文版)[M].北京:人民邮电出版社,2006.
  • 2HAN JW,KAMBER M.数据挖掘概念与技术[M].北京:机械工业出版社,2005.
  • 3沈洁,赵雷,杨季文,李榕.一种基于划分的层次聚类算法[J].计算机工程与应用,2007,43(31):175-177. 被引量:13
  • 4孙吉贵,刘杰,赵连宇.聚类算法研究[J].软件学报,2008(1):48-61. 被引量:1060
  • 5马卫武 李念平 杨志昂.室内空气品质综合评价权重系数的确定与分析.通风除尘,2004,(11):9-11.

二级参考文献9

共引文献1073

同被引文献263

引证文献34

二级引证文献125

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部