学习特征权值对K-均值聚类算法的优化被引量：48

Optimization of K-means Clustering by Feature Weight Learning

下载PDF

导出

摘要 K 均值 (K means)算法聚类的结果依赖于距离度量的选取传统的K 均值算法选择的相似性度量通常是欧几里德距离的倒数 ,这种距离通常涉及所有的特征在距离公式中引入一些特征权参数后 ,其聚类结果将依赖于这些权值 ,从而可以通过调整这些权值优化聚类效果由于K 均值算法是迭代算法 ,很难直接确定其权值以优化聚类结果 ,因此提出了一种间接的学习权值算法以改进聚类结果从数学意义上讲 ,这种权值学习相当于欧氏空间中对一组点进行了一个线性变换 The performance of K-means clustering algorithm depends on the selection of distance metrics. The Euclidean distance is usually chosen as the similarity measure in the conventional K-means clustering algorithm, which usually relates to all attributes. When feature weight parameters are introduced to the distance formula, the performance will depend on the weight values and accordingly can be improved by adjusting weight values. Since K-means algorithm is iterative, it is difficult to optimize clustering results by giving weight values directly. An indirect learning feature weight algorithm is introduced to improve the clustering result. Mathematically it corresponds to a linear transformation for a set of points in the Euclidean space. The numerical experiments prove the validity of this algorithm.

作者王熙照王亚东湛燕袁方

机构地区河北大学数学与计算机科学学院机器学习研究中心哈尔滨工业大学计算机科学与工程学院

出处《计算机研究与发展》 EI CSCD 北大核心 2003年第6期869-873,共5页 Journal of Computer Research and Development

基金国家自然科学基金 ( 69975 0 0 5 60 2 730 83) 河北省自然科学基金 ( 698139) 河北省教育厅科研计划项目 ( 2 0 0 12 0 6)

关键词 K-均值聚类相似度量特征权值梯度下降技术 K-means clustering similarity metrics feature weight gradient-descent technique

分类号 TP181 [自动化与计算机技术—控制理论与控制工程] TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

同被引文献451

1王丙参,刘鹤飞,魏艳华.改进的传统距离聚类方法及应用[J].统计与决策,2021,37(4):64-68. 被引量：10
2祝庆荣,董守斌,陈彬.基于SMO和指纹技术在线邮件过滤方法与优化[J].郑州大学学报（理学版）,2009,41(1):90-93. 被引量：1
3高季章,胡春宏,陈绪坚.论黄河下游河道的改造与“二级悬河”的治理[J].中国水利水电科学研究院学报,2004,2(1):8-18. 被引量：25
4刘小芳,曾黄麟,吕炳朝.点密度函数加权模糊C-均值算法的聚类分析[J].计算机工程与应用,2004,40(24):64-65. 被引量：28
5李焱,范植华,洪志国,王勇.基于改进模糊聚类算法的评估数据一致性分析[J].微型机与应用,2004,23(5):56-58. 被引量：1
6王书宝,牛栓文.东辛油田多油层复杂断块油藏高含水后期细分层系研究[J].石油勘探与开发,2004,31(3):116-118. 被引量：36
7闫伟,张浩,陆剑峰,张辉.加权聚类分析在设备运行监控中的应用[J].计算机工程与应用,2004,40(26):31-32. 被引量：3
8李存华,孙志挥,陈耿,胡云.核密度估计及其在聚类算法构造中的应用[J].计算机研究与发展,2004,41(10):1712-1719. 被引量：64
9张廷宪,郑志刚.耦合非线性振子系统的同步研究[J].物理学报,2004,53(10):3287-3292. 被引量：15
10闫德勤,迟忠先.一种新的聚类算法[J].小型微型计算机系统,2004,25(11):1984-1985. 被引量：1

引证文献48

1李晓波,闫道儒,顾煜炯.数据均值聚类在故障模式识别中的应用[J].中国电力教育,2005(z1):249-251.
2张海龙,王仁彪,聂俊,刘进忠.海量数据的网格启发信息密度聚类算法[J].吉林大学学报（工学版）,2011,41(S2):254-258. 被引量：2
3汤亚玲,崔志明.基于遗传算法的Web用户聚类模型的研究[J].微电子学与计算机,2004,21(8):65-67. 被引量：4
4闫伟,张浩,陆剑峰,张辉.加权聚类分析在设备运行监控中的应用[J].计算机工程与应用,2004,40(26):31-32. 被引量：3
5LIUShuai-dong,CHENShi-hong.Clustering of Web Learners Based on Rough Set[J].Wuhan University Journal of Natural Sciences,2004,9(5):542-546.
6王太雷.基于相似模式聚类的电子商务网站个性化推荐系统研究[J].计算机工程与应用,2005,41(6):152-157. 被引量：6
7王太雷.个性化推荐系统中相似模式聚类研究[J].计算机工程,2005,31(10):156-158. 被引量：3
8蔡江辉,张华煜.离群数据挖掘方法研究[J].电脑开发与应用,2005,18(12):46-47. 被引量：1
9吕巍,陈洁.基于K-means算法的中国商业银行零售业务顾客行为细分策略[J].系统工程理论方法应用,2005,14(6):502-505. 被引量：1
10高原,耿国华,王怡.基于动态矩形的聚类方法的设计与实现[J].计算机应用,2006,26(4):870-871.

二级引证文献389

1蒙克,华冉,汪佩洁.重新发现比较社会政策研究:概念化与方法[J].中国公共政策评论,2020(2):1-27. 被引量：1
2吴宝祥,张玲,樊伟平.寨子河油区长8油藏注水开发研究[J].云南化工,2021,48(5):128-130. 被引量：1
3陈卫东,胡盛林.兼顾公平和效率原则的我国电力市场碳配额分配方案[J].煤炭经济研究,2020,40(1):15-21. 被引量：8
4郭林,程保增,张博.定量方法在古墓葬研究中的运用——以邹县野店墓地为例[J].洛阳考古,2022(2):24-29.
5梁刚,赵伟,丁文珂.基于内容的个性化网站设计[J].开封教育学院学报,2006,26(4):49-51.
6汤亚玲,崔志明.遗传算法在Web关联挖掘中的应用研究[J].微电子学与计算机,2005,22(10):4-6. 被引量：4
7陈冬林,聂规划.基于商品属性隐性评分的协同过滤算法研究[J].计算机应用,2006,26(4):966-968. 被引量：12
8汤亚玲,崔志明.遗传算法在Web关联挖掘中的应用研究[J].微电子学与计算机,2006,23(6):126-129. 被引量：4
9汤亚玲,崔志明.基于遗传算法的Web行为挖掘研究[J].微电子学与计算机,2006,23(8):168-170. 被引量：2
10闫伟,童祯恭,廖西亮.一种设备实时监控新方法的研究与应用[J].计算机集成制造系统,2006,12(8):1288-1292.

1鲍连承,赵景波,朱海斌.神经网络控制的稳定性与收敛性分析[J].青岛大学学报（自然科学版）,2001,14(3):40-44.
2王智平,刘在德,高成秀,路阳.遗传算法在BP网络权值学习中的应用[J].甘肃工业大学学报,2001,27(2):20-22. 被引量：33
3何建民,孙德敏.前馈神经网络权值学习的复合形法[J].微机发展,1998,8(3):4-6.
4周咏梅,阳爱民,沈智慧.一种基于神经网络的模糊推理和规则生成方法[J].计算机工程与应用,2004,40(13):49-51. 被引量：10
5庄哲民,肖广辉,曹勤.基于遗传神经网络的异步电动机故障诊断研究[J].测试技术学报,2004,18(4):377-380. 被引量：10
6Mohammed I.ABOUHEAF,Frank L.LEWIS,Magdi S.MAHMOUD,Dariusz G.MIKULSKI.Discrete-time dynamic graphical games:model-free reinforcement learning solution[J].Control Theory and Technology,2015,13(1):55-69. 被引量：6
7陈智军.基于改进型遗传算法的前馈神经网络优化设计[J].计算机工程,2002,28(4):120-121. 被引量：12
8赵阿妮.基于权值学习的FPN攻击模型研究[J].福建电脑,2009,25(3):88-89.
9高航,王建平.函数链神经网络的性能改进[J].计算机应用与软件,1999,16(2):41-45.
10罗文广.基于模拟电路的无刷直流电动机神经元控制器研究[J].电气传动自动化,2003,25(3):28-30.

计算机研究与发展

2003年第6期

浏览历史

内容加载中请稍等...

学习特征权值对K-均值聚类算法的优化被引量：48

同被引文献451

引证文献48

二级引证文献389

相关作者

相关机构

相关主题

浏览历史

学习特征权值对K-均值聚类算法的优化 被引量：48

同被引文献451

引证文献48

二级引证文献389

相关作者

相关机构

相关主题

浏览历史

学习特征权值对K-均值聚类算法的优化被引量：48