优化K均值随机初始中点的改进算法被引量：4

Three Improved Algorithms for Optimizing of Randomly-initiated K-means Midpoints

下载PDF

导出

摘要针对传统K均值随机产生的初始聚类中心的方式提出最近邻K均值、极远邻K均值和自适应K均值3种优化算法。最近邻K均值是通过寻找多维空间下欧氏σ邻近点的方式确定K群;而极远邻K均值是极远σ邻判定确定法;自适应K均值是将数据集确定到矩阵中,对矩阵做归一化、二元化处理后,计算各向量间的相异度来修正确定初始中心点的加权欧氏距离。3种优化算法改善了原始K均值算法,提高了算法的稳定性和精确度,而且它们各自适用于不同的应用空间。 Aiming at traditional K-means which randomly generating initial clustering centers,the N2-K-means,F2-K-means and SA-K-means center point optimization algorithms were proposed,in which,the N2-K-means determines group K by looking for Euclideannearby points in multidimensional space;and F2-K-means employs a very far neighbor method;and the SA-K-means converts the data sets from the separate data into matrix,and then has them normalized and dualized to calculate the dissimilarity between every vector so as to modify Euclidean distance of each initial center.This three algorithms suitable for different spaces can improve the traditional K-means algorithm and promote its stability and accuracy.

作者王秀芳王岩

机构地区北京邮电大学信息与通信工程学院东北石油大学电气信息工程学院

出处《化工自动化及仪表》 CAS 2012年第10期1302-1304,共3页 Control and Instruments in Chemical Industry

基金黑龙江省教育厅科学技术重点项目(12511z002)

关键词最近邻K均值极远邻K均值自适应K均值欧氏距离初始聚类中心 N2-K-means,F2-K-means,SA-K-means,Euclidean distance,initial clustering center

分类号 TH701 [机械工程—精密仪器及机械]

引文网络
相关文献

参考文献6

1孙庚,冯艳红,郭显久,张春平.K-means聚类算法研究[J].长春师范学院学报（自然科学版）,2011,30(1):1-4. 被引量：9
2周慧芳.自适应的k-means聚类算法SA-K-means[J].科技创新导报,2009,6(34):4-5. 被引量：3
3徐义峰,陈春明,徐云青.一种改进的k-均值聚类算法[J].计算机应用与软件,2008,25(3):275-277. 被引量：41
4原福永,张晓彩,罗思标.基于信息熵的精确属性赋权K-means聚类算法[J].计算机应用,2011,31(6):1675-1677. 被引量：37
5毛韶阳,李肯立.K-means初始聚类中心优化算法研究[J].重庆邮电大学学报（自然科学版）,2007,19(4):422-425. 被引量：6
6王守强,朱大铭,史士英.基于最小聚类划分的K-means聚类(1+ε)近似算法[J].计算机研究与发展,2008,45(z1):26-30. 被引量：5

二级参考文献38

1司永胜,刘刚,高瑞.基于K-均值聚类的绿色苹果识别技术[J].农业机械学报,2009,40(S1):100-104. 被引量：50
2逄玉俊,柳明,李元.k均值聚类分析在过程改进中的应用[J].华中科技大学学报（自然科学版）,2009,37(S1):245-247. 被引量：9
3潘锐,朱大铭,马绍汉,肖进杰.k-Median近似计算复杂度与局部搜索近似算法分析[J].软件学报,2005,16(3):392-399. 被引量：8
4陈雷,王延章.熵权法对融合网络服务质量效率保障研究[J].计算机工程与应用,2005,41(23):1-3. 被引量：3
5杨善林,李永森,胡笑旋,潘若愚.K-MEANS算法中的K值优化问题研究[J].系统工程理论与实践,2006,26(2):97-101. 被引量：190
6[1]HAN J,KAMBER M.数据挖掘概念与技术[M].范明,孟小峰,译.北京:机械工业出版社,2002.223-262
7[2]KUMAR M,NITIN R P,JAMES B O.Clustering data with measurement errors[EB/OL].(2002-09-28)[2006-12-20].http://oz.stern.nyu.edu/seminar/fa03/1009.pdf.
8[3]SU M C,CHOU C H.A modified version of the Kmeans algorithm with a distance based on cluster symmetry[J].IEEE Trans on Pattern Analysis and Machine Intelligence,2001,23(6):674-680.
9[4]USAMA M F,CORY R,PAUL S B.Initialization of interactive refinement clustering algorithms[C]//Proceedings of Fourth International Conference on Knowledge Discovery and Data Mining,Menlo Park:AAA I Press,1998.194-198.
10[5]CHAUDHURI D,CHAUDHURI B B.A novel multiseed nonhierarchical data clustering technique[J].IEEE Transactions on Systems,Man and Cybernetics:Part B,1997,27 (5):871-877.

共引文献95

1Kui Luo,Wenhui Shi,Weisheng Wang.Extreme scenario extraction of a grid with large scale wind power integration by combined entropy-weighted clustering method[J].Global Energy Interconnection,2020,3(2):140-148. 被引量：7
2张红荣,张峰.传统的K-means聚类算法的研究与改进[J].咸阳师范学院学报,2010,25(4):59-62. 被引量：4
3郑攀,庹武.基于K-means聚类算法的女裤弹性面料分类研究[J].国际纺织导报,2014,42(5):71-72. 被引量：1
4步媛媛,关忠仁.基于K-means聚类算法的研究[J].西南民族大学学报（自然科学版）,2009,35(1):198-200. 被引量：23
5刘文,郑丽英.基于蚁群算法的模糊C均值聚类[J].太原科技,2009(1):57-59. 被引量：2
6雷宏,张著洪.受约束的两类数据分割算法及其应用[J].贵州大学学报（自然科学版）,2009,26(2):85-89.
7张继怀,顾洪博.数据挖掘技术在电子政务中的应用[J].中国科技信息,2009(13):178-178.
8刘俊,商秀芹,卢建刚,陈金水,孙优贤.采用中心聚类与PSO的RBF网络设计方法[J].计算机工程与应用,2009,45(36):212-215. 被引量：3
9顾洪博,赵万平.数据挖掘算法性能优化的研究与应用[J].长春理工大学学报（自然科学版）,2010,33(1):164-166. 被引量：9
10陈杰,朱娟.基于簇间相似度判定的自适应K均值算法[J].计算机工程与设计,2010,31(10):2270-2272. 被引量：1

同被引文献43

1张鹏.Arbor Pravail APS:专注抵御应用层DDoS攻击[J].通信世界,2011(37):41-41. 被引量：1
2潘明清,周晓军,吴瑞明,雷良育.基于主元分析的支持向量数据描述机械故障诊断[J].传感技术学报,2006,19(1):128-131. 被引量：18
3郭强,李育安,郭耀煌.社区儿童接送服务车辆的线路优化[J].西南交通大学学报,2006,41(4):486-490. 被引量：8
4谢逸,余顺争.基于Web用户浏览行为的统计异常检测[J].软件学报,2007,18(4):967-977. 被引量：42
5Adrian B,Elyot G.The school bus problem on trees[J]. Algorithmica, 2012.
6Barry M Wise, Neal B Gallagher. A Comparison of Principal Com- ponent Analysis, Multiway Principal Component Analysis, Trilinear Decomposition and Parallel Factor Analysis for Fault Detection in a Semiconductor Etch Process [ J ] Journal of Chemometrics 1999,13 :379-396.
7Jong-Min Lee,ChangKyoo Yoo, In-Beum Lee. On-Line Batch Process Monitoring Using a Consecutively Updated Multiway Prin- cipal Component Analysis Model [ J ]. Computers and Chemical En- gineering, 2003,27 : 1903-1912.
8Chen J,Liu K C. On-Line Batch Process Monitoring Using Dynamic PCA and Dynamic PLS Models Chemical Engineering Science, 2002,57( 1 ) :63275.
9Jeong Jin Hong, Jie Zhang, Julian Morris. Progressive Multi-Block Modelling for Enhanced Fault Isolation in Batch Processes [ J ]. Journal of Process Control,2014(24) :13-26.
10郑松,侯迪波,周泽魁.动态调整选择策略的改进蚁群算法[J].控制与决策,2008,23(2):225-228. 被引量：40

引证文献4

1杨宏宇,常媛.基于K均值多重主成分分析的App-DDoS检测方法[J].通信学报,2014,35(5):16-24. 被引量：13
2高选幸,孙卫红,周忠凯,童晓.校车的线路选择及优化设计方法[J].计算机工程与应用,2015,51(12):246-249. 被引量：1
3陶栋琦,薄翠梅,易辉.基于多时段MPCA的半导体蚀刻过程监测方法[J].传感技术学报,2015,28(6):798-802. 被引量：3
4吴霜,季聪,孙国强.基于CUDA技术的海量电力负荷曲线聚类算法[J].电力工程技术,2018,37(4):65-70. 被引量：8

二级引证文献25

1谢立春,张春琴.基于云模型的网络攻击检测方法及其性能分析[J].计算机科学,2015,42(B11):378-380. 被引量：4
2黄晓丹,罗伟,李秀峰,李晓冰,刘建建.基于TF-IDF算法的AAA服务异常检测机制研究[J].移动通信,2016,40(2):83-87. 被引量：2
3陆梦秋.撤点并校背景下农村义务教育服务半径分析[J].经济地理,2016,36(1):143-147. 被引量：29
4张昌明.一种基于模糊数学思想的K均值算法[J].软件导刊,2016,15(5):41-43. 被引量：1
5张明明,李玉峰,张鹏,孙淼.大流量下一种基于活跃熵的DDoS攻击检测方法[J].计算机应用研究,2016,33(7):2148-2151. 被引量：5
6张伟,刘振斌.面向Web服务的SYN flood攻击防护算法[J].计算机工程与设计,2016,37(12):3165-3170. 被引量：1
7孙梦尧,朱明,申纯洁.源端网络检测与抑制DDoS方法的研究[J].计算机测量与控制,2018,26(1):289-291. 被引量：2
8杨宏宇,王玥.云存储环境下的多关键字密文搜索方法[J].计算机应用,2018,38(2):343-347. 被引量：6
9张斌,刘自豪,董书琴,李立勋.基于偏二叉树SVM多分类算法的应用层DDoS检测方法[J].网络与信息安全学报,2018,4(3):24-34. 被引量：5
10郑皓,熊伟丽.基于多阶段ICA-SVDD的间歇过程故障监测[J].南京理工大学学报,2018,42(2):195-203. 被引量：3

1滕红智,赵建民,贾希胜,张星辉,王正军.基于CHMM的齿轮箱状态识别研究[J].振动与冲击,2012,31(5):92-96. 被引量：21
2姚立国,黄海松.改进K均值模拟退火聚类算法的滚动轴承故障诊断[J].组合机床与自动化加工技术,2017(4):114-117. 被引量：3
3徐晓俊,郭春生,高业田.最优化NN型行星传动齿数确定法[J].哈尔滨科学技术大学学报,1989,13(4):64-68.
4孙成亮.高精度光度仪器不准确度的确定[J].光电子．激光,1990,1(4):240-244.
5周昌治,杨仁逖,汪万清.对称度误差的间接确定法[J].四川工业学院学报,1990,9(1):3-11.
6张峻宁,张培林,陈彦龙,孙也尊,杨望灿.基于多层多位置稀疏的滑动轴承AE信号降噪[J].振动与冲击,2016,35(19):107-112. 被引量：1
7卢熹,孙庆鸿.基于变量特性的结构优化方法研究[J].制造业自动化,2003,25(12):15-17. 被引量：2
8黄鹏程,林雪,鲍官军,杨庆华.手指肌电信号稀疏分解重构与活动段特征提取研究[J].机电工程,2016,33(5):566-572. 被引量：1
9戴吉国.钢制压力容器残余应力的Mises屈服条件确定法[J].机械设计与制造,2004(4):61-62. 被引量：2
10赵俊杰.基于特征加权的KNNFP改进算法及在故障诊断中的应用[J].电子技术应用,2011,37(4):113-116. 被引量：2

化工自动化及仪表

2012年第10期

浏览历史

内容加载中请稍等...

优化K均值随机初始中点的改进算法被引量：4

参考文献6

二级参考文献38

共引文献95

同被引文献43

引证文献4

二级引证文献25

相关作者

相关机构

相关主题

浏览历史

优化K均值随机初始中点的改进算法 被引量：4

参考文献6

二级参考文献38

共引文献95

同被引文献43

引证文献4

二级引证文献25

相关作者

相关机构

相关主题

浏览历史

优化K均值随机初始中点的改进算法被引量：4