改进的k-means算法在三支决策中的应用研究被引量：2

Application Research of Improved k-means Algorithm in Three Decisions

下载PDF

导出

摘要针对传统k-means算法不适用有不确定因素存在的环境和现有的三支k-means聚类分析中并未避免传统k-means算法随机选择初始簇中心而导致聚类结果不稳定的问题,论文提出一种改进的k-means算法,借助层次聚类算法和数学抽样方法,结合定义的聚类结果评估有效性指数,获得一组较优的初始中心,并将其作为k-means算法的初始簇中心,然后引进三支决策聚类理论方法进行聚类结果的优化,使其适应具有不确定因素的环境。实验表明,此方法在UCI数据集上的聚类效果、准确率和稳定性均有所提高。 The traditional k-means algorithm is not applicable to the environment with uncertain factors and the existing three k-means clustering analysis does not avoid the problem that the traditional k-means algorithm randomly selects the initial cluster center and leads to unstable clustering results.In this paper,an improved k-means algorithm is proposed.By using hierarchical clustering algorithm and mathematical sampling method,combined with the defined clustering results to evaluate the validity index,a set of better initial centers is obtained and used as k-means algorithm.The initial cluster center,then introduces three decision clustering theory methods to optimize the clustering results to adapt to the environment with uncertain factors.Experiments show that the clustering effect,accuracy and stability of this method on the UCI dataset are improved.

作者蔺艳艳陆介平王郁鑫傅廷妍 LIN Yanyan;LU Jieping;WANG Yuxin;FU Tingyan(School of Computer Science,Jiangsu University of Science and Technology,Zhenjiang 212001)

机构地区江苏科技大学计算机学院

出处《计算机与数字工程》 2020年第6期1294-1299,1353,共7页 Computer & Digital Engineering

关键词聚类有效性指数 K-MEANS算法三支聚类 clustering validity index k-means algorithm three branch clustering

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1郁启麟.K-means算法初始聚类中心选择的优化[J].计算机系统应用,2017,26(5):170-174. 被引量：25
2冯波,郝文宁,陈刚,占栋辉.K-means算法初始聚类中心选择的优化[J].计算机工程与应用,2013,49(14):182-185. 被引量：49
3黄韬,刘胜辉,谭艳娜.基于k-means聚类算法的研究[J].计算机技术与发展,2011,21(7):54-57. 被引量：87

二级参考文献25

1杨善林,李永森,胡笑旋,潘若愚.K-MEANS算法中的K值优化问题研究[J].系统工程理论与实践,2006,26(2):97-101. 被引量：188
2钱线,黄萱菁,吴立德.初始化K-means的谱方法[J].自动化学报,2007,33(4):342-346. 被引量：32
3毛韶阳,李肯立.优化K-means初始聚类中心研究[J].计算机工程与应用,2007,43(22):179-181. 被引量：26
4Tan Pang-Ning,Steinbach M,Kuma V.Introduction to DataMining[M].北京:人民邮电出版社,2006:5-28.
5Hand D J,Vinciotti V.Choosing k for two-class nearest neighbor classifiers with unbalance classes[J].Pattern Recognition Letter,2003,24(9):1555-1562.
6Cuba S,Rastogi R,Shim K.CURE:An efficient clustering algorithm for large databases[C]//In:Hass L M,Tiwary A.Proc.of the ACM SIGMOD Int'1 Conf.on Management of Data.New York:ACM Press,1998:73-84.
7Harmer P K,Williams P D,Gunsch G H.An Artificial Immune System Architecture for Computer Security Applications[J].IEEE Transactions on Evolutionary Computation,2002,6(3):252-280.
8Yang M S,Hu Y J,Lin K C R,et al.Segmenttation techniques for tissue differentiation in MRI of ophthalmology using fuzzy clustering algorithm[J].Magnetic Resonance Imaging,2002(20):173-179.
9王玲,薄列峰,焦李成.密度敏感的谱聚类[J].电子学报,2007,35(8):1577-1581. 被引量：61
10Han Jiawei, Micheline Kamber. Data mining concepts and techniques[M].北京:机械工业出版社,2006.

共引文献157

1杨通辉,高玲,臧丽.基于相似性的商品陈列研究[J].微型机与应用,2012,31(5):59-61.
2王晶,孙世群,邵超,孙尔宝.模糊聚类分析法在水质监测断面优化中的应用[J].广州化工,2012,40(7):153-154. 被引量：9
3吴琰嘉,唐正宁,李俊锋.CIEL*a*b*色空间中基于爬山聚类算法的网点面积率检测研究[J].包装工程,2012,33(19):149-152. 被引量：2
4詹辉煌,朱敏琛.一种改进的动态K-means聚类算法[J].微型机与应用,2012,31(20):74-76. 被引量：2
5米晓萍,张建峰.网络舆情算法的研究与应用[J].计算机光盘软件与应用,2012,15(22):5-7.
6张磊,张公让,张金广.一种网格化聚类算法的MapReduce并行化研究[J].计算机技术与发展,2013,23(2):60-64. 被引量：3
7刘芳,郭宇春.基于数据挖掘的用户忠诚度分析[J].计算机技术与发展,2013,23(7):14-17. 被引量：3
8闵锋,鲁统伟,邹旭.自适应子空间选择方法研究[J].计算机技术与发展,2013,23(10):83-86. 被引量：1
9翟东海,聂洪玉,崔静静,杜佳.基于自适应簇中心选择的文本聚类算法研究[J].成都信息工程学院学报,2013,28(6):617-622. 被引量：1
10李蓉,周维柏.基于改进的K-Means算法入侵检测框架[J].实验室研究与探索,2014,33(3):110-114. 被引量：3

同被引文献15

1叶昱程,严伟林.杭州市造纸行业能耗现状及节能分析[J].节能技术,2013,31(4):367-370. 被引量：3
2张江石,赵群,张文越.安全管理实践与行为关系研究[J].安全与环境学报,2018,18(6):2279-2284. 被引量：11
3刘耀瑶,李祥宇,张光锐,杜文强,蔡贝贝,王海燕,刘鸿斌.基于多元统计分析的造纸废水处理过程传感器故障检测[J].中华纸业,2017,38(8):41-48. 被引量：2
4李敬强,王蓓,赵宁,李灏,王勇.基于k-means聚类的管制员注意品质特征研究[J].中国安全科学学报,2017,27(6):13-18. 被引量：6
5薛宇敬阳,傅贵.通用航空飞行事故不安全动作原因作用路径的统计分析[J].安全与环境工程,2018,25(2):131-138. 被引量：18
6边俊奇,毕建乙,王海东.基于安全行为观察的煤矿安全管理研究[J].煤矿开采,2019,24(1):150-152. 被引量：12
7孟子薇,洪蒙纳,李继庚,满奕.基于梯度增强回归树算法的磨浆过程打浆度软测量模型[J].造纸科学与技术,2019,38(1):83-88. 被引量：6
8傅贵,郭孝臣.事故致因理论的研究与应用简评[J].安全,2019,40(9):1-4. 被引量：19
9Yi Man,Yulin Han,Jigeng Li,Mengna Hong.Review of energy consumption research for papermaking industry based on life cycle analysis[J].Chinese Journal of Chemical Engineering,2019,27(7):1543-1553. 被引量：6
10付净,傅贵,聂方超,刘虹,王泽恒.煤矿事故不安全动作原因识别及作用研究[J].煤矿安全,2020,51(1):242-245. 被引量：6

引证文献2

1鞠春雷,邓慧敏,张永杰,吴悠,张江石,郭金山.基于SCM与K-means聚类算法的矿工不安全动作分类特征研究[J].煤矿安全,2021,52(11):261-264. 被引量：2
2刘昌,何正磊,朱小林,满奕.基于机器学习的造纸用能负荷特征日获取模型[J].造纸科学与技术,2023,42(2):6-12.

二级引证文献2

1张艳军,肖渭,高伟.不安全操作对煤矿生产系统因果回路及安全影响[J].微型电脑应用,2024,40(1):16-18.
2李珏,蒋敏.谱聚类和Apriori算法在建筑坍塌事故致因组合分析中的应用[J].安全与环境学报,2024,24(2):617-625.

1赵国炫,鲁文军,喻锟,谢靖言,曾祥君.基于K-means聚类分析的风电场集电线路保护方法[J].电力系统及其自动化学报,2020,32(7):39-46. 被引量：8
2张勇,张建伟,韩云祥.一种改进的航迹聚类方法[J].现代计算机,2020,26(18):11-18. 被引量：1
3鲍芳,袁园媛,张靖弦,黄海燕.马拉松消费者行为研究:特征、挑战与趋势[J].武汉体育学院学报,2020,54(6):10-18. 被引量：13

计算机与数字工程

2020年第6期

浏览历史

内容加载中请稍等...

改进的k-means算法在三支决策中的应用研究被引量：2

参考文献3

二级参考文献25

共引文献157

同被引文献15

引证文献2

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

改进的k-means算法在三支决策中的应用研究 被引量：2

参考文献3

二级参考文献25

共引文献157

同被引文献15

引证文献2

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

改进的k-means算法在三支决策中的应用研究被引量：2