基于初始均值点离散化的改进K-means算法被引量：1

Improved K-means algorithm based on discretization of initial average point

下载PDF

导出

摘要聚类分析是一种重要的数据挖掘方法,K-means算法是其中最常用的基于划分的方法。本文提出了一种基于初始均值点离散化的改进K-means算法。改进的算法在选取初始均值点时,尽量使初始均值点的分布离散化,解决了传统算法中随机选取初始均值点所造成的一些问题。同时,为了得到更高质量的聚类结果,本文进行了数据集中的离群点检测和自动确定参数k的最佳取值两方面的前期处理工作。实验证明,改进后的算法明显优于传统算法。 The clustering analysis is an important method of data mining,where K-means algorith is a com-monly used method base on classification. An improved K-means algorithm based on discretization of initial average point is proposed. When selecting the initial average point,the distribution of the initial average point should be discrete to overcome the problems in traditional algorithm. In order to improve the quality of clustering results,the detection of the outliers and the auto commit of the parameter k are carried out. The experi-ment shows that the improved algorithm is better than traditional algorithm.

作者许辉杨志浩王莉

机构地区鞍山广播电视台辽宁科技大学软件学院辽宁科技大学电子与信息工程学院

出处《辽宁科技大学学报》 CAS 2014年第5期455-459,共5页 Journal of University of Science and Technology Liaoning

基金国家自然科学基金(71472081)

关键词聚类分析 K-means算法改进离群点检测 clustering analysis improved algorithm of K-means outlier detection

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献8

1Han Jiawei,Kamber Micheline,范明,孟小峰,等译.数据挖掘概念与技术[M].北京:机械工业出版社,2007:424-479.
2韩晓红,胡彧.K-means聚类算法的研究[J].太原理工大学学报,2009,40(3):236-239. 被引量：45
3夏宁霞,苏一丹,覃希.一种高效的K-medoids聚类算法[J].计算机应用研究,2010,27(12):4517-4519. 被引量：47
4李永森,杨善林,马溪骏,胡笑旋,陈增明.空间聚类算法中的K值优化问题研究[J].系统仿真学报,2006,18(3):573-576. 被引量：39
5雷小锋,谢昆青,林帆,夏征义.一种基于K-Means局部最优性的高效聚类算法[J].软件学报,2008,19(7):1683-1692. 被引量：113
6张健沛,杨悦,杨静,张泽宝.基于最优划分的K-Means初始聚类中心选取算法[J].系统仿真学报,2009,21(9):2586-2590. 被引量：61
7汪中,刘贵全,陈恩红.一种优化初始中心点的K-means算法[J].模式识别与人工智能,2009,22(2):299-304. 被引量：139
8黄韬,刘胜辉,谭艳娜.基于k-means聚类算法的研究[J].计算机技术与发展,2011,21(7):54-57. 被引量：87

二级参考文献64

1余建桥,张帆.基于数据场改进的PAM聚类算法[J].计算机科学,2005,32(1):165-167. 被引量：15
2王汉芝,刘振全.一种新的确定K-均值算法初始聚类中心的方法[J].天津科技大学学报,2005,20(4):76-79. 被引量：9
3李永森,杨善林,马溪骏,胡笑旋,陈增明.空间聚类算法中的K值优化问题研究[J].系统仿真学报,2006,18(3):573-576. 被引量：39
4张文君,顾行发,陈良富,余涛,许华.基于均值-标准差的K均值初始聚类中心选取算法[J].遥感学报,2006,10(5):715-721. 被引量：57
5FAHIM A.M,SALEM A.M,TORKEY F.A,RAMADAN M.A.An efficient enhanced k-means clustering algorithm[J].Journal of Zhejiang University-Science A(Applied Physics & Engineering),2006,7(10):1626-1633. 被引量：30
6钱线,黄萱菁,吴立德.初始化K-means的谱方法[J].自动化学报,2007,33(4):342-346. 被引量：32
7牛琨,张舒博,陈俊亮.融合网格密度的聚类中心初始化方案[J].北京邮电大学学报,2007,30(2):6-10. 被引量：15
8袁方,周志勇,宋鑫.初始聚类中心优化的k-means算法[J].计算机工程,2007,33(3):65-66. 被引量：152
9Han J, Kamber M. Data Mining Concepts and Techniques. Orlando, USA: Morgan Kaufmann Publishers, 2001
10Huang J Z, Ng M K, Rang Hongqiang, et al. Automated Variable Weighting in K-means Type Clustering. IEEE Trans on Pattern Analysis and Machine Intelligence, 2005, 27 (5) : 657 - 668

共引文献527

1吕政阳,邓涛,张丽艳.一种基于机器视觉的飞机钣金件跨粒度识别方法[J].仪器仪表学报,2020,41(2):195-204. 被引量：10
2郑攀,庹武.基于K-means聚类算法的女裤弹性面料分类研究[J].国际纺织导报,2014,42(5):71-72. 被引量：1
3曹树志,项响琴.基于改进的K_Means算法的城市高架桥交通流分析[J].公路交通科技（应用技术版）,2010,6(10):261-264.
4高飞,鱼江,任芳,黄保瑞,次旺多吉.四维文档向量模型的k-means新闻文本聚类算法[J].西藏大学学报（社会科学版）,2013,28(4):109-112.
5王海,高岭,陈东棋,任杰.一种基于用户行为的嵌入式功耗优化方法[J].系统仿真学报,2015,27(2):320-326.
6陈兴蜀,吴小松,王文贤,王海舟.基于特征关联度的K-means初始聚类中心优化算法[J].四川大学学报（工程科学版）,2015,47(1):13-19. 被引量：29
7周顺先,林亚平,王耀南,易叶青.基于聚簇隐马尔可夫模型的文本信息抽取[J].系统仿真学报,2007,19(21):4926-4931. 被引量：2
8吴艳文,胡学钢.一种K-means算法的k值优化方案[J].巢湖学院学报,2007,9(6):21-24. 被引量：6
9耿晴.基于SSPG的空间聚类初始种子选择方法[J].地理空间信息,2008,6(4):58-61. 被引量：1
10魏士俨.基于SOM神经网的方向纹理分割[J].中国科技信息,2009(4):53-54.

同被引文献9

1亓常松,孙吉贵,于海鸿.基于离散度的决策树构造方法[J].控制与决策,2008(1):51-55. 被引量：5
2冯少荣,肖文俊.基于样本选取的决策树改进算法[J].西南交通大学学报,2009,44(5):643-647. 被引量：18
3黄宇达,王迤冉.基于朴素贝叶斯与ID3算法的决策树分类[J].计算机工程,2012,38(14):41-43. 被引量：19
4陈建凯,王熙照,高相辉.改进的基于排序熵的有序决策树算法[J].模式识别与人工智能,2014,27(2):134-140. 被引量：10
5章晓,何熊熊,朱忠记,赵松.基于粗糙集方法的决策树多值偏向理论分析[J].杭州电子科技大学学报（自然科学版）,2014,34(2):41-44. 被引量：2
6王文霞.数据挖掘中改进的C4.5决策树分类算法[J].吉林大学学报（理学版）,2017,55(5):1274-1277. 被引量：25
7安葳鹏,尚家泽.决策树C4.5算法的改进与分析[J].计算机工程与应用,2019,55(12):169-173. 被引量：22
8赵乐,麦范金,张兴旺.多特征融合的Voting-SRM情感分类研究[J].小型微型计算机系统,2019,40(11):2269-2273. 被引量：10
9黄晓辉,王成,熊李艳,曾辉.一种集成簇内和簇间距离的加权k-means聚类方法[J].计算机学报,2019,42(12):2836-2848. 被引量：40

引证文献1

1王磊,刘雨,刘志中,齐俊艳.基于属性离散和特征度量的决策树构建算法[J].河南理工大学学报（自然科学版）,2021,40(3):127-133. 被引量：11

二级引证文献11

1陈晓,刘志亮,王旭,薛力园,袁晓博.秦皇岛海域海月水母碟状体分布与环境因子关系的多粒度分析[J].海洋通报,2021,40(6):694-708.
2孙凯.训练器辅助下运动员在训练中的心率自动监测研究[J].自动化与仪器仪表,2022(6):154-158.
3秦国阳,李生启,秦勇.树形模型在青少年体质测试数据分析中的应用研究[J].六盘水师范学院学报,2022,34(3):113-120. 被引量：1
4张莉,丁毛毛,李玮,王颖,吕静贤,王笑一.基于决策树算法的客服终端冗余数据迭代消除方法[J].计算技术与自动化,2022,41(4):118-122. 被引量：5
5华振兴.决策树算法在无人船异构通信网络切换中的应用[J].舰船科学技术,2022,44(24):67-70.
6王建琴.基于改进决策树的数据挖掘与分析算法设计[J].电子设计工程,2024,32(4):84-88. 被引量：1
7李文.决策树优化选择下城市交通出行特征研究[J].现代电子技术,2024,47(5):182-186.
8徐寅森,李红艳,张子栋.基于机器学习的传感网核心节点漏洞检测仿真[J].计算机仿真,2024,41(3):410-414.
9赵东生,张荣荣,黄晓明,李敬轩,徐秋露.基于数据挖掘技术的区块链数据推荐算法[J].自动化与仪器仪表,2024(4):67-70.
10张成玉,刘宁.基于决策树分类思想的线上思政教学课程推荐方法设计[J].现代科学仪器,2024,41(2):180-185.

1张宁.离群点检测算法研究[J].桂林电子科技大学学报,2009,29(1):22-25. 被引量：5
2张宏博,江弋.改进K-means算法在网络入侵检测中的应用[J].福建电脑,2012,28(1):89-91. 被引量：2
3谷瑞军.数据流挖掘研究进展[J].中国电子商情（通信市场）,2010(3):119-123.
4李法运,农罗锋.基于向量语义相似度的改进K-Means算法[J].情报科学,2013,31(2):34-37. 被引量：2
5杨明霞,张露,丁霞军,叶冬芬.WSN数据流离群点挖掘研究[J].数字技术与应用,2013,31(7):86-86.
6刘寒梅,张鹏.基于模拟退火算法对K-means聚类算法的优化[J].中国西部科技,2013,12(6):23-24. 被引量：2
7陈积,李海珍.基于改进k-means算法的入侵检测系统及其应用研究[J].企业科技与发展,2014(5):53-56. 被引量：2
8刘培奇,孙靖,段中兴.高维空间中离群点检测算法研究[J].微电子学与计算机,2013,30(7):68-71.
9吕明磊,刘冬梅,曾智勇.基于改进K-means算法的图像检索方法[J].计算机应用,2013,33(A01):195-198. 被引量：10
10余光莉,詹英,王水.Weka平台基础类分析及算法扩展方法[J].南阳理工学院学报,2009,1(6):9-11.

辽宁科技大学学报

2014年第5期

浏览历史

内容加载中请稍等...

基于初始均值点离散化的改进K-means算法被引量：1

参考文献8

二级参考文献64

共引文献527

同被引文献9

引证文献1

二级引证文献11

相关作者

相关机构

相关主题

浏览历史

基于初始均值点离散化的改进K-means算法 被引量：1

参考文献8

二级参考文献64

共引文献527

同被引文献9

引证文献1

二级引证文献11

相关作者

相关机构

相关主题

浏览历史

基于初始均值点离散化的改进K-means算法被引量：1