不确定域环境下基于DKC值改进的K-means聚类算法被引量：7

Improved K-means Clustering Algorithm Based on DKC in Uncertain Region Environment

下载PDF

导出

摘要提出一种不确定域环境下基于DKC值改进的K-means聚类算法,即U2d-Kmeans。该算法首先考虑到数据对象的不确定性因素,引入不确定域对数据对象进行描述;其次吸取2d-Kmeans的优点,对数据集进行预处理(剔除孤立点),并且采用累积距离的方法确定初始聚类中心,从而避免了随机选取聚类初始点造成聚类不稳定的缺陷;最后经过算法有效性对比实验证明得出,U2d-Kmeans算法比前两种算法更客观、有效。 This paper presented an improved K-means clustering algorithm based on DKC in uncertain region environment,namely U2d-Kmeans.Firstly,the algorithm takes uncertainty factors into account of the data object description,then uses new pretreatment method（removing isolated point） of data set and the cumulative distance method of determining the initial clustering center that is mentioned in the 2d-Kmeans algorithm.These methods avoid the defect of clustering instability caused by the random selection of clustering initial point.Finally,comparison experiment of the algorithm proves that the improved U2d-Kmeans is more objective and effective than the other two algorithms.

作者任培花王丽珍

机构地区山西大同大学数学与计算机科学学院山西大同大学教育科学与技术学院

出处《计算机科学》 CSCD 北大核心 2013年第4期181-184,共4页 Computer Science

基金 2011年山西省科技基础条件平台建设"大同地区科学数据共享服务平台"项目(2011091002-0102)资助

关键词不确定域 DKC值 2d-距离聚类算法 Uncertain region DKC 2d-distance Clustering algorithm

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献11

1Han Jia-wei, Kamber M. Data Mining:Concepts and Techniques [M]. Morgan Kaufmann Publishers, 2001.
2李光宇.基于改进的CLARANS算法在数据挖掘中的研究[J].中南林业科技大学学报,2010,30(3):142-146. 被引量：4
3原福永,张晓彩,罗思标.基于信息熵的精确属性赋权K-means聚类算法[J].计算机应用,2011,31(6):1675-1677. 被引量：37
4姚丽娟,罗可,孟颖.一种基于粒子群的聚类算法[J].计算机工程与应用,2012,48(13):150-153. 被引量：14
5储岳中,徐波.动态最近邻聚类算法的优化研究[J].计算机工程与设计,2011,32(5):1687-1690. 被引量：5
6杨臻.基于2k-距离的孤立点算法研究[J].福建电脑,2009,25(2):77-78. 被引量：2
7陈福集,蒋芳.基于2d-距离改进的K-means聚类算法研究[J].太原理工大学学报,2012,43(2):114-118. 被引量：8
8Pfoser D,Jensen C S. Capturing the Uncertainty of Moving-Ob- jectRepresentations[C] // Proceedings of the 6th International Symposium on Advances inSpatial Databases. 1999:111-132.
9UCI Machine Learning Repository [DB/OL]. http://archive. ies. uci. edu/ml/, 1992-07-16.
10Ahrnad A, Dey L. A K-mean clustering algorithm for mixed nu- meric and categorical data[J]. Data and Knowledge Enginee- ring, 2007,63 : 503-527.

二级参考文献65

1田地,张西芝,刘小航.一种基于扩展的K-means聚类算法[J].河南教育学院学报（自然科学版）,2007,16(2):26-28. 被引量：3
2王燕.一种改进的K-means聚类算法[J].计算机应用与软件,2004,21(10):122-123. 被引量：9
3袁方,孟增辉,于戈.对k-means聚类算法的改进[J].计算机工程与应用,2004,40(36):177-178. 被引量：48
4陈雷,王延章.熵权法对融合网络服务质量效率保障研究[J].计算机工程与应用,2005,41(23):1-3. 被引量：3
5薛方正,方帅,徐心和.多机器人对抗系统仿真中的对手建模[J].系统仿真学报,2005,17(9):2138-2141. 被引量：7
6黄毅群,卢正鼎,胡和平,李瑞轩.分布式环境下保持隐私的关联规则挖掘算法[J].计算机工程,2006,32(13):12-14. 被引量：7
7陈晓明,李军怀,彭军,刘海玲,张璟.隐私保护数据挖掘算法综述[J].计算机科学,2007,34(6):183-186. 被引量：16
8HAN J,KAMBER M.数据挖掘概念与技术[M].北京:机械工业出版社,2007:251-261.
9George Karypis,Eui-Hong (Sam) Han,Vipin Kumar.CHAMELEON:A hierarchical clustering algorithm using dynamic modeling[J].Computer,1999,32:68-75.
10Ng Raymond T,Jiawei Han.Efficient and Effective Clustering Methods for Spatial Data Mining[C]// In:Proceedings of the 20th Very Large Databases Conference (VLDB 94),Santiago,Chile,1994:144-155.

共引文献70

1Kui Luo,Wenhui Shi,Weisheng Wang.Extreme scenario extraction of a grid with large scale wind power integration by combined entropy-weighted clustering method[J].Global Energy Interconnection,2020,3(2):140-148. 被引量：10
2王秀芳,王岩.优化K均值随机初始中点的改进算法[J].化工自动化及仪表,2012,39(10):1302-1304. 被引量：4
3陈福集,蒋芳.基于2d-距离改进的K-means聚类算法研究[J].太原理工大学学报,2012,43(2):114-118. 被引量：8
4谭晓天,余建桥.面向路网的移动对象全时态高效索引模型[J].计算机工程,2012,38(6):53-55.
5陈红英,王涛,毛革非.复杂系统多因素估计函数分析及其应用[J].微电子学与计算机,2012,29(6):68-70.
6唐波.改进的K-means聚类算法及应用[J].软件,2012,33(3):100-104. 被引量：10
7苏亚然,陈军霞,牛习现.随机种子最近邻居搜索聚类算法研究[J].河北科技大学学报,2012,33(4):338-342. 被引量：1
8雷军程,黄同成,柳小文.一种基于文本特征提取的版权保护方法[J].计算机科学,2012,39(10):104-107. 被引量：1
9李四海,高建德,陈建国,柳春.熵权法优选湖北海棠叶中总黄酮提取工艺[J].中国实验方剂学杂志,2012,18(23):56-58. 被引量：16
10胡博磊,谭建豪.基于累积平均密度的聚类方法[J].计算机工程与科学,2013,35(1):155-159. 被引量：1

同被引文献74

1张引,陈敏,廖小飞.大数据应用的现状与展望[J].计算机研究与发展,2013,50(S2):216-233. 被引量：379
2李道国,苗夺谦,杜伟林.粒度计算在人工神经网络中的应用[J].同济大学学报（自然科学版）,2006,34(7):960-964. 被引量：8
3袁方,周志勇,宋鑫.初始聚类中心优化的k-means算法[J].计算机工程,2007,33(3):65-66. 被引量：154
4TAN P N,MICHAEL S, VIPIN K.数据挖掘导论[M] .范明,范宏建,译.完整版.北京:人民邮电出版社,2011: 204-213.
5孙吉贵,刘杰,赵连宇.聚类算法研究[J].软件学报,2008(1):48-61. 被引量：1079
6Sergios T,Konstantinos K.模式识别[M].李晶皎,王爱侠,张广渊,译.3版.北京:电子工业出版社,2006:317-318.
7Jain A K.Data clustering:50 years beyond K-means[J].Pattern Recognition Letters,2010,31(8):651-666.
8Fred A L N,Jain A K.Combining multiple clusterings using evidence accumulation[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2005,27(6):835-850.
9Kanungo T,Mount D M,Netanyahu N S,et al.An efficient k-means clustering algorithm:analysis and implementation[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2002,24(7):881-892.
10Su M C,Chou C H.A modified version of the K-Means algorithm with a distance based on cluster symmetry[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2001,23(6):674-680.

引证文献7

1石亚冰,黄予,覃晓,元昌安.基于优化初始种子新策略的K-Means聚类算法[J].广西师范大学学报（自然科学版）,2013,31(4):33-40. 被引量：2
2陈强业,李际军.基于方向约束的对称距离聚类算法[J].计算机工程与应用,2015,51(20):120-125.
3何云斌,张志超,万静,李松.不确定数据聚类的U-PAM算法和UM-PAM算法的研究[J].计算机科学,2016,43(6):263-269. 被引量：7
4李澎林,郏莉,李伟.一种基于数据挖掘的图书荐购模型研究[J].浙江工业大学学报,2019,47(1):80-85. 被引量：8
5孙冬璞,谭洁琼.一种快速全局中心模糊聚类方法[J].哈尔滨理工大学学报,2019,24(4):110-117. 被引量：5
6余豪东,陈玉明,吴克寿,韩锋钢.决策粒K均值聚类算法[J].闽南师范大学学报（自然科学版）,2023,36(3):1-13. 被引量：1
7马翔.全局搜索密度峰值聚类中心的线性回归方法研究[J].计算机与数字工程,2024,52(5):1353-1358.

二级引证文献23

1罗倩.K-means聚类中心的鲁棒优化算法[J].计算机工程与设计,2015,36(9):2395-2400. 被引量：7
2魏方圆,黄德才.基于区间数的多维不确定性数据UID-DBSCAN聚类算法[J].计算机科学,2017,44(B11):442-447. 被引量：3
3胡明,唐东凯,李芬田,王泽儒.不确定聚类中距离计算方法综述[J].长春工业大学学报,2017,38(5):477-483. 被引量：3
4张秦,方志耕,蔡佳佳,刘思峰.基于多元异构不确定性案例学习的广义区间灰数熵权聚类模型[J].控制与决策,2018,33(8):1481-1488. 被引量：7
5林越,刘廷章,黄莉荣,奚晓晔,潘建.基于双向KL距离聚类算法的变压器状态异常检测[J].广西师范大学学报（自然科学版）,2018,36(4):20-26. 被引量：6
6韩冰,姜合.一种非独立同分布下针对数值型数据的PAM改进算法[J].齐鲁工业大学学报,2019,33(2):56-61.
7万静,崔美玉,何云斌,李松.障碍空间中基于Voronoi图的不确定数据聚类算法[J].计算机研究与发展,2019,56(5):977-991. 被引量：6
8韩冰,姜合.基于相似度计算公式改进的K-中心点算法[J].计算机与现代化,2019(5):113-117. 被引量：2
9吴翠先,何少元.基于区间数的不确定性数据聚类算法:UD-OPTICS[J].计算机工程与科学,2019,41(7):1303-1311. 被引量：3
10陈雪梅,杜棋东.面向微课移动学习的教学资源平台数据挖掘技术分析[J].计算机时代,2020,0(1):62-65. 被引量：2

1李庆如,麦中凡.域分析:为软件重用产生有用的模型[J].计算机研究与发展,1999,36(10):1188-1196. 被引量：30
2唐德玉,曹东,杨进.一种改进初始中心点的FCM算法[J].现代计算机（中旬刊）,2016(11):7-11. 被引量：2
3王霞.Word也能算数[J].电脑迷,2004,0(6):68-68.
4沃松林,邹云.广义大系统的Lyapunov稳定性分析[J].数学的实践与认识,2005,35(1):131-136. 被引量：7
5谢志江,李诚,刘楠,倪卫.6自由度装校机器人逆解的确定[J].吉林大学学报（工学版）,2012,42(6):1563-1568. 被引量：12
6周建平.PHOTOSHOP 3.0的定域和通道[J].电脑技术——Hello-IT,1997(10):20-21.
7李良钰.光学优化设计中的定域法研究[J].电子科技大学学报,2000,29(2):214-217.
8李良钰,朱健强,林大健.在定域法中实现光学全局优化[J].光子学报,2000,29(4):348-351.
9孙桂凤.确定二元一次不等式表示的平面区域的一种简易方法[J].高中数学教与学,2009(1):49-49. 被引量：1
10赵立江.基于遗传算法的混合属性聚类初始点选择研究[J].广西师范大学学报（自然科学版）,2008,26(3):194-197. 被引量：2

计算机科学

2013年第4期

浏览历史

内容加载中请稍等...

不确定域环境下基于DKC值改进的K-means聚类算法被引量：7

参考文献11

二级参考文献65

共引文献70

同被引文献74

引证文献7

二级引证文献23

相关作者

相关机构

相关主题

浏览历史

不确定域环境下基于DKC值改进的K-means聚类算法 被引量：7

参考文献11

二级参考文献65

共引文献70

同被引文献74

引证文献7

二级引证文献23

相关作者

相关机构

相关主题

浏览历史

不确定域环境下基于DKC值改进的K-means聚类算法被引量：7