二次幂耦合的K-means聚类算法研究被引量：5

Study on K-means Clustering Algorithm of Quadratic Power Coupling

下载PDF

导出

摘要在聚类研究中,通常认为数据集的对象、属性等方面是满足独立同分布的,它们之间是互不影响的,然而实际上它们之间存在着某些潜在的联系,即非独立同分布。为了更好地挖掘其存在的潜在关系,将数据集进行二次幂处理,计算皮尔森相关系数后得到二次幂耦合的数据集样本,为了解决K-means聚类算法存在选取初始中心点的敏感性问题,基于密度的思想,通过计算密度参数合理调整高密度区域,利用聚类迭代的方法进行选点,将高密度区域中的密度最大点作为初始点,距离初始点最远点作为第二个点,以前两个点为中心聚类迭代得到两个质心,将距离两个质心最远的点作为第三点,以此类推,实验结果表明所给的算法能够得到较高的准确率,较少的迭代次数,以及相对较好的聚类效果。 In clustering research, it is generally believed that the objects, attributes and other aspects of data sets are independent and identically distributed, and they do not affect each other. However, in fact, there are some potential relations between them, namely, Non-IID. In order to better mine the potential relationship, the data set is processed by the second power, and the data set samples coupled by the second power are obtained after calculating Pearson correlation coefficient. In order to solve the sensitivity problem of K-means clustering algorithm in selecting the initial center point, based on the idea of density, the high-density region is reasonably adjusted by calculating the density parameters, The clustering iteration method is used to select the points. The maximum density point in the high-density region is taken as the initial point, the farthest point from the initial point is taken as the second point, and the previous two points are taken as the center.Two centroids are obtained by clustering iteration, and the farthest point from the two centroids is taken as the third point,By analogy, the results show that it can get higher accuracy, fewer iterations, and relatively good clustering effect.

作者相益萱姜合潘品臣孙聪慧 XIANG Yixuan;JIANG He;PAN Pinchen;SUN Conghui(School of Computer Science and Technology,Qilu University of Technology(Shandong Academy of Sciences),Jinan 250353,China)

机构地区齐鲁工业大学(山东省科学院)计算机科学与技术学院

出处《计算机工程与应用》 CSCD 北大核心 2021年第14期95-102,共8页 Computer Engineering and Applications

基金国家自然科学青年基金(61502259)。

关键词非独立同分布二次幂耦合皮尔森相关系数聚类迭代 K-MEANS聚类算法 non-IID(Independent and Identically Distributed) quadratic power coupling Pearson correlation coefficient clustering iteration K-means clustering algorithm

分类号 TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献13

1袁方,周志勇,宋鑫.初始聚类中心优化的k-means算法[J].计算机工程,2007,33(3):65-66. 被引量：152
2张靖,段富.优化初始聚类中心的改进k-means算法[J].计算机工程与设计,2013,34(5):1691-1694. 被引量：56
3邹臣嵩,杨宇.基于最大距离积与最小距离和协同K聚类算法[J].计算机应用与软件,2018,35(5):297-301. 被引量：15
4行艳妮,钱育蓉,南方哲,赵京霞.Spark环境下K-means初始中心点优化研究综述[J].计算机应用研究,2020,37(3):641-647. 被引量：9
5靳雁霞,齐欣,张晋瑞,程琦甫.一种改进的简化均值粒子群K-means聚类算法[J].微电子学与计算机,2020,37(5):69-74. 被引量：11
6徐慧君,王忠,马丽萍,饶华,何承恩.改进Mini Batch K-Means时间权重推荐算法[J].计算机工程,2020,46(3):73-78. 被引量：7
7唐东凯,王红梅,胡明,刘钢.优化初始聚类中心的改进K-means算法[J].小型微型计算机系统,2018,39(8):1819-1823. 被引量：32
8王义武,杨余旺.空间投影在K-means算法中的研究与应用[J].计算机工程与应用,2020,56(7):200-204. 被引量：6
9王建仁,马鑫,段刚龙.改进的K-means聚类k值选择算法[J].计算机工程与应用,2019,55(8):27-33. 被引量：100
10洪敏,贾彩燕,王晓阳.K-means型多视图聚类中的初始化问题研究[J].计算机科学与探索,2019,13(4):574-585. 被引量：10

二级参考文献116

1江小平,李成华,向文,张新访,颜海涛.k-means聚类算法的MapReduce并行化实现[J].华中科技大学学报（自然科学版）,2011,39(S1):120-124. 被引量：79
2荆丰伟,刘冀伟,王淑盛.改进的K-均值算法在岩相识别中的应用[J].微计算机信息,2004,20(7):41-42. 被引量：5
3袁方,孟增辉,于戈.对k-means聚类算法的改进[J].计算机工程与应用,2004,40(36):177-178. 被引量：47
4张惟皎,刘春煌,李芳玉.聚类质量的评价方法[J].计算机工程,2005,31(20):10-12. 被引量：60
5贺玲,吴玲达,蔡益朝.数据挖掘中的聚类算法综述[J].计算机应用研究,2007,24(1):10-13. 被引量：222
6胡旺,李志蜀.一种更简化而高效的粒子群优化算法[J].软件学报,2007,18(4):861-868. 被引量：331
7袁方,周志勇,宋鑫.初始聚类中心优化的k-means算法[J].计算机工程,2007,33(3):65-66. 被引量：152
8Guha S,Rastogi R,Shim K.Cure:an efficient clustering algorithm for large database[C]//Proc of ACM-SIGMOND lnt Conf Managemerit on Data, Seattle, Washington, 1998 . 73-84.
9Ester M,Kriegel H P,Sander J.A density-based algorithm tier discovering chlsters in large spatial databases with noise[C]//Proc 2nd Int Conf on Knowledge Discovery and Data Mining.Portland, 1999.20:226-231.
10HAN Jia-wei, MICHELINE K. Data mining concepts and techniques [ M]. 2nd ed. Singapore:Elsevier, 2006 : 383-419.

共引文献487

1赵春丽,王延博,万润之,孙丽平.基于R语言探析中医药治疗哮喘发作期的用药规律[J].世界科学技术-中医药现代化,2023,25(3):1011-1019. 被引量：4
2段桂芹,邹臣嵩.基于K-medoids算法的学生成绩聚类研究[J].微型电脑应用,2020,0(2):64-66. 被引量：1
3冯建英,石岩,王博,穆维松.基于聚类分析的数据挖掘技术及其农业应用研究进展[J].农业机械学报,2022,53(S01):201-212. 被引量：8
4邓宇平,王桂棠.基于GoogleNet网络与残差网络的织物纹理分析[J].电子测量技术,2021,44(7):31-38. 被引量：3
5段桂芹.基于改进密度的簇内均值最小距离聚类算法[J].智能计算机与应用,2021,11(12):82-86. 被引量：1
6楼佳,王小华.一种分裂式的k-means聚类算法[J].杭州电子科技大学学报（自然科学版）,2009,29(4):54-57. 被引量：1
7高飞,鱼江,任芳,黄保瑞,次旺多吉.四维文档向量模型的k-means新闻文本聚类算法[J].西藏大学学报（社会科学版）,2013,28(4):109-112.
8鲁婧婧,张晋昕,袁向东,骆福添,古萍,张熙,薛允莲.欧氏距离的加权处理对K-means法聚类效果的改进[J].中国医院统计,2008,15(1):9-12. 被引量：1
9高燕飞,陈俊杰,强彦.自适应数据库中基于特征向量的聚类算法的研究与改进[J].电脑开发与应用,2008,21(7):57-58.
10强彦,陈俊杰,高燕飞.自适应数据库中基于特征向量的聚类算法[J].计算机工程与应用,2008,44(27):162-164. 被引量：2

同被引文献42

1赵莉,候兴哲,胡君,傅宏,孙洪亮.基于改进k-means算法的海量智能用电数据分析[J].电网技术,2014,38(10):2715-2720. 被引量：125
2谢娟英,高红超,谢维信.K近邻优化的密度峰值快速搜索聚类算法[J].中国科学：信息科学,2016,46(2):258-280. 被引量：102
3陈小雪,尉永清,任敏,孟媛媛.基于萤火虫优化的加权K-means算法[J].计算机应用研究,2018,35(2):466-470. 被引量：41
4魏康园,何庆,徐钦帅.一种改进森林优化的K-means聚类算法[J].贵州大学学报（自然科学版）,2018,35(6):69-75. 被引量：8
5蒋华,张红福,罗一迪,王鑫.基于KL距离的自适应阈值网络流量异常检测[J].计算机工程,2019,45(4):108-113. 被引量：20
6李慧慧.深度递归网络在物联网系统异常检测中应用研究[J].现代电子技术,2019,42(13):86-89. 被引量：2
7章永来,周耀鉴.聚类算法综述[J].计算机应用,2019,39(7):1869-1882. 被引量：193
8杨宏宇,李博超.基于逆向习得推理的网络异常行为检测模型[J].计算机应用,2019,39(7):1967-1972. 被引量：11
9张悦,罗明.通航产业发展背景下空域管理改革研究[J].中国管理信息化,2019,22(16):195-197. 被引量：7
10李昕,雷迎科.基于密度峰值算法的通信电台个体识别[J].信号处理,2019,35(7):1242-1249. 被引量：2

引证文献5

1黄学雨,程世超.KNN优化的密度峰值聚类算法[J].通信技术,2021,54(7):1608-1618. 被引量：6
2何聪,王彦成,冯军,姜山,李兆阳.基于K-means聚类的通航协同空域规划算法设计和实现[J].西华大学学报（自然科学版）,2021,40(6):27-31. 被引量：1
3颜宁,钟瑶,李相俊,武中立.基于风险防御的退役动力电池递进式分选方法研究[J].太阳能学报,2022,43(5):525-532.
4张雅茹.基于改进二分K-means算法的网络异常检测技术研究[J].鄂州大学学报,2022,29(6):97-99. 被引量：5
5颜宁,钟瑶,李相俊,李洋,姚清野,马少华.基于SOP动态一致性的退役动力电池模组筛选方法研究[J].太阳能学报,2024,45(2):274-282.

二级引证文献12

1钟晋孝,晋良念.毫米波雷达目标点云稳健自适应聚类方法[J].科学技术与工程,2022,22(5):1936-1943. 被引量：4
2苑明海,周凯文,张晨希,裴凤雀.基于改进Kalman滤波的智慧社区居民定位[J].计算机系统应用,2022,31(6):265-270.
3王梅,宋晓晖,刘勇,许传海.神经正切核K-Means聚类[J].计算机应用,2022,42(11):3330-3336. 被引量：1
4魏伟.基于改进K-means算法的校园网络环境安全态势感知方法[J].信息与电脑,2023,35(12):96-98.
5彭耀霖,李荣冰,何梓君.毫米波雷达点云的密度和划分联合聚类方法[J].测控技术,2023,42(10):60-66. 被引量：1
6岳珊,雍巧玲.基于确定初始簇心的优化K-means算法[J].数字技术与应用,2023,41(11):140-142. 被引量：1
7王良敏.基于多维时态特征的计算机网络异常节点检测方法[J].数字技术与应用,2023,41(12):228-230.
8宗学军,王润鹏,何戡,连莲.优化随机森林模型的工控网络异常检测[J].沈阳工业大学学报,2024,46(2):197-205.
9黄俊萍.基于改进K-means数据聚类算法的网络入侵检测[J].成都工业学院学报,2024,27(2):58-62.
10刘继,杨金瑞.基于网格近邻优化的密度峰值聚类算法[J].计算机应用研究,2024,41(4):1058-1063.

1蒋铭勤.多阈值和非独立同分布的在线分位数学习算法[J].数学杂志,2021,41(4):316-328.
2贺文晨,郭少勇,邱雪松,陈连栋,张素香.基于DRL的联邦学习节点选择方法[J].通信学报,2021,42(6):62-71. 被引量：7
3姚彩,刘燕娜,叶艳艳,王继伟.三维超声早期诊断未孕未育女性尿失禁的应用[J].中国妇幼健康研究,2021,32(6):860-867. 被引量：2
4陈子为,朱美吉,陈龙,吴正正.基于灰度积分投影的牧草高度检测算法[J].西南师范大学学报（自然科学版）,2021,46(6):126-132.
5刘俊延,贾永杰,李雄伟,张阳.基于电磁旁路分析的芯片聚类研究[J].无线电工程,2021,51(7):628-633.
6吴丽娜,何丹萍,艾渤,王剑,官科,钟章队.基于多层感知器神经网络的路径损耗预测研究[J].电波科学学报,2021,36(3):396-404. 被引量：9
7童婉迪.优化K-means算法在客户细分中的应用研究[J].景德镇学院学报,2021,36(3):21-24. 被引量：1
8李培刚,赵雄,刘丹,宣淦清,吴梦笛,李俊奇.钢弹簧浮置板静载抗裂非线性损伤分析[J].铁道建筑,2021,61(6):135-139. 被引量：1
9周晓冀,杨智超,杜文军,王雪梅,巫骏,敬龙江.四川盆地泸州区块页岩气三维地震覆盖密度优选[J].天然气勘探与开发,2021,44(2):93-99. 被引量：4
10孙希平,卢景月,张磊,钟卫军.基于离散频率编码的PD雷达二维解模糊方法[J].系统工程与电子技术,2021,43(7):1737-1747.

计算机工程与应用

2021年第14期

浏览历史

内容加载中请稍等...

二次幂耦合的K-means聚类算法研究被引量：5

参考文献13

二级参考文献116

共引文献487

同被引文献42

引证文献5

二级引证文献12

相关作者

相关机构

相关主题

浏览历史

二次幂耦合的K-means聚类算法研究 被引量：5

参考文献13

二级参考文献116

共引文献487

同被引文献42

引证文献5

二级引证文献12

相关作者

相关机构

相关主题

浏览历史

二次幂耦合的K-means聚类算法研究被引量：5