面向大规模数据精简的聚类中心点优化和FCM算法设计被引量：5

Clustering Center Optimization and FCM Algorithm Design for Large-scale Data Reduction

导出

摘要基于FCM的大规模数据聚类算法设计中,聚类中心点选择的迭代次数较多易于造成算法模型伸缩性不强、敏感性较弱和陷入局部最小值的难题.以大规模数据点精简算法设计为切入点,研究初始聚类中心点选择与FCM模型设计.首先,基于K近邻思想提出了数据点精简算法,获得精简之后的代表点集合.其次,兼顾原始数据点的稀疏程度和精简后代表点的分布特征,提出了基于密度的初始聚类中心点选取规则和具体步骤.再次,基于代表点集合和初始聚类中心点结果,给出了一种精简再融合的两阶段聚类算法.最后,运用仿真方法说明了本方法的有效性和优越性. In the process of designing large-scale data clustering algorithms based on FCM,large number of iterations for selecting the cluster center point is likely to cause weak scalability,weak sensitivity,and falling into local minimums of the algorithm model.The paper uses large-scale data point reduction algorithm as the entry point,and studies the initial clustering center point selection and FCM model design.First,based on the K-nearest neighbor idea,a data point reduction algorithm is proposed to obtain a reduced set of representative points.Secondly,considering the sparseness of the original data points and the distribution characteristics of the reduced representative points,a density-based initial clustering center point selection rule and specific steps are proposed.Thirdly,based on the results of the representative point set and the initial clustering center point,a two-stage clustering algorithm with streamlined re-fusion is given.Finally,the effectiveness and superiority of this method are demonstrated using simulation methods.

作者江文奇黄容牟华伟袁亚纯 JIANG Wen-qi;HUANG Rong;MOU Hua-wei;YUAN Ya-chun(Department of Economics and Management,Nanjing University of Science and Technology,Nanjing 210094,China)

机构地区南京理工大学经济管理学院

出处《数学的实践与认识》 2021年第17期144-151,共8页 Mathematics in Practice and Theory

基金国家自然科学基金项目(71971117) 教育部人文社科基金(17YJA630035) 南京理工大学自主科研培育项目(30916011331) 江苏省研究生科研与实践创新计划项目(KYCX18_0490 KYCX18_0489)的研究成果之一。

关键词聚类算法 FCM 初始聚类中心点 K互近邻数据精简 clustering algorithm FCM initial clustering center point k-mutual neighbor data reduction

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献9

1贾瑞玉,李玉功.类簇数目和初始中心点自确定的K-means算法[J].计算机工程与应用,2018,54(7):152-158. 被引量：50
2张慧哲,王坚.基于初始聚类中心选取的改进FCM聚类算法[J].计算机科学,2009,36(6):206-209. 被引量：68
3吴陈,许友权.点密度优选中心最大熵核FCM文本聚类算法[J].计算机工程与设计,2016,37(9):2411-2415. 被引量：3
4周世波,徐维祥,柴田.基于数据加权策略的模糊C均值聚类算法[J].系统工程与电子技术,2014,36(11):2314-2319. 被引量：13
5唐德玉,曹东,杨进.一种改进初始中心点的FCM算法[J].现代计算机（中旬刊）,2016(11):7-11. 被引量：2
6薛颖,沙秀艳.基于改进模糊聚类算法的灰色预测模型[J].统计与决策,2017,33(9):27-30. 被引量：6
7张素洁,赵怀慈.最优聚类个数和初始聚类中心点选取算法研究[J].计算机应用研究,2017,34(6):1617-1620. 被引量：82
8韩凌波,王强,蒋正锋,郝志强.一种改进的k-means初始聚类中心选取算法[J].计算机工程与应用,2010,46(17):150-152. 被引量：93
9周伟,肖杨.基于Canopy聚类的谱聚类算法[J].计算机工程与科学,2019,41(6):1095-1100. 被引量：8

二级参考文献83

1刘小芳,曾黄麟,吕炳朝.点密度函数加权模糊C-均值算法的聚类分析[J].计算机工程与应用,2004,40(24):64-65. 被引量：28
2张敏,于剑.基于划分的模糊聚类算法[J].软件学报,2004,15(6):858-868. 被引量：176
3党耀国,刘思峰,刘斌.以x^((1))(n)为初始条件的GM模型[J].中国管理科学,2005,13(1):132-135. 被引量：210
4张新波.两阶段模糊C-均值聚类算法[J].电路与系统学报,2005,10(2):117-120. 被引量：21
5尹中航,唐元钢,孙富春,孙增圻.Fuzzy Clustering with Novel Separable Criterion[J].Tsinghua Science and Technology,2006,11(1):50-53. 被引量：4
6杨善林,李永森,胡笑旋,潘若愚.K-MEANS算法中的K值优化问题研究[J].系统工程理论与实践,2006,26(2):97-101. 被引量：190
7匡泰,朱清新,孙跃.FCM算法用于灰度图像分割的初始化方法的研究[J].计算机应用,2006,26(4):784-786. 被引量：15
8王丽娟,关守义,王晓龙,王熙照.基于属性权重的Fuzzy C Mean算法[J].计算机学报,2006,29(10):1797-1803. 被引量：45
9朱强生,何华灿,周延泉.谱聚类算法对输入数据顺序的敏感性[J].计算机应用研究,2007,24(4):62-63. 被引量：7
10袁方,周志勇,宋鑫.初始聚类中心优化的k-means算法[J].计算机工程,2007,33(3):65-66. 被引量：152

共引文献316

1周斌,苏鹏,高鹏.基于改进YOLOv3算法的挖掘机检测方法[J].数字制造科学,2022(2):141-145. 被引量：2
2高文才,曹帅.基于MRF-FCM算法的矿井运动目标图像优化[J].工矿自动化,2024,50(S01):69-73.
3吴东飞,金玉龙,蒋建国.基于TMS320DM6467和TMS320C6472的高清视频处理系统[J].数据采集与处理,2012,27(S2):227-234.
4张强.论FCM在城市社会公共服务设施规划中的应用[J].求索,2014(8):107-111. 被引量：2
5林明才,康耀红,张诚一.基于科研立项管理应用的模糊C均值算法研究[J].计算机工程与设计,2010,31(7):1570-1572. 被引量：4
6周红芳,宋姣姣,罗作民.一种改进的模糊聚类算法[J].计算机应用,2010,30(5):1277-1279. 被引量：7
7庄刘,曾艳.基于模糊C-均值聚类的最优量化器设计[J].四川师范大学学报（自然科学版）,2010,33(4):559-562. 被引量：4
8王洪亮.煤种结渣预报的模糊神经网络研究[J].电力科学与工程,2010,26(10):55-58. 被引量：1
9李玉红,潘如如,高卫东,刘基宏,柴志雷.基于数字图像处理的拼毛比例分析[J].纺织学报,2010,31(11):20-24. 被引量：5
10陈孝国.基于遗传算法的可变加权FCM聚类方法改进研究[J].高师理科学刊,2011,31(1):12-15. 被引量：7

同被引文献61

1周上尧.非线性MS-DSGE模型的条件最优粒子滤波与贝叶斯估计[J].数量经济技术经济研究,2021,38(3):160-180. 被引量：1
2陈晓红,刘蓉.改进的聚类算法及在复杂大群体决策中的应用[J].系统工程与电子技术,2006,28(11):1695-1699. 被引量：22
3孙吉贵,刘杰,赵连宇.聚类算法研究[J].软件学报,2008(1):48-61. 被引量：1072
4应德全,应晓敏,叶继华.一种基于图论的聚类算法NeiMu[J].计算机工程与应用,2009,45(3):47-50. 被引量：3
5朱林,王士同,邓赵红.改进模糊划分的FCM聚类算法的一般化研究[J].计算机研究与发展,2009,46(5):814-822. 被引量：55
6徐选华,范永峰.改进的蚁群聚类算法及在多属性大群体决策中的应用[J].系统工程与电子技术,2011,33(2):346-349. 被引量：20
7王骏,王士同,邓赵红.聚类分析研究中的若干问题[J].控制与决策,2012,27(3):321-328. 被引量：194
8陈爱国,蒋亦樟,钱鹏江.基于最大中心间隔的缩放型η-极大熵聚类算法[J].计算机应用研究,2013,30(1):103-106. 被引量：7
9崔璐,杜华强,周国模,李雪建,毛方杰,徐小军,范渭亮,李阳光,朱迪恩,刘腾艳,邢璐琪.决策树结合混合像元分解的中国竹林遥感信息提取[J].遥感学报,2019,23(1):166-176. 被引量：20
10周世波,徐维祥,柴田.基于数据加权策略的模糊C均值聚类算法[J].系统工程与电子技术,2014,36(11):2314-2319. 被引量：13

引证文献5

1江文奇,牟华伟.基于类内类间距离量级平衡的FCM聚类算法设计[J].运筹与管理,2022,31(8):122-128. 被引量：1
2李晓东.基于数据挖掘技术的激光雷达硬件故障数据识别方法[J].应用激光,2022,42(7):87-93.
3宋月亭,卢巍.基于K-means的驾驶行为离散化特征聚类分析与研究[J].现代信息科技,2024,8(2):17-20.
4郝亚平.基于滑动聚类的窄带物联网特征级异构数据融合方法[J].微型电脑应用,2024,40(7):234-237.
5朱广贺,朱智强,袁逸萍.连续生产流水线深度强化学习优化调度算法[J].吉林大学学报（工学版）,2024,54(7):2086-2092.

二级引证文献1

1周倩,黄佳,宋明顺,张月义.基于改进FMEA的智能制造系统可靠性与风险评估[J].现代制造工程,2024(5):145-152.

1虞梓豪,刘瑾,杨海马,张鹏程,陈毅.基于边缘检测及可靠性排序算法的三维曲面重构[J].激光与光电子学进展,2020,57(24):209-218. 被引量：4
2林松,田林亚,毕继鑫,施贵刚,朱依民,闻亚.基于最优邻域局部熵的点云精简算法[J].测绘工程,2021,30(5):12-17. 被引量：13
3王印松,石建涛.基于深度神经网络模型的风电机组传动系统状态监测方法[J].电力科学与工程,2021,37(9):26-34. 被引量：6
4王艳,张开伟,陈海霞,杨砥,费冀,孙权.基于聚类分析的肩痛症中医证候研究[J].中医正骨,2021,33(9):38-43. 被引量：3
5宋仁旺,苏小杰,石慧.基于空间分布优选初始聚类中心的改进K-均值聚类算法[J].科学技术与工程,2021,21(19):8094-8100. 被引量：11
6徐曾旭林,谢靖,于倩倩.人才多元评价模型设计方法研究[J].数据分析与知识发现,2021,5(8):122-131. 被引量：11
7张文宇,刘嘉,杨媛,朱钰婷,于瑞.基于改进KNN-DPC算法的科技创新人才分类研究[J].计算机与数字工程,2021,49(9):1731-1736.
8段伟,赵明君,王敏,刘超.顾及结构特征的点云自适应精简算法[J].福建建设科技,2021(4):109-113. 被引量：2
9王汝心,马维华.基于BP网络的字符识别算法[J].现代计算机,2021,27(24):47-50.
10包红林,李敏,张萌.基于超大内存节点的波动方程逆时偏移高效实现[J].石油物探,2021,60(5):732-737. 被引量：1

数学的实践与认识

2021年第17期

浏览历史

内容加载中请稍等...

面向大规模数据精简的聚类中心点优化和FCM算法设计被引量：5

参考文献9

二级参考文献83

共引文献316

同被引文献61

引证文献5

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

面向大规模数据精简的聚类中心点优化和FCM算法设计 被引量：5

参考文献9

二级参考文献83

共引文献316

同被引文献61

引证文献5

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

面向大规模数据精简的聚类中心点优化和FCM算法设计被引量：5