DHSSA优化的K均值互补迭代车型信息数据聚类被引量：3

K-means Complementary Iterative Vehicle Information Data Clustering Based on DHSSA Optimization

下载PDF

导出

摘要针对传统方法在车型信息数据聚类过程中受初始化中心点的影响较大导致聚类精度低、鲁棒性差以及在迭代过程中求取均值选择聚类中心受离群点影响大的问题,提出了一种DHSSA优化的K均值互补迭代车型信息数据聚类方法。首先,针对SSA算法中发现者位置更新不足和种群多样性不足的问题,设计了一种扰动因子-领头雀优化策略,通过自适应领头雀策略加强了最优个体的影响力,利用扰动因子扩大搜索空间,提升了寻找聚类中心的准确率;其次,设计了基于筛选最大最小距离积方法 SMMP优化聚类中心的初始化,在MMP基础上增加了筛选机制,使初始化的中心尽可能更均匀地分布在每个簇中;最后,融合DHSSA和SMMP来优化K均值互补迭代,在减小迭代次数的同时增加搜索效率,得到较好的聚类结果。利用多种数据集进行测试,通过试验结果中的收敛曲线和性能指标可以看出,提出的DHSSA-KMC方法相对于SSA-KMC、IMFO-KMC、KMC和KMC++具有更高的搜索精度、收敛速度和更低的聚类代价,并且耗时相对于SSA-KMC和IMFO-KMC有所减少,证明了算法的有效性和优越性。在车型信息数据处理过程中,DHSSA-KMC可以高效聚类生成竞品车型供消费者选择,应用价值明显。 For the problems that the traditional method is greatly affected by the initialization center in the process of vehicle information data clustering,resulting in low clustering accuracy and poor robustness,and the selection of clustering center by calculating the mean in the iterative process is greatly affected by the outliers,a Kmeans complementary iterative vehicle information data clustering optimized by DHSSA is proposed. Firstly,for the problem of insufficient update of discoverer position and insufficient population diversity in SSA algorithm,a disturbance factor-head optimization strategy is designed. The influence of the optimal individual is strengthened by the adaptive head strategy,and the search space is expanded by the disturbance factor,which improves the accuracy of cluster center searching. Secondly,the initialization of cluster centers optimized by screening maximum and minimum distance product method(SMMP)is designed,and the screening mechanism is added on the basis of MMP,so that the initial centers are more evenly distributed in each cluster as much as possible. Finally,DHSSA and SMMP are integrated to optimize the K-means complementary iteration,which reduces the number of iterations and increases the search efficiency to obtain better clustering results. Using a variety of data sets for testing,through the convergence curve and performance indicators in the experimental results,it can be seen that the proposed DHSSAKMC method is of higher search accuracy,convergence speed and lower clustering cost than SSA-KMC,IMFOKMC,KMC and KMC++,and the time consumption is reduced compared with SSA-KMC and IMFO-KMC,which proves the effectiveness and superiority of the algorithm. In the process of vehicle information data processing,DHSSA-KMC can efficiently cluster and generate competitive models for consumers to choose,with obvious application value.

作者黄鹤李文龙杨澜王会峰王飚茹锋 Huang He;Li Wenlong;Yang Lan;Wang Huifeng;Wang Biao;Ru Feng(Chang’an University,Xi’an 710064;Xi’an Key Laboratory of Intelligent Expressway Information Fusion and Control,Xi’an 710064)

机构地区长安大学西安市智慧高速公路信息融合与控制重点实验室

出处《汽车工程》 EI CSCD 北大核心 2022年第5期691-700,729,共11页 Automotive Engineering

基金国家重点研发计划(2018YFB1600600) 国家自然科学基金面上项目(52172324) 陕西省重点研发计划(2021SF-483) 陕西省自然科学基础研究计划项目(2021UM-184) 陕西省博士后科研项目(2018BSHYDZZ64) 西安市智慧高速公路信息融合与控制重点实验室(长安大学)开放基金项目(300102321502) 中央高校基本科研业务费资助项目(300102240203)资助。

关键词 K均值聚类筛选最大最小距离积法麻雀搜索算法数据集车型信息数据 KMC screening maximum and minimum distance product SSA data sets car type information data

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献8

1邓旭冉,超木日力格,郭静.聚类中心初始值选择方法综述[J].中国电子科学研究院学报,2019,14(4):354-359. 被引量：2
2华佳林,朱杰,于剑.一种分割-合并聚类算法[J].南京大学学报（自然科学版）,2016,52(4):724-734. 被引量：1
3杨俊闯,赵超.K-Means聚类算法研究综述[J].计算机工程与应用,2019,55(23):7-14. 被引量：292
4陈小雪,尉永清,任敏,孟媛媛.基于萤火虫优化的加权K-means算法[J].计算机应用研究,2018,35(2):466-470. 被引量：43
5黄小莉,陈静娴,胡思宇.基于自适应果蝇优化算法的K-means聚类[J].国外电子测量技术,2021,40(6):14-20. 被引量：9
6黄鹤,李昕芮,吴琨,郭璐,王会峰,茹锋.引入改进飞蛾扑火的K均值交叉迭代聚类算法[J].西安交通大学学报,2020,54(9):32-39. 被引量：12
7杨晓伟,黄滢婷.基于多特征融合的实时单目标追踪算法[J].华南理工大学学报（自然科学版）,2019,47(6):1-9. 被引量：1
8王建仁,马鑫,段刚龙.改进的K-means聚类k值选择算法[J].计算机工程与应用,2019,55(8):27-33. 被引量：109

二级参考文献91

1陈兴蜀,吴小松,王文贤,王海舟.基于特征关联度的K-means初始聚类中心优化算法[J].四川大学学报（工程科学版）,2015,47(1):13-19. 被引量：29
2肖春景,张敏.基于减法聚类与模糊c-均值的模糊聚类的研究[J].计算机工程,2005,31(B07):135-137. 被引量：22
3张文君,顾行发,陈良富,余涛,许华.基于均值-标准差的K均值初始聚类中心选取算法[J].遥感学报,2006,10(5):715-721. 被引量：57
4孙吉贵,刘杰,赵连宇.聚类算法研究[J].软件学报,2008(1):48-61. 被引量：1073
5Jain A K, Murty M N, Flynn P J. Data clustering: Areview. ACM Computing Surveys (CSUR), 1999,31 (3) : 264- 323.
6Manning C E. Fractal clustering of metamorphic veins. Geology, 1994,22 (4) : 335- 338.
7Wang J, Wu X, Zhang C. Support vector machines hased on K-means clustering for real-time business intelligence systems. International Journal of Business Intelligence and Data Mining, 2005,1(1) :54-64.
8Szolovits P. Artiaicia: intelligence in medicine. Boulder Colorado : Westview Press, 1982,25 - 60.
9McQuitty L L. Elementary linkage analysis for isolating orthogonal and oblique types and typal relevancies. Educational and Psychological Meas- urement, 1957,17:207- 229.
10Bezdek J C. Pattern recognition with fuzzy objective function algorithms. Springer Science Business Media,2013,24-29.

共引文献436

1王炳琪,聂潇乾,严鹏,吴彬彬,高承帅.多站点低空防御系统关键技术研究[J].制导与引信,2019,0(4):17-22.
2杜康,周恒为,丁明明,叶峰,石彤非.聚类分析橡胶炭黑填充量与Yeoh模型参数的关联[J].应用化学,2021,38(6):675-684. 被引量：3
3赵栋梁,周晓磊,窦志强,武暕.基于改进FA算法的河流突发水污染事件溯源[J].计算机系统应用,2022,31(10):191-198. 被引量：2
4许毅超.基于人工智能算法的河道智能监控预警系统研究及应用[J].水利科技,2023(4):29-31. 被引量：2
5王玥,李文权,梁爽,余静财.基于改进聚类算法的共享汽车网点选址研究[J].武汉理工大学学报,2021,43(2):79-85.
6冯建英,石岩,王博,穆维松.基于聚类分析的数据挖掘技术及其农业应用研究进展[J].农业机械学报,2022,53(S01):201-212. 被引量：13
7胡小鹏,赵永杰,黄可心,项彦澍,梁冬泰,冯永飞,梁丹.基于深度学习与超像素的乒乓球运动轨迹检测[J].机械制造,2022,60(8):81-86. 被引量：4
8薛阳,张舒翔,贾巍,秦瑶.基于改进Faster RCNN的电缆外护套破损检测[J].电子测量技术,2023,46(15):158-164.
9唐辉,刘晓波,韩祥民,邱知,徐邦贤.基于混沌剑鱼算法的K_means算法[J].智能计算机与应用,2022,12(1):69-73.
10韩雪,王彤,薛文静.基于流通数据的纸质馆藏资源优化与读者服务研究[J].甘肃科技,2023,39(2):64-70.

同被引文献18

1毛伟中.受天气因素影响的电力系统短期负荷预测综述[J].人民珠江,2006,27(1):53-55. 被引量：4
2赵小强,谢亚萍.基于差分改进的仿射传播聚类算法[J].控制工程,2018,25(12):2115-2119. 被引量：3
3刘倩颖,阮应君,时翔,李铮伟.基于kmeans聚类与BP神经网络算法的办公建筑逐时电负荷预测[J].热能动力工程,2018,33(3):138-144. 被引量：33
4徐琛辉,马明辉.基于拉依达准则的交通数据粗大误差处理优化方法[J].上海工程技术大学学报,2018,32(1):64-67. 被引量：22
5黄鹤,李昕芮,吴琨,郭璐,王会峰,茹锋.引入改进飞蛾扑火的K均值交叉迭代聚类算法[J].西安交通大学学报,2020,54(9):32-39. 被引量：12
6冯文涛,邓兵.一种基于交叉选择的柯西反向鲸鱼优化算法[J].兵器装备工程学报,2020,41(8):131-137. 被引量：6
7耿嘉艺,钱雪忠,周世兵.紧邻类与小类数据集下的模糊聚类有效性指标[J].计算机应用研究,2020,37(9):2651-2655. 被引量：2
8毛清华,张强.融合柯西变异和反向学习的改进麻雀算法[J].计算机科学与探索,2021,15(6):1155-1164. 被引量：139
9王子洋,李琼琼,张子蕴,王康,杨家富.应用于无人驾驶车辆的点云聚类算法研究进展[J].世界科技研究与发展,2021,43(3):274-285. 被引量：9
10郭雨鑫,刘升,高文欣,张磊.多策略改进哈里斯鹰优化算法[J].微电子学与计算机,2021,38(7):18-24. 被引量：19

引证文献3

1李富强,朱晨烜(指导),骆利勤.基于改进FCM聚类分析方法的电力负荷特性研究[J].上海电机学院学报,2023,26(5):293-298.
2黄鹤,温夏露,杨澜,王会峰,高涛,茹锋.基于疯狂捕猎秃鹰算法的K均值互补迭代聚类优化[J].浙江大学学报（工学版）,2023,57(11):2147-2159.
3黄鹤,李文龙,杨澜,王会峰,高涛,陈婷.跳跃跟踪SSA交叉迭代AP聚类算法[J].电子学报,2024,52(3):977-990.

1郝雅娴,孙艳蕊.基于手写体数字识别的损失函数对比研究[J].电子技术与软件工程,2022(6):203-206. 被引量：4
2石亚妹,吴雪,孟新艳,罗采南,雷鑫,陈晓梅,武丽君.血清基质金属蛋白酶-3在类风湿关节炎疾病活动和骨侵蚀中的价值[J].新疆医学,2021,51(11):1225-1228. 被引量：1
3朱诚,潘旭华,张勇.基于趋化校正的哈里斯鹰优化算法[J].计算机应用,2022,42(4):1186-1193. 被引量：8
4赵珍珍,王维庆,王海云,樊小朝.基于PD⁃IM⁃MOPSO算法的微电网多目标优化运行[J].现代电子技术,2022,45(9):116-123. 被引量：4
5何玲,余泽豪.重症肺炎支原体肺炎CD3^(+)HLA-DR表达与VitA水平相关性分析[J].昆明医科大学学报,2022,43(5):103-107. 被引量：3

汽车工程

2022年第5期

浏览历史

内容加载中请稍等...

DHSSA优化的K均值互补迭代车型信息数据聚类被引量：3

参考文献8

二级参考文献91

共引文献436

同被引文献18

引证文献3

相关作者

相关机构

相关主题

浏览历史

DHSSA优化的K均值互补迭代车型信息数据聚类 被引量：3

参考文献8

二级参考文献91

共引文献436

同被引文献18

引证文献3

相关作者

相关机构

相关主题

浏览历史

DHSSA优化的K均值互补迭代车型信息数据聚类被引量：3