-
题名DHSSA优化的K均值互补迭代车型信息数据聚类
被引量:4
- 1
-
-
作者
黄鹤
李文龙
杨澜
王会峰
王飚
茹锋
-
机构
长安大学
西安市智慧高速公路信息融合与控制重点实验室
-
出处
《汽车工程》
EI
CSCD
北大核心
2022年第5期691-700,729,共11页
-
基金
国家重点研发计划(2018YFB1600600)
国家自然科学基金面上项目(52172324)
+4 种基金
陕西省重点研发计划(2021SF-483)
陕西省自然科学基础研究计划项目(2021UM-184)
陕西省博士后科研项目(2018BSHYDZZ64)
西安市智慧高速公路信息融合与控制重点实验室(长安大学)开放基金项目(300102321502)
中央高校基本科研业务费资助项目(300102240203)资助。
-
文摘
针对传统方法在车型信息数据聚类过程中受初始化中心点的影响较大导致聚类精度低、鲁棒性差以及在迭代过程中求取均值选择聚类中心受离群点影响大的问题,提出了一种DHSSA优化的K均值互补迭代车型信息数据聚类方法。首先,针对SSA算法中发现者位置更新不足和种群多样性不足的问题,设计了一种扰动因子-领头雀优化策略,通过自适应领头雀策略加强了最优个体的影响力,利用扰动因子扩大搜索空间,提升了寻找聚类中心的准确率;其次,设计了基于筛选最大最小距离积方法 SMMP优化聚类中心的初始化,在MMP基础上增加了筛选机制,使初始化的中心尽可能更均匀地分布在每个簇中;最后,融合DHSSA和SMMP来优化K均值互补迭代,在减小迭代次数的同时增加搜索效率,得到较好的聚类结果。利用多种数据集进行测试,通过试验结果中的收敛曲线和性能指标可以看出,提出的DHSSA-KMC方法相对于SSA-KMC、IMFO-KMC、KMC和KMC++具有更高的搜索精度、收敛速度和更低的聚类代价,并且耗时相对于SSA-KMC和IMFO-KMC有所减少,证明了算法的有效性和优越性。在车型信息数据处理过程中,DHSSA-KMC可以高效聚类生成竞品车型供消费者选择,应用价值明显。
-
关键词
K均值聚类
筛选最大最小距离积法
麻雀搜索算法
数据集
车型信息数据
-
Keywords
KMC
screening maximum and minimum distance product
SSA
data sets
car type information data
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-