-
题名K近邻空间密度分布的模糊聚类算法
- 1
-
-
作者
张利
路颜萍
侯晴
张皓博
-
机构
辽宁大学信息学院
中国刑事警察学院刑事科学与技术学院
-
出处
《辽宁大学学报(自然科学版)》
CAS
2023年第4期289-301,F0002,共14页
-
基金
国家自然科学基金项目(62072220)
辽宁省中央引导地方科技发展资金计划项目(2022JH6/100100032)
辽宁省自然科学基金资助项目(2022-KF-13-06)。
-
文摘
聚类是数据挖掘研究和应用中必不可少的工具,然而不完整数据对现有聚类算法提出了挑战.针对不完整数据聚类中插补方法带来的不确定性问题,本文提出一种K近邻空间密度分布的模糊聚类算法.首先,根据样本间相似度确定缺失数据的K最近邻样本集.在此基础上,由于缺失值具有不确定性,引入基于K最近邻样本集的数据分布信息,进一步将缺失数据填补为区间形式.其次,考虑聚类中离群点影响,引入数据空间密度分布,提出一种密度分布的区间型模糊C均值算法.最后,采用模糊C均值算法将填补的区间数据进行聚类.实验结果表明,在UCI数据集和人工数据集上,该算法能有效提高聚类准确性和鲁棒性.
-
关键词
不完整数据
K近邻
模糊C均值
密度
-
Keywords
incomplete data
K-nearest neighbors
fuzzy C-means
density
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-