-
题名基于加权共享近邻与累加序列的密度峰值算法
被引量:3
- 1
-
-
作者
王芙银
张德生
肖燕婷
-
机构
西安理工大学理学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2022年第4期61-69,共9页
-
基金
国家自然科学基金青年科学基金项目(11801438)。
-
文摘
密度峰值聚类(DPC)算法在对密度分布差异较大的数据进行聚类时效果不佳,聚类结果受局部密度及其相对距离影响,且需要手动选取聚类中心,从而降低了算法的准确性与稳定性。为此,提出一种基于加权共享近邻与累加序列的密度峰值算法DPC-WSNN。基于加权共享近邻重新定义局部密度的计算方式,以避免截断距离选取不当对聚类效果的影响,同时有效处理不同类簇数据集分布不均的问题。在原有DPC算法决策值的基础上,生成一组累加序列,将累加序列的均值作为聚类中心和非聚类中心的临界点从而实现聚类中心的自动选取。利用人工合成数据集与UCI上的真实数据集测试与评估DPC-WSNN算法,并将其与FKNN-DPC、DPC、DBSCAN等算法进行比较,结果表明,DPC-WSNN算法具有更好的聚类表现,聚类准确率较高,鲁棒性较强。
-
关键词
密度峰值聚类算法
局部密度
加权共享近邻
累加序列
聚类中心
-
Keywords
Density Peak Clustering(DPC)algorithm
local density
weighted shared nearest neighbor
accumulated sequence
clustering center
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-
-
题名引入共享近邻加权图的Chameleon算法
被引量:6
- 2
-
-
作者
薛文娟
刘培玉
刘栋
-
机构
山东师范大学信息科学与工程学院
山东省分布式计算机软件新技术重点实验室
-
出处
《计算机应用》
CSCD
北大核心
2012年第10期2884-2887,共4页
-
基金
国家自然科学基金资助项目(60873247)
山东省高新自主创新专项工程项目(2008ZZ28)
山东省自然科学基金资助项目(ZR2009GZ007)
-
文摘
针对Chameleon算法中采用距离函数度量数据点间的相似度,导致距离相近的两个点可能仅拥有很少的共同特征,最小二分实际操作困难,合并时需要人工指定阈值以及一旦合并完成后不能撤销的问题,对Chameleon算法进行改进,提出一种引入共享近邻加权图(WSnnG)的Chameleon算法。该算法以数据对象间的共享近邻数来衡量相似度,进一步构造WSnnG,再利用网络模块性评价函数指导最小二分,然后以结构等价相似度作为合并的依据,最后通过引入内聚度度量函数解决合并后不能撤销的问题。在UCI数据集及4个二维人造数据集上的实验结果表明,该算法在聚类精度和运行时间方面具有更好的效果。
-
关键词
共享近邻加权图
最小二分
网络模块性评价函数
结构等价相似度
内聚度度量函数
-
Keywords
Weighted Shared nearest neighbors Graph (WSnnG)
minimum half
network module evaluation function
structural equivalence similarity degree
cohesion measure
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
TP309
[自动化与计算机技术—计算机系统结构]
-