聚类算法作为数据处理的一种技术,发展迅速且被广泛应用于各个领域。密度峰值聚类算法(clustering by fast search and find of density peaks, DPC)作为一种基于密度的聚类方法,可通过高效样本分配进行图像分割。然而DPC算法的聚类结...聚类算法作为数据处理的一种技术,发展迅速且被广泛应用于各个领域。密度峰值聚类算法(clustering by fast search and find of density peaks, DPC)作为一种基于密度的聚类方法,可通过高效样本分配进行图像分割。然而DPC算法的聚类结果依赖于参数截断距离d;的选取,为此提出一种基于信息熵的DPC算法以实现d;的自适应选取。信息熵反映的信息大小与随机事件的概率呈负相关,随机事件发生的概率越大,提供的信息反而越少。因此信息熵可以体现出事件的不确定性,故可将使得信息熵最小的d;作为DPC算法的最优参数。另外聚类算法的簇类个数K普遍难以确定,而DPC算法中的簇类中心通常由局部密度极大值点构成,改进算法则根据数字图像各区域内聚程度自适应确定K的选择阈值。为将DPC算法高效应用于图像分割,改进算法通过分块与合并的方式解决DPC算法时间复杂度较大的问题。经实验对比,改进算法具有更精确的聚类效果;在图像分割方面,改进算法能够更为精准地提取图像分割边缘并与GroundTruth更加吻合。展开更多
文摘聚类算法作为数据处理的一种技术,发展迅速且被广泛应用于各个领域。密度峰值聚类算法(clustering by fast search and find of density peaks, DPC)作为一种基于密度的聚类方法,可通过高效样本分配进行图像分割。然而DPC算法的聚类结果依赖于参数截断距离d;的选取,为此提出一种基于信息熵的DPC算法以实现d;的自适应选取。信息熵反映的信息大小与随机事件的概率呈负相关,随机事件发生的概率越大,提供的信息反而越少。因此信息熵可以体现出事件的不确定性,故可将使得信息熵最小的d;作为DPC算法的最优参数。另外聚类算法的簇类个数K普遍难以确定,而DPC算法中的簇类中心通常由局部密度极大值点构成,改进算法则根据数字图像各区域内聚程度自适应确定K的选择阈值。为将DPC算法高效应用于图像分割,改进算法通过分块与合并的方式解决DPC算法时间复杂度较大的问题。经实验对比,改进算法具有更精确的聚类效果;在图像分割方面,改进算法能够更为精准地提取图像分割边缘并与GroundTruth更加吻合。