混合属性数据流聚类是数据流挖掘中的重要问题.针对现存聚类方法在处理混合属性数据流聚类时存在聚类精度低和实时性差的问题,提出一种基于密度的混合属性数据流聚类算法HDSDen(Heterogeneous Data Stream based on Density Clustering ...混合属性数据流聚类是数据流挖掘中的重要问题.针对现存聚类方法在处理混合属性数据流聚类时存在聚类精度低和实时性差的问题,提出一种基于密度的混合属性数据流聚类算法HDSDen(Heterogeneous Data Stream based on Density Clustering Algorithm),算法由在线聚类/离线优化两部分组成,在线聚类快速完成距离计算与聚类,离线优化实现二次聚类提高聚类精度.针对现存混合型属性计算距离方式精度低的问题,本文设计属性占优分析预先确定混合属性数据流中分类或数值属性占优的,随即选择对应的相似度计算公式,从而保证了混合属性的相似度计算满足属性重要性平衡,降低非占优属性数据对整体数据聚类的影响,在线聚类最终通过给定参数ε和μ确定当前窗口到达的数据点中的核心数据点.离线部分从核心数据点出发将所有密度可达的数据点聚成一个自然类,并将未被聚类的数据点存入暂存区,若暂存区内数据点达到一定数量,将暂存区的数据再聚类优化整体的聚类效果,从而实现了离群点的二次聚类,保证了聚类的精度.最后HDSDen算法对真实数据集进行聚类实验,验证HDSDen算法比现有几种典型数据流聚类方法具有更高的聚类质量,并能给出任意时间的聚类结果,能够有效地处理混合属性数据流聚类问题.展开更多
量子粒子群算法在优化过程中需要权衡局部探索性和全局开拓性,进化后期由于全局开拓能力的丧失使得种群多样性减少,设计了一种基于欧式距离的混合量子粒子群算法,通过计算粒子的种群多样性,当种群多样性低于阈值范围时加入基于欧式距离...量子粒子群算法在优化过程中需要权衡局部探索性和全局开拓性,进化后期由于全局开拓能力的丧失使得种群多样性减少,设计了一种基于欧式距离的混合量子粒子群算法,通过计算粒子的种群多样性,当种群多样性低于阈值范围时加入基于欧式距离的种群划分策略划分子种群,从而保证获得全局最优解。利用标准测试函数验证提出的混合量子群算法有效性。提出了基于混合量子粒子群的Mean Shift算法(HQPSO Mean Shift)完成目标快速跟踪,克服传统Mean Shift算法的在跟踪快速移动目标时出现"跟丢"的问题。展开更多
文摘混合属性数据流聚类是数据流挖掘中的重要问题.针对现存聚类方法在处理混合属性数据流聚类时存在聚类精度低和实时性差的问题,提出一种基于密度的混合属性数据流聚类算法HDSDen(Heterogeneous Data Stream based on Density Clustering Algorithm),算法由在线聚类/离线优化两部分组成,在线聚类快速完成距离计算与聚类,离线优化实现二次聚类提高聚类精度.针对现存混合型属性计算距离方式精度低的问题,本文设计属性占优分析预先确定混合属性数据流中分类或数值属性占优的,随即选择对应的相似度计算公式,从而保证了混合属性的相似度计算满足属性重要性平衡,降低非占优属性数据对整体数据聚类的影响,在线聚类最终通过给定参数ε和μ确定当前窗口到达的数据点中的核心数据点.离线部分从核心数据点出发将所有密度可达的数据点聚成一个自然类,并将未被聚类的数据点存入暂存区,若暂存区内数据点达到一定数量,将暂存区的数据再聚类优化整体的聚类效果,从而实现了离群点的二次聚类,保证了聚类的精度.最后HDSDen算法对真实数据集进行聚类实验,验证HDSDen算法比现有几种典型数据流聚类方法具有更高的聚类质量,并能给出任意时间的聚类结果,能够有效地处理混合属性数据流聚类问题.
文摘量子粒子群算法在优化过程中需要权衡局部探索性和全局开拓性,进化后期由于全局开拓能力的丧失使得种群多样性减少,设计了一种基于欧式距离的混合量子粒子群算法,通过计算粒子的种群多样性,当种群多样性低于阈值范围时加入基于欧式距离的种群划分策略划分子种群,从而保证获得全局最优解。利用标准测试函数验证提出的混合量子群算法有效性。提出了基于混合量子粒子群的Mean Shift算法(HQPSO Mean Shift)完成目标快速跟踪,克服传统Mean Shift算法的在跟踪快速移动目标时出现"跟丢"的问题。