利用KMeans聚类算法进行聚类过程中,有可能会产生孤立聚点,这种情况一旦发生,会严重影响算法的聚类效果。为避免产生孤立聚点,本文改进了KMeans聚类算法,设计了一类重心随机漂移(Center Random Drift,简称CRD)KMeans聚类算法。该算法会...利用KMeans聚类算法进行聚类过程中,有可能会产生孤立聚点,这种情况一旦发生,会严重影响算法的聚类效果。为避免产生孤立聚点,本文改进了KMeans聚类算法,设计了一类重心随机漂移(Center Random Drift,简称CRD)KMeans聚类算法。该算法会首先判断生成的聚点是否是孤立聚点,利用CRD算法对孤立聚点进行替换,从而有效避免了孤立聚点的产生。通过在Matlab环境下进行图像聚类对比实验发现,针对色彩丰富的图片,新算法和传统KMeans算法性能没有明显差异,而针对图片色彩比较单一的图片,传统的KMeans聚类算法聚类效果不佳,新算法依然可以有效聚类。展开更多
为解决在IIoT(industrial internet of things)环境下,现有的调度算法调度工作流中通信频繁、数据传输量大的任务所带来的完工时间上升、成本增加等影响的问题,提出一种基于聚类的工作流多雾协同调度算法。通过二分K均值算法对工作流中...为解决在IIoT(industrial internet of things)环境下,现有的调度算法调度工作流中通信频繁、数据传输量大的任务所带来的完工时间上升、成本增加等影响的问题,提出一种基于聚类的工作流多雾协同调度算法。通过二分K均值算法对工作流中的任务进行聚类,基于聚类结果,在多个雾服务器之间使用改进的免疫粒子群优化算法进行任务调度。实验结果表明,该算法相比其它一些传统的调度算法在完工时间、成本、负载均衡方面都有一定提升。展开更多
K means算法是聚类分析中使用最为广泛的算法之一。然而,该算法通常受到初始聚类条件的影响。关于这个问题的详细讨论可参看文献[1]。该算法的另一个不足之处是,聚类数目K必须作为参数由用户提供。笔者提出了一个新的有关聚类有效性... K means算法是聚类分析中使用最为广泛的算法之一。然而,该算法通常受到初始聚类条件的影响。关于这个问题的详细讨论可参看文献[1]。该算法的另一个不足之处是,聚类数目K必须作为参数由用户提供。笔者提出了一个新的有关聚类有效性的度量指标和优化的K means算法。它能自动确定最佳聚类个数。展开更多
针对传统近邻传播聚类算法以数据点对之间的相似度作为输入度量,由于需要预设偏向参数p和阻尼系数λ,算法精度无法精确控制的问题,提出了一种跳跃跟踪麻雀搜索算法优化的交叉迭代近邻传播聚类方法.首先,针对麻雀搜索算法中发现者和加入...针对传统近邻传播聚类算法以数据点对之间的相似度作为输入度量,由于需要预设偏向参数p和阻尼系数λ,算法精度无法精确控制的问题,提出了一种跳跃跟踪麻雀搜索算法优化的交叉迭代近邻传播聚类方法.首先,针对麻雀搜索算法中发现者和加入者位置更新不足的问题,设计了一种跳跃跟踪优化策略,通过考虑偏好阻尼因子的跳跃策略设计大步长更新发现者,增加麻雀搜索算法的全局勘探能力和寻优速度,加入者设计动态小步长跟踪领头雀更新位置,同时,利用自适应种群划分机制更新发现者和加入者的比重,增加算法的后期局部开发能力和寻优速度;其次,设计基于扰动因子的Tent映射,在此基础上增加3个参数,使映射分布范围增大,并避免了陷入小周期点和不稳周期点;最后,引入轮廓系数作为评价函数,跳跃跟踪麻雀搜索算法自动寻找较优的p和λ,代替手动输入参数,并融合基于扰动因子的Tent映射优化近邻传播算法,交叉迭代确定最优簇数.使用多种算法聚类University of California Irvine数据集的10种公共数据集,仿真结果表明,本文提出的聚类算法与经典近邻传播算法、基于差分改进的仿射传播聚类算法、基于麻雀搜索算法优化的近邻传播聚类算法和进化近邻传播算法相比具有更优的搜索效率以及聚类精度.对国家信息数据进行了聚类分析,提出的方法更加准确有效合理,具有较好的应用价值.展开更多
文摘利用KMeans聚类算法进行聚类过程中,有可能会产生孤立聚点,这种情况一旦发生,会严重影响算法的聚类效果。为避免产生孤立聚点,本文改进了KMeans聚类算法,设计了一类重心随机漂移(Center Random Drift,简称CRD)KMeans聚类算法。该算法会首先判断生成的聚点是否是孤立聚点,利用CRD算法对孤立聚点进行替换,从而有效避免了孤立聚点的产生。通过在Matlab环境下进行图像聚类对比实验发现,针对色彩丰富的图片,新算法和传统KMeans算法性能没有明显差异,而针对图片色彩比较单一的图片,传统的KMeans聚类算法聚类效果不佳,新算法依然可以有效聚类。
文摘为解决在IIoT(industrial internet of things)环境下,现有的调度算法调度工作流中通信频繁、数据传输量大的任务所带来的完工时间上升、成本增加等影响的问题,提出一种基于聚类的工作流多雾协同调度算法。通过二分K均值算法对工作流中的任务进行聚类,基于聚类结果,在多个雾服务器之间使用改进的免疫粒子群优化算法进行任务调度。实验结果表明,该算法相比其它一些传统的调度算法在完工时间、成本、负载均衡方面都有一定提升。
文摘针对传统近邻传播聚类算法以数据点对之间的相似度作为输入度量,由于需要预设偏向参数p和阻尼系数λ,算法精度无法精确控制的问题,提出了一种跳跃跟踪麻雀搜索算法优化的交叉迭代近邻传播聚类方法.首先,针对麻雀搜索算法中发现者和加入者位置更新不足的问题,设计了一种跳跃跟踪优化策略,通过考虑偏好阻尼因子的跳跃策略设计大步长更新发现者,增加麻雀搜索算法的全局勘探能力和寻优速度,加入者设计动态小步长跟踪领头雀更新位置,同时,利用自适应种群划分机制更新发现者和加入者的比重,增加算法的后期局部开发能力和寻优速度;其次,设计基于扰动因子的Tent映射,在此基础上增加3个参数,使映射分布范围增大,并避免了陷入小周期点和不稳周期点;最后,引入轮廓系数作为评价函数,跳跃跟踪麻雀搜索算法自动寻找较优的p和λ,代替手动输入参数,并融合基于扰动因子的Tent映射优化近邻传播算法,交叉迭代确定最优簇数.使用多种算法聚类University of California Irvine数据集的10种公共数据集,仿真结果表明,本文提出的聚类算法与经典近邻传播算法、基于差分改进的仿射传播聚类算法、基于麻雀搜索算法优化的近邻传播聚类算法和进化近邻传播算法相比具有更优的搜索效率以及聚类精度.对国家信息数据进行了聚类分析,提出的方法更加准确有效合理,具有较好的应用价值.