求解大型线性系统,带K-均值聚类的贪婪随机块Kaczmarz方法是近几年被广受关注的一类方法。本文在该方法基础上做了进一步的研究即在每一次迭代中优先消除残差向量中的最大块,构建了最大残差块Kaczmarz方法及其加速版本并进行了收敛性分...求解大型线性系统,带K-均值聚类的贪婪随机块Kaczmarz方法是近几年被广受关注的一类方法。本文在该方法基础上做了进一步的研究即在每一次迭代中优先消除残差向量中的最大块,构建了最大残差块Kaczmarz方法及其加速版本并进行了收敛性分析。数值实验证实了本文算法的有效性。The greedy random block Kaczmarz method with K-means clustering for solving large linear systems has been widely studied in recent years. This article conducted further research on this method by prioritizing the elimination of the largest block in the residual vector in each iteration, constructing the Kaczmarz method for the maximum residual block and its accelerated version, and conducting convergence analysis. Numerical experiments have confirmed the effectiveness of the algorithm proposed in this paper.展开更多
针对传统k-均值聚类方法不能有效处理海量数据聚类的问题,该文提出一种基于并行计算的加速k-均值聚类(K-means clustering based on parallel computing,Pk-means)方法。该方法首先将海量的聚类样本随机划分为多个独立同分布的聚类工作...针对传统k-均值聚类方法不能有效处理海量数据聚类的问题,该文提出一种基于并行计算的加速k-均值聚类(K-means clustering based on parallel computing,Pk-means)方法。该方法首先将海量的聚类样本随机划分为多个独立同分布的聚类工作集,并在每个工作集上并行进行传统k-均值聚类,并得到相应的聚类中心和半径,通过衡量不同子集聚类结果的关系,对每个工作集中聚类得到的子类进行合并,并对特殊数据进行二次归并以校正聚类结果,从而有效处理海量数据的聚类问题。实验结果表明,Pk_means方法在大规模数据集上在保持聚类效果的同时大幅度提高了聚类效率。展开更多
文摘求解大型线性系统,带K-均值聚类的贪婪随机块Kaczmarz方法是近几年被广受关注的一类方法。本文在该方法基础上做了进一步的研究即在每一次迭代中优先消除残差向量中的最大块,构建了最大残差块Kaczmarz方法及其加速版本并进行了收敛性分析。数值实验证实了本文算法的有效性。The greedy random block Kaczmarz method with K-means clustering for solving large linear systems has been widely studied in recent years. This article conducted further research on this method by prioritizing the elimination of the largest block in the residual vector in each iteration, constructing the Kaczmarz method for the maximum residual block and its accelerated version, and conducting convergence analysis. Numerical experiments have confirmed the effectiveness of the algorithm proposed in this paper.
文摘针对传统k-均值聚类方法不能有效处理海量数据聚类的问题,该文提出一种基于并行计算的加速k-均值聚类(K-means clustering based on parallel computing,Pk-means)方法。该方法首先将海量的聚类样本随机划分为多个独立同分布的聚类工作集,并在每个工作集上并行进行传统k-均值聚类,并得到相应的聚类中心和半径,通过衡量不同子集聚类结果的关系,对每个工作集中聚类得到的子类进行合并,并对特殊数据进行二次归并以校正聚类结果,从而有效处理海量数据的聚类问题。实验结果表明,Pk_means方法在大规模数据集上在保持聚类效果的同时大幅度提高了聚类效率。