针对海量数据聚类过程中,经典的K-均值聚类算法对其K个初始聚类中心点的选择以及数据集噪声十分敏感的问题,提出了一种针对海量数据考虑初始聚类中心点选择的聚类算法。该算法首先采用冒泡排序法对数据集进行排序,获取数据集的各维中心...针对海量数据聚类过程中,经典的K-均值聚类算法对其K个初始聚类中心点的选择以及数据集噪声十分敏感的问题,提出了一种针对海量数据考虑初始聚类中心点选择的聚类算法。该算法首先采用冒泡排序法对数据集进行排序,获取数据集的各维中心值组成第一个初始聚类中心点。其次,通过计算与第一个初始聚类中心点的欧式距离,对剩余候选初始聚类中心点进行优化选择,保证所有的聚类中心点均匀地分布在数据集密度较大的空间上,以此减少聚类过程中的迭代次数和提高聚类算法效率。最后,基于UCI(University of California,Irvine)中多个数据集,进行聚类算法对比实验。结果表明,在不降低聚类效果的前提下,该聚类算法的迭代次数平均降低到50%,所需的时间降低平均达10%,由实验结果还能推出,当点集的数目越多时,该算法就能表现出越明显的聚类优势效果。展开更多
Data mining in incomplete information systems is a hard problem but inevitable in uncertain decision. In thispaper ,an extended rough set model based on dominance relation is combined with fuzzy set theory for data mi...Data mining in incomplete information systems is a hard problem but inevitable in uncertain decision. In thispaper ,an extended rough set model based on dominance relation is combined with fuzzy set theory for data mining ininterval valued decision table ,then decision rules can be obtained from the decision table. Simulation results show thatthe method is effective.展开更多
随着自动气象站在气象业务中越来越广泛的应用,接收其数据的中心站软件的使用也越来越多,在业务使用过程中对中心站软件的功能要求的也逐渐增高。但在业务运行过程中,很多功能并没有在其用户使用手册中加以介绍,所以就需要对中心站软件...随着自动气象站在气象业务中越来越广泛的应用,接收其数据的中心站软件的使用也越来越多,在业务使用过程中对中心站软件的功能要求的也逐渐增高。但在业务运行过程中,很多功能并没有在其用户使用手册中加以介绍,所以就需要对中心站软件进行更为深入的研究与实验以便可以使其适用气象业务的需要。根据对中国华云技术开发公司的中心站软件CAWS AnyWhere Server 2010的研究与实验,得到了一些适应气象业务需要的功能的设置方法。展开更多
文摘针对海量数据聚类过程中,经典的K-均值聚类算法对其K个初始聚类中心点的选择以及数据集噪声十分敏感的问题,提出了一种针对海量数据考虑初始聚类中心点选择的聚类算法。该算法首先采用冒泡排序法对数据集进行排序,获取数据集的各维中心值组成第一个初始聚类中心点。其次,通过计算与第一个初始聚类中心点的欧式距离,对剩余候选初始聚类中心点进行优化选择,保证所有的聚类中心点均匀地分布在数据集密度较大的空间上,以此减少聚类过程中的迭代次数和提高聚类算法效率。最后,基于UCI(University of California,Irvine)中多个数据集,进行聚类算法对比实验。结果表明,在不降低聚类效果的前提下,该聚类算法的迭代次数平均降低到50%,所需的时间降低平均达10%,由实验结果还能推出,当点集的数目越多时,该算法就能表现出越明显的聚类优势效果。
文摘Data mining in incomplete information systems is a hard problem but inevitable in uncertain decision. In thispaper ,an extended rough set model based on dominance relation is combined with fuzzy set theory for data mining ininterval valued decision table ,then decision rules can be obtained from the decision table. Simulation results show thatthe method is effective.
文摘随着自动气象站在气象业务中越来越广泛的应用,接收其数据的中心站软件的使用也越来越多,在业务使用过程中对中心站软件的功能要求的也逐渐增高。但在业务运行过程中,很多功能并没有在其用户使用手册中加以介绍,所以就需要对中心站软件进行更为深入的研究与实验以便可以使其适用气象业务的需要。根据对中国华云技术开发公司的中心站软件CAWS AnyWhere Server 2010的研究与实验,得到了一些适应气象业务需要的功能的设置方法。