摘要
本文探讨了大规模数据下的无监督学习算法及其应用,包括挑战、现状、问题和难点,基本概念、分类及应用领域,以及基于核方法、深度学习和图论方法的无监督学习算法。提出了包括MiniBatch聚类、并行聚类、分布式聚类等算法优化的方法,并探究了场景聚类和异常检测等领域的应用方法。重点阐述了聚类算法的评价指标和性能分析的方法,以及不同算法的实验分析、性能比较和改进。旨在提高大规模数据下的无监督学习算法的效率和应用性能,为相关研究提供有价值的指导和参考。
出处
《统计与咨询》
2023年第6期7-11,共5页
Statistics and Consultation