针对大数据量情况下电网安全隐患快速分类难的痛点,本文提出一种基于层次结构平衡迭代聚类(Balanced Iterative Reducing and Clustering Using Hierarchies,BIRCH)和树形结构核密度评估(Tree-structured Parzen Estimator,TPE)的电网...针对大数据量情况下电网安全隐患快速分类难的痛点,本文提出一种基于层次结构平衡迭代聚类(Balanced Iterative Reducing and Clustering Using Hierarchies,BIRCH)和树形结构核密度评估(Tree-structured Parzen Estimator,TPE)的电网安全隐患分类方法。首先,算法基于TextRank构建电力行业词库,使用JIEBA库完成隐患问题文本切分词,并构建对应的特征矩阵。其次,使用BIRCH对特征矩阵进行聚类,并使用TPE优化BIRCH聚类超参数。最后,根据聚类结果映射得到安全隐患分类。实际算例测试表明,所提算法快速有效,可实现电网安全隐患分类的细颗粒度聚焦和多维度概括。展开更多
文摘针对大数据量情况下电网安全隐患快速分类难的痛点,本文提出一种基于层次结构平衡迭代聚类(Balanced Iterative Reducing and Clustering Using Hierarchies,BIRCH)和树形结构核密度评估(Tree-structured Parzen Estimator,TPE)的电网安全隐患分类方法。首先,算法基于TextRank构建电力行业词库,使用JIEBA库完成隐患问题文本切分词,并构建对应的特征矩阵。其次,使用BIRCH对特征矩阵进行聚类,并使用TPE优化BIRCH聚类超参数。最后,根据聚类结果映射得到安全隐患分类。实际算例测试表明,所提算法快速有效,可实现电网安全隐患分类的细颗粒度聚焦和多维度概括。