在一些现实场景中,数据不平衡问题普遍存在,严重影响模型的预测结果。合成少数类过采样技术(Synthetic Minority Over-Sampling Technique,SMOTE)是解决非平衡分类问题的一种方法,但存在局限性。针对数据中的类不平衡问题,提出基于数据...在一些现实场景中,数据不平衡问题普遍存在,严重影响模型的预测结果。合成少数类过采样技术(Synthetic Minority Over-Sampling Technique,SMOTE)是解决非平衡分类问题的一种方法,但存在局限性。针对数据中的类不平衡问题,提出基于数据分布和聚类加权的改进SMOTE随机森林分类算法(Random Forest Using SMOTE Based on Data Distribution and Cluster Weighting,DCSMOTE-RF)。该算法通过获取样本分布信息,将少数类样本划分到不同簇群,根据簇群信息量为每个区域分配不同合成份额;少数类样本结合自身权重,生成相应规模的目标样本;通过基于随机森林学习评价训练数据。10组非平衡数据集仿真试验结果表明,DCSMOTE-RF算法对非平衡数据具有较好的预测效果。展开更多
[目的]供电部门记录的正确的拓扑信息有助于工作人员监测电网信息,分析故障,优化电网运行以满足低压配电台区精益化、智能化管理的需要。目前,各式新型用电设备及用户的加入使低压配电网络结构呈现出持续变化的特征,线路维护成本被大大...[目的]供电部门记录的正确的拓扑信息有助于工作人员监测电网信息,分析故障,优化电网运行以满足低压配电台区精益化、智能化管理的需要。目前,各式新型用电设备及用户的加入使低压配电网络结构呈现出持续变化的特征,线路维护成本被大大提高。[方法]为此,提出基于密度聚类的低压台区归属关系识别方法。首先,提取智能电表有效电压数据生成高维时序电压矩阵;其次,采用t分布随机近邻嵌入方法(t-distributed Stochastic Neighbor Embedding,t-SNE)对高维时序电压数据进行特征提取与降维;然后,应用基于数据密度的噪声应用空间聚类方法(Density-Based Spatial Clustering of Applications with Noise,DBSCAN)对降维后的数据进行聚类分析,实现低压用户台区归属信息的识别;最后,对海南省三亚市某台区实际数据进行分析,并将所提方法与其他主流的拓扑识别算法进行对比。[结果]分析结果表明所提方法能够达到95%以上的台区识别准确率,高于目前其他主流的拓扑信息识别方法。[结论]文章中的方法在解决此类问题上具有有效性与优势性,可以为实际工程应用提供参考,为低压台区拓扑信息识别领域提供不一样的研究思路。展开更多
文摘在一些现实场景中,数据不平衡问题普遍存在,严重影响模型的预测结果。合成少数类过采样技术(Synthetic Minority Over-Sampling Technique,SMOTE)是解决非平衡分类问题的一种方法,但存在局限性。针对数据中的类不平衡问题,提出基于数据分布和聚类加权的改进SMOTE随机森林分类算法(Random Forest Using SMOTE Based on Data Distribution and Cluster Weighting,DCSMOTE-RF)。该算法通过获取样本分布信息,将少数类样本划分到不同簇群,根据簇群信息量为每个区域分配不同合成份额;少数类样本结合自身权重,生成相应规模的目标样本;通过基于随机森林学习评价训练数据。10组非平衡数据集仿真试验结果表明,DCSMOTE-RF算法对非平衡数据具有较好的预测效果。
文摘[目的]供电部门记录的正确的拓扑信息有助于工作人员监测电网信息,分析故障,优化电网运行以满足低压配电台区精益化、智能化管理的需要。目前,各式新型用电设备及用户的加入使低压配电网络结构呈现出持续变化的特征,线路维护成本被大大提高。[方法]为此,提出基于密度聚类的低压台区归属关系识别方法。首先,提取智能电表有效电压数据生成高维时序电压矩阵;其次,采用t分布随机近邻嵌入方法(t-distributed Stochastic Neighbor Embedding,t-SNE)对高维时序电压数据进行特征提取与降维;然后,应用基于数据密度的噪声应用空间聚类方法(Density-Based Spatial Clustering of Applications with Noise,DBSCAN)对降维后的数据进行聚类分析,实现低压用户台区归属信息的识别;最后,对海南省三亚市某台区实际数据进行分析,并将所提方法与其他主流的拓扑识别算法进行对比。[结果]分析结果表明所提方法能够达到95%以上的台区识别准确率,高于目前其他主流的拓扑信息识别方法。[结论]文章中的方法在解决此类问题上具有有效性与优势性,可以为实际工程应用提供参考,为低压台区拓扑信息识别领域提供不一样的研究思路。