-
题名基于多尺度信息熵特征的数据流快速聚类研究
- 1
-
-
作者
何宇新
廖长江
何新旭
-
机构
南方电网数字电网集团有限公司数字企业分公司
-
出处
《电子设计工程》
2024年第15期41-44,共4页
-
基金
南网数研院人力资源管理人才数字化建设项目(0002200000085847)。
-
文摘
由于数据流规模较大,产生和更新的速度较快,因此数据流中有价值的信息很难被充分挖掘。针对这种情况,研究一种基于多尺度信息熵特征的数据流快速聚类方法。对数据流实施降维和标准化处理,提取数据流的多尺度特征,包括压缩比数、数据流平均值、数据流峰值以及数据流峭度。计算多尺度特征的信息熵权重,选取数据流快速聚类中心,将数据流样本划分给聚类中心,完成数据流快速聚类。实验结果表明,所研究聚类方法的聚类质量系数均大于0.9,说明该方法的聚类能力更强。
-
关键词
多尺度信息熵特征
数据流
快速聚类
信息熵权重
聚类中心
-
Keywords
multi-scale information entropy feature
data flow
fast clustering
information entropy weight
cluster center
-
分类号
TN352.22
[电子电信—物理电子学]
-