-
题名非结构化高维大数据异常流量时间点挖掘算法
- 1
-
-
作者
解海燕
李杰
赵国栋
-
机构
银川能源学院
宁夏大学网络与信息管理中心
-
出处
《计算机仿真》
2024年第7期474-478,共5页
-
基金
银川能源学院科研项目(2023-KY-Z-3)
宁夏自然科学基金(2021aac03118)。
-
文摘
非结构化数据的维度较高,每个样本数据包含的特征非常多,导致了维度灾难问题,使得降低维度并保持有效特征提取难度较大,影响大数据流量异常时间点挖掘的精度。为此,提出新的基于空间映射的非结构化高维大数据流量异常时间点挖掘方法。通过近似解集的几何特征建立稀疏回归模型,求解高维目标空间映射到低维目标子空间的稀疏投影矩阵。根据密度分布选择出一个高密度集合作为聚类中心的候选集,确定聚类的初始聚类中心。同时对聚类形成的各个簇采用剪枝算法,选择时间点候选集,对候选集展开二次判断,挖掘高维大数据流量异常时间点。实验结果表明,数据的降维能有效提高流量异常挖掘精度。相比之下,所提方法的高维大数据流量异常时间点挖掘更加精准,耗时更短。
-
关键词
非结构化数据
高维大数据
流量
异常时间点
挖掘方法
-
Keywords
Non-structural
High-dimensional big data
Rate of flow
Abnormal time point
Mining method
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-