-
题名基于梯度提升回归树的大数据集离群点挖掘模型构建
- 1
-
-
作者
胡小琴
-
机构
泉州信息工程学院
-
出处
《佳木斯大学学报(自然科学版)》
CAS
2019年第5期743-747,共5页
-
文摘
为了提高大数据集离群点挖掘能力,提出基于梯度提升回归树的大数据集离群点挖掘模型,构建大数据集离群点的回归树分布模型,采用多维特征融合方法进行大数据集离群点的特征检测,提取大数据集离群点的空间区域分布特征量,采用梯度提升回归分析方法对提取的大数据集离群点特征进行模糊聚类处理,在聚类中心中实现对大数据集离群点数据的自适应融合和分布式检测,通过梯度提升回归树分析方法实现大数据集离群点挖掘。仿真结果表明,采用该方法进行大数据集离群点挖掘的准确性较高,抗干扰性较好,提高了大数据集离群点挖掘过程的收敛和控制能力。
-
关键词
梯度提升回归树
大数据
集离群点
挖掘
-
Keywords
gradient ascending regression tree
big data
cluster point
mining
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名一种基于关键域子空间的离群数据聚类算法
被引量:8
- 2
-
-
作者
金义富
朱庆生
邢永康
-
机构
重庆大学计算机科学与工程学院
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2007年第4期651-659,共9页
-
基金
国家自然科学基金项目(60403009)
重庆市自然科学基金项目(2005BB2224)
-
文摘
离群数据发现与分析是数据挖掘的重要组成部分,现有离群数据挖掘算法主要针对如何检测离群对象,缺乏对挖掘出的离群数据集进行解释与分析的有效方法.通过对离群数据来源及特性进行分析并结合粗糙集理论,定义了离群划分相似度的概念,提出了一种基于关键属性域子空间的离群数据聚类算法COKAS,该算法不仅揭示了离群数据子空间特性,进一步获取了扩展知识,而且有助于对整体数据集的理解.对两个多维数据集的实验结果表明,该算法具有良好的适应性及有效性.
-
关键词
离群集
离群划分相似度
关键域子空间
聚类
-
Keywords
outlier
outlying partition similarity
key attribute subspace
clustering
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-