期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
6
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
一种基于密度偏差抽样的孤立点检测算法
被引量:
3
1
作者
余建桥
葛继科
李娅
《计算机科学》
CSCD
北大核心
2004年第10期206-208,共3页
孤立点检测是一项有价值的、重要的知识发现任务。在对大规模数据集中的孤立点数据进行检测时,样本数据集的选择技术至关重要。本文提出了一种新的基于密度的偏差抽样技术作为数据约简的手段,并给出了基于密度偏差抽样的孤立点检测算法...
孤立点检测是一项有价值的、重要的知识发现任务。在对大规模数据集中的孤立点数据进行检测时,样本数据集的选择技术至关重要。本文提出了一种新的基于密度的偏差抽样技术作为数据约简的手段,并给出了基于密度偏差抽样的孤立点检测算法,该算法可以用来识别样本数据集低密度区域中的孤立点数据,并从理论和实验两个方面对其进行分析评估,分析与实践证明该算法是有效的。
展开更多
关键词
孤立点
检测算法
数据约简
大规模数据
知识发现
点检
识别
样本数据
区域
抽样
下载PDF
职称材料
基于神经网络的大规模数据集离群点检测算法
被引量:
7
2
作者
高志宇
宋学坤
+2 位作者
肖俊生
闫培玲
孙新娟
《沈阳工业大学学报》
CAS
北大核心
2022年第4期420-425,共6页
针对传统方法在检测离群点时常因冗余数据的干扰而导致检测用时较长、检测准确率偏低的问题,设计了基于神经网络的大规模数据集离群点检测算法.采用核主成分分析方法对大规模数据集进行降维处理,去除其中存在的冗余数据,利用神经网络在...
针对传统方法在检测离群点时常因冗余数据的干扰而导致检测用时较长、检测准确率偏低的问题,设计了基于神经网络的大规模数据集离群点检测算法.采用核主成分分析方法对大规模数据集进行降维处理,去除其中存在的冗余数据,利用神经网络在误差函数的基础上实现对离群点的检测.结果表明:该算法的检测时间始终低于0.4 min,且检测准确率始终保持在90%以上,说明该算法能够快速、准确地检测大规模数据集中的离群点.
展开更多
关键词
神经网络
大规模数据集
离群点检测
冗余数据
降维处理
误差函数
核主成分分析
中心势值
下载PDF
职称材料
基于nested-loop的大数据集快速离群点检测算法
被引量:
1
3
作者
倪巍伟
陈耿
+1 位作者
陆介平
孙志挥
《东南大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2006年第3期463-466,共4页
针对已有的多数离群点检测算法存在扩展性差,不能有效应用于大数据集的问题,在已有的基于距离的离群点检测算法的基础上,设计模信息表存储结构,利用向量内积不等式关系以及合理的存储分配和调度策略,提出一种高效离群点检测算法DBoda....
针对已有的多数离群点检测算法存在扩展性差,不能有效应用于大数据集的问题,在已有的基于距离的离群点检测算法的基础上,设计模信息表存储结构,利用向量内积不等式关系以及合理的存储分配和调度策略,提出一种高效离群点检测算法DBoda.该算法通过在预处理中存储每个点的模信息,减少点间距离的计算量,并对嵌套循环方法进行优化,进一步减少I/O的开销.理论分析和试验结果表明,所提算法具有时间消耗小和适用于处理大数据集的特点,可以有效地解决离群点检测中的算法时间复杂性和算法扩展性问题.
展开更多
关键词
大数据集
模信息表
向量内积不等式
离群点检测
下载PDF
职称材料
基于聚类的离群点检测方法研究综述
被引量:
28
4
作者
周玉
朱文豪
+1 位作者
房倩
白磊
《计算机工程与应用》
CSCD
北大核心
2021年第12期37-45,共9页
离群点检测在数据处理中具有重要研究意义,其检测方法大致可以分为基于统计、基于距离、基于密度和基于聚类的方法。为了及时掌握当前基于聚类技术的离群点检测方法的研究现状,通过归纳与整理,将具有代表性的基于聚类的离群点检测方法...
离群点检测在数据处理中具有重要研究意义,其检测方法大致可以分为基于统计、基于距离、基于密度和基于聚类的方法。为了及时掌握当前基于聚类技术的离群点检测方法的研究现状,通过归纳与整理,将具有代表性的基于聚类的离群点检测方法进行了介绍和归类,将其主要分为静态数据集中的检测方法、数据流中的检测方法、大规模数据中的检测方法和其他方法等四大类。对每类方法所解决的问题、算法思想、应用场景以及各自的优缺点进行了详细的归纳和分析,指出目前存在的问题以及未来发展方向。
展开更多
关键词
离群点检测
聚类
静态数据集
数据流
大规模数据集
下载PDF
职称材料
改进地标点采样的加速谱聚类算法
5
作者
徐航帆
刘丛
+1 位作者
唐坚刚
彭敦陆
《电子科技》
2021年第5期47-53,共7页
传统的基于地标点的大规模加速谱聚类算法易受分布不均匀地标点和离群地标点影响。K-means等采样方法在面对大规模数据时,时间空间消耗较大。针对以上问题,文中提出了一种改进地标点采样的加速谱聚类算法。该算法通过地标点间成对相似...
传统的基于地标点的大规模加速谱聚类算法易受分布不均匀地标点和离群地标点影响。K-means等采样方法在面对大规模数据时,时间空间消耗较大。针对以上问题,文中提出了一种改进地标点采样的加速谱聚类算法。该算法通过地标点间成对相似度矩阵的标准差来衡量地标点的分布均匀程度,选取随机的多组地标点集中分布最均匀的一组,去除局部密度较低的离群地标点;利用获得的地标点集与原始数据集构造稀疏相似度矩阵,并对该矩阵奇异值分解得到的前k个右奇异特征向量矩阵进行K-means聚类,得到最终聚类结果。文中从理论上分析了该算法时间复杂度和空间复杂度。验证结果表明该算法在一些数据集上比随机采样方法的准确率高3%~10%,和K-means采样方法相比时间消耗少50%~60%。
展开更多
关键词
谱聚类
大数据
地标点采样
离群点
标准差
稀疏相似度矩阵
局部密度
奇异值分解
下载PDF
职称材料
基于分类和回归树决策树的网络大数据集离群点动态检测算法
被引量:
4
6
作者
傅丽芳
陈卓
敖长林
《吉林大学学报(工学版)》
EI
CAS
CSCD
北大核心
2023年第9期2620-2625,共6页
针对大数据集中存在海量数据,当数据规模扩大到一定程度时,离散点检测处理效率受到限制的问题,提出了一种基于分类和回归树(CART)决策树的网络大数据集离群点动态检测算法。首先,划分大数据集异常数据标准,利用方差衡量数据离散程度,使...
针对大数据集中存在海量数据,当数据规模扩大到一定程度时,离散点检测处理效率受到限制的问题,提出了一种基于分类和回归树(CART)决策树的网络大数据集离群点动态检测算法。首先,划分大数据集异常数据标准,利用方差衡量数据离散程度,使用支持向量机建立异常数据样本关联规则矩阵,明确大数据集异常数据范围,并通过动态网格划分策略降低离群点检测计算量;然后,运用CART决策树方法在分支节点采取布尔检测,将待检测数据统一拟作连续数据,升序排列训练数据集,计算数据最高信息增益,剪枝决策树直到没有非叶子节点可被替换,得到离群点动态检测结果。仿真结果证明,本文算法离群点检测准确率高、检测耗时短,具备显著的计算优势,能为大数据集的可靠应用提供积极帮助。
展开更多
关键词
分类和回归树决策树
大数据集
离群点检测
数据预处理
网格划分
基尼系数
原文传递
题名
一种基于密度偏差抽样的孤立点检测算法
被引量:
3
1
作者
余建桥
葛继科
李娅
机构
西南农业大学信息学院
出处
《计算机科学》
CSCD
北大核心
2004年第10期206-208,共3页
基金
重庆市教委资助项目(030201)
文摘
孤立点检测是一项有价值的、重要的知识发现任务。在对大规模数据集中的孤立点数据进行检测时,样本数据集的选择技术至关重要。本文提出了一种新的基于密度的偏差抽样技术作为数据约简的手段,并给出了基于密度偏差抽样的孤立点检测算法,该算法可以用来识别样本数据集低密度区域中的孤立点数据,并从理论和实验两个方面对其进行分析评估,分析与实践证明该算法是有效的。
关键词
孤立点
检测算法
数据约简
大规模数据
知识发现
点检
识别
样本数据
区域
抽样
Keywords
large data set
,
biased sampling
,
outlier detection
分类号
TP391 [自动化与计算机技术—计算机应用技术]
TP301.6 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
基于神经网络的大规模数据集离群点检测算法
被引量:
7
2
作者
高志宇
宋学坤
肖俊生
闫培玲
孙新娟
机构
河南中医药大学信息技术学院
华北水利水电大学物理与电子学院
出处
《沈阳工业大学学报》
CAS
北大核心
2022年第4期420-425,共6页
基金
河南省重点研发与推广专项(科技攻关)项目(192102310214)
河南省高等学校重点科研项目(19A520005).
文摘
针对传统方法在检测离群点时常因冗余数据的干扰而导致检测用时较长、检测准确率偏低的问题,设计了基于神经网络的大规模数据集离群点检测算法.采用核主成分分析方法对大规模数据集进行降维处理,去除其中存在的冗余数据,利用神经网络在误差函数的基础上实现对离群点的检测.结果表明:该算法的检测时间始终低于0.4 min,且检测准确率始终保持在90%以上,说明该算法能够快速、准确地检测大规模数据集中的离群点.
关键词
神经网络
大规模数据集
离群点检测
冗余数据
降维处理
误差函数
核主成分分析
中心势值
Keywords
neural network
large
-scale
data
set
outlier
detection
redundant
data
dimension reduction
error function
nuclear principal component analysis
central potential value
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于nested-loop的大数据集快速离群点检测算法
被引量:
1
3
作者
倪巍伟
陈耿
陆介平
孙志挥
机构
东南大学计算机科学与工程学院
南京审计学院审计信息工程重点实验室
出处
《东南大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2006年第3期463-466,共4页
基金
国家自然科学基金资助项目(70371015)
高等学校博士学科点专项科研基金资助项目(20040286009)
审计署审计科研所专项资助项目(SK2006007)
文摘
针对已有的多数离群点检测算法存在扩展性差,不能有效应用于大数据集的问题,在已有的基于距离的离群点检测算法的基础上,设计模信息表存储结构,利用向量内积不等式关系以及合理的存储分配和调度策略,提出一种高效离群点检测算法DBoda.该算法通过在预处理中存储每个点的模信息,减少点间距离的计算量,并对嵌套循环方法进行优化,进一步减少I/O的开销.理论分析和试验结果表明,所提算法具有时间消耗小和适用于处理大数据集的特点,可以有效地解决离群点检测中的算法时间复杂性和算法扩展性问题.
关键词
大数据集
模信息表
向量内积不等式
离群点检测
Keywords
large data set
mode table
vectors' inner product inequation
outlier detection
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于聚类的离群点检测方法研究综述
被引量:
28
4
作者
周玉
朱文豪
房倩
白磊
机构
华北水利水电大学电力学院
出处
《计算机工程与应用》
CSCD
北大核心
2021年第12期37-45,共9页
基金
河南省高等学校青年骨干教师培养计划(2018GGJS079)
国家自然科学基金(U1504622,31671580)。
文摘
离群点检测在数据处理中具有重要研究意义,其检测方法大致可以分为基于统计、基于距离、基于密度和基于聚类的方法。为了及时掌握当前基于聚类技术的离群点检测方法的研究现状,通过归纳与整理,将具有代表性的基于聚类的离群点检测方法进行了介绍和归类,将其主要分为静态数据集中的检测方法、数据流中的检测方法、大规模数据中的检测方法和其他方法等四大类。对每类方法所解决的问题、算法思想、应用场景以及各自的优缺点进行了详细的归纳和分析,指出目前存在的问题以及未来发展方向。
关键词
离群点检测
聚类
静态数据集
数据流
大规模数据集
Keywords
outlier
detection
clustering
static
data
data
stream
large
-scale
data
set
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
改进地标点采样的加速谱聚类算法
5
作者
徐航帆
刘丛
唐坚刚
彭敦陆
机构
上海理工大学光电信息与计算机工程学院
出处
《电子科技》
2021年第5期47-53,共7页
基金
国家自然科学基金(61703278,61772342)。
文摘
传统的基于地标点的大规模加速谱聚类算法易受分布不均匀地标点和离群地标点影响。K-means等采样方法在面对大规模数据时,时间空间消耗较大。针对以上问题,文中提出了一种改进地标点采样的加速谱聚类算法。该算法通过地标点间成对相似度矩阵的标准差来衡量地标点的分布均匀程度,选取随机的多组地标点集中分布最均匀的一组,去除局部密度较低的离群地标点;利用获得的地标点集与原始数据集构造稀疏相似度矩阵,并对该矩阵奇异值分解得到的前k个右奇异特征向量矩阵进行K-means聚类,得到最终聚类结果。文中从理论上分析了该算法时间复杂度和空间复杂度。验证结果表明该算法在一些数据集上比随机采样方法的准确率高3%~10%,和K-means采样方法相比时间消耗少50%~60%。
关键词
谱聚类
大数据
地标点采样
离群点
标准差
稀疏相似度矩阵
局部密度
奇异值分解
Keywords
spectral clustering
large data set
s
landmark
sampling
outlier
point
standard deviation
sparse similarity matrix
local density
singular value decomposition
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
基于分类和回归树决策树的网络大数据集离群点动态检测算法
被引量:
4
6
作者
傅丽芳
陈卓
敖长林
机构
东北农业大学理学院
东北农业大学工程学院
出处
《吉林大学学报(工学版)》
EI
CAS
CSCD
北大核心
2023年第9期2620-2625,共6页
基金
国家自然科学基金项目(71874026)。
文摘
针对大数据集中存在海量数据,当数据规模扩大到一定程度时,离散点检测处理效率受到限制的问题,提出了一种基于分类和回归树(CART)决策树的网络大数据集离群点动态检测算法。首先,划分大数据集异常数据标准,利用方差衡量数据离散程度,使用支持向量机建立异常数据样本关联规则矩阵,明确大数据集异常数据范围,并通过动态网格划分策略降低离群点检测计算量;然后,运用CART决策树方法在分支节点采取布尔检测,将待检测数据统一拟作连续数据,升序排列训练数据集,计算数据最高信息增益,剪枝决策树直到没有非叶子节点可被替换,得到离群点动态检测结果。仿真结果证明,本文算法离群点检测准确率高、检测耗时短,具备显著的计算优势,能为大数据集的可靠应用提供积极帮助。
关键词
分类和回归树决策树
大数据集
离群点检测
数据预处理
网格划分
基尼系数
Keywords
classification and regression trees(CART)decision tree
large data set
s
outlier
detection
data
preprocessing
meshing
Gini coefficient
分类号
TP393 [自动化与计算机技术—计算机应用技术]
原文传递
题名
作者
出处
发文年
被引量
操作
1
一种基于密度偏差抽样的孤立点检测算法
余建桥
葛继科
李娅
《计算机科学》
CSCD
北大核心
2004
3
下载PDF
职称材料
2
基于神经网络的大规模数据集离群点检测算法
高志宇
宋学坤
肖俊生
闫培玲
孙新娟
《沈阳工业大学学报》
CAS
北大核心
2022
7
下载PDF
职称材料
3
基于nested-loop的大数据集快速离群点检测算法
倪巍伟
陈耿
陆介平
孙志挥
《东南大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2006
1
下载PDF
职称材料
4
基于聚类的离群点检测方法研究综述
周玉
朱文豪
房倩
白磊
《计算机工程与应用》
CSCD
北大核心
2021
28
下载PDF
职称材料
5
改进地标点采样的加速谱聚类算法
徐航帆
刘丛
唐坚刚
彭敦陆
《电子科技》
2021
0
下载PDF
职称材料
6
基于分类和回归树决策树的网络大数据集离群点动态检测算法
傅丽芳
陈卓
敖长林
《吉林大学学报(工学版)》
EI
CAS
CSCD
北大核心
2023
4
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部