-
题名一种个性化k近邻的离群点检测算法
被引量:11
- 1
-
-
作者
樊瑞宣
姜高霞
王文剑
-
机构
山西大学计算机与信息技术学院
山西大学计算智能与中文信息处理教育部重点实验室
-
出处
《小型微型计算机系统》
CSCD
北大核心
2020年第4期752-757,共6页
-
基金
国家自然科学基金项目(61673249,U1805263)资助
山西省回国留学人员科研基金项目(2016-004)资助。
-
文摘
在基于近邻思想的离群点检测算法中,参数k的选择是无法避免的,而k值过大或者过小都会对检测效果产生很大的影响.因此,如何选择k值是近邻方法研究中的重要内容之一.本文提出一种个性化k近邻(Personalized k-Nearest Neighbor,PKNN)的离群点检测方法,其每一个数据点的近邻个数是由算法自动确定,而不需要人为指定.位于稠密区域的点具有更多邻居,而位于稀疏区域的点具有更少的邻居.因此,PKNN方法确定的个性化近邻参数,更符合数据集的直观分布.实验结果表明,与现有方法相比,PKNN算法有很好的离群点检测效果.
-
关键词
离群点检测
个性化k近邻
参数选择
离群度
-
Keywords
outlier detection
personalized k-nearest neighbor
parameter selection
degree of outlier
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名近邻感知的标签噪声过滤算法
被引量:8
- 2
-
-
作者
姜高霞
樊瑞宣
王文剑
-
机构
山西大学计算机与信息技术学院
山西大学计算智能与中文信息处理教育部重点实验室
-
出处
《模式识别与人工智能》
EI
CSCD
北大核心
2020年第6期518-529,共12页
-
基金
国家自然科学基金项目(No.61673249,U1805263,61906113)
山西省国际合作重点研发计划项目(No.201903D421050)
山西省高等学校科技创新项目(No.2020L0007)资助。
-
文摘
基于k近邻的标签噪声过滤对近邻参数k的选取较敏感.针对此问题,文中提出近邻感知的标签噪声过滤算法,可有效解决二分类数据集的类内标签噪声的问题.算法分开考虑正类样本和负类样本,使分类问题中的标签噪声检测问题转化为两个单类别数据的离群点检测问题.首先通过近邻感知策略自动确定每个样本的个性化近邻参数,避免近邻参数敏感的问题.然后根据噪声因子将样本分为核心样本与非核心样本,并把非核心样本作为标签噪声候选集.最后结合候选样本的近邻标签信息,进行噪声的识别与过滤.实验表明,文中方法的噪声过滤效果和分类预测性能均较优.
-
关键词
标签噪声过滤
近邻感知
个性化k近邻
离群点检测
噪声因子
-
Keywords
Label Noise Filtering
Perception of Nearest Neighbors
Personalized k-Nearest Neighbor
Outlier Detection
Noise Factor
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-