邻域粗糙集中基于序列的混合型属性离群点检测被引量：6

Sequence-based Mixed Attribute Outlier Detection in Neighborhood Rough Sets

下载PDF

导出

摘要离群点检测具有广泛应用.传统粗糙集的离群点检测方法不能有效处理数值型属性数据,故提出邻域粗糙集中基于序列的混合型属性离群点检测方法.该方法采用每个属性值的均匀性来构建属性序列,以此定义属性集序列并构建邻域类序列;进而,通过分析邻域类序列中对象的变化情况来检测离群点,并设计出相应的离群点检测算法(Sequence-based Mixed Attribute Outlier Detection,SM AOD),该算法在计算单属性邻域覆盖的方式上改进了传统的逐一比较计算模式.最后,在UCI标准数据集上与主要离群点检测方法进行实验比较与分析,结果表明所提方法的有效性. Outlier detection has extensive applications. However,the outlier detection method based on classical rough sets cannot effectively deal with the numerical attribute data,and thus a new method of mixed attribute outlier detection is proposed based on sequence.The method constructs the attribute sequence by the variance of each attribute value,and the sequence attribute set is defined to construct the neighborhood class sequence. Then,the outlier is detected by analyzing the object change in the neighborhood class sequence,and the corresponding outlier detection algorithm（ Sequence-based Mixed Attribute Outlier Detection,SMOAD） is designed,to improve the traditional one-by-one calculation pattern when computing neighborhood covering of a single attribute. Finally,the experiments are compared with main outlier detection methods via the UCI standard data sets,and the results show the effectiveness of the proposed method.

作者袁钟张贤勇冯山 YUAN Zhong;ZHANG Xian-yong;FENG Shan(College of Mathematics and Software Science, Sichuan Normal University, Chengdu 610068 ,China;Institute of Intelligent Information and Quantum Information,Sichuan Normal University ,Chengdu 610068, China)

机构地区四川师范大学数学与软件科学学院四川师范大学智能信息与量子信息研究所

出处《小型微型计算机系统》 CSCD 北大核心 2018年第6期1317-1322,共6页 Journal of Chinese Computer Systems

基金国家自然科学基金项目(61673285 61203285)资助四川省青年科技基金项目(2017JQ0046)资助四川省教育厅科研基金项目(15ZB0029)资助

关键词离群点检测邻域粗糙集序列均匀性混合型属性数据挖掘 outlier detection neighborhood rough sets sequence variance mixed attribute data mining

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献2

1杨金鸿,邓廷权.一种基于单簇核PCM的SVDD离群点检测方法[J].电子学报,2017,45(4):813-819. 被引量：9
2葛清龙,薛安荣,贾小艳.关联子空间离群点挖掘[J].小型微型计算机系统,2015,36(5):1028-1032. 被引量：2

二级参考文献13

1陈斌,冯爱民,陈松灿,李斌.基于单簇聚类的数据描述[J].计算机学报,2007,30(8):1325-1332. 被引量：18
2Knorr E, Ng R. Algorithms for mining distance-based outliers in large datasets [ C ]. In Proceedings of Very Large Data Base, 1998: 392-403.
3Breunig M, Kriegel H P,Ng R,et al. LOF :identifying density-basedlocal outliers [ C]. Proceedings of the ACM SIGMOD International Conference on Management of Data, Dallas, Texas: ACM Press, 2000:93-104.
4Beyer K, Goldstein J, Ramakrishnan R, et al. When is nearest neigh- bors meaningful[ C]. International Conference on Digital Telecom- munication ( ICDT' 99 ), 1999 : 217 -235.
5Aggarwal C C, Yu P. Outlier detection for high dimensional data [ C ]. Proc. of the ACM SIGMOD International Conference on Management of Data,2001:37-47.
6Miiller E, Schiffer M, Seidl T. Statistical selection of relevant sub- space projections for outlier ranking[ C]. Proc. of the 19th Interna- tional Conference on Data Engineering ,2011:434-445.
7Keller F, Mtiller E, Bohm K. HiCS: high-contrast subspaces for den- sity-based outlier ranking [ C ]. 28th IEEE International Conference on Data Engineering(ICDE) ,2012 : 1037-1048.
8Charu C. Aggarwal,high-dimensional outlier detection:the subspace method [M. New York:Springer New York,2013:135-167.
9Kailing K, Kriegel H P, Kr6ger P, et al. Ranking interesting sub- spaces for clustering high dimensional data [ C ]. In 7th European Conference on Principles and Practice of Knowledge Discovery in Databases ( PKDD), Cavtat-Dubrovnik, Croatia,2003:241-252.
10Frank A, Asuncion A. UCI machine learning repository [ EB/OL ]. http ://archive. ics. uci. edu/m1,2013.

共引文献9

1胡洋,张娅妮.大型数据库中数据流异常路径检测仿真[J].计算机仿真,2018,35(6):451-455. 被引量：4
2陶新民,李晨曦,沈微,常瑞,王若彤,刘艳超.基于密度敏感最大软间隔SVDD不均衡数据分类算法[J].电子学报,2018,46(11):2725-2732. 被引量：6
3李长镜,赵书良,池云仙.一种基于谱嵌入和局部密度的离群点检测算法[J].计算机科学,2019,46(3):260-266. 被引量：4
4何鎏一,杨国为.基于包裹学习算法在异常点检测上的研究[J].青岛大学学报（工程技术版）,2019,34(4):11-17.
5高罗莹,田增山,李玲霞,张小娅.一种基于SVDD的WLAN室内被动入侵检测方法[J].重庆邮电大学学报（自然科学版）,2020,32(2):200-209. 被引量：5
6徐艳娜,南文娟.基于SVDD的航空蓄电池状态自动监测仪设计[J].自动化与仪器仪表,2020(9):104-107. 被引量：2
7毛林,赵利强,于明安,魏莹,王颖.融合先验知识特征的超声图像甲状旁腺结节识别[J].电子学报,2021,49(5):944-952. 被引量：1
8史小艳,陈松灿.基于单簇聚类的非对齐多视图异常检测算法[J].中国科学：信息科学,2021,51(12):2037-2052. 被引量：4
9赵向兵,张天刚.基于相关子空间的高维离群数据检测算法[J].计算技术与自动化,2022,41(1):82-86. 被引量：3

同被引文献24

1江峰,杜军威,葛艳,眭跃飞,曹存根.基于粗糙集理论的序列离群点检测[J].电子学报,2011,39(2):345-350. 被引量：16
2涂晓敏,石鸿雁.基于方形邻域和裁剪因子的离群点检测方法[J].小型微型计算机系统,2019,40(1):186-189. 被引量：6
3耿志强,姬威,韩永明,曹健.基于维度最大熵数据流聚类的异常检测方法[J].控制与决策,2016,31(2):343-348. 被引量：10
4王橙,许沛尧,马爱军,喻雪双,张韬.基于ARIMA模型对传染病监测数据异常点的探测研究[J].现代预防医学,2018,45(4):577-581. 被引量：7
5彭涛,杨妮亚,徐原博,王冰冰,刘露.双类型异质网中基于排序和聚类的离群点检测方法[J].电子学报,2018,46(2):281-288. 被引量：6
6徐波,张贤勇,冯山.邻域粗糙集的加权依赖度及其启发式约简算法[J].模式识别与人工智能,2018,31(3):256-264. 被引量：20
7袁钟,冯山.基于邻域值差异度量的离群点检测算法[J].计算机应用,2018,38(7):1905-1909. 被引量：10
8严宏,杨波,杨红雨.基于异方差高斯过程的时间序列数据离群点检测[J].计算机应用,2018,38(5):1346-1352. 被引量：10
9巩增泰,杨甲荣.基于LR-梯形模糊数的模糊线性系统解问题及其数值计算[J].云南大学学报（自然科学版）,2018,40(5):836-847. 被引量：4
10刘亮,刘星,曾帅,汪涛,庞瑞琴.移动边缘计算中基于用户移动的虚拟机迁移策略研究[J].重庆邮电大学学报（自然科学版）,2019,31(2):158-165. 被引量：11

引证文献6

1徐波,冯山.基于邻域关系矩阵的属性约简算法[J].小型微型计算机系统,2019,40(8):1595-1600. 被引量：6
2李毅,胡建成.一种面向混合属性数据的邻域粒离群点检测[J].小型微型计算机系统,2020,41(4):855-860. 被引量：8
3罗晓媛,赵丽艳,刘君,邹栋.神经网络技术下多尺度时序数据离群点挖掘[J].计算机仿真,2021,38(1):231-235. 被引量：2
4刘云,郑文凤,张轶.模糊残差算法对离群点数据的优化研究[J].小型微型计算机系统,2021,42(6):1321-1326. 被引量：1
5张玉婷,冯山.一种基于邻域近似精度的离群点检测方法[J].数据采集与处理,2022,37(5):1018-1025. 被引量：5
6段珣,杨志勇,江峰.一种基于邻域粒度熵的离群点检测算法[J].计算机与现代化,2022(10):19-23. 被引量：1

二级引证文献19

1罗良翌,马宁丽.基于混合模拟退火算法的民航运输路径优化[J].电子设计工程,2020,28(20):44-47. 被引量：5
2王晓辉,宋学坤,王晓川.基于邻域密度的异构数据局部离群点挖掘算法[J].计算机仿真,2021,38(7):281-285. 被引量：6
3李洋,程智,周维虎,高超,董登峰.面向工业复杂场景的合作靶标椭圆特征快速鲁棒检测[J].光学精密工程,2021,29(8):1910-1920. 被引量：3
4黄剑柔,王茜,蔡星娟,李建伟.一种多目标自适应DBSCAN离群点检测算法[J].小型微型计算机系统,2022,43(4):702-706. 被引量：2
5陈晶,吴玲玲.多源异构环境下的车联网大数据混合属性特征检测方法[J].计算机科学,2022,49(8):108-112. 被引量：10
6季雨瑄,叶军,杨震宇,敖家欣,王磊.结合分辨矩阵改进的邻域粗糙集属性约简算法[J].山东大学学报（工学版）,2022,52(4):99-109. 被引量：3
7潘建宏,王磊,张俊茹,樊家树,董爱迪.能源大数据中心数据脱敏关键技术研究[J].自动化技术与应用,2023,42(6):94-97. 被引量：2
8胡宁玉,张静.无线物联网感知层多源传感数据实时共享方法[J].传感技术学报,2023,36(5):819-824. 被引量：1
9刘琨,张晓涵,曹汝坤,李帅.IPv6远程监控网络下无状态通信数据的多尺度离群点挖掘算法[J].电信科学,2023,39(8):118-126. 被引量：3
10傅丽芳,陈卓,敖长林.基于分类和回归树决策树的网络大数据集离群点动态检测算法[J].吉林大学学报（工学版）,2023,53(9):2620-2625. 被引量：4

1任岩,潘逸沁,骆方.基于印象管理量表的反应模式筛查故意作假者[J].心理学探新,2018,38(3):236-240.
2尔丽绵,吴明利,李勇,檀碧波,徐志彬,郭占军,杨会钗.线粒体DNA单倍群N9a与胃肠胰神经内分泌肿瘤发病风险的关系[J].肿瘤学杂志,2018,24(4):355-359. 被引量：1
3杨金广,徐乐,刘艳,张敏.基于反方法的高负荷涡轮动叶激波控制[J].推进技术,2018,39(6):1240-1249. 被引量：1
4CHEN Yu.Beyond“Exoticism”:Strategies for Constructing the Images of China in Western Movies[J].Journal of Literature and Art Studies,2018,8(5):779-786.
5Thomas Wagner,Martin Keller,Lutz Jaencke.Impulsivity Subtypes and Maladaptive Road Performance among Drivers in Germany and Switzerland[J].Journal of Traffic and Transportation Engineering,2018,6(2):73-87.

小型微型计算机系统

2018年第6期

浏览历史

内容加载中请稍等...

邻域粗糙集中基于序列的混合型属性离群点检测被引量：6

参考文献2

二级参考文献13

共引文献9

同被引文献24

引证文献6

二级引证文献19

相关作者

相关机构

相关主题

浏览历史

邻域粗糙集中基于序列的混合型属性离群点检测 被引量：6

参考文献2

二级参考文献13

共引文献9

同被引文献24

引证文献6

二级引证文献19

相关作者

相关机构

相关主题

浏览历史

邻域粗糙集中基于序列的混合型属性离群点检测被引量：6