基于加权快速聚类的异常数据挖掘算法被引量：2

Outlier data mining algorithms based on weighted fast clustering

下载PDF

导出

摘要聚类是数据挖掘领域中最活跃的研究分支之一,并在其他的科学领域也有广泛的应用。设计了基于加权快速聚类的异常数据挖掘算法,以便能快速发现异常数据。首先通过对数据的每个属性赋予一定权值,权值的大小要体现其对分类的贡献度,并根据属性权值的特点,选择比较优良的初始分区,然后进行多次迭代,得到接近最优分区,接着运用一定规则,发现异常数据类,最后实践证明该技术取得很好的社会效果。 Clustering is one of the most flourish direction of data mining,and it has been applied abroad at other scientific fields.This article promoted outlier data mining algorithms based on weighted fast clustering to inspect and deal with outlier data effectively.The processes of algorithms were described in the followings,firstly,the each property of data should be endowed with certain weight to incarnate its sort devotion degree,and choose better initialization subarea according to the weight characteristics of property,and get to the best subarea under many times iteration ,and then find outlier data by the application of certain data class.Finally,the experiment demonstrated this technology obtained better social effect.

作者李星毅包从剑施化吉奚春海

机构地区北京交通大学电子信息学院江苏大学计算机科学与通信工程学院亭旁中学计算机中心

出处《计算机工程与应用》 CSCD 北大核心 2007年第35期153-155,共3页 Computer Engineering and Applications

基金国家火炬计划(No.2004EB33006) 江苏省高校自然科学指导性计划项目(No.05JKD520050)。

关键词异常数据数据挖掘学习规则 K-均值聚类加权快速聚类 outlier data data mining learning rule K-mean clustering weighted fast clustering

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献5

1Domeniconi C,Papadopoulos D,Ma S.Subspace cluste-gunopulos D,ring of high dimensional data[C]//Proc of the Fourth SIAM Intl Conf on Data Mining,2004:517-521.
2Chan E Y,Ching W K,Ng M K,et al.An optimization algorithm for clustering using weighted dissimilarity measures[J].Pattern Recognition, 2004,37 : 943-952.
3Wang Xi-zhao,Wang Ya-dong,Wang Li-juan.Improving fuzzy Cmeans clustering based on feature-weight leaming[J].Pattem Recognition Letters,2004,25: 1123-1132.
4MEHMEDKANTARDZIC.数据挖掘-概念、模型、方法和算法[M].北京:清华大学出版社,2003..
5Aha D.Tolerating noisy,irrelevant,and novel attributes in instancebased learning algorithms[J].International Journal of Man-Machine Studies, 1992,36(2) : 267-287.

共引文献13

1张特来,刘万军.数据挖掘在医学领域的应用研究[J].自动化技术与应用,2005,24(10):73-74. 被引量：5
2乔永生.数据挖掘的探讨[J].科技情报开发与经济,2006,16(10):247-249. 被引量：3
3徐晓霞,李金林.基于决策树法的我国商业银行信用风险评估模型研究[J].北京理工大学学报（社会科学版）,2006,8(3):71-74. 被引量：9
4夏斌,徐彬.基于超链接信息的搜索引擎检索结果聚类方法研究[J].电脑开发与应用,2007,20(5):16-17. 被引量：1
5陈键.浅析常用聚类分析算法[J].安徽电子信息职业技术学院学报,2007,6(1):100-102. 被引量：4
6蔡利平.基于神经网络的保险数据挖掘模型[J].西南民族大学学报（自然科学版）,2009,35(4):877-880. 被引量：1
7边泓,周晓苏,张牮.会计信息在商业银行信贷决策中的相关性研究——基于对成功贷款企业财务特征的遗传学习视角[J].统计与信息论坛,2009,24(8):42-48. 被引量：4
8王玉峰,邹积岩,廖敏夫.基于数据挖掘技术预测与分析变电站中电磁环境[J].高压电器,2009,45(5):77-79. 被引量：5
9刘福国.基于数据挖掘的钢球磨煤机运行特性建模和优化[J].煤炭学报,2010,35(5):850-854. 被引量：9
10胡燕,何腊梅.数据挖掘技术在转炉终点控制中的应用[J].钢铁技术,2010(5):7-9. 被引量：4

同被引文献37

1李云飞,黄继伟,朱宏.双参数指数分布异常数据的检验[J].电子科技大学学报,2005,34(1):127-130. 被引量：9
2赵泽茂,何坤金,胡友进.基于距离的异常数据挖掘算法及其应用[J].计算机应用与软件,2005,22(9):105-107. 被引量：12
3张德然.可靠性统计与数据挖掘[J].西华师范大学学报（自然科学版）,2005,26(3):334-337. 被引量：6
4张登峰,陆宝春,王执铨.基于动态神经网络的非线性系统鲁棒故障检测[J].数学的实践与认识,2006,36(1):154-159. 被引量：1
5庞茂,周晓军,孟庆华.基于免疫学的在线故障检测算法的研究及应用[J].中国电机工程学报,2005,25(24):149-153. 被引量：7
6黄洪宇,林甲祥,陈崇成,樊明辉.离群数据挖掘综述[J].计算机应用研究,2006,23(8):8-13. 被引量：42
7周晓云,孙志挥,张柏礼,杨宜东.高维类别属性数据流离群点快速检测算法[J].软件学报,2007,18(4):933-942. 被引量：21
8翁小清,沈钧毅.基于滑动窗口的多变量时间序列异常数据的挖掘[J].计算机工程,2007,33(12):102-104. 被引量：16
9Rahm E,Do H H.Data Cleaning:Problems and Current Approaches[J].IEEE Data Engineering Bulletin,2000,23(4):3-13.
10Han J W,Kamber M.Data Mining Concepts and Technique[M].Beijing:China Machine Press,2001.

引证文献2

1王和勇,吕威,陈冰川.基于加速度趋势比较的异常数据清洗研究[J].计算机应用与软件,2010,27(8):269-270.
2曾绍华,魏延,唐远炎.剔除支持向量回归中异常数据算法[J].重庆大学学报（自然科学版）,2012,35(12):120-132. 被引量：5

二级引证文献5

1苏乐群,冯爱民.基于稀疏贝叶斯回归的异常检测[J].计算机与现代化,2015(1):57-60. 被引量：2
2王立舒,李岩,梁秋艳,董守田,唐丽静.基于改进肖维涅算法的温室环境数据采集[J].农业工程学报,2015,31(5):212-217. 被引量：6
3邱思语,杨洪耕.稀疏贝叶斯回归及其在谐波电流异常检测中的应用[J].电力系统及其自动化学报,2017,29(5):104-107. 被引量：10
4段青玲,肖晓琰,刘怡然,张璐.基于SW-SVR的畜禽养殖物联网异常数据实时检测方法[J].农业机械学报,2017,48(8):159-165. 被引量：14
5吴健飞,刘勤明.基于动态EM-SHSMM的异常数据下设备健康预测研究[J].计算机应用研究,2019,36(7):2003-2006. 被引量：3

1易江涛.谈谈硬盘的分区机制与最优分区[J].微型计算机,1997(4):36-38.
2周瑞宣.欣喜遗憾希望——《中国汉字听写大会》《汉字英雄》观后感[J].小学教学（语文版）,2013(12):32-33. 被引量：1
3李中华,毛宗源,郑日荣,伍建平.基于人工免疫算法的电梯交通动态分区的优化[J].华南理工大学学报（自然科学版）,2004,32(10):46-50. 被引量：12
4刘建章.我的网络新闻评论观[J].网络传播,2005(6):4-5.
5李晓春,单梁,李军.基于最优分区搜索法的线结构激光成像方法研究[J].南京理工大学学报,2015,39(6):680-685. 被引量：2
6刘艳丽.COGENT指纹自动识别系统应用体会[J].刑事技术,2002,27(z1):44-45.
7申林.移动互联网时代手机二维码的传播效果[J].新视觉艺术,2013(1):49-50. 被引量：1
8沈望舒.确立设防的危机文化意识[J].瞭望,2010(18):43-43.
9陈嘉伟.城市监控报警联网共享系统建设的技术启迪[J].A&S（安全&自动化）,2014(8):86-89.
10民警及时制止一起网络诈骗助乡民免遭经济损失[J].中国防伪报道,2016,0(8):62-62.

计算机工程与应用

2007年第35期

浏览历史

内容加载中请稍等...

基于加权快速聚类的异常数据挖掘算法被引量：2

参考文献5

共引文献13

同被引文献37

引证文献2

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于加权快速聚类的异常数据挖掘算法 被引量：2

参考文献5

共引文献13

同被引文献37

引证文献2

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于加权快速聚类的异常数据挖掘算法被引量：2