期刊文献+

一种基于信息熵的多维流数据噪声检测算法 被引量:5

Entropy-based Algorithmin for Noise Detection in Multi-dimensional Stream Data
下载PDF
导出
摘要 流数据噪声检测是一个比较困难的领域。由于流数据的一些特殊性,使得以前的一些处理静态数据的算法对于流数据的处理而言都不理想。在局部离群点(LOF)思想的基础上,引入信息熵来计算数据各维属性的信息增益,并根据各维属性的增益来计算数据的局部离群度,提出一种多维流数据数据噪声点检测算法EDLOF。实验结果表明,该算法对于多维流数据有较好的适应性,而且具有一定的泛化能力。 Noise detection in stream data is a little more difficult area.Most of the algorithms used to deal with the sta-tic data are not helpful to process the stream data any more.Considering the idea of local outlier,we used entropy to measure the outliers and then the algorithm EDLOF was proposed to deal with the multi-dimensional stream data.And the results of experiments show that it is useful to process multi-dimensional of stream data,and it gets generalization ability at the same time.
出处 《计算机科学》 CSCD 北大核心 2012年第2期191-194,共4页 Computer Science
基金 国家自然科学基金(60973040) 国家自然科学青年基金(60903098) 吉林省科技发展计划项目(20070533) 教育部高等学校博士学科点专项科研基金(200801830021) 吉林大学基本科研业务费交叉学科与创新项目(200810025)资助
关键词 噪声检测 流数据 数据挖掘 信息熵 Noise detection Stream data Data mining Information entropy
  • 相关文献

参考文献15

二级参考文献201

共引文献353

同被引文献38

  • 1黄添强,秦小麟,叶飞跃.基于方形邻域的离群点查找新方法[J].控制与决策,2006,21(5):541-545. 被引量:16
  • 2周晓云,孙志挥,张柏礼,杨宜东.高维类别属性数据流离群点快速检测算法[J].软件学报,2007,18(4):933-942. 被引量:21
  • 3王海龙,杨岳湘.基于信息熵的大规模网络流量异常检测[J].计算机工程,2007,33(18):130-133. 被引量:14
  • 4MUTHUKRISHNAN S,SHAH R,VETTER J S. Mining deviants in time series data stream[A].Los Alamitos.CA:IEEE Computer Society Press,2004.41-50.
  • 5ANGIULLI F,FASSETTI F. Detecting distance-based outliers in streams of data[A].New York:ACM,2007.811-820.
  • 6POKRAJAC D,LAZAREVIC A,LATECKI L J. Incremental local outlier detection for data streams[A].IEEE,2007.504-515.
  • 7ZHU Xingquan,WU Xindong,YANG Ying. Effective classification of noisy data streams with attribute oriented dynamic classifier selection[J].Knowledge and Information Systems,2006,(03):339-363.
  • 8LI Peipei,HU Xuegang,LIANG Qianhui. Concept drifting detection on noisy streaming data in random ensemble decision trees[A].Berlin,Germany,2009.236-250.
  • 9CHAN P K,MAHONEY M V,ARSHAD M H. A machine learning approach to anomaly detection[M].Melbourne:Florida Institute of Technology,2003.1-13.
  • 10DAS K,SCHNEIDER J G. Detecting anomalous records in categorical datasets[A].New York:ACM,2007.220-229.

引证文献5

二级引证文献14

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部