期刊文献+

基于二次滑动窗口机制的日志异常检测方法 被引量:1

原文传递
导出
摘要 针对日志异常检测的传统特征提取方法往往选取一定数量的日志进行特征提取,在程序并发和网络时延波动较大等导致日志顺序混乱的场景下,传统方法效果不够理想。本文提出一种基于二次滑动窗口机制的日志异常检测方法,首先基于正则表达式和日志解析方法提取出日志时间戳和模板信息,再先后两次采用滑动窗口方法获取特征提取的序列对象。其中初次滑动窗口基于日志数量进行定长滑动,二次滑动窗口基于时间间隔进行变长滑动,以此优化特征提取粒度,有效筛选出时空关联性较强的日志集合。最后基于长短期记忆网络LSTM搭建判别模型解决异常日志的多分类问题。本文在开源数据集AIT-Log上开展对比实验,研究了两种滑动窗口机制、滑动窗口尺寸以及判别模型等因素对检测效果的影响。实验表明,相对于传统滑动窗口机制,所提方法有效提升了各模型检测效果,其中LSTM的查准率和查全率均提升3%左右。研究窗口尺寸对比实验结果可以发现,检测效果与滑动窗口尺寸成正相关,但当窗口大小到达一定临界点时检测效果将不再提升。在模型对比实验中,LSTM各项指标均优于传统机器学习算法,并且在输入数据维度增加时模型性能基本没有损失,可以看出LSTM的时空特征提取能力和非线性拟合能力都优于传统机器学习模型。
出处 《网络安全技术与应用》 2022年第3期42-44,共3页 Network Security Technology & Application
基金 国家重点研发计划(2020YFB1805400) 国家自然科学基金(U1736212、U19A2068、62002248、62032002) 四川省重点研发(20ZDYF3145)。
  • 相关文献

参考文献2

二级参考文献48

  • 1Coverity. Coverity Scan: 2012 Open Source Report. 2013. http://www.coverity.com/.
  • 2Yuan D, Park S, Huang P, Liu Y, Lee MM, Tang X, Zhou Y, Savage S. Be conservative: enhancing failure diagnosis with proactive logging. In: Proe. of the 10th Syrup. on Operating Systems Design and Implementation (OSDI). 2012. 293-306.
  • 3Yuan D, Park S, Zhou Y. Characterizing logging practices in open-source software. In: Proc. of the 2012 Int'l Conf. on Software Engineering. 2012. 102-112. [doi: 10.1109/ICSE.2012.6227202].
  • 4Kavulya SP, Joshi K, Di Giandomenico F, Narasimhan P. Failure Diagnosis of Complex Systems, Resilience Assessment and Evaluation of Computing Systems. Springer-Verlag, 2012. 239-261. [doi: 10.1007/978-3-642-29032-9].
  • 5Fu Q, Zhu J, Hu W, Lou JG, Ding R, Lin Q, Zhang D, Xie T. Where do developers log? An empirical study on logging practices in industry. In: Proc. of the 36th Int'l Conf. on Software Engineering. 2014.24-33. [doi: 10.1145/2591062.2591175 ].
  • 6Jiang W, Hu C, Pasupathy S, Kanevsky A, Li Z, Zhou Y. Understanding Customer Problem Troubleshooting from Storage System Logs. In: Proc. of the 7th USENIX Conf. on File and Storage Technologies (FAST). 2009.43-56.
  • 7Prewett JE. Analyzing cluster log files using logsurfer. In: Proc. of the 4th Annual Conf. on Linux Clusters. 2003.
  • 8Hellerstein JL, Ma S, Perng CS. Discovering actionable patterns in event data. IBM Systems Journal, 2002,41(3):475-493. [doi: 10. 1147/sj.413.0475].
  • 9Ma S, Hellerstein JL. Mining partially periodic event patterns with unknown periods. In: Proc. of the 17th Int'l Conf. on Data Engineering. 2001. 205-214. [doi: 10.1109/ICDE.2001.914829].
  • 10Yamanishi K, Maruyama Y. Dynamic syslog mining for network failure monitoring, In: Proc. of the 11th ACM SIGKDD Int'l Conf. on Knowledge Discovery in Data Mining. 2005.499-508. [doi: 10.1145/1081870.1081927].

共引文献68

同被引文献13

引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部