-
题名基于Hadoop平台的网站日志分析
被引量:3
- 1
-
-
作者
宋梦馨
缪红萍
王溯
张二松
-
机构
中国石油勘探开发研究院计算机应用技术研究所
中国石油勘探开发研究院西北分院
-
出处
《信息系统工程》
2015年第12期35-36,共2页
-
文摘
互联网中每天产生大量的网络日志,通过对日志的分析挖掘,能够获取用户行为、偏好等信息。随着日志数据量的爆炸式增长,传统的单一节点分析方法已无法满足需求。随着大数据技术的不断成熟,通过Hadoop平台能够实现对大规模网站日志的分析。本文通过搭建4个节点的Hadoop平台,以Nginx用户访问日志为例,使用Map Reduce计算模型对用户访问网站使用的浏览器类型进行了统计,并通过R语言进行分析结果的展示,为后续的网站决策及支持提供了参考依据。
-
关键词
HADOOP
MAPREDUCE
nginx日志分析
R语言
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于深度学习技术的恶意攻击的分析与识别
被引量:6
- 2
-
-
作者
张超群
韦川源
梁刚
黑小龙
朱旭东
-
机构
广西民族大学软件与信息安全学院
-
出处
《计算机应用研究》
CSCD
北大核心
2020年第S01期283-286,289,共5页
-
基金
国家自然科学基金资助项目(21466008,61640016)
广西科技基地和人才专项项目(2017AD23056)
+1 种基金
广西高等教育本科教学改革工程项目(2016JGA181)
广西民族大学引进人才科研启动项目(2016MDQD009)
-
文摘
对网站恶意攻击展开研究,通过在单机环境和具有1台服务器、2台客户机的局域网环境下模拟暴力破解、撞库、分布式拒绝服务攻击网站,以人工标注网站日志数据,训练一个LSTM网络分类模型,利用监控脚本在线监控网站日志,将日志数据转换成结构化数据并输入训练好的LSTM网络进行分类,以区分恶意攻击产生的日志和正常日志,达到识别恶意攻击类型的目的。在测试集数据上,分类准确率达到99%以上。按类似的思路,还构建一个基于自编码器和LSTM网络的分类模型,用KDD99数据集对该分类器进行训练和测试。实验结果表明,平均分类准确率约为99.7%,明显优于其他比较方法。网络攻击数据通常隐式地具有序列特征,将分类问题转换为序列标注问题,并用深度学习技术来求解,其整体解决思路是合理且有效的,可为后续的安全防护提供有效支持。
-
关键词
深度学习
恶意攻击
LSTM网络
PyTorch框架
nginx日志
KDD99数据集
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
TP393.08
[自动化与计算机技术—计算机应用技术]
-