-
题名面向高速网络流量的恶意镜像网站识别方法
被引量:5
- 1
-
-
作者
张蕾
张鹏
孙伟
杨兴东
邢丽超
-
机构
中国科学院大学网络空间安全学院
中国科学院信息工程研究所
北京交通大学计算机与信息技术学院
北京航空航天大学计算机学院
-
出处
《通信学报》
EI
CSCD
北大核心
2019年第7期87-94,共8页
-
基金
国家重点研究发展计划基金资助项目(No.2016YFB0801300)
国家自然科学基金资助项目(No.61602474,No.61602467,No.61702552)~~
-
文摘
针对网络环境中造成危害的信息通过镜像网站进行传播从而绕过检查的问题,提出了面向高速网络流量的恶意镜像网站识别方法。首先,从流量中提取碎片化数据并且还原网页源码,同时加入标准化处理来提高识别准确率;然后,将网页源码分块,利用相似度散列算法对每个网页源码分块计算散列值,得到网页源码的相似度散列值,同时引入海明距离来计算网页源码之间的相似性;最后,截取网页快照,提取其 SIFT 特征点,通过聚类分析和映射处理得到网页快照的感知散列值,通过感知散列值计算网页相似性。在真实流量下的实验表明,所提方法的准确率为 93.42%,召回率为 90.20%,F 值为 0.92,处理时延为 20 μs。通过所提方法,在高速网络流量下可以有效地检测恶意镜像网页。
-
关键词
恶意镜像网站
相似度散列算法
网页相似性
-
Keywords
malicious mirror website
simhash algorithm
webpage similarity
-
分类号
TP309
[自动化与计算机技术—计算机系统结构]
-