摘要
现有钓鱼网页检测算法以网页文本、网站结构或图像等特征进行相似性比较,在性能及效率仍有很大的提升空间。基于此,提出一种融合网页噪声和n-gram的钓鱼网站检测算法,提取出可疑网页中网页噪声,利用n-gram表示成模式特征,与受保护的网站进行相似性计算,以此判断可疑网页是否为钓鱼网页。对钓鱼网站样本数据的检测实验结果表明:该算法处理的网页特征稳定,网页数据量较少,在检测性能与效率较以往算法有了很大提升。
出处
《网络安全技术与应用》
2015年第1期85-86,89,共3页
Network Security Technology & Application
基金
国家自然科学基金(No.61304208
61202496)
湖南省自然科学基金(No.13JJ2031)
中南林业科技大学研究生教育教学改革项目(No.2012J004)