期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于URL特征的Phishing检测方法(英文) 被引量:2
1
作者 曹玖新 董丹 +1 位作者 毛波 王田峰 《Journal of Southeast University(English Edition)》 EI CAS 2013年第2期134-138,共5页
为了有效检测恶意网络钓鱼(phishing)行为,提出一种基于URL特征的phishing检测方法.该方法首先对现有钓鱼URL与合法URL进行分析对比,提取钓鱼URL的显著特征,然后采用机器学习算法对样本数据集训练从而获得分类检测模型,用来检测待检测的... 为了有效检测恶意网络钓鱼(phishing)行为,提出一种基于URL特征的phishing检测方法.该方法首先对现有钓鱼URL与合法URL进行分析对比,提取钓鱼URL的显著特征,然后采用机器学习算法对样本数据集训练从而获得分类检测模型,用来检测待检测的URL.为适应钓鱼URL的变化,分类模型需要根据新增样本不断更新,因此,设计了一种基于原始样本数据反馈的增量学习算法.实验表明:提取的URL特征与支持向量机(SVM)分类算法的结合能够使phishing检测达到较高的检测精度,且该增量学习算法是有效的. 展开更多
关键词 url特征 phishing检测 支持向量机 增量学习
下载PDF
基于URL特征检测的违法网站识别方法 被引量:6
2
作者 凡友荣 杨涛 +1 位作者 王永剑 姜国庆 《计算机工程》 CAS CSCD 北大核心 2018年第3期171-177,共7页
为高效识别违法网站,提出一种基于URL特征检测的识别方法。基于报文请求行信息中用户访问路径的分级特点,构建基于路径相似度的网站相似度计算模型,并使用Python编程语言实现模型的分布式计算。采用Fast Unfolding算法进行网站聚类并抽... 为高效识别违法网站,提出一种基于URL特征检测的识别方法。基于报文请求行信息中用户访问路径的分级特点,构建基于路径相似度的网站相似度计算模型,并使用Python编程语言实现模型的分布式计算。采用Fast Unfolding算法进行网站聚类并抽取违法网站的URL特征,从中筛选出准确率高、具有特定含义的特征作为有效的违法网站特征,并通过检测未知网站是否具有违法网站的URL特征识别出违法网站。实验结果证明,该方法能有效度量同类网站间的关联程度,结合Fast Unfolding算法能有效区分不同类型的网站。与基于URL词法特征、HTM L、语义特征的违法网站识别方法相比,其F-M easure值最高。 展开更多
关键词 url特征 违法网站识别 网站相似度 聚类 访问路径
下载PDF
采用URL特征的Hub网页识别方法研究 被引量:2
3
作者 张策 都云程 梁然 《现代图书情报技术》 CSSCI 2016年第1期24-31,共8页
【目的】通过构建简单数据样本,解决传统网页类型识别方法效率低的难题。【方法】采用URL特征作为识别依据,抽取URL信息构建训练集与测试集,使用支持向量机(SVM)建立机器学习模型以提高识别效率。【结果】在同样的数据集上,该方法的准... 【目的】通过构建简单数据样本,解决传统网页类型识别方法效率低的难题。【方法】采用URL特征作为识别依据,抽取URL信息构建训练集与测试集,使用支持向量机(SVM)建立机器学习模型以提高识别效率。【结果】在同样的数据集上,该方法的准确率为91.2%,优于其他识别方法。在效率性能方面,该方法提升近60%。【局限】当遇到URL特征不明显甚至完全相背的网站时,识别准确率会大幅度降低。【结论】该方法在效率方面存在很大优势,应用到采集系统中可提高采集效率。 展开更多
关键词 url特征 Hub网页 支持向量机
原文传递
改进Relief-C5.0的恶意域名检测算法 被引量:4
4
作者 马栋林 张澍寰 赵宏 《计算机工程与应用》 CSCD 北大核心 2022年第11期100-106,共7页
针对目前恶意域名检测算法中分类模型计算复杂度较大、实时性不强以及准确率不高等问题,提出了Rf-C5(Relief-C5.0)恶意域名检测算法模型。提取待测域名的全局URL特征,根据提取的特征按照改进的Relief算法进行权重计算,并依据权重值进行... 针对目前恶意域名检测算法中分类模型计算复杂度较大、实时性不强以及准确率不高等问题,提出了Rf-C5(Relief-C5.0)恶意域名检测算法模型。提取待测域名的全局URL特征,根据提取的特征按照改进的Relief算法进行权重计算,并依据权重值进行优先级排序;选取权重值排名前20的关键特征作为C5.0分类器的输入端,进行合法域名与恶意域名的分类。实验结果表明,在大样本数据集下,Rf-C5模型与当前主流恶意域名检测算法相比,在提高平均检测速率的基础上,检测准确率提高了1.58~4.91个百分点。 展开更多
关键词 恶意域名 url特征 改进的Relief算法 C5.0分类器
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部