期刊文献+
共找到15篇文章
< 1 >
每页显示 20 50 100
基于匈牙利匹配算法的钓鱼网页检测方法 被引量:15
1
作者 张卫丰 周毓明 +1 位作者 许蕾 徐宝文 《计算机学报》 EI CSCD 北大核心 2010年第10期1963-1975,共13页
如何快速有效地计算网页的相似性是发现钓鱼网页的关键.现有的钓鱼网页检测方法在检测效果上依然存在较大的提升空间.文中提出基于匈牙利匹配的钓鱼网页检测模型,该模型首先提取渲染后网页的文本特征签名、图像特征签名以及网页整体特... 如何快速有效地计算网页的相似性是发现钓鱼网页的关键.现有的钓鱼网页检测方法在检测效果上依然存在较大的提升空间.文中提出基于匈牙利匹配的钓鱼网页检测模型,该模型首先提取渲染后网页的文本特征签名、图像特征签名以及网页整体特征签名,比较全面地刻画了网页访问后的特征;然后通过匈牙利算法计算二分图的最佳匹配来寻找不同网页签名之间匹配的特征对,在此基础上能够更加客观地度量网页之间的相似性,从而提高钓鱼网页的检测效果.一系列的仿真实验表明文中方法可行,并具有较高的准确率和召回率. 展开更多
关键词 钓鱼网页 网页特征 匈牙利匹配算法 相似性 网页签名
下载PDF
基于嵌套EMD的钓鱼网页检测算法 被引量:13
2
作者 曹玖新 毛波 +1 位作者 罗军舟 刘波 《计算机学报》 EI CSCD 北大核心 2009年第5期922-929,共8页
网络钓鱼(Web phishing)以相似网站欺诈用户、骗取个人机密信息,已成为电子金融活动的重大威胁.对此,文中提出了一个钓鱼网页检测架构.在具体检测机制方面,提出了一个基于嵌套EMD(Nested Earth Mover's Distance)的网页相似度判定算... 网络钓鱼(Web phishing)以相似网站欺诈用户、骗取个人机密信息,已成为电子金融活动的重大威胁.对此,文中提出了一个钓鱼网页检测架构.在具体检测机制方面,提出了一个基于嵌套EMD(Nested Earth Mover's Distance)的网页相似度判定算法,对Web图像进行分割,抽取子图特征并构建网页的ARG(Attributed Relational Graph),在计算不同ARG属性距离的基础上,采用嵌套EMD方法计算网页的相似度,实现了对钓鱼网站的检测.实验结果表明,与国际现有研究成果相比,该算法具有较高的精度和较强的适应性. 展开更多
关键词 钓鱼网页检测 网页分割 特征关系图 嵌套EMD 相似度
下载PDF
基于页面布局相似性的钓鱼网页发现方法 被引量:6
3
作者 邹学强 张鹏 +3 位作者 黄彩云 陈志鹏 孙永 刘庆云 《通信学报》 EI CSCD 北大核心 2016年第S1期116-124,共9页
针对钓鱼网页与真实网页布局结构相似的特点,提出了基于页面布局相似性的钓鱼网页发现方法,该方法首先抽取出网页中带链接属性的标签作为特征,然后基于该特征提取网页标签序列分支来标识网页;接着通过网页标签序列树对齐算法将网页标签... 针对钓鱼网页与真实网页布局结构相似的特点,提出了基于页面布局相似性的钓鱼网页发现方法,该方法首先抽取出网页中带链接属性的标签作为特征,然后基于该特征提取网页标签序列分支来标识网页;接着通过网页标签序列树对齐算法将网页标签序列树的对齐转换成网页标签序列分支的对齐,使二维的树结构转换成一维的字符串结构,最后通过生物信息学BLOSUM62编码的替换矩阵快速计算对齐分值,从而提高钓鱼网页的检测效果,仿真实验表明该方法可行,并具有较高的准确率和召回率。 展开更多
关键词 页面布局 钓鱼网页 标签序列树
下载PDF
基于文档对象模型结构聚类的钓鱼网页检测方法 被引量:3
4
作者 冯健 张莹 《科学技术与工程》 北大核心 2018年第23期81-89,共9页
为了解决现有的钓鱼网页分析方法,往往基于页面的文本特征,而忽略了页面的结构特征的问题,提出基于文档对象模型(document object model,DOM)结构聚类的钓鱼检测方法,其关键在于如何快速有效地计算网页的相似度。首先对获取的页面进行DO... 为了解决现有的钓鱼网页分析方法,往往基于页面的文本特征,而忽略了页面的结构特征的问题,提出基于文档对象模型(document object model,DOM)结构聚类的钓鱼检测方法,其关键在于如何快速有效地计算网页的相似度。首先对获取的页面进行DOM结构解析,构建DOM树层次标签向量以刻画网页的结构特征;然后重新定义DOM树距离的概念,通过不同DOM树之间的距离来度量网页间的相似度;最后采用划分聚类思想实现网页的聚类。一系列的仿真实验表明,方法具有较高的召回率与精确率,运行时间也较短。 展开更多
关键词 钓鱼网页 DOM树 层次 聚类
下载PDF
基于主辅特征和深度学习的钓鱼网页检测方法 被引量:1
5
作者 冯健 邹联扬 +1 位作者 乔鱼强 叶鸥 《计算机工程与设计》 北大核心 2021年第10期2748-2754,共7页
为提升钓鱼网页检测的准确率和效率,提出基于主辅特征的混合式深度学习模型。从URL、HTML页面内容和文档对象模型(document object model,DOM)结构中提取39种特征来表示钓鱼网页的多样性,其中包括两种新特征,基于信息增益将这39种特征... 为提升钓鱼网页检测的准确率和效率,提出基于主辅特征的混合式深度学习模型。从URL、HTML页面内容和文档对象模型(document object model,DOM)结构中提取39种特征来表示钓鱼网页的多样性,其中包括两种新特征,基于信息增益将这39种特征根据重要程度分为主要特征和辅助特征;将两种特征向量通过不同通道分别送入由卷积神经网络和双向长短时记忆网络组成的混合式深度学习网络进行训练,对两通道的输出进行加权融合实现分类。实验结果表明,所提模型能有效地检测钓鱼网页。 展开更多
关键词 钓鱼网页 主辅特征 深度学习 双通道 加权融合
下载PDF
基于URL混淆技术识别的钓鱼网页检测方法 被引量:4
6
作者 丁岩 努尔布力 《计算机工程与应用》 CSCD 北大核心 2017年第20期75-82,共8页
针对钓鱼URL常用的混淆技术,提出一种基于规则匹配和逻辑回归的钓鱼网页检测方法(RMLR)。首先,使用针对违反URL命名标准及隐藏钓鱼目标词等混淆技术所构建的规则库对给定网页分类,若可判定其为钓鱼网址,则省略后续的特征提取及检测过程... 针对钓鱼URL常用的混淆技术,提出一种基于规则匹配和逻辑回归的钓鱼网页检测方法(RMLR)。首先,使用针对违反URL命名标准及隐藏钓鱼目标词等混淆技术所构建的规则库对给定网页分类,若可判定其为钓鱼网址,则省略后续的特征提取及检测过程,以满足实时检测的需要。若未能直接判定为钓鱼网址,则提取该URL的相关特征,并使用逻辑回归分类器进行二次检测,以提升检测的适应性和准确率,并降低因规则库规模不足导致的误报率。同时,RMLR引入基于字符串相似度的Jaccard随机域名识别方法来辅助检测钓鱼URL。实验结果表明,RMLR准确率达到98.7%,具有良好的检测效果。 展开更多
关键词 钓鱼网页 统一资源定位符(URL)混淆技术 规则匹配 机器学习
下载PDF
基于集成学习的钓鱼网页深度检测系统 被引量:2
7
作者 冯庆 连一峰 张颖君 《计算机系统应用》 2016年第10期47-56,共10页
网络钓鱼是一种在线欺诈行为,它利用钓鱼网页仿冒正常合法的网页,窃取用户敏感信息从而达到非法目的.提出了基于集成学习的钓鱼网页深度检测方法,采用网页渲染来应对常见的页面伪装手段,提取渲染后网页的URL信息特征、链接信息特征以及... 网络钓鱼是一种在线欺诈行为,它利用钓鱼网页仿冒正常合法的网页,窃取用户敏感信息从而达到非法目的.提出了基于集成学习的钓鱼网页深度检测方法,采用网页渲染来应对常见的页面伪装手段,提取渲染后网页的URL信息特征、链接信息特征以及页面文本特征,利用集成学习的方法,针对不同的特征信息构造并训练不同的基础分类器模型,最后利用分类集成策略综合多个基础分类器生成最终的结果.针对Phish Tank钓鱼网页的检测实验表明,本文提出的检测方法具有较好的准确率与召回率. 展开更多
关键词 钓鱼网页 集成学习 深度检测 特征提取
下载PDF
钓鱼网页特征向量提取方法研究
8
作者 司响 李秋锐 宋士超 《信息网络安全》 2011年第9期201-203,共3页
随着电子商务和在线交易的增加,网络钓鱼已经成为最严重的一种网络犯罪形式。文章从网页中包含的超链接这一角度出发,给出了网页的身份特征,并结合网页ICP号,版权所有者以及网页行为等对网页特征进行了提取,得到了钓鱼网页的特征向量,... 随着电子商务和在线交易的增加,网络钓鱼已经成为最严重的一种网络犯罪形式。文章从网页中包含的超链接这一角度出发,给出了网页的身份特征,并结合网页ICP号,版权所有者以及网页行为等对网页特征进行了提取,得到了钓鱼网页的特征向量,为及时准确检测钓鱼网页提供了依据。 展开更多
关键词 钓鱼网页 网页特征 特征向量
下载PDF
基于联合特征的钓鱼网页分类方法
9
作者 贾雪鹏 容晓峰 《电子技术与软件工程》 2018年第2期201-201,共1页
本文系统地描述了一种基于联合特征的钓鱼网页检测方法。提取了41项特征作为基础特征,结合信息增益和递归特征删除两种方法的排序结果计算特征重要度。引入联合特征率R(0<R<=1)对特征进行特征交叉扩充,扩充后的联合特征向量长度... 本文系统地描述了一种基于联合特征的钓鱼网页检测方法。提取了41项特征作为基础特征,结合信息增益和递归特征删除两种方法的排序结果计算特征重要度。引入联合特征率R(0<R<=1)对特征进行特征交叉扩充,扩充后的联合特征向量长度范围为40~376。文中对比了基于基础特征和联合特征的四种最优参数模型:随机森林为最优模型;神经网络模型在引入联合特征后分类能力有小幅度上升;逻辑回归和Adaboost在引入联合特征后分类能力保持不变。 展开更多
关键词 机器学习 钓鱼网页检测 联合特征 最优分类模型
下载PDF
基于SVM-RFE的钓鱼网页检测方法研究 被引量:3
10
作者 王婷 彭勇 +2 位作者 戴忠华 伊胜伟 韩兰胜 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2013年第S2期143-146,共4页
针对现有钓鱼网页检测方法存在的不足,基于后向选择算法,在信息获取、特征提取、分类器训练及检测疑似网络钓鱼网页等过程进行了优化.根据特征之间的相互关系划分等级空间,借助支持向量机回归特征消除的思想,提出了基于支持向量机的回... 针对现有钓鱼网页检测方法存在的不足,基于后向选择算法,在信息获取、特征提取、分类器训练及检测疑似网络钓鱼网页等过程进行了优化.根据特征之间的相互关系划分等级空间,借助支持向量机回归特征消除的思想,提出了基于支持向量机的回归特征消除(SVM-RFE)对钓鱼网页进行检测的思路,设计出一种改进的钓鱼网页检测方法.最后对比不同特征维度在漏报率、误报率、识别率方面的差异,分析检测的有效性.实验结果表明:实际应用中可通过该方法准确有效地选定最优特征. 展开更多
关键词 网络钓鱼检测 支持向量机 回归特征消除 特征选择 特征向量 钓鱼网页
原文传递
支持页面特征伪造识别的钓鱼网页检测方法 被引量:3
11
作者 王伟平 张兵 《山东大学学报(理学版)》 CAS CSCD 北大核心 2014年第9期90-96,共7页
钓鱼网站是指伪装成合法网站,窃取用户提交的账号、密码等私密信息的网站。基于页面特征识别的钓鱼网站检测方法具有较好的识别准确性,但现有方法对页面特征伪造的情况识别较弱,容易漏判。首先分析了大量钓鱼网站的页面代码,总结了常见... 钓鱼网站是指伪装成合法网站,窃取用户提交的账号、密码等私密信息的网站。基于页面特征识别的钓鱼网站检测方法具有较好的识别准确性,但现有方法对页面特征伪造的情况识别较弱,容易漏判。首先分析了大量钓鱼网站的页面代码,总结了常见的9种页面特征伪造方式,并针对性地提出了支持页面特征伪造识别的钓鱼网站检测方法。该方法对页面渲染后再做特征提取识别,在页面渲染过程中检查URL地址跳转的伪装,通过直接操纵DOM提取iframe内嵌页面的内容,去除页面所有隐藏元素以防止钓鱼攻击者伪造页面关键词。测试结果表明该方法能够去除多种伪装,完成页面特征的准确提取,提高检测的准确率。 展开更多
关键词 钓鱼网页 特征伪造 检测
原文传递
一种基于集成学习的钓鱼网站检测方法 被引量:4
12
作者 余恩泽 努尔布力 于清 《计算机工程与应用》 CSCD 北大核心 2019年第18期81-88,200,共9页
针对钓鱼攻击者常用的伪造HTTPS网站以及其他混淆技术,借鉴了目前主流基于机器学习以及规则匹配的检测钓鱼网站的方法RMLR和PhishDef,增加对网页文本关键字和网页子链接等信息进行特征提取的过程,提出了Nmap-RF分类方法。Nmap-RF是基于... 针对钓鱼攻击者常用的伪造HTTPS网站以及其他混淆技术,借鉴了目前主流基于机器学习以及规则匹配的检测钓鱼网站的方法RMLR和PhishDef,增加对网页文本关键字和网页子链接等信息进行特征提取的过程,提出了Nmap-RF分类方法。Nmap-RF是基于规则匹配和随机森林方法的集成钓鱼网站检测方法。根据网页协议对网站进行预过滤,若判定其为钓鱼网站则省略后续特征提取步骤。否则以文本关键字置信度,网页子链接置信度,钓鱼类词汇相似度以及网页PageRank作为关键特征,以常见URL、Whois、DNS信息和网页标签信息作为辅助特征,经过随机森林分类模型判断后给出最终的分类结果。实验证明,Nmap-RF集成方法可以在平均9~10μs的时间内对钓鱼网页进行检测,且可以过滤掉98.4%的不合法页面,平均总精度可达99.6%。 展开更多
关键词 钓鱼网页 集成学习 规则匹配 钓鱼网页混淆技术
下载PDF
一种基于机器学习的网页分类技术 被引量:9
13
作者 孙靖超 《信息网络安全》 CSCD 2017年第9期45-48,共4页
随着网络的普及,网页的数量飞速增长,混杂其中的恶意网页占据的比例也呈上升趋势。恶意网页的检测一直是网络安全领域的研究重点和难点,传统的恶意网页检测模型在新形势下的表现不尽如人意。机器学习算法在恶意网页领域的应用是突破传... 随着网络的普及,网页的数量飞速增长,混杂其中的恶意网页占据的比例也呈上升趋势。恶意网页的检测一直是网络安全领域的研究重点和难点,传统的恶意网页检测模型在新形势下的表现不尽如人意。机器学习算法在恶意网页领域的应用是突破传统恶意网页检测局限的一种途径。文章开发出一个基于机器学习的对恶意网页检测的模型,该模型通过收集诸如URL、主机信息和各种网页内容的特征信息并通过机器学习算法对网页进行分类,与前人工作相比达到了更好的分类效果。 展开更多
关键词 恶意网页 钓鱼网页 机器学习 前端安全
下载PDF
基于链接的网络页面安全检测方法
14
作者 李玲玲 辛浩 《黑河学院学报》 2016年第3期120-122,共3页
钓鱼网站的攻击在网络安全问题中的比例逐渐上升,造成的经济损失越来越严重。通过研究Web特性中网页链接的特性,提出了一种基于链接的网络安全检测方法。实验证明,该方法能精准地检测出伪装网页,并可以应对新生的钓鱼网站。
关键词 网络安全 钓鱼网页 链接 可信度
下载PDF
网页信誉引擎的分析与设计
15
作者 薛永大 《网络安全技术与应用》 2012年第11期12-14,14,共3页
本文在研究了木马和钓鱼网页检测技术的基础上,设计了一个网页信誉引擎,可以对挂马网页和钓鱼网页进行实时检测,输出网页的信誉信息。通过对系统的功能需求进行分析,把系统划分为流量还原模块、任务识别分发模块、检测模块和结果接受反... 本文在研究了木马和钓鱼网页检测技术的基础上,设计了一个网页信誉引擎,可以对挂马网页和钓鱼网页进行实时检测,输出网页的信誉信息。通过对系统的功能需求进行分析,把系统划分为流量还原模块、任务识别分发模块、检测模块和结果接受反馈模块,并且在对各模块需求分析的基础上,对子模块的工作流程进行了详细设计。 展开更多
关键词 网页木马 钓鱼网页 网页信誉 引擎设计
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部