期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
基于代价敏感学习的恶意URL检测研究 被引量:2
1
作者 蔡勍萌 王健 李鹏博 《信息安全学报》 CSCD 2023年第2期54-65,共12页
随着大数据时代的到来,恶意URL作为Web攻击的媒介渐渐威胁着用户的信息安全。传统的恶意URL检测手段如黑名单检测、签名匹配方法正逐步暴露缺陷,为此本文提出一种基于代价敏感学习策略的恶意URL检测模型。为提高卷积神经网络在恶意网页... 随着大数据时代的到来,恶意URL作为Web攻击的媒介渐渐威胁着用户的信息安全。传统的恶意URL检测手段如黑名单检测、签名匹配方法正逐步暴露缺陷,为此本文提出一种基于代价敏感学习策略的恶意URL检测模型。为提高卷积神经网络在恶意网页检测领域的性能,本文提出将URL数据结合HTTP请求信息作为原始数据样本进行特征提取,解决了单纯URL数据过于简单而造成特征提取困难的问题,通过实验对比了三种编码处理方式,根据实验结果选取了最佳字符编码的处理方式,保证了后续检测模型的效果。同时本文针对URL字符输入的特点,设计了适合URL检测的卷积神经网络模型,为了提取数据深层特征,使用了两层卷积层进行特征提取,其次本文在池化层选择使用BiLSTM算法提取数据的时序特征,同时将该网络的最后一个单元输出达到池化效果,避免了大量的模型计算,保证了模型的检测效率。同时为解决数据样本不均衡问题,在迭代过程中为其分配不同惩罚因子,改进了数据样本初始化权重的分配规则并进行了归一化处理,增加恶意样本在整体误差函数中的比重。实验结果表明本文模型在准确率、召回率以及检测效率上较优于其他主流检测模型,并对于不均衡数据集具有较好的抵抗能力。 展开更多
关键词 深度学习 恶意网页 url检测 代价敏感学习 神经网络
下载PDF
基于Stacking集成学习的恶意URL检测系统设计与实现 被引量:2
2
作者 张永刚 吕鹏飞 +2 位作者 张悦 姚兴博 冯艳丽 《现代电子技术》 2023年第10期105-109,共5页
针对传统URL检测方法在恶意URL检测时存在的准确率不高、实时性差等问题,提出一种基于Stacking集成学习的算法模型。该模型采用机器学习单一方法中的岭分类、支持向量机、朴素贝叶斯作为初级学习器,采用逻辑回归作为次级学习器,通过初... 针对传统URL检测方法在恶意URL检测时存在的准确率不高、实时性差等问题,提出一种基于Stacking集成学习的算法模型。该模型采用机器学习单一方法中的岭分类、支持向量机、朴素贝叶斯作为初级学习器,采用逻辑回归作为次级学习器,通过初级学习器和次级学习器相结合的双层结构对URL进行检测。使用大量的URL数据集分别对单一方法中的模型和Stacking集成学习方法的模型进行训练,并对每种模型进行评估。评估结果表明,Stacking集成学习的算法模型对恶意URL检测的准确率可达98.75%,与其他模型相比提升0.75%以上。采用Flask作为开发框架,实现了恶意URL检测系统的功能,并对系统进行云端等部署,得到系统根据用户输入的URL链接可以输出URL的检测结果,具有较好的应用价值。 展开更多
关键词 恶意url检测 Stacking集成学习 检测系统设计 算法模型 模型评估 Flask框架
下载PDF
融合多种特征的恶意URL检测方法 被引量:8
3
作者 吴森焱 罗熹 +1 位作者 王伟平 覃岩 《软件学报》 EI CSCD 北大核心 2021年第9期2916-2934,共19页
随着Web应用的日益广泛,Web浏览过程中,恶意网页对用户造成的危害日趋严重.恶意URL是指其所对应的网页中含有对用户造成危害的恶意代码,会利用浏览器或插件存在的漏洞攻击用户,导致浏览器自动下载恶意软件.基于对大量存活恶意URL特征的... 随着Web应用的日益广泛,Web浏览过程中,恶意网页对用户造成的危害日趋严重.恶意URL是指其所对应的网页中含有对用户造成危害的恶意代码,会利用浏览器或插件存在的漏洞攻击用户,导致浏览器自动下载恶意软件.基于对大量存活恶意URL特征的统计分析,并重点结合了恶意URL的重定向跳转、客户端环境探测等逃避检测特征,从页面内容、JavaScript函数参数和Web会话流程这3个方面设计了25个特征,提出了基于多特征融合和机器学习的恶意URL检测方法——HADMW.测试结果表明:该方法取得了96.2%的精确率和94.6%的召回率,能够有效地检测恶意URL.与开源项目以及安全软件的检测结果相比,HADMW取得了更好的效果. 展开更多
关键词 WEB安全 恶意url检测 多特征融合 机器学习
下载PDF
基于半监督学习的恶意URL检测方法 被引量:4
4
作者 麻瓯勃 刘雪娇 +2 位作者 唐旭栋 周宇轩 胡亦承 《计算机系统应用》 2020年第11期11-20,共10页
检测恶意URL对防御网络攻击有着重要意义.针对有监督学习需要大量有标签样本这一问题,本文采用半监督学习方式训练恶意URL检测模型,减少了为数据打标签带来的成本开销.在传统半监督学习协同训练(co-training)的基础上进行了算法改进,利... 检测恶意URL对防御网络攻击有着重要意义.针对有监督学习需要大量有标签样本这一问题,本文采用半监督学习方式训练恶意URL检测模型,减少了为数据打标签带来的成本开销.在传统半监督学习协同训练(co-training)的基础上进行了算法改进,利用专家知识与Doc2Vec两种方法预处理的数据训练两个分类器,筛选两个分类器预测结果相同且置信度高的数据打上伪标签(pseudo-labeled)后用于分类器继续学习.实验结果表明,本文方法只用0.67%的有标签数据即可训练出检测精确度(precision)分别达到99.42%和95.23%的两个不同类型分类器,与有监督学习性能相近,比自训练与协同训练表现更优异. 展开更多
关键词 恶意url检测 半监督学习 协同训练改进算法 Doc2Vec 分类器训练
下载PDF
基于gcForest算法的恶意URL检测
5
作者 刘涛 李思鉴 +2 位作者 何智帆 周宇 姚兴博 《机电信息》 2022年第23期11-15,共5页
恶意URL(Malicious URLs)是网络犯罪的重要途径,因此对恶意URL实施有效检测是保障网络安全的前提和关键。近年来,机器学习的迅猛发展为恶意URL检测提供了新的思路。鉴于此,在研究恶意URL以及对机器学习算法实验的基础上,得出基于gcFores... 恶意URL(Malicious URLs)是网络犯罪的重要途径,因此对恶意URL实施有效检测是保障网络安全的前提和关键。近年来,机器学习的迅猛发展为恶意URL检测提供了新的思路。鉴于此,在研究恶意URL以及对机器学习算法实验的基础上,得出基于gcForest算法的机器学习模型能够实现对恶意URL的精确分类检测,其精确度达到99.53%,远高于k近邻分类算法(k-Nearest Neighbor)和随机森林算法(Random Forest)等其他传统算法模型,具有较好的检测效果。 展开更多
关键词 恶意url检测 机器学习 特征工程 gcForest
下载PDF
一种基于FTCNN-BILSTM的恶意URLs检测方法 被引量:1
6
作者 张凯洪 柳毅 《计算机应用与软件》 北大核心 2023年第11期295-301,共7页
针对目前恶意URL检测模型中泛化性不够好,准确率不够高的问题,提出一种基于字符嵌入编码的FTCNN-LSTM的恶意URL多分类检测方法。该方法对URL中的每一个字符进行向量化编码,并通过批规范化和定向Dropout对神经网络进行剪枝,并使用Focal L... 针对目前恶意URL检测模型中泛化性不够好,准确率不够高的问题,提出一种基于字符嵌入编码的FTCNN-LSTM的恶意URL多分类检测方法。该方法对URL中的每一个字符进行向量化编码,并通过批规范化和定向Dropout对神经网络进行剪枝,并使用Focal Loss损失函数解决数据集不平衡的问题。实验结果显示,与机器学习训练的模型相比,该方法在多分类上召回率提升了1.73%。该模型在ISCX-URL2016和malicious_phish URL数据集上的多分类平均预测结果均能达到98.63%以上,具有较好的泛化能力。 展开更多
关键词 恶意url检测 卷积神经网络 向量化 Focal Loss
下载PDF
基于机器学习与特征工程的恶意链接检测研究 被引量:1
7
作者 何智帆 姜和芳 +1 位作者 刘涛 姚兴博 《科技风》 2023年第9期63-65,共3页
随着互联网技术的飞速发展,人们对互联网的需求日益增加,同时互联网安全问题也逐渐引起人们的重视。其中,恶意URL(Malicious URLs)是网络安全研究的重要内容,因此实现对恶意URL的有效侦测对网络安全至关重要。本文介绍了恶意URL检测的... 随着互联网技术的飞速发展,人们对互联网的需求日益增加,同时互联网安全问题也逐渐引起人们的重视。其中,恶意URL(Malicious URLs)是网络安全研究的重要内容,因此实现对恶意URL的有效侦测对网络安全至关重要。本文介绍了恶意URL检测的应用背景及实现步骤,根据其攻击方式,归纳总结了两种常用的攻击方法,然后介绍了机器学习及特征工程在该领域中的应用情况,最后总结了现有方法不足之处,并对未来的研究方向做出了展望。 展开更多
关键词 互联网安全 恶意url检测 机器学习 特征工程
下载PDF
基于SVM和TF-IDF的恶意URL识别分析与研究 被引量:4
8
作者 甘宏 潘丹 《计算机与现代化》 2016年第7期95-97,102,共4页
随着互联网尤其是移动互联网的快速发展,全球范围内出现了越来越多带欺诈和破坏性质的站点。本文通过分析URL的文本特征和站点特征,提出一种基于机器学习的URL检测方案,用TF-IDF算法细化了URL的站点特征,并结合以上特征使用基于RBF核的... 随着互联网尤其是移动互联网的快速发展,全球范围内出现了越来越多带欺诈和破坏性质的站点。本文通过分析URL的文本特征和站点特征,提出一种基于机器学习的URL检测方案,用TF-IDF算法细化了URL的站点特征,并结合以上特征使用基于RBF核的SVM进行URL安全检测,得到了96%的准确率和0.95的F1分数。 展开更多
关键词 网络安全 url检测 TF-IDF SVM
下载PDF
基于BI-LSTM+Attention的网站多结构异常检测分析实证研究 被引量:1
9
作者 吴晓英 朱劲松 《情报探索》 2022年第3期49-55,共7页
[目的/意义]针对现有网民网站访问分析方法存在样本规则库更新,对新网站的访问难以提供识别分析等问题,使用BI-LSTM、BI-LSTM+Attention算法构建网站识别模型,实现网民访问网站的意图和安全性识别预测。[方法/过程]使用BI-LSTM对网站进... [目的/意义]针对现有网民网站访问分析方法存在样本规则库更新,对新网站的访问难以提供识别分析等问题,使用BI-LSTM、BI-LSTM+Attention算法构建网站识别模型,实现网民访问网站的意图和安全性识别预测。[方法/过程]使用BI-LSTM对网站进行多结构分析识别,根据网站链接的结构特性提取出域名信息和参数信息作为主要分析数据,爬虫获取部分知名域名信息构建语料库,使用Word2vec来得到网站链接中域名的词向量特征作为第一种网站结构识别检测,TF-IDF结合N-Gram算法来得到网站链接中参数的特征向量作为第二种网站结构识别检测,构建网站识别模型。[结果/结论]多结构网民网站分析模型的识别分析方法适合各年龄段的网民和各阶段水平信息能力的用户进行识别分析,深度学习与网站结构结合的识别检测方法在上网过程的检测识别中具有维护健康上网环境的作用。 展开更多
关键词 网站访问 长短记忆神经网络 url检测
下载PDF
Phishing detection method based on URL features 被引量:2
10
作者 曹玖新 董丹 +1 位作者 毛波 王田峰 《Journal of Southeast University(English Edition)》 EI CAS 2013年第2期134-138,共5页
In order to effectively detect malicious phishing behaviors, a phishing detection method based on the uniform resource locator (URL) features is proposed. First, the method compares the phishing URLs with legal ones... In order to effectively detect malicious phishing behaviors, a phishing detection method based on the uniform resource locator (URL) features is proposed. First, the method compares the phishing URLs with legal ones to extract the features of phishing URLs. Then a machine learning algorithm is applied to obtain the URL classification model from the sample data set training. In order to adapt to the change of a phishing URL, the classification model should be constantly updated according to the new samples. So, an incremental learning algorithm based on the feedback of the original sample data set is designed. The experiments verify that the combination of the URL features extracted in this paper and the support vector machine (SVM) classification algorithm can achieve a high phishing detection accuracy, and the incremental learning algorithm is also effective. 展开更多
关键词 uniform resource locator url features phishingdetection support vector machine incremental learning
下载PDF
QR码网络钓鱼检测研究
11
作者 刘大恒 李红灵 《信息网络安全》 CSCD 北大核心 2020年第9期42-46,共5页
近年来,通过钓鱼网站实施诈骗的案件呈逐年上升趋势。相较于传统的钓鱼方式,QR码以制作门槛低、使用范围广和钓鱼成功率高等特点,使得QR码钓鱼方式颇受不法分子青睐。文章在分析总结基于QR码的网络钓鱼实施过程及其破坏性的基础上,重点... 近年来,通过钓鱼网站实施诈骗的案件呈逐年上升趋势。相较于传统的钓鱼方式,QR码以制作门槛低、使用范围广和钓鱼成功率高等特点,使得QR码钓鱼方式颇受不法分子青睐。文章在分析总结基于QR码的网络钓鱼实施过程及其破坏性的基础上,重点从URL结构和网页页面结构两方面进行相应的异常特征检测,实现了基于SVM的QR码网络钓鱼检测。 展开更多
关键词 钓鱼网站 QR码 网络安全 url检测
下载PDF
Research on Key Technology of Web Vulnerability Detection System Based on Cloud Environment
12
作者 Zhang Zhen 《International Journal of Technology Management》 2013年第12期121-124,共4页
In the light of the defect of web vulnerability detection system, combined with the characteristics of high efficient and sharing in the cloud environment, a design proposal is presented based on cloud environment, wh... In the light of the defect of web vulnerability detection system, combined with the characteristics of high efficient and sharing in the cloud environment, a design proposal is presented based on cloud environment, which analyses the key technology of gaining the URL, task allocation and scheduling and the design of attack detection. Experiment shows its feasibility and effectiveness in this paper. 展开更多
关键词 cloud technology web crawler task allocation and scheduling detection of SQL injection XSS detection
下载PDF
A sampling method based on URL clustering for fast web accessibility evaluation 被引量:2
13
作者 Meng-ni ZHANG Can WANG Jia-jun BU Zhi YU Yu ZHOU Chun CHEN 《Frontiers of Information Technology & Electronic Engineering》 SCIE EI CSCD 2015年第6期449-456,共8页
When evaluating the accessibility of a large website, we rely on sampling methods to reduce the cost of evaluation. This may lead to a biased evaluation when the distribution of checkpoint violations in a website is s... When evaluating the accessibility of a large website, we rely on sampling methods to reduce the cost of evaluation. This may lead to a biased evaluation when the distribution of checkpoint violations in a website is skewed and the selected samples do not provide a good representation of the entire website. To improve sampling quality, stratified sampling methods first cluster web pages in a site and then draw samples from each cluster. In existing stratified sampling methods, however, all the pages in a website need to be analyzed for clustering, causing huge I/O and computation costs. To address this issue, we propose a novel page sampling method based on URL clustering for web accessibility evaluation, namely URLSamp. Using only the URL information for stratified page sampling, URLSamp can efficiently scale to large websites. Meanwhile, by exploiting similarities in URL patterns, URLSamp cluster pages by their generating scripts and can thus effectively detect accessibility problems from web page templates. We use a data set of 45 web sites to validate our method. Experimental results show that our URLSamp method is both effective and efficient for web accessibility evaluation. 展开更多
关键词 Page sampling url clustering Web accessibility evaluation
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部