-
题名网页内容链接层次语义树的恶意网页检测方法
被引量:2
- 1
-
-
作者
陈本刚
宋礼鹏
-
机构
中北大学大数据学院大数据与网络安全研究所
-
出处
《计算机工程与应用》
CSCD
北大核心
2020年第11期90-97,共8页
-
基金
国家自然科学基金(No.61772478)
中北大学第十四届研究生科技立项(No.20181542)。
-
文摘
针对攻击者利用URL缩短服务导致仅依赖于URL特征的恶意网页检测失效的问题,及恶意网页检测中恶意与良性网页高度不均衡的问题,提出一种融合网页内容层次语义树特征的成本敏感学习的恶意网页检测方法。该方法通过构建网页内容链接层次语义树,提取基于语义树的特征,解决了URL缩短服务导致特征失效的问题;并通过构建成本敏感学习的检测模型,解决了数据类别不均衡的问题。实验结果表明,与现有的方法相比,提出的方法不仅能应对缩短服务的问题,还能在类别不均衡的恶意网页检测任务中表现出较低的漏报率2.1%和误报率3.3%。此外,在25万条无标签数据集上,该方法比反病毒工具VirusTotal的查全率提升了38.2%。
-
关键词
恶意网页检测
缩短服务
链接层次语义树
成本敏感
-
Keywords
malicious webpage detection
URL shortening service
link level semantic tree
cost sensitive
-
分类号
TP309
[自动化与计算机技术—计算机系统结构]
-
-
题名基于两层分类器的恶意网页快速检测系统研究
被引量:6
- 2
-
-
作者
王正琦
冯晓兵
张驰
-
机构
中国科学技术大学
中国科学院电磁空间信息重点实验室
-
出处
《网络与信息安全学报》
2017年第8期44-60,共17页
-
基金
国家自然科学基金资助项目(No.61202140
No.61328208)~~
-
文摘
针对当前传统静态恶意网页检测方案在面对海量的新增网页时面临的压力,引入了两段式的分析检测过程,并依次为每段检测提出相应的特征提取方案,通过层次化使用优化的朴素贝叶斯算法和支持向量机算法,设计并实现了一种兼顾效率和功能的恶意网页检测系统——TSMWD(two-step malicious Web page detection system)。第一层检测系统用于过滤大量的正常网页,其特点为效率高、速度快、更新迭代容易,真正率优先。第二层检测系统追求性能,对于检测的准确率要求较高,时间和资源的开销上适当放宽。实验结果表明,该架构能够在整体检测准确率基本不变的情况下,提高系统的检测速度,在时间一定的情况下,接纳更多的检测请求。
-
关键词
恶意网页检测:网络安全
机器学习
特征提取
-
Keywords
malicious Web page detection, network security, machine learning, feature extraction
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名一种应用于机器学习的恶意网页特征提取方法
- 3
-
-
作者
张珂伟
郑世普
程永灵
王长帅
-
机构
中电(海南)联合创新研究院有限公司
海南省PK体系关键技术研究重点实验室
-
出处
《电子技术应用》
2022年第12期122-127,共6页
-
文摘
基于机器学习的恶意网页检测技术进行研究。目前流行的“特征码”“白名单”等方式,仅能够检测已知的恶意网页;机器学习方法,能够检测出未知的恶意网页,但在处理网页特征时要面临数据量大、复杂和繁琐的问题。提出一种哈希压缩的方法,用于处理网页的特征数据。该方法在保证检测模型的漏报率和误报率下可实现将150万的特征映射在2万的特征空间内,对提取出的特征数据运用K折交叉验证法训练多个传统机器学习模型和集成学习模型。并通过评估模型的检测效果,筛选出表现最好的分类检测模型。
-
关键词
机器学习
恶意网页检测
哈希压缩
-
Keywords
machine learning
malicious web page detection
Hash compression method
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-