期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
一种基于BERT-Stacking的钓鱼网站检测方法 被引量:2
1
作者 胡强 周杭霞 刘倩 《中国计量大学学报》 2022年第1期49-54,共6页
目的:设计一种新型的钓鱼网站检测技术,以提高检测的精确率。方法:提出了一种利用BERT(Bidirectional Encoder Representations from Transformers)提取HTML字符串嵌入特征的方法,将HTML文档转化为词嵌入向量。同时提出一种结合四种分... 目的:设计一种新型的钓鱼网站检测技术,以提高检测的精确率。方法:提出了一种利用BERT(Bidirectional Encoder Representations from Transformers)提取HTML字符串嵌入特征的方法,将HTML文档转化为词嵌入向量。同时提出一种结合四种分类器的Stacking集成学习模型,使用HTML字符串嵌入特征以及筛选出的URL特征进行钓鱼网站检测。结果:在10万级数据集上精确率达到98.52%,F_(1)值达到98.81%。且相较只使用URL特征,引入上述HTML字符串嵌入特征后,检测钓鱼网站的精确率提升了近两个百分点。结论:本文所提出的基于BERT提取的HTML字符串嵌入特征对于检测钓鱼网站具有显著提升。 展开更多
关键词 钓鱼网站 BERT算法 特征提取 字符串嵌入 集成学习
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部