期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
面向恶意PDF文档分类的对抗样本生成方法研究
1
作者 刘超 娄尘哲 +2 位作者 喻民 姜建国 黄伟庆 《信息安全学报》 CSCD 2023年第5期14-26,共13页
通过恶意文档来传播恶意软件在现代互联网中是非常普遍的,这也是众多机构面临的最高风险之一。PDF文档是全世界应用最广泛的文档类型,因此由其引发的攻击数不胜数。使用机器学习方法对恶意文档进行检测是流行且有效的途径,在面对攻击者... 通过恶意文档来传播恶意软件在现代互联网中是非常普遍的,这也是众多机构面临的最高风险之一。PDF文档是全世界应用最广泛的文档类型,因此由其引发的攻击数不胜数。使用机器学习方法对恶意文档进行检测是流行且有效的途径,在面对攻击者精心设计的样本时,机器学习分类器的鲁棒性有可能暴露一定的问题。在计算机视觉领域中,对抗性学习已经在许多场景下被证明是一种有效的提升分类器鲁棒性的方法。对于恶意文档检测而言,我们仍然缺少一种用于针对各种攻击场景生成对抗样本的综合性方法。在本文中,我们介绍了PDF文件格式的基础知识,以及有效的恶意PDF文档检测器和对抗样本生成技术。我们提出了一种恶意文档检测领域的对抗性学习模型来生成对抗样本,并使用生成的对抗样本研究了多检测器假设场景的检测效果(及逃避有效性)。该模型的关键操作为关联特征提取和特征修改,其中关联特征提取用于找到不同特征空间之间的关联,特征修改用于维持样本的稳定性。最后攻击算法利用基于动量迭代梯度的思想来提高生成对抗样本的成功率和效率。我们结合一些具有信服力的数据集,严格设置了实验环境和指标,之后进行了对抗样本攻击和鲁棒性提升测试。实验结果证明,该模型可以保持较高的对抗样本生成率和攻击成功率。此外,该模型可以应用于其他恶意软件检测器,并有助于检测器鲁棒性的优化。 展开更多
关键词 恶意pdf文档 对抗样本 文档分类 样本生成 鲁棒性
下载PDF
基于混合特征的恶意PDF文档检测 被引量:5
2
作者 杜学绘 林杨东 孙奕 《通信学报》 EI CSCD 北大核心 2019年第2期118-128,共11页
针对现有恶意PDF文档在检测方案存在特征顽健性差、易被逃避检测等问题,提出了一种基于混合特征的恶意PDF文档检测方法,采用动静态混合分析技术从文档中提取出其常规信息、结构信息以及API调用信息,并基于K-means算法设计了特征提取方法... 针对现有恶意PDF文档在检测方案存在特征顽健性差、易被逃避检测等问题,提出了一种基于混合特征的恶意PDF文档检测方法,采用动静态混合分析技术从文档中提取出其常规信息、结构信息以及API调用信息,并基于K-means算法设计了特征提取方法,聚合出表征文档安全性的核心混合特征,从而提高了特征的顽健性。在此基础上,利用随机森林算法构建分类器并设计实验,对所提方案的检测性能以及抵抗模拟攻击的能力进行了探讨。 展开更多
关键词 恶意pdf文档 混合特征 机器学习 检测
下载PDF
一种基于复合特征的恶意PDF检测方法 被引量:2
3
作者 李国 黄永健 +2 位作者 王静 徐俊洁 王鹏 《现代电子技术》 北大核心 2020年第2期45-48,52,共5页
为了提高特征有效性和扩大检测范围,提出在提取PDF文件的恶意结构特征的基础上再提取JavaScript的恶意特征;为了减少检测时间,提出在特征提取前,增加基于信息熵差异的预检测过程。先利用恶意PDF和良性PDF的信息熵差异筛选出可疑PDF文件... 为了提高特征有效性和扩大检测范围,提出在提取PDF文件的恶意结构特征的基础上再提取JavaScript的恶意特征;为了减少检测时间,提出在特征提取前,增加基于信息熵差异的预检测过程。先利用恶意PDF和良性PDF的信息熵差异筛选出可疑PDF文件和良性PDF文件;然后在检测过程中,提取可疑PDF文件的结构和JavaScript特征;再利用C5.0决策树算法进行分类;最后,通过实验检测,验证了提出的方法对恶意PDF文件检测有效。实验结果表明,与PJScan,PDFMS等模型做对比,该方法检测率比PJScan高27.79%,时间消耗低390 s,误检率比PDFMS低0.7%,时间消耗低473 s,综合性能更优。 展开更多
关键词 恶意pdf文档 文档检测 文件筛选 文件特征提取 信息熵预检 实验验证
下载PDF
基于SVM的恶意PDF检测研究 被引量:2
4
作者 李涛 《现代计算机(中旬刊)》 2018年第3期117-120,共4页
近年来,随着PDF的广泛应用,它的安全性也受到很大的威胁,它出现在APT攻击、钓鱼攻击中越来越频繁。通过提取恶意PDF中的Java Script代码特征向量,提出一种基于支持向量机的机器学习静态检测模型。从实验结果显示达到预期效果。
关键词 机器学习 恶意pdf文档 单一类别支持向量机 恶意软件检测
下载PDF
一种双向采样的恶意PDF文档检测方法 被引量:1
5
作者 李睿 杨淑群 张新宇 《软件导刊》 2022年第5期67-72,共6页
随着信息化发展,PDF文档以其良好的特性,成为日常流行的数据交换文件格式,也成为APT攻击事件中常被利用的文件载体。现有的恶意PDF文档检测方法往往采用平衡样本数据集进行评估,但真实环境中恶意文档数量远少于良性文档,因此在样本分类... 随着信息化发展,PDF文档以其良好的特性,成为日常流行的数据交换文件格式,也成为APT攻击事件中常被利用的文件载体。现有的恶意PDF文档检测方法往往采用平衡样本数据集进行评估,但真实环境中恶意文档数量远少于良性文档,因此在样本分类不均衡情况下,提出KM-TBSMOTE双向采样法的恶意PDF文档检测方法。基于BSMOTE算法,利用生成的过渡样本合成新样本,给出TBSMOTE算法,提高负样本比例。利用K-Means算法进行良性PDF文档样本欠采样,结合TBSMOTE算法,使样本分类达到均衡状态。最后采用随机森林方法进行恶意性检测。实验表明,该方法在不均衡PDF样本集上检测效果良好,综合评价指标F1达98.98%,召回率98.91%,误检率0.026%。与传统BSMOTE过采样方法相比,评价指标F1提高1.39%,召回率提高1.96%,误检率降低0.048%。基于KM-TB⁃SMOTE双向采样的恶意PDF文档检测方法能够有效解决样本分类不均衡对分类模型的影响,提高检测效果,适用于现实环境中的PDF文档恶意性检测。 展开更多
关键词 恶意pdf 文档检测 APT攻击 不均衡数据 双向采样
下载PDF
一种改进的恶意PDF文档静态检测方案 被引量:6
6
作者 孙本阳 王轶骏 薛质 《计算机应用与软件》 CSCD 2016年第3期308-313,共6页
随着PDF文件的使用日益广泛,恶意的PDF文档不断涌现。现有的恶意PDF文档的检测方案有一定的缺陷,静态检测的准确度较低并且易混淆。提出一种基于改进的N-gram文本提取机制和增强的单一类别支持向量机的机器学习模型的静态检测方案。实... 随着PDF文件的使用日益广泛,恶意的PDF文档不断涌现。现有的恶意PDF文档的检测方案有一定的缺陷,静态检测的准确度较低并且易混淆。提出一种基于改进的N-gram文本提取机制和增强的单一类别支持向量机的机器学习模型的静态检测方案。实验结果表明,该方案提高了静态检测方案的准确率,增加了一定的功能性和扩展性。 展开更多
关键词 恶意pdf文档 静态检测 单一类别支持向量机
下载PDF
基于恶意PDF文档的APT检测 被引量:6
7
作者 周可政 施勇 薛质 《信息安全与通信保密》 2016年第1期131-136,共6页
APT攻击通常是由一些技术精湛且拥有丰富资源的攻击者,经过精心策划发起的针对一些公司或政府组织的特定的、长期的网络攻击,目的是窃取高价值的或是机密的信息,或蓄意破坏。攻击者通常会使用邮件作为目标组织初始渗透的攻击向量。针对... APT攻击通常是由一些技术精湛且拥有丰富资源的攻击者,经过精心策划发起的针对一些公司或政府组织的特定的、长期的网络攻击,目的是窃取高价值的或是机密的信息,或蓄意破坏。攻击者通常会使用邮件作为目标组织初始渗透的攻击向量。针对这类鱼叉式钓鱼攻击中使用的恶意PDF文档,和在APT攻击场景下攻击者试图逃避检测而采用的模仿攻击。我们从PDF文档的样本中提取特征,用其训练用于检测的模型以检测出恶意的PDF文档,并且取得了理想的检测效果。 展开更多
关键词 APT 恶意pdf 模仿攻击
下载PDF
针对JavaScript攻击的恶意PDF文档检测技术研究 被引量:3
8
作者 胡江 周安民 《现代计算机》 2016年第1期36-40,共5页
当今社会,便携式文档(PDF)已经成为恶意代码传播的主要载体,而90%的恶意PDF样本都是基于Java Script攻击的。因此针对Java Script攻击的恶意样本检测是非常有必要的。介绍PDF的结构,以及常见的嵌入Java Script的恶意PDF文档攻击手段,在... 当今社会,便携式文档(PDF)已经成为恶意代码传播的主要载体,而90%的恶意PDF样本都是基于Java Script攻击的。因此针对Java Script攻击的恶意样本检测是非常有必要的。介绍PDF的结构,以及常见的嵌入Java Script的恶意PDF文档攻击手段,在此基础上,提出一种基于Java Script攻击的恶意PDF文档检测方法,并实现基于该方法的检测系统,主要包括PDF文档格式深入解析模块、Java Script代码定位与提取模块、恶意特征提取模块。实验表明该系统能有效检测PDF恶意文档。 展开更多
关键词 恶意pdf文档 JAVASCRIPT代码 静态检测 特征提取
下载PDF
基于机器学习算法的恶意PDF检测模型 被引量:1
9
作者 苟孟洛 《计算机安全》 2014年第5期12-13,18,共3页
随着互联网的高速发展和办公自动化的日益普及,PDF(portable document format)文件已经成为全球电子文档分发的开放式标准,由于PDF文档的高实用性和普遍适应性,使其成为有针对性钓鱼攻击的有效载体。恶意代码对计算机的严重破坏性,检测... 随着互联网的高速发展和办公自动化的日益普及,PDF(portable document format)文件已经成为全球电子文档分发的开放式标准,由于PDF文档的高实用性和普遍适应性,使其成为有针对性钓鱼攻击的有效载体。恶意代码对计算机的严重破坏性,检测和防止含有恶意代码的PDF文档已日益成为计算机安全领域的重要目标。通过从文档中提取特征数据,提出了一个基于机器学习算法的恶意PDF检测框架[1],最后并通过实验验证了其检测模型的有效性。 展开更多
关键词 恶意pdf 特征提取 机器学习 检测
下载PDF
恶意PDF检测中的特征工程研究与改进 被引量:1
10
作者 黄娜 何泾沙 吴亚飈 《电子科技大学学报》 EI CAS CSCD 北大核心 2022年第5期766-773,共8页
在基于机器学习的恶意PDF检测中,现有特征容易引起混淆或逃逸。为了提高特征的准确性和鲁棒性,在现有方法的基础上研究和改进特征提取方法,结合内容特征、结构特征以及逻辑树的间接结构特征,通过分析特征重要性进行特征选择,最后应用分... 在基于机器学习的恶意PDF检测中,现有特征容易引起混淆或逃逸。为了提高特征的准确性和鲁棒性,在现有方法的基础上研究和改进特征提取方法,结合内容特征、结构特征以及逻辑树的间接结构特征,通过分析特征重要性进行特征选择,最后应用分类算法实现恶意PDF检测。结构特征包括多个高频次叶子节点数量;内容特征包括元数据特征、字节熵值、流字节比例等特征。收集实验数据集,提取特征并分析,最终选择出58维特征,使用LightGBM算法训练梯度提升决策树模型,测试准确率为99.9%,优于其他方法。另外,模拟攻击部分样本的特征,生成对抗样本,检测准确率同样达到99.2%。 展开更多
关键词 内容特征 DOM树 梯度提升决策树 恶意pdf检测 结构特征
下载PDF
基于特征集聚和卷积神经网络的恶意PDF文档检测方法 被引量:1
11
作者 俞远哲 王金双 邹霞 《信息技术与网络安全》 2021年第8期35-41,共7页
针对现有恶意PDF文档检测方法存在特征维度高、数据集样本少导致模型欠拟合等问题,提出了一种基于特征集聚和卷积神经网络的恶意PDF文档检测方法。该方法以词袋模型为基础,从PDF文档中提取常规特征和结构特征。然后以合并后特征簇最小... 针对现有恶意PDF文档检测方法存在特征维度高、数据集样本少导致模型欠拟合等问题,提出了一种基于特征集聚和卷积神经网络的恶意PDF文档检测方法。该方法以词袋模型为基础,从PDF文档中提取常规特征和结构特征。然后以合并后特征簇最小方差为目标,使用Ward最小方差聚类方法实现特征集聚。最后,将聚合特征送入卷积神经网络分类模型进行训练。根据不同聚合特征数下模型性能的好坏,确定最优的聚合特征数。实验结果表明,该方法降低了特征维度,提升了模型的召回率,缓解了模型的欠拟合问题。纵向比较来看,在不同的良性样本和恶意样本比例下,遍历得到最优的聚合特征数,召回率平均提升了53%,F-score平均提升了0.44,运行时间平均缩短了27%;与PJScan、PDFrate、Luxor 3种检测工具横向相比,检测的综合性能平均提升了5%。 展开更多
关键词 恶意pdf文档 特征集聚 静态检测 卷积神经网络
下载PDF
逃避攻击下恶意PDF文件检测技术 被引量:3
12
作者 李坤明 顾益军 王安 《中国人民公安大学学报(自然科学版)》 2019年第3期60-64,共5页
KNN(K近邻)算法以其操作简单、分类效果明显的优点被广泛应用于网络入侵检测、垃圾邮件识别和图像识别等领域。KNN算法通过计算测试集与训练集之间的相似度进行分类。传统的机器学习分类模型通常只考虑分类的精度,没有考虑到攻击者的攻... KNN(K近邻)算法以其操作简单、分类效果明显的优点被广泛应用于网络入侵检测、垃圾邮件识别和图像识别等领域。KNN算法通过计算测试集与训练集之间的相似度进行分类。传统的机器学习分类模型通常只考虑分类的精度,没有考虑到攻击者的攻击问题,导致当存在非法攻击时,分类模型的鲁棒性降低。对此首先通过使用逃避攻击方法实现对KNN算法在恶意PDF文件分类上的攻击,然后将攻击产生的对抗样本添加到训练集中训练出新的分类器,最后模拟两种不同攻击方式在不同攻击强度下对改进前后KNN分类器分类效果的影响。实验结果表明,通过将对抗样本添加到训练集中能够有效提高KNN分类器的鲁棒性。 展开更多
关键词 KNN算法 逃避攻击 恶意pdf文件
下载PDF
基于文档图结构的恶意PDF文档检测方法
13
作者 俞远哲 王金双 邹霞 《信息技术与网络安全》 2021年第11期16-23,共8页
目前基于机器学习的恶意PDF文档检测方法依赖于专家经验来遴选特征,无法全面反映文档属性。而且在面对对抗样本时,检测器性能下降明显。针对上述问题,提出了一种基于文档图结构和卷积神经网络的恶意PDF文档检测方法。该方法解析文档结构... 目前基于机器学习的恶意PDF文档检测方法依赖于专家经验来遴选特征,无法全面反映文档属性。而且在面对对抗样本时,检测器性能下降明显。针对上述问题,提出了一种基于文档图结构和卷积神经网络的恶意PDF文档检测方法。该方法解析文档结构,根据文档中各对象之间的引用关系构建出有向图。然后,通过TF-IDF算法计算各节点对分类的贡献度来进行图结构精简。最后,计算精简后图的邻接矩阵和度矩阵,并得到图的拉普拉斯矩阵,以此作为特征送入CNN分类模型进行训练。同时还加入了对抗样本,对模型进行对抗训练。实验评估表明,在给定训练和测试样本比例9:1条件下,不断调整神经网络结构和参数,该方法的准确率达到了99.71%,性能优于KNN和SVM分类模型。在针对对抗样本的检测上,与知名在线检测网站VirusTotal上的67款杀毒引擎相比,该方法取得了更高的检测性能。 展开更多
关键词 恶意pdf文档 文档图结构 卷积神经网络 对抗样本
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部