针对恶意JavaScript识别的降维方法被引量：1

Using dimension reduction approach to identify malicious JavaScript

下载PDF

导出

摘要针对将JavaScript代码N-gram处理后识别算法特征维度较高的问题,提出一种高效的降维方法。该方法利用TF-IDF-like模型分别计算特征在正常样本和恶意样本中的权重,基于特征权重在两类样本中的差异度进行降维。基于多个识别算法,将提出的降维方法与基于主成分分析(Principal Component Analysis,PCA)的降维方法进行比较,实验结果表明:当识别算法维度相同时,基于本文所给降维方法的识别算法在识别效果方面优于基于PCA的识别算法;当降维后识别算法的维度超过某个阈值时,随着识别算法维度的增长,本降维方法的时间开销增长速率远低于PCA方法。 This paper proposes an efficient dimension reduction method to avoid the curse of dimensionality caused by using the N-gram model to identify malicious JavaScript.The method uses the TF-IDF-like model to calculate respectively the weight of features in normal samples and malicious samples,and carries out dimension reduction based on the difference feature weight.Based on many recognition algorithms,this paper compares the proposed method with the dimension reduction method based on Principal Component Analysis(PCA).The experimental results demonstrate two conclusions.Firstly,the recognition effect of the proposed method is better than that of PCA at the same feature dimension.Secondly,when the reserved dimension exceeds a certain threshold,with the increase of the reserved dimension,the growth rate of time cost is much lower than PCA.

作者刘鹏睿宋礼鹏 LIU Pengrui;SONG Lipeng(Research Institute of Big Data and Network Security,School of Big Data,North University of China,Taiyuan 030051,China)

机构地区中北大学大数据学院大数据与网络安全研究所

出处《计算机工程与应用》 CSCD 北大核心 2018年第21期20-24,36,共6页 Computer Engineering and Applications

基金国家自然科学基金(No.61379125)

关键词降维 TF-IDF-like模型特征差异度 JAVASCRIPT 主成分分析(PCA) dimension reduction TF-IDF-like model different weight of features JavaScript Principal Component Analysis(PCA)

分类号 TP309 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献2

1马洪亮,王伟,韩臻.基于JavaScript的轻量级恶意网页异常检测方法[J].华中科技大学学报（自然科学版）,2014,42(11):34-38. 被引量：8
2马洪亮,王伟,韩臻.混淆恶意JavaScript代码的检测与反混淆方法研究[J].计算机学报,2017,40(7):1699-1713. 被引量：19

二级参考文献3

1Chih-Chung Chang,Chih-Jen Lin.LIBSVM[J]ACM Transactions on Intelligent Systems and Technology (TIST),2011(3).
2马洪亮,王伟,韩臻.面向drive-by-download攻击的检测方法[J].华中科技大学学报（自然科学版）,2016,44(3):6-11. 被引量：3
3马洪亮,王伟,韩臻.基于JavaScript的轻量级恶意网页异常检测方法[J].华中科技大学学报（自然科学版）,2014,42(11):34-38. 被引量：8

共引文献25

1马洪亮,王伟,韩臻.面向drive-by-download攻击的检测方法[J].华中科技大学学报（自然科学版）,2016,44(3):6-11. 被引量：3
2赖清楠,陈诗洋,马皓,张蓓.基于机器学习的批量网页篡改检测方法[J].华中科技大学学报（自然科学版）,2016,44(11):16-20. 被引量：3
3杨洪娇.基于机器学习的校园网恶意网页检测方法[J].信息与电脑,2016,28(11):175-176. 被引量：2
4马洪亮,王伟,韩臻.混淆恶意JavaScript代码的检测与反混淆方法研究[J].计算机学报,2017,40(7):1699-1713. 被引量：19
5张蕊,张桂发,郭记眀,蒋洪波.富属性异质信息网络的可约束异常检测[J].华中科技大学学报（自然科学版）,2017,45(12):26-31. 被引量：1
6宋雪勦,张俊,何明星.基于动态符号执行的不透明谓词反混淆算法[J].西华大学学报（自然科学版）,2018,37(3):73-77.
7曲文鹏,赵连军,邓旭.混淆恶意JavaScript代码的多特征检测识别与分析[J].智能计算机与应用,2018,8(4):42-47. 被引量：1
8夏凡,崔艳荣.基于canvas的前端数据加密[J].电脑知识与技术,2018,14(12Z):33-34.
9黄一才,周伟伟,郁滨.目标成本值最优的物联网WSS蠕虫抑制算法[J].计算机研究与发展,2018,55(11):2467-2481. 被引量：2
10邱瑶瑶,方勇,黄诚,刘亮,张星.基于语义分析的恶意JavaScript代码检测方法[J].四川大学学报（自然科学版）,2019,56(2):273-278. 被引量：7

同被引文献15

1房娟,张宏杰,施佳锋,马冬冬,丁皓.基于调控云的智能电网海量运行数据深层次检测技术[J].自动化与仪器仪表,2018,0(12):162-165. 被引量：4
2周念成,廖建权,王强钢,李春艳,李剑.深度学习在智能电网中的应用现状分析与展望[J].电力系统自动化,2019,43(4):180-191. 被引量：183
3周飞,陆振纲,于弘洋,潘冰,荆平,郭剑波.统一潮流控制器多时间尺度混合实时数字仿真[J].电网技术,2015,39(10):2848-2855. 被引量：11
4张燕,王小兵,高鲜妮,豆建斌,耿顺山.基于AOTF的可见光多光谱成像系统2D鉴别率阈值测试平台设计及测试方法研究[J].光学与光电技术,2017,15(1):44-48. 被引量：1
5马强,田大伟,徐征,耿玉杰.云计算在电力系统大数据中的应用与研究[J].自动化技术与应用,2018,37(3):46-49. 被引量：7
6李元诚,邱日轩,曾婧.基于核主成分分析的智能电网盲在线虚假数据注入攻击[J].电网技术,2018,42(7):2270-2278. 被引量：19
7曾学强.大数据背景下智能电网动态电力监控问题探讨[J].通讯世界,2018,25(10):177-178. 被引量：4
8杨建华,董知周,余琳,成敬周,陈丽园,林厚飞.基于业务数据地图下智能电网数据管理系统构建[J].自动化与仪器仪表,2018,0(11):244-247. 被引量：5
9覃海,黄育松,沈冠全,黄俊,郑杰辉,李志刚.基于MATLAB平台的BPA数据快速准确转换方法[J].电测与仪表,2018,55(19):78-85. 被引量：3
10颜勇进.含分布式能源的智能配电网规划研究[J].电子世界,2018,0(20):88-89. 被引量：4

引证文献1

1褚云龙,谢丽荣,张小东,任景,刘鹏飞.面向智能电网的PCA近似法错误数据注入攻击[J].计算机与数字工程,2021,49(2):360-365. 被引量：5

二级引证文献5

1程亚萍,占永红.电力智能通信电源技术应用[J].通讯世界,2021,28(9):103-105.
2黄崇鑫,洪明磊,伏帅,邓松.考虑虚假数据注入攻击的有源配电网分布式状态估计[J].电力工程技术,2022,41(3):22-31. 被引量：13
3彭露苇,李寿山,张四江,岳铁军,王亚丽.基于虚拟模型重建与智能校核的电力工程数据处理技术研究[J].电子设计工程,2024,32(3):176-180. 被引量：3
4田炯,秦发宪,朱涛.基于局部信息熵的智能电网数据离群点识别[J].电子设计工程,2024,32(5):118-121.
5殷敏,方天睿,施晓敏.基于融合特征值提取的配电网工程数据分析算法[J].电子设计工程,2024,32(20):98-102.

1田小龙,王雯,傅卫平,高志强,娄雷亭,吴洁蓓,李鹏阳.考虑微凸体相互作用的机械结合面接触刚度模型[J].机械工程学报,2017,53(17):149-159. 被引量：23
2王洪涛.吉非替尼用于晚期非小细胞肺癌治疗药物经济学研究[J].北方药学,2018,15(11):183-183. 被引量：1
3刘宸,刘长建,冯绪,许岭峰,杜莹.适用于不同尺度区域的Klobuchar-like电离层模型[J].测绘学报,2016,45(S2):54-63. 被引量：12
4施瑞朗.基于社交平台数据的文本分类算法研究[J].电子科技,2018,31(10):69-70. 被引量：9
5杨舒生,屈健,杨学贵.液滴撞击超疏水碳纳米管阵列表面的行为研究[J].工程热物理学报,2018,39(7):1549-1556. 被引量：3
6刘宸,赵鹤,朱伟刚,刘长建,冯绪.基于抗差估计的Klobuchar-like电离层模型参数估计方法[J].测绘工程,2018,27(10):22-28. 被引量：1
7王东,徐超,万强,胡杰.基于微凸体接触压力分布的粗糙表面法向接触建模[J].固体力学学报,2017,38(6):521-529. 被引量：4
8刘家成,王艺憬,孙燕红.基于TF-IDF算法和K-means聚类的商品评论与价格波动相关性研究——以ThinkPad电脑为例[J].科技创业月刊,2018,31(7):45-49. 被引量：2
9浩庆波,高慧,万曙静.一种基于PSO特征加权的局部支持向量机[J].智能计算机与应用,2018,8(6):61-63.
10李浩,孙媛.基于词向量的英文教育文本推荐技术[J].中国教育信息化,2018,24(20):91-93. 被引量：1

计算机工程与应用

2018年第21期

浏览历史

内容加载中请稍等...

针对恶意JavaScript识别的降维方法被引量：1

参考文献2

二级参考文献3

共引文献25

同被引文献15

引证文献1

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

针对恶意JavaScript识别的降维方法 被引量：1

参考文献2

二级参考文献3

共引文献25

同被引文献15

引证文献1

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

针对恶意JavaScript识别的降维方法被引量：1