基于增强AST的图神经网络函数级代码漏洞检测方法被引量：3

Function Level Code Vulnerability Detection Method of Graph Neural Network Based on Extended AST

下载PDF

导出

摘要软件漏洞逐年递增,安全问题愈发严重。在软件项目的交付阶段对原始代码进行漏洞检测可以有效避免后期运行时的安全漏洞,而代码漏洞检测依赖于有效的代码表征。传统的基于软件度量的表征方法与漏洞关联性较弱,难以对漏洞信息进行有效表征。近年来,机器学习为漏洞的智能化发现提供了新的思路,但该方法同样可能遗漏关键的代码特征信息。针对以上问题,文中在传统抽象语法树(AST)上增加控制依赖、数据依赖和语句序列边生成增强抽象语法树(EXAST)图结构,对原始代码进行表征以更好地处理代码结构化信息,并采用词向量嵌入算法(Word2Vec)将代码信息初始化为机器能够识别和学习的数值向量。同时,在传统的图神经网络(GNN)中引入门控循环单元(GRU),构建图识别模型,以缓解梯度消失并加强图结构中长期信息的传播,从而增强了代码执行的时序关系,提高了漏洞检测的准确度。最后在SARD公开数据集上对模型进行对比测试,实现了函数粒度的代码漏洞检测,相比传统的漏洞检测方法,准确率和F1分值分别最大提高了32.54%和44.99,实验结果证明了所提方法对代码漏洞检测的有效性。 With the increase of software vulnerabilities year by year,security problems are becoming more and more serious.Vulnerability detection of original code in the delivery stage of software project can effectively avoid security vulnerabilities in later run-time,and the discovery of code vulnerability depends on effective code characterization.The traditional characterization me-thods based on software metrics have weak correlation with vulnerabilities,so it is difficult to characterize vulnerability information efficiently.In recent years,machine learning has provided a new idea for intelligent discovery of vulnerabilities,but this method also has the problem of missing key information of code feature.To solve the above problems,control flow edge,data flow edge and next token edge are added to the traditional abstract syntax tree(AST)to generate an expanded abstract syntax tree(EXAST)graph structure,characterize the original code to better process the code structure information,and the word vector embedding model(word2vec)is used to initialize the code information into a numerical vector that the machine can recognize and learn.At the same time,the gate recurrent unit(GRU)is introduced into the traditional graph neural network(GNN)to build the model,which can alleviate the disappearance of the gradient,enhance the dissemination of long-term information in the graph structure to strengthen the timing relationship of code execution and improve the accuracy of vulnerability detection.Finally,the model is trained and tested on the SARD data sets to realize the function granularity code vulnerability detection,which can improve the accuracy of 32.54%and the F1 score of 44.99 compared with the traditional vulnerability detection method.Experimental results confirm the effectiveness of the method for code vulnerability detection.

作者顾守珂陈文 GU Shouke;CHEN Wen(School of Cyber Science and Engineering,Sichuan University,Chengdu 610065,China)

机构地区四川大学网络空间安全学院

出处《计算机科学》 CSCD 北大核心 2023年第6期283-290,共8页 Computer Science

基金国家重点研发计划(020YFB1805405,2019QY0800) 国家自然科学基金(U1736212,61872255,U19A2068) 模式识别与智能信息处理四川省高校重点实验室(MSSB-2020-01)。

关键词漏洞挖掘图神经网络深度学习抽象语法树门控循环单元 Vulnerability mining,Graph neural network,Deep learning,Abstract syntax tree,Gate recurrent unit

分类号 TP309 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

同被引文献34

1龚扣林,周宇,丁笠,王永超.基于BiLSTM模型的漏洞检测[J].计算机科学,2020,47(5):295-300. 被引量：3
2王慧,王励成,柏雪,刘清华,沈晓鹰.区块链隐私保护和扩容关键技术研究[J].西安电子科技大学学报,2020,47(5):28-39. 被引量：18
3胡建伟,赵伟,崔艳鹏,崔俊洁.一种改进ASTNN网络的PHP代码漏洞挖掘方法[J].西安电子科技大学学报,2020,47(6):164-173. 被引量：10
4章思宇,周育玲,刘楚彤.私有云环境下主机安全漏洞高效检测[J].通信技术,2021,54(3):727-731. 被引量：7
5吕志强,薛亚楠,张宁,冯朝雯,金忠峰.WHID Defense:USB HID攻击检测防护技术[J].信息安全学报,2021,6(2):110-128. 被引量：1
6向杰,杨哲慜,周顺帆,杨珉.一种基于运行时信息的以太坊智能合约防御技术[J].计算机研究与发展,2021,58(4):834-848. 被引量：4
7杨颜博,张嘉伟,马建峰.一种使用区块链保护车联网数据隐私的方法[J].西安电子科技大学学报,2021,48(3):21-30. 被引量：22
8王小虎,王超,李群,任天宇.基于黑盒遗传算法的电力系统网络安全漏洞挖掘方法[J].沈阳工业大学学报,2021,43(5):500-504. 被引量：16
9马艺新,唐时博,谭静,李雪霏,胡伟.基于信息流分析的密码核设计安全验证与漏洞检测[J].西北工业大学学报,2022,40(1):76-83. 被引量：9
10李雪莲,张夏川,高军涛,向登梅.支持属性和代理重加密的区块链数据共享方案[J].西安电子科技大学学报,2022,49(1):1-16. 被引量：24

引证文献3

1郭春霞.基于权限验证图的Web访问控制漏洞检测方法[J].自动化与仪器仪表,2024(6):252-256.
2李小涵,杨颜博,张嘉伟,李宝山,马建峰.面向以太坊智能合约的图神经网络漏洞检测[J].西安电子科技大学学报,2024,51(4):139-150.
3张佳发,农彩勤,王健,吴佩泽,刘家豪,王斌,陈锋.电力物联网终端漏洞自动挖掘方法研究[J].现代科学仪器,2024,41(6):289-295.

1陈琦,王运泽.基于改进粒子群算法的SVM的文本情感分析[J].阜阳师范大学学报（自然科学版）,2023,40(1):79-86. 被引量：1
2张骞,倪林,吴波.基于IoT设备漏洞检测的安全防护技术研究[J].网络安全技术与应用,2023(5):24-26. 被引量：1
3王鹏,姚鑫鹏,汪克念,陈文琪,陈曦.基于大感知域LSTM-Seq2Seq模型的代码缺陷检测方法[J].中国民航大学学报,2023,41(2):14-20. 被引量：2
4曹婉莹,曹旭栋,葛平原,张玉清.中美网络安全漏洞披露与共享政策研究[J].信息安全研究,2023,9(6):602-608. 被引量：3
5王松,方勇,贾鹏.无碰撞灰盒模糊测试方法研究[J].四川大学学报（自然科学版）,2023,60(3):97-103.
6王春才,李金伟,金龙.PC构件用金属预埋吊件的力值试验研究[J].混凝土世界,2023(5):67-71.
7张弛,翁方宸,张玉清.ChatGPT在网络安全领域的应用、现状与趋势[J].信息安全研究,2023,9(6):500-509. 被引量：13
8江兵,赵和军,张建敏.预混式燃气机混合燃气流量估计技术改进[J].柴油机,2023,45(2):16-21.
9林茂新,王太愚,王晶.静态代码安全检测技术发展研究与前沿技术实践[J].保密科学技术,2023(5):43-50.
10陈晨,郭庆娣,施伟,陆爱萍,杨志欣,倪寂.上海市崇明区延伸处方实施现状调查研究[J].中国医药导刊,2023,25(3):326-332.

计算机科学

2023年第6期

浏览历史

内容加载中请稍等...

基于增强AST的图神经网络函数级代码漏洞检测方法被引量：3

同被引文献34

引证文献3

相关作者

相关机构

相关主题

浏览历史

基于增强AST的图神经网络函数级代码漏洞检测方法 被引量：3

同被引文献34

引证文献3

相关作者

相关机构

相关主题

浏览历史

基于增强AST的图神经网络函数级代码漏洞检测方法被引量：3