基于种子智能生成的内核模糊测试模型

Kernel Fuzzing Model Base on Intelligent Seed Generation

下载PDF

导出

摘要操作系统具有庞大的用户群体,因此使得内核漏洞具有极强的通用性。模糊测试作为一种高效的漏洞挖掘方法,也被应用于操作系统内核,并且已经取得不错的成果。但是,目前流行的面向内核的模糊测试模型Syzkaller在生成种子时具有一定的盲目性,无法自动产生具有依赖关系的系统调用,制约了模糊测试的代码覆盖能力。为解决上述问题,本文提出并实现了基于种子智能生成的内核模糊测试模型SyzMix。该模型一方面结合LSTM(Long Short-Term Memory)神经网络,使用语法模板,通过序列化操作和反序列化操作,能自动生成更多蕴含潜在依赖关系的系统调用序列,有效提高了种子执行的成功率;另一方面,通过静态分析方法获得系统调用显式依赖关系,通过动态分析方法获得系统调用隐式依赖关系,并通过上述依赖关系进一步优化种子内部系统调用关系,结合测试用例的生成策略和变异策略,显著提高了选择系统调用的准确性。综合上述方法,SyzMix达到了更高的代码覆盖能力和代码覆盖加速比。为了验证模型的有效性和实用性,利用SyzMix与Syzkaller在不同版本的内核中进行测试,种子执行成功率提高了16%,选择系统调用的准确性提高了88.8%,内核代码覆盖率提高了7.87%,代码覆盖加速比达到了132.3%。另外,SyzMix在不同版本的内核中发现了8个的未知bug,并申请得到CVE编号CVE-2021-45868。 Operating system has a large user base,which makes the kernel vulnerability very versatile.As an efficient vulnerability mining method,fuzzing has also been applied to the operating system kernel,and has achieved good results.However,Syzkaller,the popular kernel oriented fuzzing model,has some blindness in generating seeds,and cannot automatically generate system calls with dependencies,which will restrict the code coverage ability of fuzzing.To solve these problems,this paper proposes and implements a kernel fuzzing model SyzMix based on seed intelligent generation.On the one hand,the model combines with LSTM(long short term memory)neural network,uses syntax template,automatically generates more system call sequences with potential dependencies through serialization and deserialization,and effectively improves the success rate of seed execution;on the other hand,the explicit dependencies of system calls are obtained by static analysis method,and the implicit dependencies of system calls are obtained by dynamic analysis method,and further optimize the relationship of system calls within the seed through the above dependencies.Combined with the generation strategy and mutation strategy of test cases,the accuracy of selecting system calls is significantly improved.Based on the above methods,SyzMix achieves higher code coverage and the code coverage speed-up.To verify the validity and practicability of the model,SyzMix and Syzkaller are tested in different versions of the kernel.The success rate of seed execution is increased by 16%,the accuracy of selecting system calls is improved by 88.8%,the kernel code coverage is increased by 7.87%,and code coverage achieved a speed-up of 132.3%.In addition,SyzMix found eight unknown bugs in different versions of the kernel and requested CVE number CVE-2021-45868.

作者王明义甘水滔王晓锋刘渊 WANG Mingyi;GAN Shuitao;WANG Xiaofeng;LIU Yuan(School of Artificial Intelligence and Computer Science,Jiangnan University,Wuxi 214122,China;Institute for Network,Tsinghua University,Beijing 100084,China;State Key Laboratory of Mathematical Engineering and Advanced Computing,Wuxi 214083,China;Peng Cheng Laboratory,Shenzhen 518005,China)

机构地区江南大学人工智能与计算机学院清华大学网络研究院数学工程与先进计算国家重点实验室鹏城实验室

出处《信息安全学报》 CSCD 2024年第3期124-137,共14页 Journal of Cyber Security

基金鹏城实验室重大任务项目(No.PCL2022A03) 国家自然科学基金项目(No.62172191,No.61972182)资助。

关键词模糊测试漏洞挖掘操作系统内核神经网络 fuzzing vulnerability discovery operating system kernel neural network

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献4

1任泽众,郑晗,张嘉元,王文杰,冯涛,王鹤,张玉清.模糊测试技术综述[J].计算机研究与发展,2021,58(5):944-963. 被引量：26
2李贺,张超,杨鑫,朱俊虎.操作系统内核模糊测试技术综述[J].小型微型计算机系统,2019,40(9):1994-1999. 被引量：5
3Jun Li,Bodong Zhao,Chao Zhang.Fuzzing:a survey[J].Cybersecurity,2018,1(1):80-92. 被引量：15
4涂序文,王晓锋,甘水滔,陈爱国.Diskaller:基于覆盖率制导的操作系统内核漏洞并行挖掘模型[J].信息安全学报,2019,4(2):69-82. 被引量：4

二级参考文献5

1吴志勇,王红川,孙乐昌,潘祖烈,刘京菊.Fuzzing技术综述[J].计算机应用研究,2010,27(3):829-832. 被引量：30
2姚洪波,尹亮,文伟平.基于FUZZING测试技术的Windows内核安全漏洞挖掘方法研究及应用[J].信息网络安全,2011(12):9-16. 被引量：4
3赵跃华,邓渊浩.基于硬件虚拟化的内核竞态漏洞监测技术研究与实现[J].软件导刊,2015,14(5):161-164. 被引量：5
4何远,张玉清,张光华.基于黑盒遗传算法的Android驱动漏洞挖掘[J].计算机学报,2017,40(5):1031-1043. 被引量：20
5Jun Li,Bodong Zhao,Chao Zhang.Fuzzing:a survey[J].Cybersecurity,2018,1(1):80-92. 被引量：15

共引文献42

1贾春福,严盛博,王志,武辰璐,黎航.提高fuzzing边覆盖率的改进方法[J].通信学报,2019,40(11):76-85.
2蔡敏.基于混合深度学习模型的网络服务软件漏洞挖掘方法[J].宁夏师范学院学报,2020,41(7):73-79. 被引量：1
3李明磊,黄晖,陆余良,朱凯龙.SymFuzz:一种复杂路径条件下的漏洞检测技术[J].计算机科学,2021,48(5):25-31. 被引量：4
4任泽众,郑晗,张嘉元,王文杰,冯涛,王鹤,张玉清.模糊测试技术综述[J].计算机研究与发展,2021,58(5):944-963. 被引量：26
5张弛,司徒凌云,王林章.物联网固件安全缺陷检测研究进展[J].信息安全学报,2021,6(3):141-158. 被引量：5
6王颖,王冰青,关永,李晓娟,王瑞.面向ROS的差分模糊测试方法[J].软件学报,2021,32(6):1867-1881. 被引量：4
7Wenjie Wang,Donghai Tian,Rui Ma,Hang Wei,Qianjin Ying,Xiaoqi Jia,Lei Zuo.SHFuzz:A Hybrid Fuzzing Method Assisted by Static Analysis for Binary Programs[J].China Communications,2021,18(8):1-16.
8项兆坤,陈婷,苏仟,张蓉.面向OLAP数据库查询处理功能的模糊测试工具[J].华东师范大学学报（自然科学版）,2021(5):74-83. 被引量：4
9王雨绚,张之江,姚旭寅,李伟杰,杨融.机载网络安保测试方法研究[J].工业控制计算机,2022,35(3):95-97. 被引量：2
10冯光升,张熠哲,孙嘉钰,吕宏武.计算机系统漏洞自动化利用研究关键技术及进展[J].信息网络安全,2022(3):39-52. 被引量：6

1王玉胜,毛子恒.基于双流融合网络的恶意软件动态行为检测[J].现代信息科技,2024,8(8):177-181.
2郝武民,郑建国,张志鹏.LNG气化站泄漏动态风险概率评估方法及应用[J].安全、健康和环境,2024,24(3):1-8.
3杨清玲.蒸汽吞吐井注汽阶段油层加热理论计算方法研究[J].中国科技期刊数据库工业A,2019(3):221-222.
4严瑞,陈哲.多线程C程序内存安全性动态分析方法[J].计算机科学,2024,51(S01):791-796.
5刘斯诺,阮树骅,陈兴蜀,郑涛.基于eBPF的云上威胁观测系统[J].信息网络安全,2024(4):534-544.
6刘佳.特低渗透油藏CO2驱提高采收率调整挖潜对策----以中原油田卫42块某井组为例[J].中文科技期刊数据库（引文版）工程技术,2016(12):255-255.
7郑炜,许晴晴,李奇,陈翔,孙家泽.Tenda AX12路由器0-Day栈溢出漏洞挖掘方法[J].信息安全学报,2024,9(3):157-175.

信息安全学报

2024年第3期

浏览历史

内容加载中请稍等...

基于种子智能生成的内核模糊测试模型

参考文献4

二级参考文献5

共引文献42

相关作者

相关机构

相关主题

浏览历史