一种基于域知识的协议状态机主动推断算法被引量：4

Domain-specific Algorithm of Protocol State Machine Active Inference

下载PDF

导出

摘要现有基于L*算法的协议状态机主动推断方法忽略了协议特有的域知识,将协议报文抽象为相互独立、无意义的符号,并完全随机地生成测试样本进行状态机等价判定,导致产生大量的无效询问和测试样本,在真实网络环境下推断效率较低。在L+M算法的基础上提出了一种基于域知识的协议状态机主动推断算法L+N,其改进主要体现在:依据会话样本集提取各报文之间的强顺序约束关系来过滤无效的输出询问,构建会话样本集对应的扩展前缀树接受器(Extended Prefix Tree Accepter,EPTA)对输出询问进行预响应,提出了一种基于正例样本变异的等价询问近似判定算法以提升寻找反例的效率。实验结果表明,L+N算法能够大幅提高推断效率,并且具有与L+M算法相同的推断准确度。 Existing protocol state machine inference approaches based on algorithm L^＊ are inefficient owing to ignorance of protocol-specific knowledge. As the protocol messages are abstracted as the independent and insignificant sym- bols, and test samples are completely generated randomly in equivalence query, invalid queries and test samples are inevitable. A protocol state machine active inference algorithm named LN^＋ was proposed, which improves the algorithm LM^＋ in three aspects. Firstly,LN^＋ filters the invalid output query according to the constraint on strict order, which is extracted from conservation samples. Secondly, LN^＋ constructs the extended prefix tree accepter（EPTA） corresponding to the sample set and answers the output query in advance. Thirdly, a new proposed strategy to find counterexamples more effectively is applied to judge the equivalence query based on positive sample mutation. Experimental results show that LN＋ improves the inference efficiency greatly and achieves the same accuracy as algorithm LM^＋.

作者王辰吴礼发洪征郑成辉庄洪林

机构地区解放军理工大学指挥信息系统学院

出处《计算机科学》 CSCD 北大核心 2015年第12期233-239,共7页 Computer Science

基金国家自然科学基金项目(611032253) 江苏省自然科学基金项目(BK2011115)资助

关键词 L^＊算法协议状态机主动推断域知识推断效率 Algorithm L^＊ , Protocol state machine, Active inference, Domain-specific knowledge, Inference efficiency

分类号 TP393 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献22

1李伟明,张爱芳,刘建财,李之棠.网络协议的自动化模糊测试漏洞挖掘方法[J].计算机学报,2011,34(2):242-255. 被引量：67
2侯莹,洪征,潘璠,吴礼发.基于模型的Fuzzing测试脚本自动化生成[J].计算机科学,2013,40(3):206-209. 被引量：7
3应凌云,杨轶,冯登国,苏璞睿.恶意软件网络协议的语法和行为语义分析方法[J].软件学报,2011,22(7):1676-1689. 被引量：23
4Tridgell. How Samba was written [EB/OL]. 2005-02-04/2014- 11-101. http://samba, org/ftp/tridge/misc/french cafe. txt.
5Lang K J. Faster Algorithms for Finding Minimal Consistent DFAs[R]. NEC Research Institute, 1999.
6Oncina J, Garcia P. Inferring regular languages in polynomial up- date time [J]- Pattern Recognition and Image Analysis, 1992,1 49-61.
7Lang K J,Pearlmutter B A,Price R A. Results of the Abbadingo one DFA learning competition and a new evidence-driven state merging algorithm[M]//Grammatical Inference. Springer Berlin Heidelberg, 1998 : 1-12.
8Gold E M. Language Identification in the Limit [J]. Information and Control, 1967,10 (5) : 447-474.
9Dupont P, Lambeau B, Damas C, et al. The QSM algorithm and its application to software behavior model induction EJ]. Applied Artificial Intelligence, 2008,22 ( 1 ) : 77-115.
10Angluin D. Learning regular sets from queries and counterexam- ples [J]. Information and computation, 1987,75(2): 87-106.

二级参考文献104

1刘立芳,霍红卫,王宝树.PHGA-COFFEE:多序列比对问题的并行混合遗传算法求解[J].计算机学报,2006,29(5):727-733. 被引量：11
2Cui Weidong, Paxson V, Weaver N C, et al. Protocol-inde- pendent adaptive replay of application dialog [ C ]//Proceed- ing of the 13th Annual Network and Distributed System Se- curity Symposium. San Diego, CA,2006.
3Dreger H, Feldmann A, Mai M, et al. Dynamic application- layer protocol analysis for network intrusion detection[ C ]// USENIX Security Symposium. Vancouver, Canada, 2006: 257 - 272.
4Caballero J, Poosankam P, Kreibich C, et al. Dispatcher: ena- bling active hornet infiltration using automatic protocol re- verse-engineering[ C]//ACM Conference on Computer and Communications Security. ACM, New York, NY, USA ,2009 : 621 - 634.
5Comparetti P M, Wondracek G, Kruegel C, et al. Prospex: Protocol specification extraction [ C ]//30th IEEE Symposi- um on Security and Privacy. Oakland,CA,2009:110 -125.
6Cui W, Paxson V, Weaver N C, et al. Protocol-independent adaptive replay of application dialog[ C ]//Network and Dis- tributed System Security Symposium. San Diego, CA,2006.
7Beddoe M. Protocol informations project[ EB/OL]. [2012 - 2 - 18 ]. http ://www. 4tphi. net/- awalters/PI/pi, pdf.
8Cui W, Kannan J, Wang H. Discoverer: Automatic protocol reverse engineering from network traces [ C ]//16th USENIX Security Symposium. USENIX,2007 : 199 - 212.
9Smith T F, Waterman M S. Identification of common molec- ular subsequences[ J ]. Journal of Molecular Biology, 1981, 147 : 195 - 197.
10Jain A K,Murty M N,Flynn P J. Data clustering: A review [ J ]. ACM Computing Surveys, 1999,31 (3) :265 - 281.

共引文献103

1刘兵,林刚,林章,胡力勤.地下综合管廊可编程软件设计的语义逻辑[J].科技通报,2020,36(11):49-51. 被引量：1
2潘璠,吴礼发,杜有翔,洪征.协议逆向工程研究进展[J].计算机应用研究,2011,28(8):2801-2806. 被引量：21
3杜有翔,吴礼发,潘璠,洪征.一种基于报文序列分析的半自动协议逆向方法[J].计算机工程,2012,38(19):277-280. 被引量：5
4崔宝江,梁姝瑞,彭思维,郭祎嘉.基于节点克隆的IEEE802.15.4协议动态安全检测技术[J].清华大学学报（自然科学版）,2012,52(10):1500-1506. 被引量：1
5潘璠,洪征,杜有翔,吴礼发.基于递归聚类的报文结构提取方法[J].四川大学学报（工程科学版）,2012,44(6):137-142. 被引量：13
6张钊,唐文,温巧燕.一种基于长度语义约束的报文格式挖掘方法[J].北京邮电大学学报,2012,35(6):55-59. 被引量：4
7黎敏,余顺争.抗噪的未知应用层协议报文格式最佳分段方法[J].软件学报,2013,24(3):604-617. 被引量：16
8罗成,张玉清,王龙,刘奇旭.基于符号表达式的未知协议格式分析及漏洞挖掘[J].中国科学院研究生院学报,2013,30(2):278-284. 被引量：4
9侯莹,洪征,潘璠,吴礼发.基于模型的Fuzzing测试脚本自动化生成[J].计算机科学,2013,40(3):206-209. 被引量：7
10戴理,舒辉,黄荷洁.基于数据流分析的网络协议逆向解析技术[J].计算机应用,2013,33(5):1217-1221. 被引量：4

同被引文献24

1李伟明,张爱芳,刘建财,李之棠.网络协议的自动化模糊测试漏洞挖掘方法[J].计算机学报,2011,34(2):242-255. 被引量：67
2潘璠,吴礼发,杜有翔,洪征.协议逆向工程研究进展[J].计算机应用研究,2011,28(8):2801-2806. 被引量：21
3肖明明,余顺争.基于文法推断的协议逆向工程[J].计算机研究与发展,2013,50(10):2044-2058. 被引量：9
4潘璠,洪征,周振吉,吴礼发.语义层次的协议格式提取方法[J].通信学报,2013,34(10):162-173. 被引量：10
5黄笑言,陈性元,祝宁,唐慧林.基于状态标注的协议状态机逆向方法[J].计算机应用,2013,33(12):3486-3489. 被引量：8
6唐成华,刘鹏程,汤申生,谢逸.基于特征选择的模糊聚类异常入侵行为检测[J].计算机研究与发展,2015,52(3):718-728. 被引量：47
7孟凡治,刘渊,张春瑞,李桐.基于状态相关字段识别的未知二进制协议状态机逆向方法[J].电讯技术,2015,55(4):372-378. 被引量：2
8吴礼发,王辰,洪征,庄洪林.协议状态机推断技术研究进展[J].计算机应用研究,2015,32(7):1931-1936. 被引量：8
9王辰,吴礼发,洪征,赖海光,庄洪林.一种基于状态融合的协议状态机推断方法[J].解放军理工大学学报（自然科学版）,2015,16(4):322-329. 被引量：3
10刘渊,张春瑞,孟凡治,李桐,岳旸.基于网络数据的协议逆向工程研究进展[J].计算机工程与设计,2015,36(11):2915-2920. 被引量：7

引证文献4

1王晓晨,沈晶,刘海波,于爱民,蔡利君.自动协议逆向工程研究综述[J].计算机应用研究,2020,37(9):2561-2570. 被引量：2
2潘雁,林伟,祝跃飞.渐进式的协议状态机主动推断方法[J].网络与信息安全学报,2023,9(2):81-93.
3盛嘉杰,牛胜杰,陈阳,方伟青,张玉杰,李鹏,胡素君.未知协议状态机推断技术研究综述[J].计算机与现代化,2023(5):58-67.
4潘雁,祝跃飞.主动自动机学习中的等价查询算法优化[J].软件学报,2023,34(7):3241-3255. 被引量：1

二级引证文献3

1丛培鑫,李晓慧,王俊峰.基于生物信息的未知二进制协议聚类方法[J].四川大学学报（自然科学版）,2022,59(3):63-70.
2盛嘉杰,牛胜杰,陈阳,方伟青,张玉杰,李鹏,胡素君.未知协议状态机推断技术研究综述[J].计算机与现代化,2023(5):58-67.
3孙来平,虞翊,楚彭子.状态轮询和事件驱动的软件状态机设计优化[J].计算机工程与应用,2024,60(12):303-313.

1吴艳彬,鲜继清,郭艳荣,谢昊飞.EPA协议状态机与服务的一致性测试方法研究[J].电信快报（网络与通信）,2009(4):42-45.
2黄笑言,陈性元,祝宁,唐慧林.基于状态标注的协议状态机逆向方法[J].计算机应用,2013,33(12):3486-3489. 被引量：8
3金文进.基于协议状态机的入侵检测方法研究[J].义乌工商职业技术学院学报,2008,6(4):78-81.
4王辰,吴礼发,洪征,赖海光,庄洪林.一种基于状态融合的协议状态机推断方法[J].解放军理工大学学报（自然科学版）,2015,16(4):322-329. 被引量：3
5高强文.用ACE实现可靠消息传送[J].电脑编程技巧与维护,2005(8):16-20. 被引量：2
6严悍,丁锋,朱文.复杂Web系统的模型驱动重构方法研究[J].数字技术与应用,2014,32(10):83-83.
7王晓川,金士尧,夏明波.基于多线程事件驱动框架高性能应用层网关的设计与实现[J].计算机工程与科学,2008,30(2):19-20. 被引量：2
8朱光喜,吴伟民,阮幼林,刘干.一种基于前缀树的频繁模式挖掘算法[J].计算机科学,2005,32(4):34-36. 被引量：4
9孔德香,刘厚泉.基于SHOIN^+(D)的关系数据库语义化方法研究[J].微电子学与计算机,2008,25(4):169-173.
10王平,王浩文,易明华,张艳芳.EPA协议状态机的一致性测试方法及实现[J].计算机集成制造系统,2007,13(3):621-624. 被引量：5

计算机科学

2015年第12期

浏览历史

内容加载中请稍等...

一种基于域知识的协议状态机主动推断算法被引量：4

参考文献22

二级参考文献104

共引文献103

同被引文献24

引证文献4

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

一种基于域知识的协议状态机主动推断算法 被引量：4

参考文献22

二级参考文献104

共引文献103

同被引文献24

引证文献4

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

一种基于域知识的协议状态机主动推断算法被引量：4