-
题名基于文法推断的协议逆向工程
被引量:9
- 1
-
-
作者
肖明明
余顺争
-
机构
中山大学信息科学与技术学院
仲恺农业工程学院信息科学与技术学院
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2013年第10期2044-2058,共15页
-
基金
国家"八六三"高技术研究发展计划基金项目(2007AA01Z449)
国家自然科学基金-广东联合基金重点项目(U0735002)
+1 种基金
国家自然科学基金项目(60970146
61202271)
-
文摘
要深入了解网络中的各种应用过程,进而对这些应用进行自动分类、识别、跟踪和控制,首先就要获得代表这些应用会话过程的状态机.为此提出一种新的方法从采集的应用层数据中反推协议状态机.它采用基于差错纠正的文法推断方法,利用应用层协议交互过程中出现的标识符状态序列,逆向工程其协议状态机.为充分挖掘和发挥差错纠正的性能,提出了最佳路径匹配标准确定纠正路径,以及基于概率统计的异常入度区分及其剪枝的方法;通过去重的状态合并和相似行为意义的协议结构化简措施解决状态膨胀问题,从而获取最精简的协议状态机.通过在包含多种应用层协议的实际网络中的实验,验证了该方法的有效性.
-
关键词
协议逆向工程
协议状态机推断
协议分析
差错纠正文法推断
网络安全
-
Keywords
protocol reverse engineering
protocol state machine inference
protocol analysis
error-correcting grammatical inferences network security
-
分类号
TP393.08
[自动化与计算机技术—计算机应用技术]
-
-
题名文法推断网络协议状态机
被引量:1
- 2
-
-
作者
肖明明
余顺争
张世龙
-
机构
仲恺农业工程学院信息科学与技术学院
中山大学信息科学与技术学院
-
出处
《科学技术与工程》
北大核心
2014年第19期100-105,共6页
-
基金
国家高技术研究发展计划(2007AA01Z449)
国家自然科学基金-广东联合基金重点项目(U0735002)
+4 种基金
国家自然科学基金项目(60970146
61202271)
广东省自然科学基金项目(S2012010009976)
广东省科技计划项目(2011B040200074)
湛江市科技攻关计划项目(2011C3105001)资助
-
文摘
针对现有正则的正负推断(regular positive and negative inference,RPNI)算法的局限性,提出一种通过标记前缀树接受器中的状态,以差异化的状态标记方法防止状态的过度融合改进的算法——改进的RPNI算法(improved RPNI,IRPNI)。该算法从网络数据流量中导出协议规范,并将该规范表示为确定性有限自动机(definite finite automata,DFA)模型;根据网路协议特性,把启发式的差异化的状态标记算法嵌入该算法中,使得状态融合结果体现网络协议的结构特征。实验证明IRPNI算法更有助于推断出更一般化的网络协议状态机。
-
关键词
协议逆向工程
协议状态机推断
协议分析
文法推断
网络安全
-
Keywords
protocol reverse engineering
protocol state machine inference
protocol analysis
grammatical inference, network security
-
分类号
TP393.04
[自动化与计算机技术—计算机应用技术]
-
-
题名文法推断研究的历史和现状
被引量:4
- 3
-
-
作者
张瑞岭
-
机构
中国科学院软件研究所计算机科学开放研究实验室
-
出处
《软件学报》
EI
CSCD
北大核心
1999年第8期850-860,共11页
-
基金
国家自然科学基金
国家863高科技项目
国家"九五"高科技攻关项目
-
文摘
文法推断属于形式语言的归纳学习问题,它研究如何从语言的有限信息出发,通过归纳推断得到语言的语法定义.文章综述了文法推断研究的历史和现状.首先阐述文法推断的理论模型,接着罗列上下文无关文法类及其非平凡子类、隐马尔可夫模型以及随机上下文无关文法的推断方法,最后简介文法推断的应用,并展望其发展趋势.
-
关键词
归纳推断
形式语言
文法推断
归纳学习
-
Keywords
Learning from examples, inductive inference, learning of formal languages, grammatical inference
-
分类号
TP301.2
[自动化与计算机技术—计算机系统结构]
-
-
题名文法推断RNA二级结构的研究进展
被引量:3
- 4
-
-
作者
唐四薪
刘艳波
尹军
-
机构
衡阳师范学院计算机科学系
-
出处
《生物信息学》
2008年第4期190-192,共3页
-
基金
衡阳师范学院科研基金资助项目(2006B63)
-
文摘
生物序列可看成是一种语言,通过计算语言学的方法理解生物序列的内涵是近年来研究的热点,本文综述了文法推断RNA二级结构的基本原理,研究历史和现状,阐述了文法推断RNA二级结构的理论模型和算法,列举了一些有代表性的预测方法,总结了存在的问题并展望了研究的趋势。
-
关键词
RNA二级结构
结构预测
文法推断
-
Keywords
RNA Secondary Structure, Structure prediction, Grammatical inference
-
分类号
Q522
[生物学—生物化学]
-
-
题名文法推断与HMM相结合的信息提取
被引量:1
- 5
-
-
作者
卢正鼎
董泽锋
-
机构
华中科技大学计算机科学与技术学院
-
出处
《计算机工程与科学》
CSCD
2005年第8期1-3,共3页
-
文摘
本文提出了一种结合文法推断和HMM进行信息提取的方法。首先将待提取的原始文本转换为相应有意义的一个小的抽象符号集合,然后通过使用文法推断(GI)获取一个合适的HMM拓扑结构,最后利用所得的HMM拓扑结构,使用经典的Viterbi算法提取出用户感兴趣的信息。实验结果表明,针对半结构化文档,该方法在某些领域能够有效地提高提取的精确度。
-
关键词
文法推断
隐马尔可夫模型
信息提取
半结构化
-
Keywords
grammatical inference
HMM
information extraction semi-structured
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名上下文无关文法推断中的几条启发规则及其应用
- 6
-
-
作者
李志圣
陈永生
-
机构
东北电力学院信息工程系
-
出处
《计算机工程与科学》
CSCD
2006年第9期64-66,共3页
-
文摘
本文先简要介绍了一种上下文无关文法的推断方法———逐步求精法,然后论述了递归概念在文法推断中的核心作用,并从递归概念的特殊性质出发提出了多条启发规则,能有效减少无效探求和与用户交互的次数,尤其适合于文法较复杂、例句集信息量较大的情况。这些启发规则同时也适用于对上下文无关文法的其它推断方法。
-
关键词
文法推断
逐步求精
启发规则
-
Keywords
grammatical inference
stepwise refining
heuristic rules
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名关于有限状态文法推断的实用算法
- 7
-
-
作者
盛立东
-
机构
北京邮电学院信息工程系
-
出处
《北京邮电学院学报》
CSCD
1990年第3期84-88,共5页
-
文摘
针对目前句法结构模式识别中的一个难题——文法推断进行较深入研究.分析了有限状态文法推断的一些方法.给出有限状态文法推断的一个实用算法.此算法对一般字符串文法都能适用.
-
关键词
模式识别
文法推断
形式语言
算法
-
Keywords
formal languages
grammatical Inference pattern recognition
finite state grammar
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名一个上下文无关文法的构造定理及其在推断中的应用
- 8
-
-
作者
张雪峰
许丽娟
罗洪霞
党德玉
-
机构
广东工业大学华立学院
东北电力大学信息工程学院
-
出处
《计算机与现代化》
2008年第6期4-7,共4页
-
文摘
递归概念可以在句子中重复派生、循环出现。对这样的句子推断时,若为递归概念的每一个派生部分引进一个递归概念来描述,将推断出多个与之有相似的产生式结构的递归概念,同时也构造出一个新文法。本文先给出新文法的形式化构造方法,证明了新文法与原文法的等价性。在文章的后部,通过实例,介绍该定理在简化复杂文法推断中的应用。
-
关键词
上下文无关文法
递归推导
文法构造
文法推断
-
Keywords
context-free grammar
recursion deduce
grammar construct
grammatical inference
-
分类号
TP311.52
[自动化与计算机技术—计算机软件与理论]
-
-
题名一个上下文无关文法获取过程的设计和实现
被引量:6
- 9
-
-
作者
张瑞岭
-
机构
中国科学院软件研究所计算机科学开放研究实验室
-
出处
《软件学报》
EI
CSCD
北大核心
1998年第8期601-605,共5页
-
基金
国家自然科学基金
国家"九五"科技攻关项目基金
国家863高科技项目基金
-
文摘
文章介绍一个基于复用的上下文无关文法获取过程的设计和实现,该过程用于获取以上下文无关文法表示的概念.它从待获取概念的有限实例和句型以及可能复用的已知概念出发,通过一个交互式文法推断过程。
-
关键词
文法推断
示例学习
SCFG
自然语言处理
-
Keywords
Grammatical inference, learning by examples, context free language, reuse.
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名协议逆向工程研究进展
被引量:21
- 10
-
-
作者
潘璠
吴礼发
杜有翔
洪征
-
机构
解放军理工大学指挥自动化学院
-
出处
《计算机应用研究》
CSCD
北大核心
2011年第8期2801-2806,共6页
-
基金
解放军理工大学预先研究基金资助项目
-
文摘
首先给出了协议逆向工程的形式化定义,并探讨了主要应用领域的特定需求;然后从报文序列分析和指令执行序列分析两个方面介绍了协议逆向技术的研究现状,并对两类技术的优劣进行了比较;最后结合当前方案的缺陷和实际应用的需求,对协议逆向技术的发展趋势进行了展望。
-
关键词
协议逆向工程
多序列比对
文法推断
动态污点分析
数据流分析
-
Keywords
protocol reverse engineering
multiple sequences alignment
grammatical inference
dynamic taint analysis
data flow analysis
-
分类号
TP393.08
[自动化与计算机技术—计算机应用技术]
-
-
题名协议规范挖掘研究综述
被引量:9
- 11
-
-
作者
张钊
温巧燕
唐文
-
机构
北京邮电大学网络与交换技术国家重点实验室
西门子(中国)研究院
-
出处
《计算机工程与应用》
CSCD
2013年第9期1-9,共9页
-
基金
国家自然科学基金(No.61202434
No.61170270
+4 种基金
No.61121061)
中央高校基本科研业务费专项资金资助(No.2011RC0505
No.2011RCZJ15
No.2012RC0612
No.2011YB01)
-
文摘
针对网络安全领域中的协议规范挖掘问题,通过对近十年相关文献的研究,将此问题进行了规范的形式化定义,根据协议规范的作用域将其分为两个层面:报文内部的格式、语义规范挖掘与报文之间的协议行为规范挖掘。针对每个层面研究中涉及到的方法与技术,给出了概要的分析介绍、评价及应用场景。针对目前研究的不足与应用需求,对整个协议规范挖掘的研究趋势进行了展望。
-
关键词
协议规范
逆向工程
报文格式
行为建模
文法推断
自动机学习
-
Keywords
protocol specification
reverse engineering
packet format
behavior modeling
grammatical inference
automation learning
-
分类号
TP393.08
[自动化与计算机技术—计算机应用技术]
-
-
题名面向Deep Web数据自动抽取的模板生成方法
被引量:3
- 12
-
-
作者
杨晓琴
鞠时光
曹庆皇
王秀红
-
机构
江苏大学计算机学院
-
出处
《计算机应用研究》
CSCD
北大核心
2010年第1期200-203,共4页
-
基金
国家自然科学基金资助项目(60773049)
江苏大学博士生创新基金资助项目(CX08B_18X)
-
文摘
DeepWeb结果页面大多由网站根据请求从后台数据库读取数据并动态填充到通用模板而生成的。研究如何从一系列同模板生成的页面中生成该模板,并利用模板自动抽取数据。给出了模板生成问题的形式化描述,提出了一种新颖的模板生成方法,利用生成的模板从实例网页中抽取数据。与现有方法相比,该方法适用于列表页面和详细页面两种类型网页。通过在多个领域站点上实验,说明新方法在不降低准确率的情况下能大大提高召回率。
-
关键词
DEEP
WEB
数据抽取
模板生成
文法推断
-
Keywords
Deep Web
data extraction
template generation
grammar inference
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名未知网络协议逆向分析综述
- 13
-
-
作者
徐正国
邓月华
-
出处
《电信技术研究》
2015年第3期47-58,共12页
-
文摘
在全面梳理近十年来相关研究成果的基础上,从当前两个不同的研究视角,给出了研究问题的形式化定义,并由此将现有的逆向分析原型系统和算法模型分为两类进行综述:基于指令序列的污点分析和基于报文数据的统计分析。分别对这两类方法的产生动机进行了分析,并详细描述了近年来各方法的改进过程。综合比较了两类方法的优缺点,在此基础上给出了未知协议逆向分析的五个评价指标。最后对协议逆向分析的研究发展趋势做了展望。
-
关键词
协议报文
逆向分析
序列比对
文法推断
统计分析
机器学习
-
分类号
TP331.1
[自动化与计算机技术—计算机系统结构]
-
-
题名手写体字符识别方法的探讨
被引量:2
- 14
-
-
作者
代汝为
胡启恒
-
机构
中国科学院自动化研究所
-
出处
《自动化学报》
EI
1979年第1期39-46,共8页
-
文摘
手写体字符识别的一项重要应用是在邮政自动化系统中自动识别邮区编码.本文扼要介绍了应用于我国邮电部信函自动分拣系统中的手写体数字识别机,并对于识别顺序逻辑的设计方法问题进行分析.试图利用有限状态文法推断的一些结果来设计识别顺序逻辑,并考虑用不分明集(模糊集)的一些概念来进行信息压缩.
-
关键词
特征链
逻辑
水平线
从属度
文法推断
设计识别
手写体字符识别
文法规则
非终止符
方向特征
-
分类号
TP39
[自动化与计算机技术—计算机应用技术]
-