-
题名基于改进PCFG的语言解释器模糊测试
- 1
-
-
作者
刘志昊
孙晓山
张阳
-
机构
中国科学院软件研究所
-
出处
《计算机工程》
CAS
CSCD
北大核心
2019年第8期22-24,30,共4页
-
基金
国家自然科学基金(61471344)
-
文摘
为在语言解释器的模糊测试中构造符合语言规范的样本,并尽可能地得出异常测试结果以便发现漏洞,采用改进的概率上下文无关语法模型控制样本的变异过程,对变异结果中的未定义变量进行修正以提高符合语言规范的样本比率。在此基础上,对语言解释器进行模糊测试,结果表明,该测试所生成样本中符合语法、语义规范的比率高达96 %。
-
关键词
模糊测试
马尔科夫模型
概率上下文无关语法
机器学习
语言解释器
-
Keywords
fuzzing testing
Markov model
Probabilistic Context Free Grammar(pcfg)
machine learning
language interpreter
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于GLR算法的新型概率句法分析器
- 2
-
-
作者
丁向民
徐斌
-
机构
盐城师范学院信息科学与技术学院
阿尔卡特.朗讯南京分公司
-
出处
《计算机工程与应用》
CSCD
北大核心
2009年第32期130-132,136,共4页
-
文摘
为了提高句法分析器的分歧能力和分析准确率,结合上下文无关概率模型PCFG和头驱动概率模型HDSM各自的优点,提出了一种新型的概率模型PCFG_HDSM,并基于GLR算法,实现了一个新型的汉语句法分析器。在词性标注阶段,通过对助词的详细标注使部分歧义在规则阶段就被去除掉,提高了系统消歧的能力。经过开放测试,准确率和回归率分别达到82.8%、74.7%,与其他分析器分析结果比较有了较大提高,证明新模型PCFG_HDSM确实提高了分析器的分歧能力。
-
关键词
GLR算法
上下文无关文法(pcfg)
头驱动的概率模型(HDSM)
概率句法分析
-
Keywords
GLR algorithm
Probabilistic Context-Free Grammar(pcfg)
head-driven Statistical models (HDSM)
probabilistic syntactic analysis
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名中心词驱动的汉语统计句法分析模型的改进
被引量:3
- 3
-
-
作者
何亮
戴新宇
周俊生
陈家骏
-
机构
南京大学计算机软件新技术国家重点实验室
南京师范大学计算机科学系
-
出处
《中文信息学报》
CSCD
北大核心
2008年第4期3-9,共7页
-
基金
国家863高科技计划资助项目(2006AA01Z143,2006AA01Z139)
国家自然科学基金资助项目(60673043)
国家社科基金资助项目(07BYY051)
-
文摘
在对Dan Bikel基于Collins中心词驱动概率句法分析模型实现的句法分析器进行深入研究分析的基础上,对其进行了两个方面的改进。一是通过提供N-best词性候选序列,改进原模型在词性方面的处理,改善了句法分析的结果;二是在该模型中引进单独的基本名词短语识别,从而降低句法分析的复杂度,提高了效率,其中,针对中文的特点,通过对BaseNP的概念进行一系列的扩展,深入研究了基于不同层次概念的BaseNP对句法分析的影响并探讨更适合中文句法分析的BaseNP定义。利用改进的句法分析模型进行中文句法分析实验,实验结果表明,改进模型可以缩短分析时间26%,提高F值4.4个百分点,交叉括号平均减少18%。
-
关键词
计算机应用
中文信息处理
中心词驱动pcfg概率模型
基本名词短语
N-Best词性序列
汉语句法分析
-
Keywords
computer application
Chinese information processing
head-driven pcfg model
base NP
N-Best POS sequences
Chinese parsing
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名明文口令生成模型研究综述
被引量:3
- 4
-
-
作者
周浩
王靖康
王博
罗宇韬
马泽文
刘功申
-
机构
上海交通大学电子信息与电气工程学院
上海交通大学机械与动力工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2018年第4期9-16,共8页
-
基金
国家自然科学基金(No.61472448
No.61772337)
-
文摘
近些年来,针对明文口令的破解和恢复等技术展开了广泛而深刻的研究,总的来说,该领域的主流方法已经大大提升了口令破解和恢复的成功率,但多种方法之间缺少比较和内在关联的分析。着眼于明文口令字典的生成问题,总结了近十年来主流的明文口令生成模型:马尔可夫模型、概率上下文无关模型和神经网络模型。为了有效并客观地评估这三种主流模型,设计并进行了一系列性能验证实验,给出了三种模型各自适用的场合及优缺点,并从原理层面解释了三种模型存在缺陷的原因,给出了一些优化改进的思路。最后,认为神经网络将会成为未来最具潜力的模型,并指出该领域的进一步研究和发展依赖于规范数据集的建立和多种方法的结合运用。
-
关键词
明文口令
口令生成
马尔可夫模型
概率上下文无关语法
神经网络
-
Keywords
plain password
password generation
Markov model
Probability Context-Free Grammar(pcfg)
Neural Network(NN)
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于LSTM与多头注意力机制的恶意域名检测算法
被引量:3
- 5
-
-
作者
黄偲琪
张冬梅
闫博
-
机构
北京邮电大学网络空间安全学院
-
出处
《软件》
2019年第2期83-90,共8页
-
文摘
DGA域名是一类由特定算法生成,用来与恶意C&C服务器进行通信的域名,针对DGA域名的检测一直是一个研究热点。有文献提出了基于PCFG模型的DGA域名生成算法,在现有DGA检测方法的测试下,它的抗检测效果非常显著。这是因为它由合法域名生成,具备合法域名的统计特征。基于此,本文提出了将神经网络和自注意力机制相结合的检测模型M-LSTM,它利用Bi-LSTM实现字符序列编码以及初步特征提取,并结合多头注意力机制进行深度特征提取。实验结果表明,该算法在检测基于PCFG模型的域名上效果优异。
-
关键词
域名检测
多头注意力机制
pcfg模型
-
Keywords
Domain name detection
Multi-Head attention mechanism
pcfg model
-
分类号
TP399
[自动化与计算机技术—计算机应用技术]
-