期刊文献+
共找到16篇文章
< 1 >
每页显示 20 50 100
基于解析树的Java Web灰盒模糊测试
1
作者 王鹃 张志杰 杨鸿远 《计算机系统应用》 2023年第9期67-76,共10页
由于Java Web应用业务场景复杂,且对输入数据的结构有效性要求较高,现有的测试方法和工具在测试Java Web时存在测试用例的有效率较低的问题.为了解决上述问题,本文提出了基于解析树的Java Web应用灰盒模糊测试方法.首先为Java Web应用... 由于Java Web应用业务场景复杂,且对输入数据的结构有效性要求较高,现有的测试方法和工具在测试Java Web时存在测试用例的有效率较低的问题.为了解决上述问题,本文提出了基于解析树的Java Web应用灰盒模糊测试方法.首先为Java Web应用程序的输入数据包进行语法建模创建解析树,区分分隔符和数据块,并为解析树中每一个叶子结点挂接一个种子池,隔离测试用例的单个数据块,通过数据包拼接生成符合Java Web应用业务格式的输入,从而提高测试用例的有效率;为了保留高质量的数据块,在测试期间根据测试程序的执行反馈信息,为每个数据块种子单独赋予权值;为了突破深度路径,会在相应种子池中基于条件概率学习提取数据块种子特征.本文实现了基于解析树的Java Web应用灰盒模糊测试系统PTreeFuzz,测试结果表明,该系统相较于现有工具取得了更好的测试准确率. 展开更多
关键词 漏洞挖掘 模糊测试 Java Web 解析树
下载PDF
基于语法解析树的函数漏洞发现方法 被引量:1
2
作者 陈永艳 束洪春 戴伟 《计算机科学》 CSCD 北大核心 2013年第8期119-123,135,共6页
大多数行业定制软件的漏洞检测较困难,而传统的静态漏洞检测方法会产生很多错误的和虚假的信息。针对函数调用前后存在的漏洞问题,提出了基于上下文无关的自顶向下与自底向上相结合的语法解析树的方法,它能够在对函数内部定义不了解或... 大多数行业定制软件的漏洞检测较困难,而传统的静态漏洞检测方法会产生很多错误的和虚假的信息。针对函数调用前后存在的漏洞问题,提出了基于上下文无关的自顶向下与自底向上相结合的语法解析树的方法,它能够在对函数内部定义不了解或者部分了解的情况下,解析函数调用前后安全契约规则:前置规则和后置规则。同时通过扩展规则表示的XML文法来表示面向对象下,规则中的属性存在继承关系下的契约规则。实验表明,与同类型安全分析工具比较,该方法具有避免函数重复分析、规则可扩展性良好、尤其在自定义对象类和特定环境下自定义参数准确率高等优点。 展开更多
关键词 函数弱点 继承关系 契约规则 语法解析树
下载PDF
基于最优解析树提取的多功能雷达状态快速估计方法 被引量:8
3
作者 代鹂鹏 王布宏 +1 位作者 曹帅 沈海鸥 《电子学报》 EI CAS CSCD 北大核心 2016年第3期514-519,共6页
针对基于文法建模的多功能雷达(Multi-Function Radar,MFR)参数估计领域中常规算法具有的高运算复杂度问题,提出一种快速估计算法.该算法利用文法的派生过程仅与文法结构有关,而与文法概率参数无关这一事实,利用库克-杨-卡塞米(Cocke-Yo... 针对基于文法建模的多功能雷达(Multi-Function Radar,MFR)参数估计领域中常规算法具有的高运算复杂度问题,提出一种快速估计算法.该算法利用文法的派生过程仅与文法结构有关,而与文法概率参数无关这一事实,利用库克-杨-卡塞米(Cocke-Younger-Kasami,CYK)算法对截获雷达数据序列进行预处理,构造出可以反映该序列派生过程的解析表,进而从该解析表中提取出序列的最优解析树,然后利用改进的Viterbi-Score算法对雷达文法概率参数进行快速估计.论文仿真分析了该算法的计算复杂度、存储复杂度和估计精度,实验结果表明了该算法相对于常规算法,可以减少60%左右的计算量. 展开更多
关键词 多功能雷达 随机上下文无关语法 解析 解析树
下载PDF
融合句法解析树的汉-越卷积神经机器翻译 被引量:7
4
作者 王振晗 何建雅琳 +3 位作者 余正涛 文永华 郭军军 高盛祥 《软件学报》 EI CSCD 北大核心 2020年第12期3797-3807,共11页
神经机器翻译是目前应用最广泛的机器翻译方法,在语料资源丰富的语种上取得了良好的效果.但是在汉语-越南语这类缺乏双语数据的语种上表现不佳.考虑汉语和越南语在语法结构上的差异性,提出一种融合源语言句法解析树的汉越神经机器翻译方... 神经机器翻译是目前应用最广泛的机器翻译方法,在语料资源丰富的语种上取得了良好的效果.但是在汉语-越南语这类缺乏双语数据的语种上表现不佳.考虑汉语和越南语在语法结构上的差异性,提出一种融合源语言句法解析树的汉越神经机器翻译方法,利用深度优先遍历得到源语言的句法解析树的向量化表示,将句法向量与源语言词嵌入相加作为输入,训练翻译模型.在汉-越语言对上进行了实验,相较于基准系统,获得了0.6个BLUE值的提高.实验结果表明,融合句法解析树可以有效提高在资源稀缺情况下机器翻译模型的性能. 展开更多
关键词 神经机器翻译 资源稀缺 句法解析树
下载PDF
树形结构数据帧解析和处理 被引量:4
5
作者 魏纪东 王昭顺 +1 位作者 戴桂兰 戴军 《小型微型计算机系统》 CSCD 北大核心 2010年第12期2352-2354,共3页
在过程工业的数据处理领域中,由二进制数据组成的数据帧是较为常见的一种数据形式.数据处理的一个重要方面是数据帧的结构识别和帧内参数的解析.针对帧结构和处理方法的多样性,提出一种基于树形结构的数据帧解析和处理方案.通过利用数... 在过程工业的数据处理领域中,由二进制数据组成的数据帧是较为常见的一种数据形式.数据处理的一个重要方面是数据帧的结构识别和帧内参数的解析.针对帧结构和处理方法的多样性,提出一种基于树形结构的数据帧解析和处理方案.通过利用数据处理过程抽象与解耦、插件和数据同步等技术,使得该方案具备良好的可扩展性和灵活性. 展开更多
关键词 数据帧 解析树 插件技术 数据同步
下载PDF
基于解析器树的日志压缩优化方法 被引量:3
6
作者 刘吉强 何嘉豪 +1 位作者 张建成 黄学臻 《信息网络安全》 CSCD 北大核心 2022年第4期30-39,共10页
信息系统日志数据对安全分析非常重要,随着日志规模与日俱增,高效地进行日志数据存储和审计成为信息系统安全的关键问题之一。日志数据压缩能够减少对日志数据存储的巨大开销,已经成为日志数据领域的研究热点之一。传统的压缩工具、算... 信息系统日志数据对安全分析非常重要,随着日志规模与日俱增,高效地进行日志数据存储和审计成为信息系统安全的关键问题之一。日志数据压缩能够减少对日志数据存储的巨大开销,已经成为日志数据领域的研究热点之一。传统的压缩工具、算法在小规模文本的处理上效果较好,但对于信息系统产生的大规模日志数据并不适用。现有日志压缩算法通过提取日志结构的方式实现数据压缩,但对日志数据中数值变量部分的压缩率和压缩速度的提升不明显。文章提出一种基于解析器树的日志压缩优化方法(TOLC),通过解析器构造解析器树,提取相应的日志模板并进行模板压缩,进而对数值变量部分进行编码压缩。文章通过5个不同类型的大型日志数据集对TOLC进行评估,并与其他方法进行比较。实验结果表明,TOLC在所有数据集上都实现了最高的压缩率,且在大型日志数据集中也表现出了很好的压缩速度,整体上表现最优。 展开更多
关键词 解析 日志压缩 模板提取 数值编码 压缩率
下载PDF
基于自注意力机制和平均池化下图卷积网络的商品新闻事件抽取
7
作者 罗茜雅 李红军 +2 位作者 王子怡 甘晨灼 胡正浩 《成都理工大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第3期500-512,共13页
商品新闻事件抽取是对新闻非结构化语句进行归纳和表达,以提取出该语句所包含的事件以及相关信息,能够为供货需求预测、价格预测、问答系统等提供基础。现有研究工作普遍存在候选触发词与实体向量关联性利用不强以及参数角色提取准确率... 商品新闻事件抽取是对新闻非结构化语句进行归纳和表达,以提取出该语句所包含的事件以及相关信息,能够为供货需求预测、价格预测、问答系统等提供基础。现有研究工作普遍存在候选触发词与实体向量关联性利用不强以及参数角色提取准确率不够的问题,因此本文在已有研究工作的基础上,提出了一种基于自注意力机制和平均池化图卷积网络及依赖解析树的提取模型(SAT-GCN-DPT)。该模型主要分为3个模块,ComBERT预训练模块、self-attention机制下的触发分类模块、利用平均池化图卷积和依赖解析树的参数角色分类模块。模型利用self-attention机制对输入数据进行操作增强候选触发词与实体向量之间关联性,同时对图卷积结果使用平均池化函数进行信息聚合来更大程度地还原事件之间关联性和提高分类准确率。实验结果表明,在CON数据集上,本文提出的模型在触发分类以及参数角色分类的准确度以及F 1值均有了提高。 展开更多
关键词 商品新闻事件抽取 自注意力机制 平均池化函数 图卷积网络 依赖解析树
下载PDF
云上异构数据库管理技术(DMS)研究
8
作者 刘旭 武梦娟 +2 位作者 冯义磊 井长军 李嘉怡 《移动信息》 2024年第4期335-338,共4页
为了解决企业中因国产数据库及国外数据库等异构数据库增多而带来的管理难度增加、运维成本高涨等问题,文中基于云服务的异构数据库管理(DMS),采用了Web模式。其提供了异构数据库对象研究、异构数据库SQL脚本兼容、异构数据库SQL执行分... 为了解决企业中因国产数据库及国外数据库等异构数据库增多而带来的管理难度增加、运维成本高涨等问题,文中基于云服务的异构数据库管理(DMS),采用了Web模式。其提供了异构数据库对象研究、异构数据库SQL脚本兼容、异构数据库SQL执行分析、异构数据库SQL结果展示及审计等能力,解决了当前数据库管理工具良莠不齐,存在费用高、安装困难、部署耗时、难上手的问题,致力于帮助企业高效、安全的挖掘数据价值,助力企业数字化转型。 展开更多
关键词 DMS 异构数据库 AST 解析树 数据可视化
下载PDF
一种支持异构协议解析的可配置解析器设计 被引量:5
9
作者 王孝龙 刘勤让 林森杰 《计算机应用研究》 CSCD 北大核心 2018年第6期1830-1833,共4页
针对当前网络转发设备难以快速应对不断出现的新型网络协议的现状,设计了一种支持异构协议的可重配置解析器。首先,通过配置用户定制模块,实时更新用于解析逻辑的解析树,快速实现新型协议的添加、删除;然后,在满足传统互联网解析需求的... 针对当前网络转发设备难以快速应对不断出现的新型网络协议的现状,设计了一种支持异构协议的可重配置解析器。首先,通过配置用户定制模块,实时更新用于解析逻辑的解析树,快速实现新型协议的添加、删除;然后,在满足传统互联网解析需求的同时,引入数据链路层的可配置性,将异构协议解析进行统一;最后,通过相应的解析树映射算法将用户定制的协议映射到硬件结构中,并通过匹配域的压缩,减少了所用的硬件资源。实验结果表明,与已有的方案相比,节省了20%的slice资源和17%的BRAM资源,并实现了176 Gbps的解析速度。 展开更多
关键词 可配置解析 异构协议 解析树 映射算法
下载PDF
消除GCC抽象语法树文本中冗余信息的算法研究 被引量:8
10
作者 李鑫 王甜甜 +1 位作者 苏小红 马培军 《计算机科学》 CSCD 北大核心 2008年第10期170-172,共3页
由GCC编译器对C语言源程序进行语法分析产生的抽象语法树文本存在大量的冗余信息,如果直接对其进行解析,则会产生解析效率低、产生的抽象语法树会占用大量的存储空间的问题。针对此问题,在深入研究GCC抽象语法树文本结构和解析过程的基... 由GCC编译器对C语言源程序进行语法分析产生的抽象语法树文本存在大量的冗余信息,如果直接对其进行解析,则会产生解析效率低、产生的抽象语法树会占用大量的存储空间的问题。针对此问题,在深入研究GCC抽象语法树文本结构和解析过程的基础上,提出了一种高效消除冗余的算法,通过实验证明了算法的正确性和适用性,并提出了GCC抽象语法树解析的数学定义。 展开更多
关键词 抽象语法(AST) 抽象语法文本 抽象语法解析 规范化的抽象语法文本 冗余
下载PDF
基于决策树的自适应网页正文抽取方法
11
作者 吕容政 刘嘉勇 《现代计算机》 2019年第7期16-22,共7页
为了从大量无关信息中获取有用内容,正文抽取成为Web数据应用不可获缺的组成部分。针对网页正文提取的通用性与适应性问题,提出一种基于决策树分类的自适应性网页正文抽取算法。为了更好地表征网页正文的特征和平滑有分类错误带来的误差... 为了从大量无关信息中获取有用内容,正文抽取成为Web数据应用不可获缺的组成部分。针对网页正文提取的通用性与适应性问题,提出一种基于决策树分类的自适应性网页正文抽取算法。为了更好地表征网页正文的特征和平滑有分类错误带来的误差,选取标签用途、文本密度、兄弟节点的相似性标签的外链四个特征向量表征DOM树的叶子结点,避免特征向量单一导致的分类误差大。其次通过对已知样本的分析得到的四个特征向量特征,并使用决策树方法将叶子结点分为正文类和噪声类。最后根据分类的结果计算DOM树中非叶子结点的信噪比,选取信噪比最高的DOM树结点即获取的网页正文,通过这种方式克服其他网页正文抽取中需要人工确定不同类型网页的阈值的问题,并且实验证明,保证同样的正确率下,可以适用更多类型的网页。 展开更多
关键词 决策分类算法 网页正文抽取 自适应网页正文抽取 DOM解析
下载PDF
基于查询模板的特定领域中文问答系统的研究与实现 被引量:3
12
作者 刘亮亮 林乐宇 《江苏科技大学学报(自然科学版)》 CAS 北大核心 2011年第2期163-168,共6页
随着网络信息的爆炸性增长,传统的搜索引擎已经不能满足人们的需求,从而促使对问答系统(Question AnsweringSystem,QAS)的研究.文中介绍了基于查询模板的问答系统框架结构,定义了关键词词典和查询模板的结构,并且介绍了基于关键词词典... 随着网络信息的爆炸性增长,传统的搜索引擎已经不能满足人们的需求,从而促使对问答系统(Question AnsweringSystem,QAS)的研究.文中介绍了基于查询模板的问答系统框架结构,定义了关键词词典和查询模板的结构,并且介绍了基于关键词词典的分词算法、查询模板存储结构以及模板匹配算法.在此基础上实现了基于铁路领域的问答系统,实验结果表明该系统具有很高的准确率和识别率. 展开更多
关键词 问答系统 查询模板 分词 句型解析树 模板匹配
下载PDF
面向对象语言中的漏洞发现方法
13
作者 陈永艳 束洪春 +1 位作者 戴伟 曹靖国 《昆明理工大学学报(自然科学版)》 CAS 北大核心 2013年第3期56-61,共6页
大多数行业定制软件漏洞检测困难,而传统的静态漏洞检测方法不但报告很多错误的和虚假的信息,同时针对面向对象的函数(方法)检测并未提及.针对函数调用前后存在的漏洞问题,首先用XML文法来表示出面向对象情况下,对象存在继承关系时,从... 大多数行业定制软件漏洞检测困难,而传统的静态漏洞检测方法不但报告很多错误的和虚假的信息,同时针对面向对象的函数(方法)检测并未提及.针对函数调用前后存在的漏洞问题,首先用XML文法来表示出面向对象情况下,对象存在继承关系时,从祖先类搜索开始,建立函数调用前后安全契约规则,利用基于上下文无关的自顶向下与自底向上相结合的语法解析树的方法,解析函数的调用是否违反了安全契约规则并报告漏洞的内容.实验表明,与同类型安全分析工具比较,具有避免函数重复分析、规则的可扩展性良好、准确率高等优点. 展开更多
关键词 契约规则 面向对象 解析树
下载PDF
PHP程序污点型漏洞静态检测方法 被引量:9
14
作者 麻荣宽 魏强 武泽慧 《计算机工程与应用》 CSCD 北大核心 2018年第1期64-69,共6页
针对基于PHP语言开发的Web应用程序产生的污点型漏洞,提出一种静态代码分析检测的方法。提出的生成控制流图的算法,基于PHP内置函数解析PHP程序,生成抽象解析树,进而生成控制流图;对内置特征、入口点和敏感点进行建模,精确分析数据流;... 针对基于PHP语言开发的Web应用程序产生的污点型漏洞,提出一种静态代码分析检测的方法。提出的生成控制流图的算法,基于PHP内置函数解析PHP程序,生成抽象解析树,进而生成控制流图;对内置特征、入口点和敏感点进行建模,精确分析数据流;提出基于有效路径的污点分析方法,提高了分析的准确性,实现了基于变量回溯的路径遍历算法。实现了该方法的原型系统,并对两个广泛使用的PHP应用程序进行测试,发现了6个未公开漏洞和11个已公开漏洞,证明了该系统具有较强的漏洞检测能力。 展开更多
关键词 抽象解析树 控制流图 污点型漏洞 路径遍历 污点分析
下载PDF
一种建立控制依赖子图的方法 被引量:2
15
作者 吕蕾 刘弘 李鑫 《计算机工程》 CAS CSCD 北大核心 2009年第15期50-52,共3页
提出一种基于GCC(GNU Compiler Collection)抽象语法树文本建立控制依赖子图的方法,消除抽象语法树文本中与分析控制流无关的信息,将消除冗余后的抽象语法树文本转化为以邻接表为存储结构的抽象语法树的算法,从而高效地完成了抽象语法... 提出一种基于GCC(GNU Compiler Collection)抽象语法树文本建立控制依赖子图的方法,消除抽象语法树文本中与分析控制流无关的信息,将消除冗余后的抽象语法树文本转化为以邻接表为存储结构的抽象语法树的算法,从而高效地完成了抽象语法树的解析。基于以邻接表为存储结构的抽象语法树建立了控制依赖子图。通过实验证明了该方法的正确性和适用性。 展开更多
关键词 抽象语法 抽象语法文本 抽象语法解析 规范化的抽象语法文本 冗余 控制依赖子图
下载PDF
深度学习算法与组合范畴语法的比较研究
16
作者 赵靓 《湖北大学学报(哲学社会科学版)》 CSSCI 北大核心 2020年第6期39-45,共7页
近年来,深度学习算法在自然语言处理(NLP)领域获得了很大成功,尤其是语义识别方面优势突出。但是,深度学习算法在分析句法构成和识别句法成分方面的效果较差。与深度学习算法相比,组合范畴语法(CCG)缺乏对语义外延信息的存储和分析,但... 近年来,深度学习算法在自然语言处理(NLP)领域获得了很大成功,尤其是语义识别方面优势突出。但是,深度学习算法在分析句法构成和识别句法成分方面的效果较差。与深度学习算法相比,组合范畴语法(CCG)缺乏对语义外延信息的存储和分析,但其句法分析方式和深度学习算法的SG模型及CBOW模型思路一致,不仅更为系统、精练,而且有比较成熟的CCG库可供使用。深度学习算法和组合范畴语法(CCG)在实际操作中可以互相修正、彼此优化。 展开更多
关键词 深度学习算法 词向量 组合范畴语法 解析树
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部