期刊文献+
共找到337篇文章
< 1 2 17 >
每页显示 20 50 100
基于Swing的HTML解析器的实现与应用
1
作者 宋宇 《科技资讯》 2024年第14期43-45,49,共4页
HTML页面解析是一切工作的基础。首先,通过分析HTML解析器感兴趣的标签与超链接的分类,在Java的Swing包的基础上实现了一个HTML解析器,用来提取HTML文档的超链接和锚文本;其次,把HTML解析器应用到多媒体信息检索系统的搜索器Spider的开... HTML页面解析是一切工作的基础。首先,通过分析HTML解析器感兴趣的标签与超链接的分类,在Java的Swing包的基础上实现了一个HTML解析器,用来提取HTML文档的超链接和锚文本;其次,把HTML解析器应用到多媒体信息检索系统的搜索器Spider的开发中,通过设定若干个种子网站,选择合适的搜索算法,从中筛选出包含音频、视频和Flash动画的Web页面,并将其存放在数据库中。 展开更多
关键词 解析器 HTML SWING 超文本链接 链接文本
下载PDF
基于Stanford Parser的实体间关系识别 被引量:8
2
作者 刘建华 张智雄 《现代图书情报技术》 CSSCI 北大核心 2009年第5期1-5,共5页
分析当前基于GATE等开源工具进行关系识别的研究,提出利用GATE和Stanford Parser构建开放式实体间语义关系识别的Rela Pair模型。实验表明,该模型可以有效识别出由动词或介词所引导的命名实体关系三元组,为后续的情报分析工作提供重要... 分析当前基于GATE等开源工具进行关系识别的研究,提出利用GATE和Stanford Parser构建开放式实体间语义关系识别的Rela Pair模型。实验表明,该模型可以有效识别出由动词或介词所引导的命名实体关系三元组,为后续的情报分析工作提供重要支撑。 展开更多
关键词 语义关系识别 GATE STANFORD parser关系三元组
下载PDF
基于HTML Parser的网页信息提取技术研究 被引量:3
3
作者 珠杰 罗潘 《西藏大学学报(社会科学版)》 CSSCI 2010年第3期41-44,共4页
在互联网上信息量激增,迫切需要一些自动化工具帮助人们在海量信息源中迅速找到真正需要的信息。文章基于开源项目HTMLParser包,以提取中关村笔记本频道产品信息的文本信息和图片信息为例,提出了信息提取系统设计方案,给出了文字信息和... 在互联网上信息量激增,迫切需要一些自动化工具帮助人们在海量信息源中迅速找到真正需要的信息。文章基于开源项目HTMLParser包,以提取中关村笔记本频道产品信息的文本信息和图片信息为例,提出了信息提取系统设计方案,给出了文字信息和图片信息提取算法。 展开更多
关键词 搜索引擎 网页信息提取 HTML parser
下载PDF
高性能的XML解析器OnceXMLParser 被引量:4
4
作者 金蓓弘 曹冬磊 +2 位作者 任鑫 余双 戴蓓洁 《软件学报》 EI CSCD 北大核心 2008年第10期2728-2738,共11页
XML(extensible markup language)解析器是分析、处理XML文档的基础软件.研究高性能验证型XML解析器的实现.开发了支持3种解析模型的XML解析器OnceXMLParser,该解析器通过了严格的XML兼容性测试和API兼容性测试.OnceXMLParser具有轻量... XML(extensible markup language)解析器是分析、处理XML文档的基础软件.研究高性能验证型XML解析器的实现.开发了支持3种解析模型的XML解析器OnceXMLParser,该解析器通过了严格的XML兼容性测试和API兼容性测试.OnceXMLParser具有轻量级体系结构并进行了多方面的性能优化,包括高效的词法分析、基于统计分析的自动机实现、合理的资源分配策略以及语言层次上的优化.性能测试结果表明,OnceXMLParser具有出色的解析性能. 展开更多
关键词 XML(extensible MARKUP language) 解析器 性能优化
下载PDF
基于HTML Parser的BBS信息抽取系统的设计与实现 被引量:4
5
作者 蒋琴琴 宫哲 辛阳 《自动化技术与应用》 2012年第1期32-37,共6页
针对目前BBS信息爬取时网页噪声严重的特点,研究BBS信息抽取的实现。应用HTML Parser平台以及正则匹配技术,实现BBS信息的抽取、存储。设计建立了包含网页抽取模块、网页解析模块、数据库存储模块组成的信息抽取系统。实验结果表明,此... 针对目前BBS信息爬取时网页噪声严重的特点,研究BBS信息抽取的实现。应用HTML Parser平台以及正则匹配技术,实现BBS信息的抽取、存储。设计建立了包含网页抽取模块、网页解析模块、数据库存储模块组成的信息抽取系统。实验结果表明,此方法能有效抽取BBS信息,减少网页噪声的干扰。 展开更多
关键词 HTML parser 正则匹配 爬虫 BBS 信息抽取
下载PDF
OnceSAXParser:一种高效轻量的XML解析器 被引量:7
6
作者 曹冬磊 田四化 金蓓弘 《计算机工程》 EI CAS CSCD 北大核心 2006年第19期49-50,53,共3页
通过优化XML词法和语法处理以及构造轻量级体系结构,实现了支持SAX的高效XML解析器――OnceSAXParser。文中还将OnceSAXParser与目前最流行的XML解析器Xerces进行了对比分析和性能测试,结果显示OnceSAXParser的性能比Xerces平均提高了27... 通过优化XML词法和语法处理以及构造轻量级体系结构,实现了支持SAX的高效XML解析器――OnceSAXParser。文中还将OnceSAXParser与目前最流行的XML解析器Xerces进行了对比分析和性能测试,结果显示OnceSAXParser的性能比Xerces平均提高了27%以上。 展开更多
关键词 XML解析器 SAX 性能优化
下载PDF
Text-to-SQL文本信息处理技术研究综述 被引量:1
7
作者 彭钰寒 乔少杰 +5 位作者 薛骐 李江敏 谢添丞 徐康镭 冉黎琼 曾少北 《无线电工程》 2024年第5期1053-1062,共10页
信号与信息处理的需求日益增加,离不开数据处理技术,数据处理需要数据库的支持,然而没有经过训练的使用者会因为不熟悉数据库操作产生诸多问题。文本转结构化查询语言(Text to Structured Query Language,Text-to-SQL)的出现,使用户无... 信号与信息处理的需求日益增加,离不开数据处理技术,数据处理需要数据库的支持,然而没有经过训练的使用者会因为不熟悉数据库操作产生诸多问题。文本转结构化查询语言(Text to Structured Query Language,Text-to-SQL)的出现,使用户无需掌握结构化查询语言(Structured Query Language,SQL)也能够熟练操作数据库。介绍Text-to-SQL的研究背景及面临的挑战;介绍Text-to-SQL关键技术、基准数据集、模型演变及最新研究进展,关键技术包括Transformer等主流技术,用于模型训练的基准数据集包括WikiSQL和Spider;介绍Text-to-SQL不同阶段模型的特点,详细阐述Text-to-SQL最新研究成果的工作原理,包括模型构建、解析器设计及数据集生成;总结Text-to-SQL未来的发展方向及研究重点。 展开更多
关键词 文本转结构化查询语言 解析器 文本信息处理 数据库 深度学习
下载PDF
Parser Generator词法分析原理研究
8
作者 于思江 王小兵 《国外电子测量技术》 2015年第3期51-55,共5页
针对Windows环境下的词法分析工具相关文献较少,不便排除词法错误的不足,对Parser Generator中ALEX的词法分析原理进行了研究。在分析ALEX词法源文件结构的基础上,研究了输出verbose文件的内部结构,给出了相应自动机的图示说明,并概述... 针对Windows环境下的词法分析工具相关文献较少,不便排除词法错误的不足,对Parser Generator中ALEX的词法分析原理进行了研究。在分析ALEX词法源文件结构的基础上,研究了输出verbose文件的内部结构,给出了相应自动机的图示说明,并概述了生成的C++文件的内容。对转换得到的C++文件进行编译执行,结果分析表明,对于不同的字符串输入,ALEX生成的词法分析器均能正确的进行处理。最后,提出使用ALEX编写词法分析器,分析其verbose文件及相应的自动机有利于用户纠正词法错误。 展开更多
关键词 parser GENERATOR ALEX 词法分析
下载PDF
The Key Techniques of VHDL Parser's Automatic Generation
9
作者 牛振东 宋翰涛 刘明业 《Journal of Beijing Institute of Technology》 EI CAS 1995年第2期187+182-187,共7页
VHDL and its supporting environment are active domain in the field of logic design.In the paper the design principle and some key techniques to solve the problems on the implementation of the VHDL parser are introduce... VHDL and its supporting environment are active domain in the field of logic design.In the paper the design principle and some key techniques to solve the problems on the implementation of the VHDL parser are introduced. According to the methods discussed in the paper, the VHDL parser based on VHDL IEEE 1076 standard version is implemented and a series of strict tests are done. This VHDL parser is front-end tool of the VHDL high level synthesis and mixed level simulation system developed by the Research Center of ASIC of BIT. 展开更多
关键词 compiler/VHDL VHDL parser YACC
下载PDF
基于UAM的Stanford parser多层级句法标注实例评析 被引量:1
10
作者 王大鹏 《电子测试》 2013年第5S期201-202,共2页
利用集成于UAM中的Stanford parser对TEGC语料库进行句法标注,实例评析其内嵌的STNFD Parse模块的句法标注精度、错误率,分析其错误原因。
关键词 UAM STANFORD parser 句法标注
下载PDF
基于面向对象概念的PARSER
11
作者 杨闯 费翔林 《小型微型计算机系统》 CSCD 北大核心 1996年第10期16-23,共8页
本文给出了一个骨架:如何用类以及类分层来建造一个递归下降扫描程序。使用类来组织Parser的实现有很多优点,促使程序易于理解和修改,能方便地实现从BNF生成规则到Parser生成的自动处理。
关键词 扫描程序 面向对象 parser 程序设计
下载PDF
LR(K) Parser Construction Using Bottom-up Formal Analysis
12
作者 Nazir Ahmad Zafar 《Journal of Software Engineering and Applications》 2012年第1期21-28,共8页
Design and construction of an error-free compiler is a difficult and challenging process. The main functionality of a compiler is to translate a source code to an executable machine code correctly and efficiently. In ... Design and construction of an error-free compiler is a difficult and challenging process. The main functionality of a compiler is to translate a source code to an executable machine code correctly and efficiently. In formal verification of software, semantics of a language has more meanings than the syntax. It means source program verification does not give guarantee the generated code is correct. This is because the compiler may lead to an incorrect target program due to bugs in itself. It means verification of a compiler is much more important than verification of a source program. In this paper, we present a new approach by linking context-free grammar and Z notation to construct LR(K) parser. This has several advantages because correctness of the compiler depends on describing rules that must be written in formal languages. First, we have defined grammar then language derivation procedure is given using right-most derivations. Verification of a given language is done by recursive procedures based on the words. Ambiguity of a language is checked and verified. The specification is analyzed and validated using Z/Eves tool. Formal proofs are presented using powerful techniques of reduction and rewriting available in Z/Eves. 展开更多
关键词 COMPILER CONSTRUCTION LR(K) parser Context-Free Grammar Z Specification CORRECTNESS Verification
下载PDF
使用Log Parser审查ⅡS的安全性
13
作者 Orin Thomas 肖欣(译者) 《Windows IT Pro Magazine(国际中文版)》 2006年第7期53-55,共3页
日志是ITPro们使用最多的东西。Log Parser则是分析日志的利器。通过使用Log Parser工具结合SQL查询语句。可以从ⅡS日志中生成各种有效的数据和报表。以供管理员分析。通过本文介绍的方法可以快速找出被攻击的征兆或证据。根据这些分... 日志是ITPro们使用最多的东西。Log Parser则是分析日志的利器。通过使用Log Parser工具结合SQL查询语句。可以从ⅡS日志中生成各种有效的数据和报表。以供管理员分析。通过本文介绍的方法可以快速找出被攻击的征兆或证据。根据这些分析结果进一步采取措施,从而提高Web服务器的安全性.08。 展开更多
关键词 parser LOG 安全性 SQL查询语句 WEB服务器 分析结果 日志 管理员
下载PDF
通用串口数据协议解析与显控系统的设计与实现 被引量:2
14
作者 刘彪 张进智 +3 位作者 张巧 王睿乔 李明乐 乔邦江 《计算机技术与发展》 2023年第7期80-84,共5页
针对目前设备(惯性测量单元、惯性导航系统、卫星接收机等)在输出测量数据时,由于数据通讯协议不同,数据输出格式不统一。对不同设备进行测试或验收时,必须编写不同的采集测试软件,或在原有软件上进行大量的修改,造成不必要的人力成本... 针对目前设备(惯性测量单元、惯性导航系统、卫星接收机等)在输出测量数据时,由于数据通讯协议不同,数据输出格式不统一。对不同设备进行测试或验收时,必须编写不同的采集测试软件,或在原有软件上进行大量的修改,造成不必要的人力成本和时间成本。基于上述问题,研究并设计一种通用串口数据协议解析与显控系统,提出采用XML(可扩展性标记语言)作为串口通讯协议解析器的协议描述文件,利用XML文件的可扩展性、异构性和标签之间的父子层级关系,实现串口协议解析器的通用性,达到更新或更换通讯协议时,无须重新编写代码,只需重新配置并加载XML文件即可;支持对不同设备输出数据的自动解析,满足多设备协议的数据要求。主要介绍该系统的工作原理以及实现方法,设计一款通用串口数据协议与显控系统软件,并根据已有设备进行测试,证明该系统能够正确解析设备数据,系统运行稳定、可靠,满足了研发需求。 展开更多
关键词 通用串口 数据协议 数据解析 数据采集 显控系统
下载PDF
基于Wireshark的铁路信号协议解析器的设计与实现 被引量:1
15
作者 董渠江 陆志伟 +1 位作者 曾庆文 刘晨 《铁路通信信号工程技术》 2023年第7期80-86,共7页
Wireshark在网络包捕获以及协议解析方面有着广泛的应用,在分析RSSP-Ⅰ协议以及TCC外部接口应用数据的基础上,基于Wireshark采用Lua脚本语言实现一种可配置的接口协议启发式解析插件,能对RSSP-Ⅰ、RSSP-Ⅱ等多种协议以及多种接口应用数... Wireshark在网络包捕获以及协议解析方面有着广泛的应用,在分析RSSP-Ⅰ协议以及TCC外部接口应用数据的基础上,基于Wireshark采用Lua脚本语言实现一种可配置的接口协议启发式解析插件,能对RSSP-Ⅰ、RSSP-Ⅱ等多种协议以及多种接口应用数据进行同时解析。测试结果表明该解析器具备较好的可扩展性和易用性,对联锁、列控工程设计人员具备较大的实用价值。 展开更多
关键词 WIRESHARK Lua脚本 RSSP 协议自适应解析器
下载PDF
基于规则的域名WHOIS信息抽取技术研究 被引量:1
16
作者 薛鹏飞 沈毅 +1 位作者 胡淼 郑敬华 《信息对抗技术》 2023年第1期66-77,共12页
域名WHOIS数据包含域名所有权的相关信息,包括域名创建信息、注册者信息等,是网络空间实体与社会空间实体相关联的重要数据来源。然而,WHOIS协议仅在传输机制方面具有统一的标准,查询获得的域名注册信息在格式和内容上还存在较大差异,... 域名WHOIS数据包含域名所有权的相关信息,包括域名创建信息、注册者信息等,是网络空间实体与社会空间实体相关联的重要数据来源。然而,WHOIS协议仅在传输机制方面具有统一的标准,查询获得的域名注册信息在格式和内容上还存在较大差异,数据呈现多种模式。针对WHOIS数据存在多种模式,难以进行信息准确抽取的问题,设计实现了WHOIS信息的批量获取方法和基于规则的WHOIS信息解析器(rule-based parser),提升了域名WHOIS信息获取效率和分析准确率。通过合理设计解析字段,构建详尽的规则库,解决了不同模式下WHOIS信息解析效率不高的问题。与传统解析器对比,基于规则的WHOIS信息解析器能解析更多的顶级域名WHOIS信息,并能以更高的成功率和更低的时间开销完成对WHOIS信息的解析,能够为网络空间测绘、网络公害治理等方向提供技术和数据支撑。 展开更多
关键词 WHOIS 知识抽取 规则解析器 统计解析器
下载PDF
一种计算机代数系统的设计与实现
17
作者 汪明 《河北软件职业技术学院学报》 2023年第4期27-32,共6页
为利用计算机对数学表达式进行自动推理,实现自主可控的计算机代数系统,提出了基于抽象语法树模式匹配的计算机代数系统设计方法。在对计算机代数系统设计过程进行认知与分解的基础上建立了总体设计模型,并利用F#强大的函数式编程语言能... 为利用计算机对数学表达式进行自动推理,实现自主可控的计算机代数系统,提出了基于抽象语法树模式匹配的计算机代数系统设计方法。在对计算机代数系统设计过程进行认知与分解的基础上建立了总体设计模型,并利用F#强大的函数式编程语言能力,快速实现解析器和表达式模式匹配,从而提高开发效率。通过设计一个可实现表达式化简、展开、求导、极限、泰勒级数和积分等功能的计算机代数系统,验证了该设计的准确性和有效性。 展开更多
关键词 计算机代数系统 符号计算 特定领域语言 解析器
下载PDF
基于数据集成平台SQL解析器的研究
18
作者 樊亚妮 蔡灿材 +2 位作者 郑泽森 谢嘉豪 张大明 《信息与电脑》 2023年第3期13-15,共3页
针对层出不穷的大数据组件和新型数据库,为了降低研发成本,兼容不同类型结构化查询语言(Structured Query Language,SQL)的解析,提出一种以传统SQL语法为模板,基于Antlr4开发的全新SQL解析器。经实践验证,该SQL解析器能够兼容MySQL、Spa... 针对层出不穷的大数据组件和新型数据库,为了降低研发成本,兼容不同类型结构化查询语言(Structured Query Language,SQL)的解析,提出一种以传统SQL语法为模板,基于Antlr4开发的全新SQL解析器。经实践验证,该SQL解析器能够兼容MySQL、Spark SQL、Postgres,具有较高的实际应用价值. 展开更多
关键词 SQL解析器 Antlr4 兼容 大数据平台
下载PDF
工业机器人语言的词法语法分析器研究 被引量:9
19
作者 郑炳坤 叶峰 +1 位作者 赵崇裕 赖乙宗 《机械设计与制造》 北大核心 2014年第1期209-212,共4页
解释器与编译器是把工业机器人语言程序翻译成目标代码的两种主要语言处理器实现技术,但二者的翻译过程都离不开词法语法分析环节。词法分析器主要用于识别语言系统的标识符及关键字等标记,而语法分析器则对这些标记所组成的句子进行语... 解释器与编译器是把工业机器人语言程序翻译成目标代码的两种主要语言处理器实现技术,但二者的翻译过程都离不开词法语法分析环节。词法分析器主要用于识别语言系统的标识符及关键字等标记,而语法分析器则对这些标记所组成的句子进行语法检查等。高效准确的词法语法分析是实现工业机器人语言程序向可执行目标代码翻译的关键之一。提出以C语言为蓝本的动作级工业机器人语言的体系结构及指令集;采用Parser Generator工具来开发词法语法分析器,运用正则表达式和LR文法来描述扩展工业机器人语言的词法语法规则,并指出了非法格式的错误报告实现。对所开发的可视化分析器进行的实例测试表明,分析结果正确可靠。 展开更多
关键词 词法语法分析 工业机器人语言 parser GENERATOR 正则表达式 LR文法
下载PDF
基于GML的WebGIS应用研究 被引量:43
20
作者 罗英伟 汪小林 +1 位作者 马坚 许卓群 《计算机工程》 CAS CSCD 北大核心 2002年第7期15-16,共2页
GML(Geography Markup )已逐渐成为大家所接受并容易理解的一种空间信息的交换格式,基于的大众化应LanguageGMLWebGIS用将具有广泛的实用价值和市场前景,这包括基于的空间数据交易以及以数据为基础的大众化应用。基于技GMLGMLWebGISXML ... GML(Geography Markup )已逐渐成为大家所接受并容易理解的一种空间信息的交换格式,基于的大众化应LanguageGMLWebGIS用将具有广泛的实用价值和市场前景,这包括基于的空间数据交易以及以数据为基础的大众化应用。基于技GMLGMLWebGISXML Parser术,探讨了一个实现基于的大众化应用系统的建设方法,为大众化应用提供了有益的参考。 展开更多
关键词 GML WEBGIS 地理信息系统 空间数据 XML
下载PDF
上一页 1 2 17 下一页 到第
使用帮助 返回顶部