期刊文献+
共找到23篇文章
< 1 2 >
每页显示 20 50 100
基于胶囊异构图注意力网络的中文表格型数据事实验证
1
作者 杨鹏 查显宇 +1 位作者 赵广振 林茜 《软件学报》 EI CSCD 北大核心 2024年第9期4324-4345,共22页
事实验证旨在检查一个文本陈述是否被给定的证据所支持.由于表格结构上具有依赖性、内容上具有隐含性,以表格作为证据的事实验证任务仍面临很多挑战.现有工作或者利用逻辑表达式来解析基于表格证据的陈述,或者设计表格感知神经网络来编... 事实验证旨在检查一个文本陈述是否被给定的证据所支持.由于表格结构上具有依赖性、内容上具有隐含性,以表格作为证据的事实验证任务仍面临很多挑战.现有工作或者利用逻辑表达式来解析基于表格证据的陈述,或者设计表格感知神经网络来编码陈述-表格对,以此实现基于表格的事实验证任务.但是,这些方法没有充分利用陈述背后隐含的表格信息,从而导致模型的推理性能下降,并且基于表格证据的中文陈述具有更加复杂的语法和语义,也给模型推理带来更大的困难.为此,提出基于胶囊异构图注意力网络(CapsHAN)的中文表格型数据事实验证方法,所提方法能充分理解陈述的结构和语义,进而挖掘和利用陈述所隐含的表格信息,有效提升基于表格的事实验证任务准确性.具体而言,首先通过对陈述进行依存句法分析和命名实体识别来构建异构图,接着对该图采用异构图注意力网络和胶囊图神经网络进行学习和理解,然后将得到的陈述文本表示与经过编码的表格文本表示进行拼接,最后完成结果的预测.更进一步,针对现有中文表格型事实验证数据集匮乏而难以支持基于表格的事实验证方法性能评价的难题,首先对主流TABFACT和INFOTABS表格事实验证英文数据集进行中文转化,并且专门针对中文表格型数据的特点构建了基于UCL国家标准的数据集UCLDS,该数据集将维基百科信息框作为人工注释的自然语言陈述的证据,并被标记为蕴含、反驳或中立3类.UCLDS在同时支持单表和多表推理方面比传统TABFACT和INFOTABS数据集更胜一筹.在上述3个中文基准数据集上的实验结果表明,所提模型的表现均优于基线模型,证明该模型在基于中文表格的事实验证任务上的优越性. 展开更多
关键词 基于表格的事实验证 异构图注意力网络 胶囊图神经网络 依存句法分析 命名实体识别
下载PDF
表格问答研究综述
2
作者 张洪廙 李韧 +4 位作者 杨建喜 杨小霞 肖桥 蒋仕新 王笛 《中文信息学报》 CSCD 北大核心 2024年第4期1-16,共16页
表格问答通过自然语言问句直接与表格数据进行交互并得到答案,是智能问答的主要形式之一。近年来,研究人员利用以语义解析为主的技术在该领域开展了深入研究。该文从不同表格类型分类及其问答任务问题定义出发,将表格问答细分为单表单... 表格问答通过自然语言问句直接与表格数据进行交互并得到答案,是智能问答的主要形式之一。近年来,研究人员利用以语义解析为主的技术在该领域开展了深入研究。该文从不同表格类型分类及其问答任务问题定义出发,将表格问答细分为单表单轮、多表单轮、多表多轮式问答三种任务,并系统介绍了各类表格问答任务的数据集及其代表性方法。其次,该文总结了当前主流表格预训练模型的数据构造、输入编码以及预训练目标。最后,探讨当前工作的优势与不足,并分析了未来表格问答的前景与挑战。 展开更多
关键词 表格问答 语义解析 自然语言处理 综述
下载PDF
融合边特征与注意力的表格结构识别模型 被引量:1
3
作者 吕学强 张煜楠 +2 位作者 韩晶 崔运鹏 李欢 《计算机应用》 CSCD 北大核心 2023年第3期752-758,共7页
针对现有方法在表格结构识别问题中存在的先验知识依赖、鲁棒性不足、表达能力不足等问题,提出一种新的融合边特征与注意力的表格结构识别模型——GEAN-TSR。首先,提出图边注意力网络(GEAN)并作为模型的主干网络,在边卷积结构的基础上... 针对现有方法在表格结构识别问题中存在的先验知识依赖、鲁棒性不足、表达能力不足等问题,提出一种新的融合边特征与注意力的表格结构识别模型——GEAN-TSR。首先,提出图边注意力网络(GEAN)并作为模型的主干网络,在边卷积结构的基础上引入并改进图注意力机制聚合图节点特征,解决图网络在特征提取过程中的信息损失的问题,提高图网络的表达能力;然后,引入边特征融合模块融合浅层图节点信息与图网络输出,增强图网络的局部信息提取能力与表达能力;最后,将门控循环单元(GRU)提取的图节点文本特征融入文本特征融合模块对边进行分类预测。在SciTSR-COMP数据集上的对比实验中,相较于目前最优的模型SEM,GEAN-TSR的召回率与F1值分别提升2.5与1.4个百分点。在消融实验中,GEAN-TSR采用特征融合模块后,所有指标都取得了最优值,验证了模块的有效性。实验结果表明,GEAN-TSR能够有效提升网络性能,更好地完成表格结构识别任务。 展开更多
关键词 图神经网络 图注意力网络 特征融合 表格结构识别 表格解析
下载PDF
电能质量数据交换格式文件通用解析方案 被引量:12
4
作者 张逸 杨洪耕 +2 位作者 林瑞星 王巍 谢康 《电力系统自动化》 EI CSCD 北大核心 2012年第11期86-91,共6页
针对国内电能质量领域各厂家以及各省规范对电能质量数据交换格式(PQDIF)文件定义差异所造成的解析程序兼容性问题,提出并实现了一种PQDIF文件通用解析方案。通过总结已知PQDIF文件标签组合及其对应测量指标类型,进而构造可扩展标记语言... 针对国内电能质量领域各厂家以及各省规范对电能质量数据交换格式(PQDIF)文件定义差异所造成的解析程序兼容性问题,提出并实现了一种PQDIF文件通用解析方案。通过总结已知PQDIF文件标签组合及其对应测量指标类型,进而构造可扩展标记语言(XML)格式存储的通道序列定义表;利用哈希表将待解析文件的标签组合在表中快速匹配对应的测量指标类型,并对未知标签组合进行差异匹配得到最相近组合。在无需修改解析程序源代码的前提下,不但可以实现对已知不同定义结构PQDIF文件的正确快速解析,而且只需用户进行简单配置,即可顺利解析包含未知标签组合的PQDIF文件。在某省电能质量一体化数据平台中的成功应用证明了此方案的可靠性和实用性。 展开更多
关键词 电能质量 电能质量数据交换格式(PQDIF) 通用解析方案 可扩展标记语言(XML) 哈希表
下载PDF
SIP协议实现中消息解析的研究 被引量:4
5
作者 姜秀玉 杨峰 崔再惠 《计算机工程与设计》 CSCD 北大核心 2010年第13期2988-2991,2995,共5页
在满足SIP协议被设计为可灵活扩展的文本协议的要求的基础上,分析了传统SIP消息解析器中基于字符串比较操作来判断消息头字段类型对整体SIP消息解析性能的影响。结合SIP协议栈实现过程中的对可维护性和可扩展性要求,深入研究了逐行解析... 在满足SIP协议被设计为可灵活扩展的文本协议的要求的基础上,分析了传统SIP消息解析器中基于字符串比较操作来判断消息头字段类型对整体SIP消息解析性能的影响。结合SIP协议栈实现过程中的对可维护性和可扩展性要求,深入研究了逐行解析消息头字段的基本流程和静态查找表的基本工作原理,提出了借助开源工具Gperf自动化构建高效静态查找表以实现头字段类型查询的方法,并实现了SIP消息头类型的快速匹配的目的。该方法改善了SIP消息解析器的性能和扩展性。 展开更多
关键词 SIP协议 消息解析 SIP协议解析性能 Gperf工具 静态查找表
下载PDF
LR分析的教学法探讨 被引量:2
6
作者 李侃 王贵珍 计卫星 《计算机教育》 2010年第3期26-29,共4页
LR分析法是编译程序语法分析中最常用且有效的自下而上的分析方法,理论较完善,适用于大多数上下文无关语言的分析。本文主要探讨LR分析的教学方法,采用"启发+关联式"教学法,引导学生理解LR分析的内涵。
关键词 LR分析法 项目集规范族 LR分析表 LR文法
下载PDF
基于状态转换图的LL语法快速分析方法 被引量:1
7
作者 孙安 毕翔 +1 位作者 韩江洪 魏振春 《合肥工业大学学报(自然科学版)》 CAS CSCD 北大核心 2009年第7期1030-1033,共4页
有向路径分析法是在预测分析法的基础上利用状态转换图思想设计的;由于去掉了预测分析法中的许多中间产生式匹配,因此该方法具有较高的语法分析效率,实验表明分析效率较预测分析法提高约2倍以上。文中阐述了LL(1)文法、预测分析法、有... 有向路径分析法是在预测分析法的基础上利用状态转换图思想设计的;由于去掉了预测分析法中的许多中间产生式匹配,因此该方法具有较高的语法分析效率,实验表明分析效率较预测分析法提高约2倍以上。文中阐述了LL(1)文法、预测分析法、有向路径分析法的定义、原理和设计步骤,并给出了事例和实验加以说明和验证。 展开更多
关键词 语法分析 自上而下分析法 状态转换图 预测分析表
下载PDF
Web表格信息抽取模型的设计与实现 被引量:1
8
作者 廖涛 刘宗田 孔庆苹 《计算机应用与软件》 CSCD 2009年第4期72-74,共3页
Web表格作为一种简洁有效的数据信息表达方式,已广泛应用于Web页面中。现提出一种基于表格结构的Web表格信息抽取模型,该模型主要有表格定位模块、表格结构预处理模块和表格信息抽取与重构模块三个模块组成,根据Web表格的结构标记和自... Web表格作为一种简洁有效的数据信息表达方式,已广泛应用于Web页面中。现提出一种基于表格结构的Web表格信息抽取模型,该模型主要有表格定位模块、表格结构预处理模块和表格信息抽取与重构模块三个模块组成,根据Web表格的结构标记和自定义的启发式规则来抽取表格信息。实验结果表明该模型能够很好地应用于Web表格信息的抽取。 展开更多
关键词 表格结构 抽取模型 启发式规则 预处理 解析
下载PDF
融合丰富语言知识的汉语统计句法分析 被引量:2
9
作者 熊德意 刘群 林守勋 《中文信息学报》 CSCD 北大核心 2005年第3期61-66,共6页
知识获取一直以来是自然语言处理中的瓶颈,基于树库的统计句法分析也不例外。树库中潜在隐含的语言知识是非常丰富的,但它们并不是可以直接得到,往往需要特定的策略才能将它们融合到模型中。我们的汉语统计句法分析模型从3个方面融合潜... 知识获取一直以来是自然语言处理中的瓶颈,基于树库的统计句法分析也不例外。树库中潜在隐含的语言知识是非常丰富的,但它们并不是可以直接得到,往往需要特定的策略才能将它们融合到模型中。我们的汉语统计句法分析模型从3个方面融合潜在的丰富语言知识:1)重新标注树库中的非递归名词短语和非递归动词短语;2 )设计新的中心词映射表;3)引进上下文配置框架以更具体地描述二元依存结构。由于融合了以上三种潜在语言知识,模型的F1值提高了2 37% ,完全匹配正确率提高了5 36 %。 展开更多
关键词 人工智能 自然语言处理 统计句法分析 非递归短语 中心词映射表 上下文配置框架
下载PDF
使用LR分析表的词法分析器与分析表最小化 被引量:1
10
作者 温敬和 庞艳霞 王娜 《上海第二工业大学学报》 2007年第3期201-209,共9页
以一个模型语言为例,系统地介绍了使用LR分析表的词法分析器工作原理,以及词法分析器所使用的LR分析表最小化方法。使用LR分析表的词法分析器,统一了词法分析器和语法分析器的构造方法,简化了编译程序的设计和构造。分析表的最小化是通... 以一个模型语言为例,系统地介绍了使用LR分析表的词法分析器工作原理,以及词法分析器所使用的LR分析表最小化方法。使用LR分析表的词法分析器,统一了词法分析器和语法分析器的构造方法,简化了编译程序的设计和构造。分析表的最小化是通过编码压缩来实现的,分析表的最小化减少了编译程序运行所需的内存空间。 展开更多
关键词 编译程序 词法分析 上下文无关文法 LR分析法 LR分析表最小化
下载PDF
基于双向图算法的快速部分汉语语法分析器
11
作者 叶丹瑾 黄萱菁 吴立德 《计算机研究与发展》 EI CSCD 北大核心 1997年第7期546-550,共5页
本文给出了一个用双向图算法实现的快速部分汉语语法分析器.为了实现真实文本的快速部分语法分析,分析器使用FIRST分析表和LAST分析表来更大程度地避免创建不必要的活动弧,并且引进了弧的竞争机制和对于一些情况的处理方法... 本文给出了一个用双向图算法实现的快速部分汉语语法分析器.为了实现真实文本的快速部分语法分析,分析器使用FIRST分析表和LAST分析表来更大程度地避免创建不必要的活动弧,并且引进了弧的竞争机制和对于一些情况的处理方法.使用了各种分析策略的分析器的准确率达到87.2%。 展开更多
关键词 双向图 FIRST分析表 LAST分析表 计算语言学
下载PDF
一个改进的LR(1)分析表及其构造算法 被引量:1
12
作者 韩光辉 《武汉理工大学学报(信息与管理工程版)》 CAS 2001年第4期13-15,共3页
LR(1)分析表是LR(1)分析器的核心。改进了传统的LR(1)分析表 ,提出了新的构造算法。该算法利用LR(1)基本集代替LR(1)项集 ,对于归约状态直接标注归约转移后的状态编号。该分析表不含GOTO表 ,基于它的LR(1)语法分析过程一般不需要后入先... LR(1)分析表是LR(1)分析器的核心。改进了传统的LR(1)分析表 ,提出了新的构造算法。该算法利用LR(1)基本集代替LR(1)项集 ,对于归约状态直接标注归约转移后的状态编号。该分析表不含GOTO表 ,基于它的LR(1)语法分析过程一般不需要后入先出栈的辅助。 展开更多
关键词 LR(1)文法 LR(1)分析表 LR(1)项集 LR(1)基本集 LR(1)语法分析器 构造算法
下载PDF
基于数据库的通用预测分析法的设计与实现
13
作者 宋雅娟 于岳峰 《长春大学学报》 2009年第6期32-34,共3页
简要叙述了预测分析法的基本原理,并阐述如何利用数据库存储预测分析表,使得用户可以通过web界面输入任何文法的LL(1)分析表,并保存在数据库中。通过统一的预测分析程序对句子进行解析,从而完成语法分析工作。
关键词 预测分析法 数据库 LL(1)分析表
下载PDF
基于大规模文法的LR表的优化策略
14
作者 孙冀侠 何丽宏 《鞍山师范学院学报》 2006年第2期56-58,共3页
构造大规模文法的LR分析表是非常耗时的,本文对SLR(1)分析表进行讨论,给出了在构造SLR(1)分析表过程中的几种优化方法.
关键词 语法分析 LR表 SLR(1)表 大规模文法 优化策略
下载PDF
高效扩增式LL语法分析表的构造方法
15
作者 王明斐 李晓月 《河南机电高等专科学校学报》 CAS 2010年第2期29-30,81,共3页
扩增式LL语法分析的效率能极大地影响扩增式编译和解释环境的成功,而生成一个高效的扩增式LL语法分析,首先需要构建一个附加距离入口的扩增式LL预测分析表。在文中构建出了一个高效的表构造算法,并通过实例详细分析了该算法的有效性。
关键词 LL(1)文法 扩增式语法分析表 编译
下载PDF
面向拟态判决的可编程语义解析方法 被引量:1
16
作者 张文建 宋克 +2 位作者 谭力波 魏帅 董春雷 《通信学报》 EI CSCD 北大核心 2020年第4期62-69,共8页
针对拟态判决领域的应用,提出了一种面向拟态判决的可编程语义解析方法。该方法基于匹配查表思想,通过域指针配置方式进行定制协议解析,解决了针对不同协议的可编程解析问题;采用流水控制的方式保证了协议解析过程无拥塞,提高了协议解... 针对拟态判决领域的应用,提出了一种面向拟态判决的可编程语义解析方法。该方法基于匹配查表思想,通过域指针配置方式进行定制协议解析,解决了针对不同协议的可编程解析问题;采用流水控制的方式保证了协议解析过程无拥塞,提高了协议解析的性能;通过引入哈希运算,降低了子分组基于语义的重排序设计复杂度。性能分析结果表明,所提方法在协议解析方面具有高灵活性、高处理能力及低资源利用率等特点。 展开更多
关键词 拟态判决 可编程 匹配查表 语义解析
下载PDF
一种较少状态数的LR分析器 被引量:1
17
作者 金毅 陆蓓 王小华 《杭州电子科技大学学报(自然科学版)》 2006年第3期74-77,共4页
该文提出了一种新的LR分析器的构造方法,该方法从构造识别活前缀的确定有限状态自动机出发,通过合并有限状态自动机中可合并的等价状态对,对得到的有限状态自动机进行化简,从而得到较少状态数的LR分析表。该构造方法具有与LALR方法相同... 该文提出了一种新的LR分析器的构造方法,该方法从构造识别活前缀的确定有限状态自动机出发,通过合并有限状态自动机中可合并的等价状态对,对得到的有限状态自动机进行化简,从而得到较少状态数的LR分析表。该构造方法具有与LALR方法相同的语法识别能力并且避免了LALR方法在合并同心项目集时可能出现的归约-归约冲突。结果表明采用该方法构造文法分析表可以在一些情况下减少文法分析表的状态数目。 展开更多
关键词 语法分析器 文法分析表 确定有限状态自动机
下载PDF
基于指令表自驱动的指令解析模型实现方法研究
18
作者 宋铮 张红光 +1 位作者 李福才 陈正 《微电子学与计算机》 CSCD 北大核心 2007年第11期175-177,180,共4页
在硬件仿真平台的设计中,指令集解析模型的设计是关键。从对常规的指令集解析模型设计出发,分析了其主要缺陷及改进思路,并给出了一种的新的指令解析模型——基于指令表自驱动的指令解析模型,通过描述硬件仿真平台的设计过程,分析了其... 在硬件仿真平台的设计中,指令集解析模型的设计是关键。从对常规的指令集解析模型设计出发,分析了其主要缺陷及改进思路,并给出了一种的新的指令解析模型——基于指令表自驱动的指令解析模型,通过描述硬件仿真平台的设计过程,分析了其优化的核心策略和主要技术路线,给出了一种实现这种新的指令解析模型的方法。 展开更多
关键词 嵌入式系统 指令集 解析模型 指令表 自驱动
下载PDF
脚本引擎的简单实现 被引量:1
19
作者 李剑 周文 王东 《电脑编程技巧与维护》 2009年第6期16-17,41,共3页
脚本是使用一种特定的描述性语言,依据一定的格式编写的可执行文件,又称作宏或批处理文件。脚本引擎对脚本进行编译和执行。一个脚本引擎通常包括的组件有:符号表、词法分析器、语法分析器、语义检查器、中间代码生成器、代码优化器、... 脚本是使用一种特定的描述性语言,依据一定的格式编写的可执行文件,又称作宏或批处理文件。脚本引擎对脚本进行编译和执行。一个脚本引擎通常包括的组件有:符号表、词法分析器、语法分析器、语义检查器、中间代码生成器、代码优化器、代码生成器、虚拟机。通过对一个简单脚本引擎实现过程的分析,可以深入理解各组件的实现方法。将以上组件合起来,就可以执行脚本语言。脚本语言可以通过调用软件的COM来扩展功能,实现软件的定制,也可以实现软件的自动化。 展开更多
关键词 脚本引擎 编译 符号表 词法分析 语法分析 语义 中间代码 虚拟机
下载PDF
图神经网络在Text-to-SQL解析中的技术研究 被引量:2
20
作者 曹合心 赵亮 李雪峰 《计算机科学》 CSCD 北大核心 2022年第4期110-115,共6页
语义解析领域中的Text-to-SQL任务对实现基于数据库的自动问答具有重要意义。现有深度学习模型,如Seq2Seq的序列生成模型在单表SQL查询中已取得显著效果,但无法解决多表SQL查询的问题。图神经网络能够有效提取数据库表和问句之间的关联... 语义解析领域中的Text-to-SQL任务对实现基于数据库的自动问答具有重要意义。现有深度学习模型,如Seq2Seq的序列生成模型在单表SQL查询中已取得显著效果,但无法解决多表SQL查询的问题。图神经网络能够有效提取数据库表和问句之间的关联信息,丰富解析过程中的语义信息,从而提升多表SQL查询的准确率。文中提出一种自适应的图构建方式和图编码方式,在现有Text-to-SQL模型中引入问句信息,通过对问句和数据库的拼接词向量进行卷积操作生成图网络初始化权重,对同种类型下的不同数据库可实现统一训练。采用IRNet框架和关系扩充的方式进行整体模型设计,在当前开放的Text-to-SQL数据集Spider上进行验证。结果表明,该技术能够有效提升多表SQL语句生成的匹配准确率,同时算法对图神经网络在Text-to-SQL领域的研究具有重要的参考价值。 展开更多
关键词 Text-to-SQL解析 深度学习 图构建 图神经网络 多表SQL语句生成
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部