期刊文献+
共找到15篇文章
< 1 >
每页显示 20 50 100
基于依存分析和错误驱动的中文时间表达式识别 被引量:21
1
作者 贺瑞芳 秦兵 +2 位作者 刘挺 潘越群 李生 《中文信息学报》 CSCD 北大核心 2007年第5期36-40,共5页
时间表达式识别是进行时间表达式归一化的基础,其识别结果的好坏直接影响归一化的效果。本文提出一种基于依存分析和错误驱动识别中文时间表达式的新方法。首先以时间触发词为切入点,据依存关系递归地识别时间表达式,大大地提高了识别效... 时间表达式识别是进行时间表达式归一化的基础,其识别结果的好坏直接影响归一化的效果。本文提出一种基于依存分析和错误驱动识别中文时间表达式的新方法。首先以时间触发词为切入点,据依存关系递归地识别时间表达式,大大地提高了识别效果;然后,采用错误驱动学习来进一步增强识别效果,根据错误识别结果和人工标注的差异自动地获取和改进规则,使系统的性能又提高了近3.5%。最终在封闭测试集和开放测试集上,F1值达到了76.38%和76.57%。 展开更多
关键词 计算机应用 中文信息处理 时间表达式识别 触发词 依存分析 错误驱动学习
下载PDF
自动构建时间基元规则库的中文时间表达式识别 被引量:16
2
作者 邬桐 周雅倩 +1 位作者 黄萱菁 吴立德 《中文信息学报》 CSCD 北大核心 2010年第4期3-10,共8页
该文提出一种基于正则文法的时间表达式识别算法:它基于"时间基元"①进行规则构建,提高了时间表达式识别的召回率;同时使用基于错误驱动思想的规则剪枝算法,削减了从训练语料带来的噪声,提高了识别的正确率,两者搭配有效提高... 该文提出一种基于正则文法的时间表达式识别算法:它基于"时间基元"①进行规则构建,提高了时间表达式识别的召回率;同时使用基于错误驱动思想的规则剪枝算法,削减了从训练语料带来的噪声,提高了识别的正确率,两者搭配有效提高了系统整体性能。在ACE07中文语料上的实验结果显著超过了现有水平,F-score达到89.9%。该文提出的算法具有很好的通用性和扩展性,加以改进将可以有更广泛的应用。 展开更多
关键词 计算机应用 中文信息处理 时间表达式识别 时间基元 Timex2 错误驱动 正则表达式
下载PDF
基于启发式错误驱动学习的中文时间表达式识别 被引量:3
3
作者 贺瑞芳 秦兵 +2 位作者 潘越群 刘挺 李生 《高技术通讯》 EI CAS CSCD 北大核心 2008年第12期1258-1262,共5页
提出了一种基于启发式错误驱动学习的中文时间表达式识别的新方法。该方法先采用依存分析方法以时间触发词为切入点递归地识别时间表达式,有效地解决了长距离依赖的问题,大大提高了识别效果;在此基础上,对比错误识别结果和人工标注... 提出了一种基于启发式错误驱动学习的中文时间表达式识别的新方法。该方法先采用依存分析方法以时间触发词为切入点递归地识别时间表达式,有效地解决了长距离依赖的问题,大大提高了识别效果;在此基础上,对比错误识别结果和人工标注,采用启发式A*算法搜索策略进行错误驱动学习,降低了规则学习的复杂度,并具有区分每条规则的有效性和规则间相容性的优点,使系统性能提高近6%。最终在封闭测试集和开放测试集上,F值分别达到了77.96%和77.92%。 展开更多
关键词 时间表达式识别 时间触发词 依存分析 错误驱动学习 A*算法
下载PDF
基于词典特征优化和依存关系的中文时间表达式识别 被引量:4
4
作者 高源 席耀一 +1 位作者 李弼程 李苏奕 《信息工程大学学报》 2016年第4期490-495,共6页
提出一种基于词典特征优化和依存关系的时间表达式识别方法。首先针对中文文本时间表达式边界定位不准确及长距离依赖的问题,优化了传统时间词典特征,将时间词典分为时间词词典和时间单位词典;其次针对传统基于机器学习的时间表达式识... 提出一种基于词典特征优化和依存关系的时间表达式识别方法。首先针对中文文本时间表达式边界定位不准确及长距离依赖的问题,优化了传统时间词典特征,将时间词典分为时间词词典和时间单位词典;其次针对传统基于机器学习的时间表达式识别方法忽视时间表达式本身结构特点的问题,在优化后的词典特征的基础上提取依存特征,挖掘时间表达式的结构信息;最后综合时间表达式的基本特征、词典特征和依存特征,在条件随机场模型上完成时间表达式识别。在中文语料上进行实验,时间表达式识别达到较好效果。 展开更多
关键词 时间表达式 时间表达式识别 时间词典 条件随机场 依存句法分析
下载PDF
基于规则的中文时间表达式识别与规范化 被引量:3
5
作者 左亚尧 龙耀发 李杰骏 《广东工业大学学报》 CAS 2014年第3期88-94,共7页
为了解决文本时间表达式的识别与规范化问题,针对时间表达式在形式上的多样性与非结构化,提出了对时态元素进行刻画的思想,划分时间表达式类别及规范形式;在此基础上,采用正则表达式与Trie树结构相结合的方式构建出时间短语识别树,自动... 为了解决文本时间表达式的识别与规范化问题,针对时间表达式在形式上的多样性与非结构化,提出了对时态元素进行刻画的思想,划分时间表达式类别及规范形式;在此基础上,采用正则表达式与Trie树结构相结合的方式构建出时间短语识别树,自动进行中文时间表达式的识别与分类;最后,提出规范化算法与修正算法处理识别后的结果,得到规范化形式.以中文语料进行实验,中文表达式识别与规范化工作达到较好的效果. 展开更多
关键词 规则 正则表达式 时间表达式识别 规范化
下载PDF
联机手写数学表达式识别方法综述 被引量:1
6
作者 张建成 洪留荣 《淮北煤炭师范学院学报(自然科学版)》 2008年第3期40-47,共8页
数学表达式的自动识别是将科学和工程文献中的数学表达式转变成电子文档的一个关键手段.数学表达式的识别由符号识别和结构分析两个主要阶段组成,符号识别又分两步骤,即符号的分割和识别.文章介绍了目前数学表达式识别的研究现状,给出... 数学表达式的自动识别是将科学和工程文献中的数学表达式转变成电子文档的一个关键手段.数学表达式的识别由符号识别和结构分析两个主要阶段组成,符号识别又分两步骤,即符号的分割和识别.文章介绍了目前数学表达式识别的研究现状,给出了联机手写数学表达式的识别过程,对符号识别方法和结构分析方法进行概述.对数学表达式识别过程中的重要论点进行比较深入的阐述,根据一些总结性的评述,讨论了其他相关问题以及数学表达式识别的发展趋势. 展开更多
关键词 数学表达式识别 错误检测和纠正 符号分割 结构分析
下载PDF
手写数学表达式识别方法研究 被引量:1
7
作者 沈佳伟 周宇昂 +3 位作者 赵天宇 周渊 周志豪 张娟 《福建电脑》 2021年第7期59-61,共3页
本文构建了一种基于编码器-解码器结构的网络结构,用于处理手写数学表达式识别的问题。经过对不同卷积神经网络的测试,整个网络先用密集连接卷积网络提取图片特征,再引入一个门限循环单元来形成编码器-解码器结构来处理图片特征,并在其... 本文构建了一种基于编码器-解码器结构的网络结构,用于处理手写数学表达式识别的问题。经过对不同卷积神经网络的测试,整个网络先用密集连接卷积网络提取图片特征,再引入一个门限循环单元来形成编码器-解码器结构来处理图片特征,并在其中使用带有Coverage的2D注意力机制。基于CROHME竞赛提供的手写数学表达式数据集,结果达到了17.1%的字错误率和36.5%的识别率,验证了该模型的有效性。 展开更多
关键词 密集连接网络 门限循环单元 编码器-解码器结构 2D注意力机制 手写数学表达式识别
下载PDF
基于条件随机域模型的英语时间表达式识别研究 被引量:2
8
作者 王凤玲 《电子技术(上海)》 2012年第5期8-10,共3页
时间表达式在多个自然语言处理领域都有着重要的作用,为了更好地识别时间表达式,提出使用条件随机域模型结合多种特征的方法对英语时间表达式进行识别,并采用TimeML标记语言对识别结果进行标记。采用Timebank1.1作为评测语料,通过实验... 时间表达式在多个自然语言处理领域都有着重要的作用,为了更好地识别时间表达式,提出使用条件随机域模型结合多种特征的方法对英语时间表达式进行识别,并采用TimeML标记语言对识别结果进行标记。采用Timebank1.1作为评测语料,通过实验结果发现各种特征的选择和应用是系统非常重要的部分,文中所选取的特征对于英语时间表达式的识别来说是非常成功的。 展开更多
关键词 时间表达式 条件随机域 TimeML 时间表达式识别与归范化(TERN) 特征
原文传递
一种融合Transformer和CNN的印刷体数学表达式图像识别方法
9
作者 尹锋 朱跃生 周昭坤 《电子技术与软件工程》 2022年第4期191-195,共5页
本文提出了一种基于深度学习的端到端PMER方法TrCPMER(Transformer-CNNPMER),该方法融合Transformer和CNN的特点,首先使用CNN提取图像特征并生成特征图,然后使用Transformer编码器对特征图进行编码,最后使用标准的Transformer解码器生成... 本文提出了一种基于深度学习的端到端PMER方法TrCPMER(Transformer-CNNPMER),该方法融合Transformer和CNN的特点,首先使用CNN提取图像特征并生成特征图,然后使用Transformer编码器对特征图进行编码,最后使用标准的Transformer解码器生成LaTeX字符序列。该TrCPMER方法简单且有效,不仅可以捕获图像的局部特征和全局特征,而且提升了模型的训练效率和识别准确率。与现有的方法的对比实验结果表明,我们的方法在识别性能的评价指标BLEU、Edit Distance和Match上分别达到了90.40%、96.18%和86.56%,相应提升了3.04%、9.79%和11.75%。 展开更多
关键词 数学表达式识别 注意力机制 TRANSFORMER CNN RNN
下载PDF
表达式符号的大小归一化方法
10
作者 万励 陈洪波 《广西大学梧州分校学报》 2005年第1期79-82,共4页
符号的大小归一化是数学表达式识别的一种很常见的预处理方法,它对于提高符号的识别率具有重要的意义。本文对表达式符号的大小归一化方法进行了研究。通过比较两种归一化算法的性能,说明在表达式符号的归一化中需要将两种算法结合起来... 符号的大小归一化是数学表达式识别的一种很常见的预处理方法,它对于提高符号的识别率具有重要的意义。本文对表达式符号的大小归一化方法进行了研究。通过比较两种归一化算法的性能,说明在表达式符号的归一化中需要将两种算法结合起来才能满足不同的情况。另外,对于特殊的符号,如长根号需要进行裁剪等归一化预处理,才能获得更好的效果。理论分析和实践证明,本文提出的算法是很有效的,也可作为其他模式识别问题的预处理方法。 展开更多
关键词 数学表达式识别 符号识别 预处理 大小归一化
下载PDF
一种表达式自然书写形式的生成算法
11
作者 姜边 《信息技术》 2004年第9期34-37,共4页
提出了一种基于表达式语法树的表达式自然书写形式生成算法。该算法可根据表达式语法树生成符合人们习惯的表达式的自然书写形式。该算法不需要额外的图形库支持,具有平台无关性。
关键词 自然书写形式 语法树 表达式识别
下载PDF
基于K-L变换与SVM的数学符号识别
12
作者 徐晓蓉 王强 陈洪波 《甘肃联合大学学报(自然科学版)》 2007年第1期53-57,共5页
为了实现印刷体数学表达式的自动识别,对印刷体数学符号的识别方法进行了研究,提出了一种基于K-L变换和支持向量机的符号识别方法.该方法首先对数学符号图像进行预处理,然后对其归一化之后的图像使用K-L变换进行特征降维,最后使用支持... 为了实现印刷体数学表达式的自动识别,对印刷体数学符号的识别方法进行了研究,提出了一种基于K-L变换和支持向量机的符号识别方法.该方法首先对数学符号图像进行预处理,然后对其归一化之后的图像使用K-L变换进行特征降维,最后使用支持向量机分类器对其进行识别.对同济大学版的《高等数学》上册书中出现频率最高的112个基元或符号的识别率可以达到96%以上,实验结果表明,该方法比近年报道的方法有明显优势. 展开更多
关键词 K-L变换 数学符号 数学表达式识别 支持向量机
下载PDF
基于ResNet与Transformer的离线手写数学公式识别 被引量:3
13
作者 周名杰 《科技创新与应用》 2022年第21期18-21,共4页
手写数学表达式的识别是一项困难的工作,文章聚焦于离线手写表达式识别方法的研究,提出由残差网络(ResNet)以及Transformer网络组成的模型结构。编码解码模型通常端到端训练,输入为图片,输出为识别结果。文章提出的网络使用残差网络进... 手写数学表达式的识别是一项困难的工作,文章聚焦于离线手写表达式识别方法的研究,提出由残差网络(ResNet)以及Transformer网络组成的模型结构。编码解码模型通常端到端训练,输入为图片,输出为识别结果。文章提出的网络使用残差网络进行特征的提取并进行位置编码,用以生成待计算序列,并使用Transformer网络进行序列的编码和解码分析。通过手写数学表达式识别的竞赛组织(CROHME)提供的数学公式数据来验证所提出的算法,结果表明,本方法具有可行性。 展开更多
关键词 数学表达式识别 编码解码模型 特征提取 Transformer网络
下载PDF
基于改进Hough变换的符号线段特征提取 被引量:11
14
作者 陈洪波 王强 +1 位作者 徐晓蓉 张超英 《光学精密工程》 EI CAS CSCD 2003年第6期632-636,共5页
研究了数学表达式识别中符号线段特征的提取问题。为正确提取符号的线段特征及其一些相关属性,提高识别系统的符号识别率,对Hough变换的局限性进行了分析,并作了一些改进,改进算法在原算法的基础上增加了线段的连续性的检测以及相关属... 研究了数学表达式识别中符号线段特征的提取问题。为正确提取符号的线段特征及其一些相关属性,提高识别系统的符号识别率,对Hough变换的局限性进行了分析,并作了一些改进,改进算法在原算法的基础上增加了线段的连续性的检测以及相关属性的提取,如线段数目、方向(角度)以及始末端点等。实验证明,该算法能有效地提取出符号线段及其一些属性,可应用于其他识别系统的符号特征提取。 展开更多
关键词 数学表达式识别 HOUGH变换 线段检测 特征提取
下载PDF
基于云计算的多重查询优化系统 被引量:3
15
作者 葛星 沈耀 徐常亮 《计算机工程》 CAS CSCD 2014年第9期46-50,58,共6页
在常规海量数据分析作业中,CPU/IO密集型的查询语句通常复杂、耗时并存在大量可复用的公共部分。如何检测、共享和复用回归查询集中语句间的公共部分成为亟需解决的问题。为此,提出特征值索引方法,并构建适用于云计算场景的LSShare多重... 在常规海量数据分析作业中,CPU/IO密集型的查询语句通常复杂、耗时并存在大量可复用的公共部分。如何检测、共享和复用回归查询集中语句间的公共部分成为亟需解决的问题。为此,提出特征值索引方法,并构建适用于云计算场景的LSShare多重查询优化系统。基于查询语句的抽象语法树将语句划分为不同的查询层次,针对每个查询层次抽取特征向量并计算特征值。建立简单高效的特征值索引表以识别多重查询语句间的公共部分,并结合SQL重写技术来复用其中的公共部分。随着运行迭代次数的增加,LSShare系统将逐步优化云计算场景中的回归查询集。实验结果表明,该系统在运行效率上优于传统查询语句系统,可节约近1/3的执行时间。 展开更多
关键词 云计算 多重查询优化 查询处理 表达式识别 海量数据处理 回归查询集
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部