期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
基于数据增广和复制的中文语法错误纠正方法 被引量:12
1
作者 汪权彬 谭营 《智能系统学报》 CSCD 北大核心 2020年第1期99-106,共8页
中文作为一种使用很广泛的文字,因其同印欧语系文字的天然差别,使得汉语初学者往往会出现各种各样的语法错误。本文针对初学者在汉语书写中可能出现的错别字、语序错误等,提出一种自动化的语法纠正方法。首先,本文在自注意力模型中引入... 中文作为一种使用很广泛的文字,因其同印欧语系文字的天然差别,使得汉语初学者往往会出现各种各样的语法错误。本文针对初学者在汉语书写中可能出现的错别字、语序错误等,提出一种自动化的语法纠正方法。首先,本文在自注意力模型中引入复制机制,构建新的C-Transformer模型。构建从错误文本序列到正确文本序列的文本语法错误纠正模型,其次,在公开数据集的基础上,本文利用序列到序列学习的方式从正确文本学习对应的不同形式的错误文本,并设计基于通顺度、语义和句法度量的错误文本筛选方法;最后,还结合中文象形文字的特点,构造同形、同音词表,按词表映射的方式人工构造错误样本扩充训练数据。实验结果表明,本文的方法能够很好地纠正错别字、语序不当、缺失、冗余等错误,并在中文文本语法错误纠正标准测试集上取得了目前最好的结果。 展开更多
关键词 自注意力机制 复制机制 序列到序列学习 中文 语法错误纠正 神经网络 文本生成 通顺度
下载PDF
基于预训练语言模型的语法错误纠正方法 被引量:2
2
作者 韩明月 王英林 《上海交通大学学报》 EI CAS CSCD 北大核心 2022年第11期1554-1560,共7页
自然语言处理中的语法错误纠正(GEC)任务存在着低资源性的问题,学习GEC模型需要耗费大量的标注成本以及训练成本.对此,采用从掩码式序列到序列的预训练语言生成模型(MASS)中的迁移学习方式,充分利用预训练模型已提取的语言特征,在GEC的... 自然语言处理中的语法错误纠正(GEC)任务存在着低资源性的问题,学习GEC模型需要耗费大量的标注成本以及训练成本.对此,采用从掩码式序列到序列的预训练语言生成模型(MASS)中的迁移学习方式,充分利用预训练模型已提取的语言特征,在GEC的标注数据上微调模型,结合特定的前处理、后处理方法改善GEC模型的表现,从而提出一种新的GEC系统(MASS-GEC).在两个公开的GEC任务中评估该系统,在有限的资源下,与当前GEC系统相比,达到了更好的效果.具体地,在CoNLL14数据集上,该系统在强调查准率的指标F上表现分数为57.9;在JFLEG数据集上,该系统在基于系统输出纠正结果与参考纠正结果n元语法重合度的评估指标GLEU上表现分数为59.1.该方法为GEC任务低资源问题的解决提供了新视角,即从自监督预训练语言模型中,利用适用于GEC任务的文本特征,辅助解决GEC问题. 展开更多
关键词 语法错误纠正 自然语言生成 序列到序列
下载PDF
基于Back-translation的语法错误纠正 被引量:2
3
作者 邓俊锋 朱聪慧 赵铁军 《智能计算机与应用》 2020年第6期187-190,共4页
语法错误纠正,面临着较为严重的数据稀疏问题,这给机器翻译方法在该任务上的应用带来了直接的困难。本文首次提出在back-translation阶段采用sampling解码策略,并对比基于不同解码策略合成的伪平行句对给训练语法错误纠正模型带来的影... 语法错误纠正,面临着较为严重的数据稀疏问题,这给机器翻译方法在该任务上的应用带来了直接的困难。本文首次提出在back-translation阶段采用sampling解码策略,并对比基于不同解码策略合成的伪平行句对给训练语法错误纠正模型带来的影响。在标准数据集CoNLL-2014 Test Set上的实验结果表明,本文提出的方法能显著提升语法错误纠正的性能。 展开更多
关键词 语法错误纠正 Back-translation 数据增强
下载PDF
基于LSTM和N-gram的ESL文章的语法错误自动纠正方法 被引量:8
4
作者 谭咏梅 杨一枭 +1 位作者 杨林 刘姝雯 《中文信息学报》 CSCD 北大核心 2018年第6期19-27,共9页
针对英语文章语法错误自动纠正(Grammatical Error Correction,GEC)问题中的冠词和介词错误,该文提出一种基于LSTM(Long Short-Term Memory,长短时记忆)的序列标注GEC方法;针对名词单复数错误、动词形式错误和主谓不一致错误,因其混淆... 针对英语文章语法错误自动纠正(Grammatical Error Correction,GEC)问题中的冠词和介词错误,该文提出一种基于LSTM(Long Short-Term Memory,长短时记忆)的序列标注GEC方法;针对名词单复数错误、动词形式错误和主谓不一致错误,因其混淆集为开放集合,该文提出一种基于ESL(English as Second Lauguage)和新闻语料的N-gram投票策略的GEC方法。该文方法在2013年CoNLL的GEC数据上实验的整体F1值为33.87%,超过第一名UIUC的F1值31.20%。其中,冠词错误纠正的F1值为38.05%,超过UIUC冠词错误纠正的F1值33.40%,介词错误的纠正F1为28.89%,超过UIUC的介词错误纠正F1值7.22%。 展开更多
关键词 语法错误自动纠正 LSTM N-gram投票策略 ESL语料
下载PDF
中文语法纠错方法的研究综述 被引量:5
5
作者 赵国红 《现代计算机》 2021年第28期65-69,共5页
随着中国国际影响力的日益提高和汉语国际地位的提升,使得当今世界各国各民族对汉语和中国文化的了解和掌握的需求越来越迫切。众所周知,汉语是世界上一门难以学习的语言之一,由于它的语法规则复杂多变,导致中文的语法纠错在自然语言处... 随着中国国际影响力的日益提高和汉语国际地位的提升,使得当今世界各国各民族对汉语和中国文化的了解和掌握的需求越来越迫切。众所周知,汉语是世界上一门难以学习的语言之一,由于它的语法规则复杂多变,导致中文的语法纠错在自然语言处理领域中一直极具有挑战性。本文对语法错误的纠正方法进行综述性研究与分析,介绍语法纠错的现状;对比现有的语法错误纠正方法进行分类分析,分析每类语法错误纠正方法的优缺点;以及对未来语法错误纠正的方法提出三点建议。 展开更多
关键词 语法错误 语法错误纠正 中文语法错误纠正
下载PDF
AI人工智能翻译中数据增广策略和语法错误分析技术研究
6
作者 李潇 《自动化与仪器仪表》 2024年第7期243-246,共4页
人工智能的信息处理逻辑可以对语言系统进行学习理解,进而在翻译工作中给出最优结果,以满足实际应用需要。研究结合数据增广策略和语料库对语法错误生成、纠正及检测模型进行数据训练。研究分析基于规则的数据增广策略对其数据处理进行... 人工智能的信息处理逻辑可以对语言系统进行学习理解,进而在翻译工作中给出最优结果,以满足实际应用需要。研究结合数据增广策略和语料库对语法错误生成、纠正及检测模型进行数据训练。研究分析基于规则的数据增广策略对其数据处理进行分析,进而提高训练数据的质量,采用学习者语料库对不同规模的语法纠错(grammatical error correction, GEC)模型进行结果分析,得出200 M左右的合成数据训练的GEC模型的精准率为45%、召回率最高为24%、F_0.5值最高为38%。再对优化后的GEC模型进行训练,得出其值分别为37%、24%和34%。最后在重排序策略下基于数据增广策略的语法错误模型的结果为75%、43%和65%。因此,证明基于数据增广策略的语法错误模型具有高检测精度,为人工智能翻译技术提供技术支持。 展开更多
关键词 数据增广策略 学习者语料库 语法错误纠正 GEG模型 重排序策略
原文传递
基于机器视觉的英语拼写语法错误识别
7
作者 晏芳 胡社利 司海峰 《自动化与仪器仪表》 2022年第12期138-142,共5页
针对当前机器英语语法错误识别纠正精确度低且模式单一的问题,以Transformer模型为基础提出一款基于机器视觉的英语拼写语法错误识别纠正模型,以提高英语语法纠正的整体水平。实验结果表明,本研究设计的视觉系统能够准确地进行图像英语... 针对当前机器英语语法错误识别纠正精确度低且模式单一的问题,以Transformer模型为基础提出一款基于机器视觉的英语拼写语法错误识别纠正模型,以提高英语语法纠正的整体水平。实验结果表明,本研究设计的视觉系统能够准确地进行图像英语信息的提取;以Transformer模型作为英语拼写语法错误纠正的基础模型,能够完成英语语法错误的识别纠正,与传统模型相比,Transformer模型的召回率达到了33.21,在F0.5指标上达到了64.56,更加适用于英语语法错误的纠正。以上实验结果验证了本研究选用的Transformer模型的合理性,同时验证了提出的基于机器视觉的英语拼写语法错误识别纠正模型的可行性,具有一定的实际参考价值。 展开更多
关键词 语法错误纠正 机器视觉 图像处理 Transformer模型
原文传递
二语写作中纠错性反馈研究述评
8
作者 周湉 《忻州师范学院学报》 2014年第6期58-64,共7页
纠错性反馈在写作中发挥的作用一直以来都是学术界争议的焦点,研究者针对纠错性反馈的相关问题做了大量的实证研究,但对其是否能提高学生的写作准确性仍然没有得出确切的答案。文章从三个方面回顾了关于纠错性反馈的研究——纠错性反馈... 纠错性反馈在写作中发挥的作用一直以来都是学术界争议的焦点,研究者针对纠错性反馈的相关问题做了大量的实证研究,但对其是否能提高学生的写作准确性仍然没有得出确切的答案。文章从三个方面回顾了关于纠错性反馈的研究——纠错性反馈的有效性、不同反馈策略的有效性、反馈对不同错误类别的有效性,并指出其对未来研究和二语写作教学的启示。 展开更多
关键词 二语写作 纠错性反馈 语法错误纠正 写作准确性
下载PDF
基于神经网络的智能外语翻译机器人语义纠错系统 被引量:3
9
作者 李星 《自动化与仪器仪表》 2023年第1期246-250,共5页
针对传统语法错误纠正系统存在并行化程度低的问题,提出以神经语法错误纠正基线模型为基础模型,在基于循环神经网络编码器-解码器基础上对其进行改进,并构建一个基于自注意力机制的语法错误纠正模型—Transformer,通过此模型提升语法纠... 针对传统语法错误纠正系统存在并行化程度低的问题,提出以神经语法错误纠正基线模型为基础模型,在基于循环神经网络编码器-解码器基础上对其进行改进,并构建一个基于自注意力机制的语法错误纠正模型—Transformer,通过此模型提升语法纠正效果。实验结果表明,Transformer模型在对冠词、名词、介词、形容词等语法错误进行纠错时,其纠错召回率明显高于传统的MLConv模型,且本模型的计算并行化程度更高。由此说明,基于自注意力机制的语法错误纠正模型性能更为优越,构建的Transformer系统在语法错误纠正中具有可行性。 展开更多
关键词 语法错误纠正 循环神经网络 编码器-解码器 Transformer系统
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部