摘要
语法错误纠正(grammatical error correction,GEC)旨在将包含语法错误的句子纠正为正确的句子。目前语法错误纠正研究主要基于Transformer模型,但由于模型参数规模大,中文GEC任务语料不足,Transformer无法得到充分训练来学习文本中足够的语义信息。提出了基于知识及流利度提升策略的中文GEC模型,将MacBERT预训练模型作为外部知识来源,并利用流利度提升策略缓解GEC模型单轮推理纠错不完全的局限。为了验证所提出的GEC模型的有效性,在NLPCC 2018中文GEC共享任务数据集上进行了大量实验,其性能优于NLPCC 2018 GEC共享任务中开发的最佳模型。
作者
王岩
梁椰玲
WANG Yan;LIANG Yeling
出处
《信息技术与信息化》
2024年第5期107-110,共4页
Information Technology and Informatization