期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
融合词性与声调特征的越南语语法错误检测 被引量:1
1
作者 张洲 朱俊国 余正涛 《计算机科学》 CSCD 北大核心 2022年第11期221-227,共7页
BERT(Bidirectional Encoder Representation from Transformers)预训练语言模型在对越南语分词时会去掉越南语音节的声调,导致语法错误检测模型在训练过程中会丢失部分语义信息。针对该问题,提出了一种融合越南语词性和声调特征的方法... BERT(Bidirectional Encoder Representation from Transformers)预训练语言模型在对越南语分词时会去掉越南语音节的声调,导致语法错误检测模型在训练过程中会丢失部分语义信息。针对该问题,提出了一种融合越南语词性和声调特征的方法来补全输入音节的语义信息。由于越南语的标注语料稀缺,语法错误检测任务面临训练数据规模不足的问题。针对该问题,设计了一种由正确语料生成大量错误文本的数据增强算法。在越南语维基百科和新闻语料上的实验结果表明,所提方法在测试集上取得了最高的F和F分数,证明该方法可提高检测效果,并且随着生成数据规模的扩大,该方法与基线模型方法的效果都得到了逐步提升,从而证明了所提数据增强算法的有效性。 展开更多
关键词 预训练言模型 越南语语法错误检测 特征融合 数据增强
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部