期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
藏文虚词知识融合的藏汉机器翻译方法研究
1
作者 严松思 珠杰 +3 位作者 汪超 刘亚姗 许泽洲 徐泽辉 《中央民族大学学报(自然科学版)》 2024年第1期20-27,共8页
针对藏文虚词的文法特点,设计了基于藏文虚词知识融合的方法,该方法能够提高藏汉翻译的效果。首先通过全部藏文虚词知识融合、过滤兼类虚词知识融合、单音节虚词知识融合和多音节虚词知识融合,得到四种对应语料,其次将其在Transformer... 针对藏文虚词的文法特点,设计了基于藏文虚词知识融合的方法,该方法能够提高藏汉翻译的效果。首先通过全部藏文虚词知识融合、过滤兼类虚词知识融合、单音节虚词知识融合和多音节虚词知识融合,得到四种对应语料,其次将其在Transformer模型和mBART模型上进行了实验,使用轮数集成和不同网络结构集成来提高最终模型的泛化能力。对比实验证明,藏文虚词知识融合算法与模型集成策略可以提升藏汉机器翻译的翻译效果,最高可以达到38.05个BLEU。 展开更多
关键词 藏文虚词知识融合 机器翻译 模型集成
下载PDF
MP-CMLMs模型的藏汉机器翻译研究
2
作者 严松思 珠杰 汪超 《计算机与数字工程》 2023年第2期401-404,410,共5页
论文使用mask-predict解码扩展CMLMs模型,研究了藏汉神经机器翻译方法。并且针对该模型进行改进。在不同领域藏汉数据集上,经过实验,与非自回归模型NAT和标准的Transformer模型进行比较,在不降低解码速度的情况下,与非自回归模型相比提... 论文使用mask-predict解码扩展CMLMs模型,研究了藏汉神经机器翻译方法。并且针对该模型进行改进。在不同领域藏汉数据集上,经过实验,与非自回归模型NAT和标准的Transformer模型进行比较,在不降低解码速度的情况下,与非自回归模型相比提升了4个BLEU以上;与标准的Transformer模型相比能够达到甚至超过Transformer模型性能,同时解码速度更快。 展开更多
关键词 汉藏神经机器翻译 非自回归模型 掩码预测
下载PDF
结合级联技术的藏文预训练命名实体识别模型
3
作者 徐泽辉 珠杰 +3 位作者 许泽洲 汪超 严松思 刘亚姗 《中文信息学报》 CSCD 北大核心 2023年第11期23-28,共6页
命名实体识别是藏文自然语言处理中的一项关键任务,该文提出了结合三种藏文预训练模型(Word2Vec、ELMo、ALBERT)的Casade-BiLSTM-CRF结构。级联技术(Cascade)将藏文命名实体识别划分为两个子任务(实体边界划分,实体类别判断)分阶段进行... 命名实体识别是藏文自然语言处理中的一项关键任务,该文提出了结合三种藏文预训练模型(Word2Vec、ELMo、ALBERT)的Casade-BiLSTM-CRF结构。级联技术(Cascade)将藏文命名实体识别划分为两个子任务(实体边界划分,实体类别判断)分阶段进行,简化了模型结构;使用藏文预训练模型,能更好地学习藏文先验知识。实验表明,Cascade-BiLSTM-CRF模型相比于BiLSTM-CRF模型训练一轮时间缩短了28.30%;而将级联技术与预训练技术相结合,在取得更好识别效果的同时还缩短了模型训练时间。 展开更多
关键词 藏文命名实体识别 级联 预训练
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部