期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
融合剪枝和多语微调的黏着语命名实体识别 被引量:1
1
作者 罗凯昂 哈里旦木·阿布都克里木 +2 位作者 刘畅 阿布都克力木·阿布力孜 郭文强 《计算机工程与应用》 CSCD 北大核心 2023年第24期121-130,共10页
以维吾尔语为代表的少数民族语言具有黏着性和资源匮乏等特点,为其命名实体识别任务带来了巨大挑战。与此同时,多语言模型存在参数规模和词表大、推理速度慢等问题。为此,通过对CINO进行重新剪枝,提出针对低资源黏着语命名实体识别的CIN... 以维吾尔语为代表的少数民族语言具有黏着性和资源匮乏等特点,为其命名实体识别任务带来了巨大挑战。与此同时,多语言模型存在参数规模和词表大、推理速度慢等问题。为此,通过对CINO进行重新剪枝,提出针对低资源黏着语命名实体识别的CINO新版本:CINO-Agglu。为了探讨最佳微调策略,缓解低资源问题,对维吾尔语、哈萨克语、柯尔克孜语、乌兹别克语、塔塔尔语等五种黏着语分别进行单语言和多语言微调。实验结果表明,CINO-Agglu相较于剪枝前,模型大小、参数量、词表大小、推理时间分别减少45%、44%、92%、38%,并且在五种语言上的平均F1值为85.9%,超过了所有基线模型。加入适当规模的同语族数据有利于提升微调效果。 展开更多
关键词 黏着语 低资源语言 命名实体识别 多语言迁移 模型剪枝
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部