-
题名基于迁移学习的小样本语言语音识别研究
- 1
-
-
作者
赵泽彬
兰亮
姜丹
王大亮
-
机构
北京印刷学院信息工程学院
中国电信股份有限公司四川分公司科技创新部
数据堂(北京)科技股份有限公司AI创新中心
-
出处
《北京印刷学院学报》
2024年第6期27-34,共8页
-
基金
北京市自然基金项目-北京市教委科技计划重点项目(KZ202010015021)
专业学位研究生联合培养基地建设-电子信息(21090223001)
北京印刷学院博士启动金(27170123036)研究成果。
-
文摘
本文提出了面向小样本语言的语音识别迁移学习方法,探讨该方法的实现与效果。为了克服目前小样本语言语音识别常见数据样本不足、数据质量过低、词典缺乏等问题,立足迁移学习算法思想,提出迭代性语言模型构建方法,旨在提高语音识别模型的识别性能。迭代性语言模型构建方法包括对普通话发音词典和文本语料进行特殊方言化处理,并加以可迭代训练流程规范化处理,从语言学角度构建西南官话独有文本语料,语言模型成功提高了预测率。对比实验结果表明,迁移学习模型在普通话和西南官话数据集上均表现出较好的字错率,最终西南官话语音识别结果字错率低于14.4%,在AISHELL-1普通话公共数据集上的字错率为5.50%,为目前同期模型最优识别结果,实现了从普通话到西南官话的知识迁移。
-
关键词
语音识别
神经网络
迁移学习
小样本
方言
-
Keywords
ASR
neural network
transfer learning
small sample
dialect
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-