期刊文献+

基于迁移学习的小样本语言语音识别研究

Research on Small Sample Language Speech Recognition Based on Transfer Learning
下载PDF
导出
摘要 本文提出了面向小样本语言的语音识别迁移学习方法,探讨该方法的实现与效果。为了克服目前小样本语言语音识别常见数据样本不足、数据质量过低、词典缺乏等问题,立足迁移学习算法思想,提出迭代性语言模型构建方法,旨在提高语音识别模型的识别性能。迭代性语言模型构建方法包括对普通话发音词典和文本语料进行特殊方言化处理,并加以可迭代训练流程规范化处理,从语言学角度构建西南官话独有文本语料,语言模型成功提高了预测率。对比实验结果表明,迁移学习模型在普通话和西南官话数据集上均表现出较好的字错率,最终西南官话语音识别结果字错率低于14.4%,在AISHELL-1普通话公共数据集上的字错率为5.50%,为目前同期模型最优识别结果,实现了从普通话到西南官话的知识迁移。 The paper proposes a transfer learning approach for small sample language speech recognition and investigates its implementation and effectiveness.In order to overcoming challenges such as insufficient data samples,low data quality,and the absence of suitable dictionaries in small sample language speech recognition,the research is grounded in the principles of transfer learning algorithms and introduces a method involving specialized dialectal processing of Mandarin pronunciation dictionaries and text corpora.The approach follows an iterative training process,which results in the creation of unique text corpora tailored specifically to Southwest Mandarin from a linguistic perspective.The language model demonstrates a significant improvement in prediction accuracy.The results of comparative experiments reveal that the transfer learning model performs well in terms of character error rates on both Mandarin and Southwest Mandarin datasets.Ultimately,the character error rate for Southwestern Mandarin speech recognition results falls below 14.4%,reaching 5.50%on the AISHELL-1 Mandarin public dataset.This accomplishment stood as the best recognition result among models of the same period,showcasing the successful transfer of knowledge from Mandarin to Southwest Mandarin.
作者 赵泽彬 兰亮 姜丹 王大亮 ZHAO Zebin;LAN Liang;JIANG Dan;WANG Daliang(School of Information Engineering,Beijing Institute of Graphic Communication,Beijing 102600,China;Science and Technology Innovation Department,Sichuan Branch,China Telecom Corporation Limited,Chengdu 610041,China;AI Innovation Center,Datang(Beijing)Technology Co.,LTD.,Beijing 100192,China)
出处 《北京印刷学院学报》 2024年第6期27-34,共8页 Journal of Beijing Institute of Graphic Communication
基金 北京市自然基金项目-北京市教委科技计划重点项目(KZ202010015021) 专业学位研究生联合培养基地建设-电子信息(21090223001) 北京印刷学院博士启动金(27170123036)研究成果。
关键词 语音识别 神经网络 迁移学习 小样本 方言 ASR neural network transfer learning small sample dialect
  • 相关文献

参考文献1

二级参考文献12

  • 1甄尚灵,张一舟.《蜀语》词语的记录方式[J].方言,1992(1):23-30. 被引量:13
  • 2李实.蜀语[M].黄仁寿,等,校注.成都:巴蜀书社,1990.
  • 3又,中国人民大学报刊复印资料《语言文字学》2013年第5期).
  • 4清·张娘《烬余录》,胡传淮注,中国文史出版社,2010.
  • 5周及徐《四川青衣江地区方言的语音特征及其历史形成》(《语言历史论丛》(第八辑),巴蜀书社,2015).
  • 6何婉.成都话音系词汇调查研究[M].成都:四川大学出版社,2013.
  • 7四川方言音系编写组.四川方言音系[J].四川大学学报:社会科学版,1960(3).
  • 8张一舟.《蜀语》音注材料分析[J].语言研究.1994(增刊).
  • 9周及徐.四川青衣江地区方言的语音特征及其历史形成[C]//语言历史论丛:第八辑.成都:巴蜀书社,2015.
  • 10周及徐.从语音特征看四川重庆“湖广话”的来源——成渝方言与湖北官话代表点音系特点比较[J].四川师范大学学报(社会科学版),2012,39(3):94-101. 被引量:16

共引文献5

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部