摘要
临高话是海南省一种独特且重要的方言,因语音资源稀缺且缺乏标准化,语音识别系统的开发面临诸多挑战。为了 提升临高方言的语音识别精度,本文多维度的采集了超过 400 小时的临高话语音数据,构建了一个专门的数据集。在此基础上, 本文利用 WeNet3.0 开源平台,并采用卷积增强的 Transformer(Conformer)模型进行了深入的训练。通过多轮优化,该语音识 别模型达到了 8.04% 的词错误率。
出处
《信息产业报道》
2024年第10期0248-0250,共3页
Information Industry Report
基金
海南经贸职业技术学院院级课题“基于深度学习的海南方言语言识别技术研究”(hnjmk2023214)。