期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
融合语言模型的端到端中文语音识别算法
被引量:
11
1
作者
吕坤儒
吴春国
+4 位作者
梁艳春
袁宇平
任智敏
周柚
时小虎
《电子学报》
EI
CAS
CSCD
北大核心
2021年第11期2177-2185,共9页
为了解决语音识别模型在识别中文语音时鲁棒性差,缺少语言建模能力而无法有效区分同音字或近音字的不足,本文提出了融合语言模型的端到端中文语音识别算法.算法建立了一个基于深度全序列卷积神经网络和联结时序分类的从语音到拼音的语...
为了解决语音识别模型在识别中文语音时鲁棒性差,缺少语言建模能力而无法有效区分同音字或近音字的不足,本文提出了融合语言模型的端到端中文语音识别算法.算法建立了一个基于深度全序列卷积神经网络和联结时序分类的从语音到拼音的语音识别声学模型,并借鉴Transformer的编码模型,构建了从拼音到汉字的语言模型,之后通过设计语音帧分解模型将声学模型的输出和语言模型的输入相连接,克服了语言模型误差梯度无法传递给声学模型的难点,实现了声学模型和语言模型的联合训练.为验证本文方法,在实际数据集上进行了测试.实验结果表明,语言模型的引入将算法的字错误率降低了21%,端到端的联合训练算法起到了关键作用,其对算法的影响达到了43%.和已有5种主流算法进行比较的结果表明本文方法的误差明显低于其他5种对比模型,与结果最好的Deep⁃Speech2模型相比字错误率降低了28%.
展开更多
关键词
语音
识别
联结时序分类
语言模型
声学模型
语音帧分解
下载PDF
职称材料
题名
融合语言模型的端到端中文语音识别算法
被引量:
11
1
作者
吕坤儒
吴春国
梁艳春
袁宇平
任智敏
周柚
时小虎
机构
吉林大学计算机科学与技术学院
吉林大学符号计算与知识工程教育部重点实验室
珠海科技学院计算机学院
出处
《电子学报》
EI
CAS
CSCD
北大核心
2021年第11期2177-2185,共9页
基金
国家自然科学基金(No.61972174)
吉林省预算内基本建设资金(No.2021C044-1)
+1 种基金
广东省国际科技合作项目(No.2020A0505100018)
吉林省自然科学基金(No.20200201163JC)。
文摘
为了解决语音识别模型在识别中文语音时鲁棒性差,缺少语言建模能力而无法有效区分同音字或近音字的不足,本文提出了融合语言模型的端到端中文语音识别算法.算法建立了一个基于深度全序列卷积神经网络和联结时序分类的从语音到拼音的语音识别声学模型,并借鉴Transformer的编码模型,构建了从拼音到汉字的语言模型,之后通过设计语音帧分解模型将声学模型的输出和语言模型的输入相连接,克服了语言模型误差梯度无法传递给声学模型的难点,实现了声学模型和语言模型的联合训练.为验证本文方法,在实际数据集上进行了测试.实验结果表明,语言模型的引入将算法的字错误率降低了21%,端到端的联合训练算法起到了关键作用,其对算法的影响达到了43%.和已有5种主流算法进行比较的结果表明本文方法的误差明显低于其他5种对比模型,与结果最好的Deep⁃Speech2模型相比字错误率降低了28%.
关键词
语音
识别
联结时序分类
语言模型
声学模型
语音帧分解
Keywords
speech recognition
CTC
language model
acoustic model
speech frame decomposition
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
TP39 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
融合语言模型的端到端中文语音识别算法
吕坤儒
吴春国
梁艳春
袁宇平
任智敏
周柚
时小虎
《电子学报》
EI
CAS
CSCD
北大核心
2021
11
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部