期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
面向大语料库的语音合成方法研究
被引量:
2
1
作者
于延锁
朱风云
+2 位作者
李先刚
刘翼
吴玺宏
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2014年第5期791-796,共6页
针对几百小时粗标注大语料库,提出一种新颖的语音合成系统构建方法。首先,借助于语音识别、文本对齐和句法分析等技术实现大语料库的自动筛选与标注。然后,为了有效解决大语料库声学模型训练中存在的内存空间以及计算时间开销过大等问题...
针对几百小时粗标注大语料库,提出一种新颖的语音合成系统构建方法。首先,借助于语音识别、文本对齐和句法分析等技术实现大语料库的自动筛选与标注。然后,为了有效解决大语料库声学模型训练中存在的内存空间以及计算时间开销过大等问题,优化了传统的训练流程,在不损失声学模型准确性的前提下,显著提高了模型的训练速度。主观实验表明,与具有精标注的小语料库相比,引入粗标注的大语料库可以带来0.5分左右的MOS提升。
展开更多
关键词
语音数据筛选
声学模型训练
基于HMM的单元挑选与波形拼接
下载PDF
职称材料
题名
面向大语料库的语音合成方法研究
被引量:
2
1
作者
于延锁
朱风云
李先刚
刘翼
吴玺宏
机构
北京大学言语听觉研究中心
出处
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2014年第5期791-796,共6页
基金
国家自然科学基金(91120001
61121002)
+1 种基金
国家社会科学基金重大项目(12&ZD119)
国家重点基础研究发展计划(2013CB329304)资助
文摘
针对几百小时粗标注大语料库,提出一种新颖的语音合成系统构建方法。首先,借助于语音识别、文本对齐和句法分析等技术实现大语料库的自动筛选与标注。然后,为了有效解决大语料库声学模型训练中存在的内存空间以及计算时间开销过大等问题,优化了传统的训练流程,在不损失声学模型准确性的前提下,显著提高了模型的训练速度。主观实验表明,与具有精标注的小语料库相比,引入粗标注的大语料库可以带来0.5分左右的MOS提升。
关键词
语音数据筛选
声学模型训练
基于HMM的单元挑选与波形拼接
Keywords
speech data selection
acoustic model training
HMM-based unit selection and waveformconcatenation
分类号
TN912.3 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
面向大语料库的语音合成方法研究
于延锁
朱风云
李先刚
刘翼
吴玺宏
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2014
2
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部