期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
低数据资源条件下基于优化的数据选择策略的无监督语音识别声学建模
被引量:
2
1
作者
钱彦旻
刘加
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2013年第7期1001-1004,1010,共5页
为了克服低数据资源条件下的资源匮乏问题,该文利用无监督的声学模型训练方法来增加训练数据,改善系统性能。在标准的无监督训练框架下,在传统词图后验概率的词置信度基础上,提出了基于句子后验概率的置信度数据筛选准则,所选数据在保...
为了克服低数据资源条件下的资源匮乏问题,该文利用无监督的声学模型训练方法来增加训练数据,改善系统性能。在标准的无监督训练框架下,在传统词图后验概率的词置信度基础上,提出了基于句子后验概率的置信度数据筛选准则,所选数据在保证整句话可靠性的同时很好保留了上下文信息,有利于跨词的三音子声学模型建模;还提出了基于音素覆盖率准则的数据筛选方法,在考虑假设标注句子置信可靠度的同时,尽可能选取训练样本中最为稀疏的音素单元,从源头再次克服低数据资源的困难,数据选择效率更高,性能进一步提升。实验表明:基于本文改进的无监督训练方法的词错误率比基线有监督训练方法的降低约相对8%,比传统无监督方法的也有绝对2%的减少,极大程度改善了低数据资源条件下的系统性能。
展开更多
关键词
语音识别
低数据资源
无监督训练
数据
选择
原文传递
题名
低数据资源条件下基于优化的数据选择策略的无监督语音识别声学建模
被引量:
2
1
作者
钱彦旻
刘加
机构
清华大学电子工程系清华信息科学与技术国家实验室
出处
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2013年第7期1001-1004,1010,共5页
基金
国家自然科学基金资助项目(60931160443,61273268,90920302)
国家科技支撑计划项目(2009BAH41B01)
文摘
为了克服低数据资源条件下的资源匮乏问题,该文利用无监督的声学模型训练方法来增加训练数据,改善系统性能。在标准的无监督训练框架下,在传统词图后验概率的词置信度基础上,提出了基于句子后验概率的置信度数据筛选准则,所选数据在保证整句话可靠性的同时很好保留了上下文信息,有利于跨词的三音子声学模型建模;还提出了基于音素覆盖率准则的数据筛选方法,在考虑假设标注句子置信可靠度的同时,尽可能选取训练样本中最为稀疏的音素单元,从源头再次克服低数据资源的困难,数据选择效率更高,性能进一步提升。实验表明:基于本文改进的无监督训练方法的词错误率比基线有监督训练方法的降低约相对8%,比传统无监督方法的也有绝对2%的减少,极大程度改善了低数据资源条件下的系统性能。
关键词
语音识别
低数据资源
无监督训练
数据
选择
Keywords
speech recognition
low data resource
unsupervised training
data selection
分类号
TN912.3 [电子电信—通信与信息系统]
原文传递
题名
作者
出处
发文年
被引量
操作
1
低数据资源条件下基于优化的数据选择策略的无监督语音识别声学建模
钱彦旻
刘加
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2013
2
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部