期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于综合因素的汉语连续语音库语料自动选取
被引量:
3
1
作者
康恒
刘文举
《中文信息学报》
CSCD
北大核心
2003年第4期27-32,共6页
大词汇量连续语音识别系统的性能很大程度上取决于语音库的质量 ,而语音库设计的中心环节就是语料选取。但是传统语料选取方法往往考虑因素单一 ,不利于语音识别系统有效利用语言信息。本语音库的语料选取方法综合考虑了多种因素 :三音...
大词汇量连续语音识别系统的性能很大程度上取决于语音库的质量 ,而语音库设计的中心环节就是语料选取。但是传统语料选取方法往往考虑因素单一 ,不利于语音识别系统有效利用语言信息。本语音库的语料选取方法综合考虑了多种因素 :三音子覆盖率、三音子覆盖效率、三音子稀疏度、常用词分布等 ,并完全实现程序自动选取 ,充分利用了原始语料 ,使选取结果的信息量更加丰富。程序自动选取结果可以覆盖94 1%的三音子 ,75 4 %的最常用词 ,覆盖效率和稀疏度也比传统方法有了较大改善。
展开更多
关键词
语音识别系统
语料
选取
程序自动选取
覆盖效率
稀疏度
综合因素
三音子
高频词
下载PDF
职称材料
题名
基于综合因素的汉语连续语音库语料自动选取
被引量:
3
1
作者
康恒
刘文举
机构
中国科学院自动化研究所模式识别国家重点实验室
出处
《中文信息学报》
CSCD
北大核心
2003年第4期27-32,共6页
基金
国家自然科学基金资助项目 (6 0 172 0 5 5 )
国家"86 3"资助项目 (2 0 0 1AA114 181)
北京市自然科学基金资助项目 (40 0 2 0 12 )
文摘
大词汇量连续语音识别系统的性能很大程度上取决于语音库的质量 ,而语音库设计的中心环节就是语料选取。但是传统语料选取方法往往考虑因素单一 ,不利于语音识别系统有效利用语言信息。本语音库的语料选取方法综合考虑了多种因素 :三音子覆盖率、三音子覆盖效率、三音子稀疏度、常用词分布等 ,并完全实现程序自动选取 ,充分利用了原始语料 ,使选取结果的信息量更加丰富。程序自动选取结果可以覆盖94 1%的三音子 ,75 4 %的最常用词 ,覆盖效率和稀疏度也比传统方法有了较大改善。
关键词
语音识别系统
语料
选取
程序自动选取
覆盖效率
稀疏度
综合因素
三音子
高频词
Keywords
computer application
Chinese information processing
speech database
triphone
commonly used words
covering rate
分类号
TN912.34 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于综合因素的汉语连续语音库语料自动选取
康恒
刘文举
《中文信息学报》
CSCD
北大核心
2003
3
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部