期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
面向口语统计语言模型建模的自动语料生成算法 被引量:1
1
作者 司玉景 肖业鸣 +2 位作者 徐及 潘接林 颜永红 《自动化学报》 EI CSCD 北大核心 2014年第12期2808-2814,共7页
在资源相对匮乏的自动语音识别(Automatic speech recognition,ASR)领域,如面向电话交谈的语音识别系统中,统计语言模型(Language model,LM)存在着严重的数据稀疏问题,本文提出了一种基于等概率事件的采样语料生成算法,白动生成领域相... 在资源相对匮乏的自动语音识别(Automatic speech recognition,ASR)领域,如面向电话交谈的语音识别系统中,统计语言模型(Language model,LM)存在着严重的数据稀疏问题,本文提出了一种基于等概率事件的采样语料生成算法,白动生成领域相关的语料,用来强化统计语言模型建模实验结果表明,加入本算法生成的采样语料可以缓解语言模型的稀疏性,从而提升整个语音识别系统的性能,在开发集上语言模型的困惑度相对降低7.5%,字错误率(Character error rate,CER)绝对降低0.2个点;在测试集上语言模型的困惑度相对降低6%,字错误率绝对降低0.4点. 展开更多
关键词 自动语音识别 资源匮乏 语言模型 等概率事件 语料生成算法
下载PDF
基于在线语音流的字幕自动生成系统算法研究与实现 被引量:1
2
作者 司玉景 潘接林 +1 位作者 颜永红 高杰 《网络新媒体技术》 2013年第4期52-54,共3页
针对语音文稿已知的情况,提出了一种简单方法实现了适用于在线语音流的字幕自动生成系统。主要思路是根据文稿分句的情况确定在线语音的句子边界,进而,将相应的句子显示到屏幕上。假设在线语音的句子起点已知,本文建立了具有帧同步的统... 针对语音文稿已知的情况,提出了一种简单方法实现了适用于在线语音流的字幕自动生成系统。主要思路是根据文稿分句的情况确定在线语音的句子边界,进而,将相应的句子显示到屏幕上。假设在线语音的句子起点已知,本文建立了具有帧同步的统计假设似然比模型检测在线语音的句子尾点,在HMM框架下对该模型进行求解。实验表明,如果以检测到的句子尾点与真正的句子尾点的时间差作为指标,对于干净语音,99.5%左右的时间差在一秒以内,达到了实际要求。最后,本文利用所提出的针对在线语音流的字幕自动生成算法,实现了一个适用于在线新闻广播加字幕场景的演示系统。 展开更多
关键词 字幕自动生成系统 HMM 帧同步的统计假设似然比模型
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部