-
题名基于在线语音流的字幕自动生成系统算法研究与实现
被引量:1
- 1
-
-
作者
司玉景
潘接林
颜永红
高杰
-
机构
中国科学院声学研究所语言声学与内容理解重点实验室
腾讯公司语音计算组
-
出处
《网络新媒体技术》
2013年第4期52-54,共3页
-
基金
国家自然科学基金(No.10925419
90920302
+3 种基金
10874203
60875014
61072124
11074275)经费资助
-
文摘
针对语音文稿已知的情况,提出了一种简单方法实现了适用于在线语音流的字幕自动生成系统。主要思路是根据文稿分句的情况确定在线语音的句子边界,进而,将相应的句子显示到屏幕上。假设在线语音的句子起点已知,本文建立了具有帧同步的统计假设似然比模型检测在线语音的句子尾点,在HMM框架下对该模型进行求解。实验表明,如果以检测到的句子尾点与真正的句子尾点的时间差作为指标,对于干净语音,99.5%左右的时间差在一秒以内,达到了实际要求。最后,本文利用所提出的针对在线语音流的字幕自动生成算法,实现了一个适用于在线新闻广播加字幕场景的演示系统。
-
关键词
字幕自动生成系统
HMM
帧同步的统计假设似然比模型
-
Keywords
The system of subtitles automatically generated, HMM, a frame - synchronous likelihood ratio test model
-
分类号
TN912.3
[电子电信—通信与信息系统]
-