-
题名蒙古语长音频语音文本自动对齐的研究
被引量:5
- 1
-
-
作者
牛米佳
飞龙
高光来
-
机构
内蒙古大学计算机学院
-
出处
《中文信息学报》
CSCD
北大核心
2020年第1期51-57,共7页
-
基金
国家自然科学基金(61563040,61773224)
内蒙古自然科学基金(2018MS06006,2016ZD06)。
-
文摘
目前,面向蒙古语的语音识别语音库资源相对稀缺,但存在较多的电视剧、广播等蒙古语音频和对应的文本。该文提出基于语音识别的蒙古语长音频语音文本自动对齐方法,实现蒙古语电视剧语音的自动标注,扩充了蒙古语语音库。在前端处理阶段,使用基于高斯混合模型的语音端点检测技术筛选并删除噪音段;在语音识别阶段,构建基于前向型序列记忆网络的蒙古语声学模型;最后基于向量空间模型,将语音识别得到的假设序列和参考音素序列进行句子级别的动态时间归整算法匹配。实验结果表明,与基于Needleman-Wunsch算法的语音对齐比较,该文提出的蒙古语长音频语音文本自动对齐方法的对齐正确率提升了31.09%。
-
关键词
蒙古语
语音端点检测
语音文本对齐
动态时间归整算法
-
Keywords
Mongolian language
voice activity detection
speech-text alignment
dynamic time warping algorithm
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-