-
题名基于WFST的俄语字音转换算法研究
被引量:3
- 1
-
-
作者
冯伟
易绵竹
马延周
-
机构
战略支援部队信息工程大学洛阳校区
-
出处
《中文信息学报》
CSCD
北大核心
2018年第2期87-93,101,共8页
-
基金
洛阳市社会科学规划项目(2016B285)
-
文摘
在俄语语音信息处理的资源建设中,字音转换技术起到了至关重要的作用。该文尝试对基于SAMPA的俄语音素集进行改进设计,使标音结果能够反映俄语单词的重音位置及元音弱化现象。依据改进的新音素集构建了包含20 000词的俄语发音词典。在此基础上,实现了一种数据驱动的俄语字音转换算法,将加权有限状态转化器(WFST)应用于算法的对齐、建模和解码过程中。首先利用期望最大化算法以"多对多"的方式对俄语字音进行对齐,然后将对齐结果通过联合N-gram模型训练,并转化为WFST发音模型,最后通过WFST解码算法对任意单词的发音进行预测。交叉验证实验结果表明,平均词形正确率为62.9%,平均音素正确率为92.2%。
-
关键词
字音转换
俄语
发音词典
加权有限状态转化器
-
Keywords
G2P
Russian
pronunciation dictionary
WFST
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-