-
题名一种语料缺乏条件下的藏语音素自动切分方法
被引量:2
- 1
-
-
作者
李冠宇
于洪志
吴志强
-
机构
西北民族大学中国民族语言文字教育部重点实验室
-
出处
《计算机工程与科学》
CSCD
北大核心
2014年第10期2009-2013,共5页
-
基金
国家自然科学基金资助项目(61262054)
-
文摘
藏语语音合成及语音学研究中,经常需要切分音素。人工切分费时费力,但是由于藏语语料缺乏,训练的藏语声学模型不够精确和鲁棒,自动切分的音素边界不够准确。以藏语拉萨方言为研究对象,在确定拉萨方言音素集、建立拉萨方言发音词典的基础上,通过计算音素模型间的距离,确定了拉萨方言和英语的共同音素,融合拉萨方言和英语GMM-HMM模型,并自动判断语音中的静音和短时停顿,构造语音对应的词网络,查询发音词典,将词网络扩展为模型(音素)网络,使用Viterbi算法将每一帧特征参数对应到模型的每一个状态上,进而对音素进行切分。实验表明,切分效果要优于单纯的藏语模型方法。
-
关键词
藏语
拉萨方言
自动音素切分
维特比算法
隐马尔可夫模型
-
Keywords
Tibetan
Lhasa dialect
automatic phoneme segmentation
Viterbi
HMM
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名面向语音合成的维吾尔语音素自动切分算法研究
被引量:4
- 2
-
-
作者
阿依木尼萨.胡甫尔
艾斯卡尔.艾木都拉
-
机构
新疆大学信息科学与工程学院
-
出处
《计算机应用与软件》
CSCD
2011年第9期18-21,共4页
-
基金
国家自然科学基金(61062008)
国家语委项目(MZ115-75)
-
文摘
结合维吾尔语语音特征,以建立维吾尔音素语料库为目标,为了减少人工工作量,通过HTK工具实现了音素的自动切分算法:首先完成了文本设计、录音和手动标注等准备工作,设计了上下文属性集,通过训练获得了每个音素的HMM模型,随后对任意输入的语音句子进行了其音素构成部分的自动切分,最后分析了其切分准确度、存在的问题及对策等。实践表明,在语料库的建设中,该研究策略确实节省了大量的时间和人力成本,提高了语音语料库标注信息的一致性和准确性。
-
关键词
音素自动切分
隐马尔科夫模型
维吾尔语
语音合成
音素语音语料库
-
Keywords
Phoneme automatic segmentation HMM Uyghur language Speech synthesis Phonemic speech corpus
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名面向语音合成的藏语音素切分算法研究
- 3
-
-
作者
张金溪
李照耀
肖俊生
李艾林
-
机构
西北民族大学 中国民族语言文字信息技术重点实验室
-
出处
《西北民族大学学报(自然科学版)》
2012年第4期27-31,共5页
-
基金
国家自然基金项目(61262054)
西北民族大学中央高校基本科研业务费专项(ycx12024)
-
文摘
文章通过采用两种方法对藏语语音合成语料库中的语音进行音素切分:一种是基于单音素HMM模型的自动切分方法,一种是传统的人工切分方法,并通过实验分析了自动切分与人工切分方法的准确率程度.实验结果表明:在构建语料库时,前者有助于缩短建库周期,尤其对于大语料库的建立会有明显的优势.这种方法既节省了切分与标注的大量时间和人力成本,又提高了语音语料库标注信息的精确度和一致性.
-
关键词
音素自动切分
藏语
语音合成
语料库
-
Keywords
Phoneme automatic segmentation
Tibetan
Speech synthesis
Corpus
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-