面向语音合成的藏语音素切分算法研究

Study on Tibetan Phoneme Segmentation Algorithms Facing Speech Synthesis

下载PDF

导出

摘要文章通过采用两种方法对藏语语音合成语料库中的语音进行音素切分:一种是基于单音素HMM模型的自动切分方法,一种是传统的人工切分方法,并通过实验分析了自动切分与人工切分方法的准确率程度.实验结果表明:在构建语料库时,前者有助于缩短建库周期,尤其对于大语料库的建立会有明显的优势.这种方法既节省了切分与标注的大量时间和人力成本,又提高了语音语料库标注信息的精确度和一致性. This paper adopted two methods being used for phoneme segmentation for Tibetan speech synthesis corpus：one was based on single phoneme HMM model automatic segmentation;the other was the traditional manual segmentation way.The accuracy degree between automatic and manual segmentation was analyzed through the experiments.The results of experiment showed that the automatic segmentation is helpful for shortening the cycle duration in building corpus process,especially for the establishment of large corpus.A lot of time for segmentation and labeling was reduced,the accuracy and consistency of speech corpus labeling information has been improved.

作者张金溪李照耀肖俊生李艾林

机构地区西北民族大学中国民族语言文字信息技术重点实验室

出处《西北民族大学学报（自然科学版）》 2012年第4期27-31,共5页 Journal of Northwest Minzu University(Natural Science)

基金国家自然基金项目(61262054) 西北民族大学中央高校基本科研业务费专项(ycx12024)

关键词音素自动切分藏语语音合成语料库 Phoneme automatic segmentation Tibetan Speech synthesis Corpus

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1王丽娟,曹志刚.基于HMM模型的语音单元边界的自动切分[J].数据采集与处理,2005,20(4):381-384. 被引量：4
2陈锴,柴佩琪.基于HMM的中文语音自动切分中的静音添加[J].计算机工程,2004,30(9):40-41. 被引量：1
3李永宏,于洪志.安多藏语语音合成语料库的设计[J].西北民族大学学报（自然科学版）,2006,27(1):36-39. 被引量：16
4艾斯卡尔·肉孜.基于HMM的维吾尔语音合成系统的研究与实现[J].新疆大学学报,2008.
5Gao Lu, Yu Hongzhi, et al. Study on SAMPA-ST for Lhasa Tibetan and Realization of Automatic Labelling System[ C]. IASP 2010. Vol I, PP- 133 - 137.
6王丽娟,曹志刚.TTS语音单元边界的自动切分[J].微电子学与计算机,2005,22(12):8-11. 被引量：3

二级参考文献23

1郑玉玲.藏语方言语音量化分析[J].民族语文,1998(5):42-50. 被引量：4
2孔江平.藏语（拉萨话）声调感知研究[J].民族语文,1995(3):56-64. 被引量：42
3朱亚喆,柴佩琪.语音合成系统中语音库的设计与实现[J].计算机工程,1997,23(S1):45-46. 被引量：2
4Brugnara F, Falavigna D, Omologo M. Automatic Segmentation and Labeling of Speech Based on Hidden Markov Models. Speech Comm,1993,12:357-370
5Donovan R E, Woodland P C. A Hidden Markov Model Based Trainable Speech Synthesiser. Computer Speech and Language, 1999,13(3): 223-242
6Doroteo Torre Toledano, Luis A Hernandez Gomez. Automatic Phonetic Segmentation [J]. IEEE Transactions on speech and audio processing, November 2003,11(6): 617～625.
7Abhinav Sethy, Shrikanth Narayanam. Refined Speech Segmentation for Concatenative Speech Synthesis[C]. Proceeding of ICSLP, Denver, Colorado, USA, September 2002:145～148.
8KI- Seung Lee, Jeong Su Kim. Context- adaptive Phone Boundary Refining for a TTS Database [C]. Proceeding of ICASSP, Hongkong, China, April 2003: 252～255.
9Eun-Young Park, Sang-Hun Kim, Jae-Ho Chung. Automatic Speech Synthesis Unit Generation with MLP based Postprocessor Against Auto-segmented Phoneme Errors[C]. Proceeding of ICASSP, Phoenix, Arizona, March 1999:2985～2990.
10Odell J, Ollason D, Woodland P, et al. The HTK Book for HTK V3.0 [M]. Cambridge University Press, Cambridge,UK, 2001.

共引文献20

1井晓阳,罗飞,王亚棋.汉语语音合成技术综述[J].计算机科学,2012,39(S3):386-390. 被引量：13
2高璐.藏语天气预报语音合成系统的初步研究[J].电脑与电信,2009(1):36-37.
3洪拓夷.汉语方言语音数据库建设构想[J].图书情报工作,2009,53(5):83-86. 被引量：6
4高定国,关白.回顾藏文信息处理技术的发展[J].西藏大学学报（社会科学版）,2009,24(3):18-27. 被引量：15
5杨鸿武,梁青青,郭威彤,李锦珑,陈龙.一个面向言语工程的兰州方言语料库[J].西北师范大学学报（自然科学版）,2009,45(6):54-59. 被引量：6
6廖艳莎,安亚彬,杨阳蕊,何向真.藏语单音节声学参数数据库结构设计[J].陇东学院学报,2010,21(4):26-29. 被引量：1
7热依曼.吐尔逊,依皮提哈尔.买买提.维吾尔语语音语料库管理软件的研究与实现[J].新疆大学学报（自然科学版）,2011,28(2):242-247. 被引量：7
8阿依木尼萨.胡甫尔,艾斯卡尔.艾木都拉.面向语音合成的维吾尔语音素自动切分算法研究[J].计算机应用与软件,2011,28(9):18-21. 被引量：4
9高原,顾明亮,孙平,王侠,张长水.多用途汉语方言语音数据库的设计[J].计算机工程与应用,2012,48(5):118-120. 被引量：7
10热依曼.吐尔逊,依皮提哈尔.买买提,吾守尔.斯拉木.维吾尔语电话语音语料库的研发[J].新疆大学学报（自然科学版）,2013,30(2):199-203. 被引量：2

1张金溪,李永宏,单广荣,李照耀,江静.面向语音合成的藏语单音素与三音素自动切分算法研究[J].计算机应用研究,2013,30(11):3272-3275. 被引量：5
2李冠宇,于洪志,吴志强.一种语料缺乏条件下的藏语音素自动切分方法[J].计算机工程与科学,2014,36(10):2009-2013. 被引量：2
3阿依木尼萨.胡甫尔,艾斯卡尔.艾木都拉.面向语音合成的维吾尔语音素自动切分算法研究[J].计算机应用与软件,2011,28(9):18-21. 被引量：4
4吕国云,蒋冬梅,蒋晓悦,赵荣椿,侯云舒,孙阿利,H.Sahli,W.Verhelst.基于动态贝叶斯网络的音视频连续语音识别和音素切分[J].计算机应用,2007,27(7):1670-1673. 被引量：2
5吕国云,蒋冬梅,樊养余,赵荣椿,H．Sahli,W．Vlerhelst.基于多流三音素DBN模型的音视频语音识别和音素切分[J].电子与信息学报,2009,31(2):297-301.
6袁家宏.大规模语音语料库的采集、处理和研究[J].语言学研究,2017(1):34-42. 被引量：5
7刘映杰,马义德,刘悦,袁敏,段磊.连续汉语音流中声韵母切分研究[J].甘肃科学学报,2005,17(3):90-93. 被引量：1
8陈晨,陈琪,李永宏,于洪志.藏语语音合成语料库的韵律标注规则设计[J].西北民族大学学报（自然科学版）,2010,31(1):24-28. 被引量：5
9吕国云,蒋冬梅,张艳宁,赵荣椿,Hichem Sahli.基于动态贝叶斯网络的大词汇量连续语音识别和音素切分研究[J].西北工业大学学报,2008,26(2):173-178. 被引量：1
10冯炎,安宝坤.带噪藏语语音增强算法研究[J].重庆科技学院学报（自然科学版）,2013,15(6):136-139. 被引量：1

西北民族大学学报（自然科学版）

2012年第4期

浏览历史

内容加载中请稍等...

面向语音合成的藏语音素切分算法研究

参考文献6

二级参考文献23

共引文献20

相关作者

相关机构

相关主题

浏览历史