一个普通话文语转换系统中的韵律模型被引量：1

Prosody Model for Mandarin Text-to-Speech System

下载PDF

导出

摘要韵律模型是文语转换系统中的重要组成部分,对合成语音的自然度起着至关重要的作用。结合人工神经网络和单元选择算法,将它们分别应用于韵律模型中时长和基频曲线的生成,其中时长模型采用三层的反向传播网络,而基频模型则采用一种基于最小距离和的单元选择算法。 Prosody model is a essential part in text-to-speech system. It plays an important role in naturalness of synthesized speech. This paper integrates artificial neural networks with unit selection in prosody model, and applies them to the generation of duration and pitch. It presents a three-layer back-propagation neural network in duration model, and an algorithm based on minimizing distance summation of a whole utterance in pitch model.

作者王志伟邵艳秋赵永贞刘挺

机构地区哈尔滨工业大学计算机科学与技术学院

出处《计算机应用研究》 CSCD 北大核心 2006年第6期79-81,104,共4页 Application Research of Computers

基金国家自然科学基金资助项目(60435020)

关键词文语转换韵律模型神经网络单元选择 Text-to-Speech （TTS） Prosody Model Neural Network Unit Selection

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1Klatt D H.The Klattalk Text-to-Speech Conversion System[C].ICASSP'82,1982.1589-1592.
2Bellegarda J R,Silverman K E A,Lenzo K,et al.Statistical Prosodic Modeling:From Corpus Design to Parameter Estimation[J].IEEE Transactions on Speech and Audio Processing,2001,9(1):52-66.
3Chen S,Hwang S,Wang Y.An RNN-based Prosodic Information Synthesizer for Mandarin Text-to-Speech[J].IEEE Transactions on Speech and Audio Processing,1998,6(3):226-239.
4陶建华,蔡莲红,赵世霞,吴志勇.汉语文语转换系统中可训练韵律模型的研究[J].声学学报,2001,26(1):67-72. 被引量：14
5朱廷劭,高文,凌晓峰.神经网络在汉语两字词韵律规则学习中的应用[J].计算机研究与发展,1999,36(6):664-667. 被引量：2

二级参考文献14

1林茂灿,颜景助,孙国华.北京话两字组正常重音的初步实验[J].方言,1984,6(1):57-73. 被引量：82
2杨行峻迟惠生.语音信号数字处理[M].北京:电子工业出版社,1990..
3吴宗济.普通话语句中的声调变化[J].中国语文,1982,6:439-449.
4初敏.高清晰度高自然度汉语文语转换系统的研究[博士论文].北京:中国科学院声学研究所,1995..
5王伟，人工神经网络原理.入门与应用，1995年
6初敏，博士学位论文，1995年
7杨行峻，语音信号数字处理，1990年
8林茂灿，方言，1984年，1期
9吴宗济，中国语文，1982年，6期，439页
10Xu Chingx，ICPHS'99,San Francisco，1999年，2359页

共引文献14

1赵欢,谭华.Apriori算法在语音合成应用中的一种改进[J].湖南大学学报（自然科学版）,2004,31(5):94-98. 被引量：2
2李炎阳,景新幸.改进的Apriori算法对语音合成中韵律参数的预测[J].桂林电子工业学院学报,2005,25(6):19-22. 被引量：5
3胡文英,祖漪清,王志中.语句的基频曲线预测[J].声学学报,2006,31(1):19-27. 被引量：4
4马欢,吾守尔.斯拉木.维吾尔语文语转换系统文本分析模块初探[J].计算机工程,2006,32(16):267-268. 被引量：6
5赵欢,谭华.多维关联规则在汉语韵律模型研究中的运用[J].计算机工程与应用,2007,43(34):223-225.
6郑鲁,王红.数据挖掘技术在情感语音合成中的应用[J].信息技术与信息化,2010(5):54-56.
7郑业夫.无障碍信息交流辅助系统的VB实现[J].长春大学学报,2011,21(8):13-14. 被引量：1
8徐俊芳,田素贞.Smart Voice系统的设计与实现[J].郑州轻工业学院学报（自然科学版）,2012,27(3):34-37.
9徐燕,单波,王颖.对一种矢量量化聚类算法的改进及应用[J].华北电力大学学报（自然科学版）,2001,28(3):62-65. 被引量：1
10杨鸿武,蔡莲红,陶建华.屏幕文本的语音合成[J].计算机应用,2002,22(5):94-95. 被引量：4

同被引文献12

1王丽娟,曹志刚.TTS语音单元边界的自动切分[J].微电子学与计算机,2005,22(12):8-11. 被引量：3
2侯传宇.马尔可夫及隐马尔可夫模型在数据挖掘中的应用[J].电脑知识与技术,2008(3):1186-1188. 被引量：5
3胡锡衡.正向最大匹配法在中文分词技术中的应用[J].鞍山师范学院学报,2008,10(2):42-45. 被引量：18
4李波,褚振勇,张圣杰,毛玉泉,王宝良.基于小语料库训练的语音转换系统[J].中国科技信息,2008(18):28-29. 被引量：2
5苏珊珊.基于波形拼接的语音合成技术研究[J].福建电脑,2008,24(10):104-105. 被引量：1
6陈小莹,陈晨,华侃,于洪志.语音语料库的设计研究[J].科技信息,2008(36):5-6. 被引量：7
7梅勇,王群生,徐秉铮.将词类信息融入三元文法统计模型的汉语音字转换方法[J].电子科学学刊,1998,20(5):625-630. 被引量：3
8才让卓玛,才智杰.基于语料库的藏语TTS技术研究[J].青海师范大学学报（自然科学版）,2010,26(2):66-69. 被引量：2
9阿依木尼萨.胡甫尔,艾斯卡尔.艾木都拉.面向语音合成的维吾尔语音素自动切分算法研究[J].计算机应用与软件,2011,28(9):18-21. 被引量：4
10语音合成系统的关键技术与应用实例[J].杭州科技,2000,21(2):19-21. 被引量：3

引证文献1

1井晓阳,罗飞,王亚棋.汉语语音合成技术综述[J].计算机科学,2012,39(S3):386-390. 被引量：13

二级引证文献13

1那勇,李明全.基于深度学习的中文自动分词研究[J].吉林广播电视大学学报,2019(12):58-59.
2赵建东,高光来,飞龙.基于HMM的蒙古语语音合成技术研究[J].计算机科学,2014,41(1):80-82. 被引量：6
3侯华洋,苏伟,蔡川,李廉,李辉.基于MathML的数学公式中文发音方法研究[J].系统科学与数学,2014,34(4):402-412. 被引量：2
4林小平,鲁青,郭伟,邓杰航,王超.一种SmartFusion FPGA的快速语音合成系统设计[J].广东工业大学学报,2014,31(2):43-48. 被引量：3
5鲁小勇,潘涛,高兰德.基于广义回归神经网络的情感语音韵律特征预测[J].自动化与仪器仪表,2015(2):145-146.
6牛其其日乐格.蒙古语语音合成技术的研究[J].民营科技,2016(4):262-262.
7王崇羽,刘锋.一种面向用户的卫星状态监视系统设计[J].航天器工程,2017,26(3):112-117.
8白海莉.情感语音合成技术或对声纹鉴定准确性产生影响[J].科技创新与应用,2018,8(36):24-24. 被引量：6
9王峥.语音合成技术在声音修复上的尝试[J].现代电影技术,2019,0(7):46-50. 被引量：2
10杨随先,刘行,康慧,李晴.互联网+智能设计背景下的交互设计与体验[J].包装工程,2019,40(16):1-13. 被引量：20

1谢崇文,柴佩琪.中文文语转换系统中基于决策树的基频模型提取[J].微电子学与计算机,2004,21(8):39-42. 被引量：1
2胡文英,王志中.基于韵律模型的普通话基频分析[J].计算机仿真,2006,23(1):262-266.
3陈高鹏,胡郁,王仁华.考虑语速和前后环境的基频Target模型及实现[J].中文信息学报,2004,18(3):81-85. 被引量：3
4谢崇文,柴佩琪.中文文语转换系统中基于决策树的基频模型提取[J].微型电脑应用,2007,23(7):4-7.
5杨金辉,易中华,王煦法.一种基于Straight的语音焦点合成方法[J].计算机工程,2005,31(13):46-47. 被引量：3
6陈益强,高文,刘军发,杨长水.手语合成中的多模式行为协同韵律模型[J].计算机学报,2006,29(5):822-827. 被引量：9
7恶人.入门好音质——三诺N20GⅢ电脑多媒体音箱[J].微电脑世界,2008(4):37-37.
8王敬华,刘建银,张国燕,赵新想.情感语音合成中韵律参数的基频研究[J].小型微型计算机系统,2013,34(9):2047-2050. 被引量：2
9张元平,汪丹丹.一种基于GBDT算法的语音模型聚类方法[J].信息化研究,2013,39(3):23-27. 被引量：1
10郭威彤,杨鸿武,梁青青,裴东.普通话到西安话的韵律转换[J].计算机工程与应用,2011,47(16):122-127.

计算机应用研究

2006年第6期

浏览历史

内容加载中请稍等...

一个普通话文语转换系统中的韵律模型被引量：1

参考文献5

二级参考文献14

共引文献14

同被引文献12

引证文献1

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

一个普通话文语转换系统中的韵律模型 被引量：1

参考文献5

二级参考文献14

共引文献14

同被引文献12

引证文献1

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

一个普通话文语转换系统中的韵律模型被引量：1