中国计算机产业的下一个亮点——汉语语音合成的实用化被引量：1

The Next Hot Research of China Computer Industry——The Practicability of Chinese Voice Synthesis

下载PDF

导出

摘要现代社会已经进入数字化信息时代 ,网络技术和多媒体技术获得迅猛发展 ,计算机与人之间的交互日益频繁。如何使电脑具有类似于人一样的听、说能力 ,成为自 90年代以来信息产业的研究热点。要建立一个具有听、说能力的计算机语音系统 ,必需的两项关键技术就是语音识别技术与语音合成技术。同语音识别技术相比 ,语音合成技术相对成熟一些 ,是该领域中近期最有希望产生突破性进展并形成产业化的技术 ,而汉语语音合成的实用化更将成为中国计算机产业的下一个亮点。近几十年来国际和国内对于语音合成技术的研究主要集中在按规则进行文语转换 ,即将书面语言转换成口头语言。到目前为止 ,法语、德语、英语、日语等语种的文语转换系统都已经研制成功 ,相对而言 ,中文语音合成技术现在还尚未达到实用化的要求。本文对于当前语音合成中热点的文本分析、韵律生成、语音合成三项关键技术进行了剖析 ,并针对中文的文语特点 ,指出了中文语音合成技术的难点所在。勿庸置疑 ,中文语音合成技术具有非常惊人的市场潜力 ,因而必将成为国内外IT业争夺的重点。虽然国内的语音合成技术起步较晚 ,但是我们拥有其他非汉语言国家所不能相比的优势。汉语对于我们来说是如此熟悉 ,以至于我们可以说 With the coming of the digital information era, network and multimedia technology are developing in a tremendous speed. The interaction between computer and man is increasing greatly. How to make the computer have the same listening and speaking ability as human being has become the focus of research of the information industry since 1990s. To establish a computer system which has listening and speaking ability, Voice Identification and Voice Synthesis are the two key technologies. Comparing with the Voice Identification technology, Voice Synthesis technology is somewhat more mature and is the most promising technology which can bring forth breakthrough development and realize industrialization. Meanwhile, the utilization of Chinese voice synthesis will become the next hotspot of China computer industry. In the past decades, the domestic and international research of voice synthesis technology had mainly focused on the text to speech transition according to the rules, that is, to transform the written language into oral language. Up to now, the text to speech systems on French, German, English and Japanese have come into being. However, Chinese Voice Synthesis technology can not yet meet the requirements of utilization. This paper analyzes Text Analysis, Rhythm Generation and Speech Generation, the three key technologies which are the hotspots of voice synthesis, and points out the difficulties that may come up according to the characteristics of Chinese language. No doubt, Chinese voice synthesis technology will have an amazing market potentiality. It will surely become the key point of competition among domestic and foreign companies. Although out domestic voice synthesis technology was launched comparatively late, we have some matchless advantages that the other non-Chinese speaking countries lack. Chinese is a language that we are so familiar with, we can even say that we have a talents team which can well master the Chinese characters and its voice processing technology. Also, we have outstanding achievements in fields of Chinese input, Chinese output, Chinese composition and Chinese OCR. Therefore, the real practical Chinese voice synthesis system should and will be developed successfully in China.

作者朱耀庭李霞

机构地区南开大学计算机系

出处《世界科技研究与发展》 CSCD 2002年第5期49-54,共6页 World Sci-Tech R&D

关键词中国计算机产业汉语语音合成实用化 voice synthesis, voice identification, text to speech system, Chinese text to speech system

分类号 TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献1

1黄昌宁,夏莹.《语言信息处理专论》,清华大学出版社、广西科学技术出版社,1995

同被引文献12

1王丽娟,曹志刚.TTS语音单元边界的自动切分[J].微电子学与计算机,2005,22(12):8-11. 被引量：3
2王志伟,邵艳秋,赵永贞,刘挺.一个普通话文语转换系统中的韵律模型[J].计算机应用研究,2006,23(6):79-81. 被引量：1
3侯传宇.马尔可夫及隐马尔可夫模型在数据挖掘中的应用[J].电脑知识与技术,2008(3):1186-1188. 被引量：5
4胡锡衡.正向最大匹配法在中文分词技术中的应用[J].鞍山师范学院学报,2008,10(2):42-45. 被引量：18
5李波,褚振勇,张圣杰,毛玉泉,王宝良.基于小语料库训练的语音转换系统[J].中国科技信息,2008(18):28-29. 被引量：2
6苏珊珊.基于波形拼接的语音合成技术研究[J].福建电脑,2008,24(10):104-105. 被引量：1
7陈小莹,陈晨,华侃,于洪志.语音语料库的设计研究[J].科技信息,2008(36):5-6. 被引量：7
8梅勇,王群生,徐秉铮.将词类信息融入三元文法统计模型的汉语音字转换方法[J].电子科学学刊,1998,20(5):625-630. 被引量：3
9才让卓玛,才智杰.基于语料库的藏语TTS技术研究[J].青海师范大学学报（自然科学版）,2010,26(2):66-69. 被引量：2
10阿依木尼萨.胡甫尔,艾斯卡尔.艾木都拉.面向语音合成的维吾尔语音素自动切分算法研究[J].计算机应用与软件,2011,28(9):18-21. 被引量：4

引证文献1

1井晓阳,罗飞,王亚棋.汉语语音合成技术综述[J].计算机科学,2012,39(S3):386-390. 被引量：13

二级引证文献13

1那勇,李明全.基于深度学习的中文自动分词研究[J].吉林广播电视大学学报,2019(12):58-59.
2赵建东,高光来,飞龙.基于HMM的蒙古语语音合成技术研究[J].计算机科学,2014,41(1):80-82. 被引量：6
3侯华洋,苏伟,蔡川,李廉,李辉.基于MathML的数学公式中文发音方法研究[J].系统科学与数学,2014,34(4):402-412. 被引量：2
4林小平,鲁青,郭伟,邓杰航,王超.一种SmartFusion FPGA的快速语音合成系统设计[J].广东工业大学学报,2014,31(2):43-48. 被引量：3
5鲁小勇,潘涛,高兰德.基于广义回归神经网络的情感语音韵律特征预测[J].自动化与仪器仪表,2015(2):145-146.
6牛其其日乐格.蒙古语语音合成技术的研究[J].民营科技,2016(4):262-262.
7王崇羽,刘锋.一种面向用户的卫星状态监视系统设计[J].航天器工程,2017,26(3):112-117.
8白海莉.情感语音合成技术或对声纹鉴定准确性产生影响[J].科技创新与应用,2018,8(36):24-24. 被引量：6
9王峥.语音合成技术在声音修复上的尝试[J].现代电影技术,2019,0(7):46-50. 被引量：2
10杨随先,刘行,康慧,李晴.互联网+智能设计背景下的交互设计与体验[J].包装工程,2019,40(16):1-13. 被引量：20

1谢政.让你拥有一台“会说话的电脑”——天音话王98使用印象[J].微电脑世界,1999,0(6):35-36.
2井晓阳,罗飞,王亚棋.汉语语音合成技术综述[J].计算机科学,2012,39(S3):386-390. 被引量：13
3向农,康小宁.液晶显示器的背后[J].微电脑世界,2001(18):32-38.
4余玮.胡伟武:创“芯”与创新的传奇[J].科学24小时,2010(10):36-38.
5余玮.胡伟武:创“芯”与创新的传奇[J].今日科苑,2010(15):69-71.
6魏茂盛,章森.汉语语音合成中文本处理的几个问题[J].山东建材学院学报,1999,13(1):73-75. 被引量：5
7李涛.微软力推可验证软件[J].新电脑,2009,33(11):167-167.
8陶建华.语音合成技术的发展、关键技术及应用[J].CTI世界（计算机与电信集成世界）,2001(3):26-32. 被引量：2
9王志堂,蔡淋波.隐马尔可夫模型(HMM)及其应用[J].湖南科技学院学报,2009,30(4):42-44. 被引量：15
10杜长磊.计算机信息管理系统安全的对策探讨[J].亚太教育,2015,0(17):143-144. 被引量：1

世界科技研究与发展

2002年第5期

浏览历史

内容加载中请稍等...

中国计算机产业的下一个亮点——汉语语音合成的实用化被引量：1

参考文献1

同被引文献12

引证文献1

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

中国计算机产业的下一个亮点——汉语语音合成的实用化 被引量：1

参考文献1

同被引文献12

引证文献1

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

中国计算机产业的下一个亮点——汉语语音合成的实用化被引量：1