语音合成中的语言学计算模型:现状及展望被引量：5

Linguistic models in speech synthesis:The state of the art

导出

摘要本文对应用于语音合成的文本处理技术的现状进行了总结,其中涉及了三个计算模型:自动分词器、自动标音器、韵律预测器。在分析现阶段语音合成系统存在的与文本处理模块相关联的注音错误、韵律结构预测偏差、韵律描述过于简略等三方面问题之后,指出在语言学计算模型中必须应用更为丰富的语言学知识,并提出为解决这些问题可能的技术实现路径。 This paper examines the state-of-the-art technology in text processing modular used in speech synthesis systems.It includes three computing models:parser,phonetizer and prosodic structure predictor.Problems associated with phonetic error occurrence,prosodic structure prediction and prosodic description in current systems are analyzed.As solutions to these problems,richer linguistic information is proposed to be integrated into the linguistic models and methodologies for achieving the goals are also explored.

作者朱维彬

机构地区北京交通大学

出处《当代语言学》 CSSCI 北大核心 2009年第2期159-166,共8页 Contemporary Linguistics

基金国家863计划项目2006AA010104 2007AA01Z198研究基金的支持

关键词语音合成语言学模型文本分析韵律预测数据驱动 speech synthesis,linguistic model,speech parser,phonetizer,prosody prediction

分类号 H11 [语言文字—汉语]

引文网络
相关文献

参考文献20

1Black, A. and N. Campbell. 1995. Optimising selection of units from speech databases for concatenative synthesis. Proceedings of Eurospeech 1995. Pp. 551 -4.
2Cao, Jianfen and Zhu Weibin. 2002. Syntactic and lexical constraint in prosodic segmentation and grouping. Proceedings of Speech Prosody 2002. Pp. 203-6.
3Chu, Min and Qian Yao. 2001. Locating boundaries for prosodic constituents in unrestricted Mandarin text. Computational Linguistics and Chinese Language Processing 6,1:1- 22.
4Fujisaki, H. 2004. Information, prosody, and modeling: With emphasis on tonal features of speech. Proceedings of Speech Prosody 2004. Pp. 1 -10.
5Li, Aijun, Zu Yiqing, and Li Zhiqiang. 1999. A national database design for speech synthesis and prosodic labeling of standard Chinese. Proceedings of Oriental COCOSDA 199.
6Li, Wei, Lin Zhenhua, Hu Yu, and Wang Renhua. 2001. A statistical method for computing candidate unit cost in corpus based chinese speech synthesis system. Proceedings of ICCC 2001.
7Ma, Xijun, Zhang Wei, and Zhu Weibin, et al. 2004. Probability prosody model for unit selection. Proceedings of ICASSP 2004. Pp. 649 - 52.
8Pan, Shimei. 2002. Prosody modeling in concept-to-speech generation. Ph.D. diss. , Columbia University.
9Pan, Shimei and K.R. McKeown. 1997. Integrating language generation with speech synthesis in a concept to speech system. Proceedings of ACL/EACLI97 Concept to Speech Workshop. Pp. 23-8.
10Shi, Qin, Ma Xijun, and Zhu Weibin, et al. 2002. Statistic prosody structure prediction. Proceedings of IEEE TTS Workshop 2002. Pp. 155-8.

二级参考文献31

1孙茂松.谈谈汉语分词语料库的一致性问题[J].语言文字应用,1999(2):90-93. 被引量：20
2黄昌宁.中文信息处理中的分词问题[J].语言文字应用,1997(1):74-80. 被引量：83
3孙茂松,张磊.人机并存,“质”“量”合一—谈谈制定信息处理用汉语词表的策略[J].语言文字应用,1997(1):81-88. 被引量：7
4刘开瑛.现代汉语自动分词评测技术研究[J].语言文字应用,1997(1):103-108. 被引量：15
5孙茂松,邹嘉彦.汉语自动分词研究评述[J].当代语言学,2001,3(1):22-32. 被引量：101
6杨尔弘,方莹,刘冬明,乔羽.汉语自动分词和词性标注评测[J].中文信息学报,2006,20(1):44-49. 被引量：16
7王惠詹卫东俞士汶.现代汉语语义词典规格说明书.汉语语言与计算学报,2003,13(2):159-176.
8Black A,Campbell N.Optimising selection of units from speech databases for concatenative synthesis[C]∥Proceedings of Eurospeech 1995.Madrid,Spain:[s.n.],1995:581-584.
9Black A.Perfect synthesis for all of the people all of the time[C]∥Proceedings of IEEE TTS Workshop 2002.Santa Monica,USA:[s.n.],2002:167-170.
10Chu Min,Peng Hu,Chang Eric.Selecting non-uniform units from a very large corpus for concatenative speech synthesizer[C]∥Proceedings of IEEE International Conference on Acoustics,Speech,and Signal Processing 2001.Sale Lake City,USA:[s.n.],2001:785-788.

共引文献255

1唐琳,郭崇慧,陈静锋.中文分词技术研究综述[J].数据分析与知识发现,2020,4(2):1-17. 被引量：43
2李对红,王裴岩 ,张桂平,张少阳.基于字簇的多模型中文分词方法研究[J].计算机应用研究,2020,37(2):355-359. 被引量：2
3王蔚,吴建明,刘磊.汉字的理据性[J].汉字文化,2024(5):129-133.
4宋凯丽,李云岭,姚露露.基于条件随机场的分词标注一体化地址解析方法[J].测绘地理信息,2021,46(S01):185-187. 被引量：4
5于江德,谷川,葛文英,樊孝忠.一种基于字和子串联合标注的汉语分词方法[J].山西大学学报（自然科学版）,2011,34(3):357-362. 被引量：2
6赵海,揭春雨.基于有效子串标注的中文分词[J].中文信息学报,2007,21(5):8-13. 被引量：26
7李知兵,李龙澍.基于数据驱动的中文分词方法研究[J].现代计算机,2007,13(12):8-10. 被引量：1
8麦范金,王挺.基于双向最大匹配和HMM的分词消歧模型[J].现代图书情报技术,2008(8):37-41. 被引量：9
9苏珊珊.基于波形拼接的语音合成技术研究[J].福建电脑,2008,24(10):104-105. 被引量：1
10王凡秀.基于条件随机场的中文地名识别[J].中国西部科技,2008,7(28):8-8.

同被引文献42

1陶建华.基于统计和规则相结合的汉语语音合成的韵律模型[J].声学技术,2003,22(z2):359-361. 被引量：1
2初敏.自然言语的韵律组织中的不确定性及其在语音合成中的应用[J].中文信息学报,2004,18(4):66-71. 被引量：2
3张国宪.单双音节形容词的选择性差异[J].汉语学习,1996(3):3-9. 被引量：19
4吴为善.主谓结构前的单音节能否站得住?[J].汉语学习,1990(2):10-12. 被引量：2
5吴为善.论汉语后置单音节的粘附性[J].汉语学习,1989(1):16-19. 被引量：28
6吴为善.现代汉语三音节组合规律初探[J].汉语学习,1986(5):1-2. 被引量：40
7刘丹青.汉语中的框式介词[J].当代语言学,2002,4(4):241-253. 被引量：198
8王洪君.音节单双、音域展敛(重音)与语法结构类型和成分次序[J].当代语言学,2001,3(4):241-252. 被引量：101
9蔡莲红.波形编辑语音合成技术及在汉语TTS中的应用[J].小型微型计算机系统,1994,15(10):11-16. 被引量：7
10张国宪.形名组合的韵律组配图式及其韵律的语言地位[J].当代语言学,2005,7(1):35-52. 被引量：28

引证文献5

1周开来.中文语音合成系统过程分析及实现初探[J].现代计算机,2010,16(4):73-77.
2周开来.基于语音数据库的文语转换系统过程分析[J].计算机时代,2010(7):7-9. 被引量：1
3裴雨来.词类-音节数序列与语句韵律结构关联及韵律结构预测[J].语言科学,2011,10(6):574-585. 被引量：3
4马立东.英语语音合成系统超前端文本分析知识库的构建[J].电脑与信息技术,2013,21(5):47-51. 被引量：1
5张斌,全昌勤,任福继.语音合成方法和发展综述[J].小型微型计算机系统,2016,37(1):186-192. 被引量：29

二级引证文献34

1张小军,张宇.大规模语音语料库的文语转换技术研究[J].通讯世界,2015,21(9):283-283.
2佘陈凤,余远波,陈静娴,曹友,陈泽游.多语种医嘱播报系统设计与实现[J].软件工程,2016,19(5):47-50. 被引量：3
3裴雨来,邱金萍.音步结构对语句形式的影响研究[J].西安外国语大学学报,2016,24(3):38-41.
4崔鑫彤.语音合成技术专利分析[J].电子技术与软件工程,2018(4):142-142. 被引量：4
5童新,姚莉,倪波.基于物联网的Cortex-A53智能云镜系统的设计与实现[J].物联网技术,2018,8(5):48-50. 被引量：3
6白海莉.情感语音合成技术或对声纹鉴定准确性产生影响[J].科技创新与应用,2018,8(36):24-24. 被引量：6
7王峥.语音合成技术在声音修复上的尝试[J].现代电影技术,2019,0(7):46-50. 被引量：2
8张学军,董晓辉.高中人工智能课程项目案例资源设计与开发[J].电化教育研究,2019,40(8):87-95. 被引量：20
9王莉.以C++与Windows设计为基础的计算机辅助英语教学[J].现代科学仪器,2019,0(3):30-32.
10张轶秋,王卫民,唐洋,张健.基于状态机的手语动画自动生成技术[J].计算机与数字工程,2020,48(1):217-220. 被引量：2

1朱维彬,吕士楠.基于语义的语音合成——语音合成技术的现状及展望[J].北京理工大学学报,2007,27(5):408-412. 被引量：8
2夏秀燕,王迎雪.基于HTK平台的语言学模型[J].信息技术,2009(6):207-208.
3朱维彬.基于语义的语音合成——语音合成技术的现状及展望[J].中国学术期刊文摘,2007,13(20):8-8.
4赵颖.基于HMM的藏语TTS语调韵律预测[J].西南民族大学学报（自然科学版）,2010,36(6):1060-1062.
5李海.单片机的嵌入式TCP/IP协议栈设计及其实现路径[J].电子测试,2016,27(10X):5-6. 被引量：4
6潘正强,周经伦,郑龙.预测偏差的LS-SVM预测控制[J].火力与指挥控制,2008,33(11):43-45. 被引量：1
7艾金勇,陈小莹,刘泽国.藏语自动标音系统的设计与实现[J].智能计算机与应用,2015,5(6):33-35.
8王永鑫,蔡莲红.语法信息与韵律结构的分析与预测[J].中文信息学报,2010,24(1):65-70. 被引量：13
9刘晓坤.一种输入法引发的口水战[J].多媒体世界,2007(5):25-25.
10郝东亮,杨鸿武,张策,张帅,郭立钊,杨静波.面向汉语统计参数语音合成的标注生成方法[J].计算机工程与应用,2016,52(19):146-153. 被引量：1

当代语言学

2009年第2期

浏览历史

内容加载中请稍等...

语音合成中的语言学计算模型:现状及展望被引量：5

参考文献20

二级参考文献31

共引文献255

同被引文献42

引证文献5

二级引证文献34

相关作者

相关机构

相关主题

浏览历史

语音合成中的语言学计算模型:现状及展望 被引量：5

参考文献20

二级参考文献31

共引文献255

同被引文献42

引证文献5

二级引证文献34

相关作者

相关机构

相关主题

浏览历史

语音合成中的语言学计算模型:现状及展望被引量：5