深度学习语音合成技术综述被引量：15

Overview of Deep Learning Speech Synthesis Technology

下载PDF

导出

摘要语音合成技术在人机交互中扮演着重要角色,深度学习的发展带动语音合成技术高速发展。基于深度学习的语音合成技术在合成语音的质量和速度上都超过了传统语音合成技术。从基于深度学习的声码器和声学模型出发对语音合成技术进行综述,探讨各类声码器和声学模型的工作原理及其优缺点,在此基础上对语音合成系统进行综述,系统综述经典的基于深度学习的语音合成系统,对基于深度学习的语音合成技术进行展望。 Speech synthesis technology plays an important role in human-machine interaction.The development of deep learning drives the rapid development of speech synthesis technology.Speech synthesis technology based on deep learning surpasses traditional speech synthesis technology in both quality and speed.This paper reviews speech synthesis technology based on deep learning vocoders and acoustic models,discusses the working principles and advantages and disadvantages of various vocoders and acoustic models,and then summarizes the speech synthesis system,systematically reviews the classic speech synthesis system based on deep learning,and finally looks forward to the speech synthesis technology based on deep learning.

作者张小峰谢钧罗健欣杨涛 ZHANG Xiaofeng;XIE Jun;LUO Jianxin;YANG Tao(Command&Control Engineering College,Army Engineering University of PLA,Nanjing 210007,China;Unit 31121 of PLA,China)

机构地区中国人民解放军陆军工程大学指挥控制工程学院中国人民解放军

出处《计算机工程与应用》 CSCD 北大核心 2021年第9期50-59,共10页 Computer Engineering and Applications

基金国家部委科技基金江苏省自然科学基金青年基金项目(BK20150722)。

关键词语音合成声码器声学模型端到端语音合成系统 speech synthesis vocoder acoustic model end to end speech synthesis

分类号 TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献3

1张斌,全昌勤,任福继.语音合成方法和发展综述[J].小型微型计算机系统,2016,37(1):186-192. 被引量：29
2陈小东,宋文爱,刘晓峰.基于LPCNet的语音合成方法研究[J].计算机与数字工程,2020,48(5):1143-1147. 被引量：3
3张小峰,谢钧,罗健欣,俞璐.深度学习语音合成技术研究[J].计算机时代,2020(9):24-28. 被引量：5

二级参考文献11

1杨金辉,易中华,王煦法.一种基于Straight的语音焦点合成方法[J].计算机工程,2005,31(13):46-47. 被引量：3
2朱维彬.语音合成中的语言学计算模型:现状及展望[J].当代语言学,2009,11(2):159-166. 被引量：5
3章森,刘磊,刁麓弘.大规模语音语料库及其在TTS中应用的几个问题[J].计算机学报,2010,33(4):687-696. 被引量：12
4倪崇嘉,张爱英,刘文举.基于声学相关特征与词典语法相关特征的汉语重音检测[J].计算机学报,2011,34(9):1638-1649. 被引量：8
5王敬华,刘建银,张国燕,赵新想.情感语音合成中韵律参数的基频研究[J].小型微型计算机系统,2013,34(9):2047-2050. 被引量：2
6韩文静,李海峰,阮华斌,马琳.语音情感识别研究进展综述[J].软件学报,2014,25(1):37-50. 被引量：169
7戴礼荣,张仕良.深度语音信号与信息处理:研究进展与展望[J].数据采集与处理,2014,29(2):171-179. 被引量：33
8周志华,陈世福.神经网络集成[J].计算机学报,2002,25(1):1-8. 被引量：246
9纪正飚,王吉林,赵力.基于HMM的中英文语音合成技术研究[J].科学技术与工程,2014,22(32):237-240. 被引量：2
10蔡文彬,魏云龙,徐海华,潘林.混合单元选择语音合成系统的目标代价构建[J].计算机工程与应用,2018,54(24):20-25. 被引量：1

共引文献33

1程美,王力华.医疗智能语音技术与应用综述[J].中国数字医学,2021,16(8):1-7. 被引量：7
2潘梦鹞,吕小勇,陈少伟,郇锐铁,王锋.基于AI智能语音技术线上教学的创新与实践[J].创新创业理论研究与实践,2022(24):170-173. 被引量：1
3崔鑫彤.语音合成技术专利分析[J].电子技术与软件工程,2018(4):142-142. 被引量：4
4童新,姚莉,倪波.基于物联网的Cortex-A53智能云镜系统的设计与实现[J].物联网技术,2018,8(5):48-50. 被引量：3
5白海莉.情感语音合成技术或对声纹鉴定准确性产生影响[J].科技创新与应用,2018,8(36):24-24. 被引量：6
6王峥.语音合成技术在声音修复上的尝试[J].现代电影技术,2019,0(7):46-50. 被引量：2
7张学军,董晓辉.高中人工智能课程项目案例资源设计与开发[J].电化教育研究,2019,40(8):87-95. 被引量：20
8张轶秋,王卫民,唐洋,张健.基于状态机的手语动画自动生成技术[J].计算机与数字工程,2020,48(1):217-220. 被引量：2
9付婧,罗建,龙彦霖,苗晨,程玉勤.前馈序列记忆网络在语音识别中的应用综述[J].内江师范学院学报,2020,35(4):41-51. 被引量：4
10张学军,董晓辉.高中人工智能课程项目案例资源设计与开发[J].复印报刊资料（中学政治及其他学科教与学）,2019(12):15-22.

同被引文献139

1程美,王力华.医疗智能语音技术与应用综述[J].中国数字医学,2021,16(8):1-7. 被引量：7
2祁荣,陈军,余邵民.关于抑郁症的研究综述[J].心理月刊,2020(17):238-240. 被引量：11
3井晓阳,罗飞,王亚棋.汉语语音合成技术综述[J].计算机科学,2012,39(S3):386-390. 被引量：13
4曹犟,邬晓钧,夏云庆,郑方.基于拼音索引的中文模糊匹配算法[J].清华大学学报（自然科学版）,2009(S1):1328-1332. 被引量：14
5蒋杰.心理战历史渊源追溯——心理战发展史探究之一[J].空军政治学院学报,1996(4):73-75. 被引量：1
6赵海青.美国心理战部队大透视——战场“无形利剑”,不战而屈人之兵[J].国际展望,2002(6):40-43. 被引量：1
7孙一军.重视军事斗争准备中的心理战[J].政工学刊,2001(1):33-34. 被引量：1
8王长君,黄雁,高岩.超速行驶违法行为的分析和对策[J].交通运输工程与信息学报,2005,3(3):10-15. 被引量：10
9王鹏,欧立寿.试论心理战的地位及作用[J].国防科技,2006,27(3):75-77. 被引量：1
10张跃,蔡常青,孙桥.机动车测速仪现场测试技术的国内外现状[J].中国计量,2007(4):69-70. 被引量：8

引证文献15

1师庆科,郑涛.大型三甲医院患者智能随访语音平台设计与应用[J].中国数字医学,2021,16(8):22-27. 被引量：11
2姑丽斯坦·奥布力喀斯木,帕力旦·吐尔逊,艾斯卡尔·艾木都拉.不同粒度嵌入单元的端到端语音合成技术研究[J].现代计算机,2021,27(24):14-20. 被引量：1
3杨海涛,王华朋,楚宪腾,牛瑾琳,张琨瑶.基于深度卷积神经网络的伪造语音检测[J].警察技术,2022(1):33-36. 被引量：2
4张悦,朱利,练倩倩,韩冷,刘丽,张立肖.人工智能即将催生的心理战变革及启示[J].国防科技,2022,43(2):111-117. 被引量：1
5徐扬,张嘉宝,杨满玉,李晶,聂云丽.MFCCs和DTW在拼音相似度中的研究[J].电脑知识与技术,2022,18(14):1-4.
6罗伟,房云龙,吴旭东,朱慧媛.基于Android的盲用手机阅读器设计[J].中国集成电路,2022,31(10):66-71.
7翟乃强.语音合成技术在听力考试系统设计中的应用[J].青岛远洋船员职业学院学报,2022,43(3):78-82. 被引量：1
8王渭刚.基于TTS技术的智能化英语自动翻译系统[J].信息技术,2023,47(3):117-121. 被引量：1
9陈志业,张智骞,王兵,谢元坤.AI语音合成技术的应用与展望[J].影视制作,2023,29(3):51-55. 被引量：5
10邓丽君.基于语音识别技术的在线语言翻译交互学习系统的设计与实现[J].自动化与仪器仪表,2023(6):199-203. 被引量：2

二级引证文献25

1杨杰,刘佳,刘保延,文天才,张小平,张磊,潘溪水,陈卫党.基于慢病/传染病患者参与的临床评价随访平台模式的构建[J].中华中医药学刊,2022,40(4):151-153. 被引量：1
2裘君娜,孔长虹,金立明,徐烨彪,王翠娥,胡伟.献血咨询管理系统构建及应用[J].中国卫生质量管理,2022,29(7):94-96.
3文雯,张亚茹,时文杰,王静,饶曼,陈民,王亨,李佳佳.数字治理视角下弥合医患双方数字鸿沟的实践[J].中华医院管理杂志,2022,38(3):231-234. 被引量：4
4胡琼丹,陈霞,赵方方,陈珍凤.基于智能语音平台的脑卒中患者出院后随访模式构建及应用[J].军事护理,2022,39(12):55-57. 被引量：3
5涂琼引,成南.基于语音识别的英语翻译终端设计[J].自动化与仪器仪表,2023(1):251-256.
6陶毛毛,刘隽,廖骞,王旭东.基于AI智能语音随访的口腔科互联网门诊患者使用现状分析[J].上海口腔医学,2023,32(2):183-187. 被引量：4
7田华.智能化技术在音频制作中的应用与展望[J].电视技术,2023,47(5):89-92.
8林虹虹,徐丽群,吴汝明.基于VBA操作ACCESS数据库的局域网考试系统编制[J].工程技术研究,2023,8(12):145-146. 被引量：1
9杨洋,胡中健.人工智能时代美军网络隐蔽宣传行动变革及启示[J].情报杂志,2023,42(9):1-5. 被引量：1
10邢肖雅,屈小伶,仇金玮,李媛媛.智能化语音随访系统在老年糖尿病患者中的应用[J].中华现代护理杂志,2023,29(23):3179-3184. 被引量：1

1肖强.关于自动化技术在汽车机械制造领域中的应用探讨[J].数码设计,2021,10(10):57-57.
2杜睿山,陈思路,李阳,张可佳,杨丽波,解红涛,宋欣雨.基于Tacotron模型的油田射孔语音合成方案[J].系统仿真技术,2020,16(4):231-234.
3刘俊锋.初探证券投资基金的交易行为及其市场影响[J].投资与创业,2020(24):3-5. 被引量：1
4夏天睿,骆梓源.促进我国经济增长的财政支出结构研究[J].时代人物,2021(4):129-129.
5刘洋,战荫伟.基于改进SSD算法的小目标检测与应用[J].计算机科学与应用,2021,11(4):1061-1069. 被引量：2

计算机工程与应用

2021年第9期

浏览历史

内容加载中请稍等...

深度学习语音合成技术综述被引量：15

参考文献3

二级参考文献11

共引文献33

同被引文献139

引证文献15

二级引证文献25

相关作者

相关机构

相关主题

浏览历史

深度学习语音合成技术综述 被引量：15

参考文献3

二级参考文献11

共引文献33

同被引文献139

引证文献15

二级引证文献25

相关作者

相关机构

相关主题

浏览历史

深度学习语音合成技术综述被引量：15