检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到8篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

基于Tacotron模型的油田射孔语音合成方案: 1; 作者杜睿山陈思路 +4 位作者李阳张可佳杨丽波解红涛宋欣雨《系统仿真技术》 2020年第4期231-234,共4页; 射孔施工作业是油田开采的关键步骤之一。针对油田射孔操作依赖井场人工操控的局限,将语音合成技术应用到油田射孔操作中,实现了射孔设备远程操作。在油田射孔操作指令数据集的基础上,实现姿势指令与操作指令的映射,并使用Tacotron模型... 展开更多; 关键词油田射孔语音合成 tacotron; 下载PDF 职称材料

一种基于Tacotron 2的端到端中文语音合成方案被引量：13: 2; 作者王国梁陈梦楠陈蕾《华东师范大学学报（自然科学版）》 CAS CSCD 北大核心 2019年第4期111-119,共9页; 颠覆性设计的端到端语音合成系统Tacotron 2,目前仅能处理英文.致力于对Tacotron 2进行多方位改进,设计了一种中文语音合成方案,主要包括:针对汉字不表音、变调和多音字等问题,添加预处理模块,将中文转化为注音字符;针对现有中文训练语... 展开更多; 关键词语音合成多头注意力 tacotron 2; 下载PDF 职称材料

城市台虚拟数字人的研究与实践: 3; 作者孙德莱《广播与电视技术》 2024年第10期15-19,共5页; 本文通过调查分析城市台现有融媒体演播室的现实情况,对基于模板化制作的虚拟数字人资讯包装系统进行了研究和实践,在2D数字人系统的建设费用、制作流程、制作人员方面大幅降低了成本,实现了一种4K高效新媒体微视频/广播级电视栏目制作... 展开更多; 关键词虚拟数字人模板化制作 tacotron2模型多模态; 下载PDF 职称材料

基于条件变分自编码器的端到端情感语音合成方法被引量：4: 4; 作者张建明彭锦涛 +1 位作者贾洪杰毛启容《信号处理》 CSCD 北大核心 2023年第4期678-687,共10页; 情感语音合成作为语音合成的一个重要分支,在人机交互领域得到了广泛的关注。如何获得更好的情感嵌入并有效地将其引入到语音合成声学模型中是目前主要存在的问题。表达性语音合成往往从参考音频中获得风格嵌入,但只能学习到风格的平均... 展开更多; 关键词情感语音合成条件变分自编码器端到端 tacotron; 下载PDF 职称材料

不同粒度嵌入单元的端到端语音合成技术研究被引量：1: 5; 作者姑丽斯坦·奥布力喀斯木帕力旦·吐尔逊艾斯卡尔·艾木都拉《现代计算机》 2021年第24期14-20,共7页; 语音合成是人机交互、人工智能领域的核心技术,传统的语音合成技术相对复杂,需要大量领域专业知识,设计和实现的门槛较高。深度学习方法的应用,像WaveNet、Tacotron等提出降低了语音合成的实现难度。针对维吾尔语语音合成中的复杂前端,... 展开更多; 关键词语音合成深度学习端到端 tacotron 多粒度维吾尔语; 下载PDF 职称材料

基于CBHG的Mel谱精细结构重建被引量：2: 6; 作者唐君张连海李嘉欣《信息工程大学学报》 2022年第2期135-140,共6页; 在大多数语音合成系统中,预测的Mel谱的质量直接决定了最终合成语音的质量。基于Tacotron 2的框架预测的Mel谱通常缺乏接近真实数据的精细结构,为解决此问题,提出一种基于CBHG的后处理网络。该后处理网络通过对解码输出的Mel谱进行分析... 展开更多; 关键词语音合成 CBHG Mel谱后处理网络 tacotron 2 HiFi-GAN; 下载PDF 职称材料

端到端的藏语语音合成方法被引量：2: 7; 作者拉巴顿珠珠杰 +1 位作者欧珠尼玛《应用声学》 CSCD 北大核心 2023年第2期324-332,共9页; 近年来,得益于计算机运算能力的提高和语音数据的不断积累,涌现出许多基于机器学习的语音处理新技术,其中基于深度神经网络算法,端到端的Tacotron2语音合成系统框架得到业界广泛的青睐。它是一个开源程序,简单易行,已成功地应用于多种... 展开更多; 关键词语音合成藏语字音转换端到端 tacotron2; 下载PDF 职称材料

一种基于改进注意力机制的实时鲁棒语音合成方法被引量：1: 8; 作者唐君张连海李嘉欣《信号处理》 CSCD 北大核心 2022年第3期527-535,共9页; 针对现有的语音合成系统Tacotron 2中存在的注意力模型学习慢、合成语音不够鲁棒以及合成语音速度较慢等问题,提出了三点改进措施:1.采用音素嵌入作为输入,以减少一些错误发音问题;2.引入一种注意力损失来指导注意力模型的学习,以实现... 展开更多; 关键词语音合成注意力损失机制 tacotron 2 WaveGlow 序列到序列; 下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部