期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于梯度归一化的端到端语音合成自适应损失权衡
1
作者 陈宽 陈涛 +2 位作者 尤玮珂 周琳娜 杨忠良 《网络空间安全科学学报》 2024年第1期72-82,共11页
语音合成技术是指给定文本经过模型处理生成目标说话人语音的过程,该技术在现实社会中已经得到广泛应用。在众多的语音合成模型中,VITS(The Variational Inference for Text-to-Speech)模型将多任务损失函数进行有效组合,相比以往的模型... 语音合成技术是指给定文本经过模型处理生成目标说话人语音的过程,该技术在现实社会中已经得到广泛应用。在众多的语音合成模型中,VITS(The Variational Inference for Text-to-Speech)模型将多任务损失函数进行有效组合,相比以往的模型,能够生成质量更高、听感更自然的语音。然而,现有模型依赖多个损失函数,暂时缺乏对其有效权衡的研究。因此,在现有模型损失函数的基础上,引入了梯度归一化自适应损失平衡优化方法,它根据模型不同损失函数的量级与不同子任务的训练速度来平衡各损失函数之间的权重,以验证该方法在语音合成任务中的适用性。在公开的中文语音合成数据集上评估了该方法合成语音的准确度与自然度,结果表明,采用此损失函数的模型在性能上得到了提升,证明了方法的有效性。 展开更多
关键词 文本转语音 端到端语音合成 多任务学习 多目标优化 梯度归一化
下载PDF
视频隐写分析技术研究综述 被引量:5
2
作者 张弘 尤玮珂 赵险峰 《信息安全学报》 CSCD 2018年第6期13-27,共15页
作为当今最流行的传播媒介之一,数字视频被普遍视为一种理想的隐蔽通信载体,视频隐写和视频隐写分析技术也因此吸引了信息隐藏领域研究者的广泛关注,成为该领域的研究热点之一。近年来,视频隐写技术的快速发展,使得视频隐写分析面临着... 作为当今最流行的传播媒介之一,数字视频被普遍视为一种理想的隐蔽通信载体,视频隐写和视频隐写分析技术也因此吸引了信息隐藏领域研究者的广泛关注,成为该领域的研究热点之一。近年来,视频隐写技术的快速发展,使得视频隐写分析面临着巨大的挑战。本文对当前视频隐写分析领域的研究现状进行了综述概括,重点阐述了关于压缩域视频隐写分析技术的研究进展。针对不同类型的嵌入域,分别归纳了相应隐写分析技术的原理,并对其中的经典方法进行了详细介绍和分析。此外,还对未来视频隐写分析领域可能的研究重点和发展方向进行了讨论和展望。 展开更多
关键词 信息隐藏 视频隐写分析 视频编码 隐写
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部