-
题名基于多领域条件生成的语音情感转换
- 1
-
-
作者
姚文翰
柯登峰
黄良杰
胡睿欣
项敏特
张劲松
-
机构
北京语言大学信息科学学院
-
出处
《郑州大学学报(理学版)》
CAS
北大核心
2023年第5期67-72,共6页
-
基金
汉考国际科研基金项目(HT-202011-374)。
-
文摘
语音情感转换是在不改变话者声纹、语义的情况下,将一种情感语音转换成另一种情感语音的技术,本质是实现语音的风格迁移。主流的风格迁移技术有对抗生成技术(如CycleGAN,StarGAN)和实例规一化技术(如IN,CIN)。CIN相对于IN添加了均值方差选择性模块,具有更强的风格迁移能力。提出了将StarGAN和CIN结合的语音情感转换模型CIN-StarGAN,将CIN模块嵌入到StarGAN生成器。在ESD数据集上的实验结果表明,CINStarGAN比基于CycleGAN的情感转换模型收敛速度快28%,具有较好的风格转换能力。在多领域情感转换方法上具有潜在研究价值。
-
关键词
语音情感转换
域转换
条件实例归一化
生成对抗网络
-
Keywords
emotional speech conversion
domain transfer
conditional instance normalization
generator adversarial network
-
分类号
TN912.3
[电子电信—通信与信息系统]
-
-
题名基于条件流的人脸正面化生成对抗模型
- 2
-
-
作者
张鹏升
解易
刘钊
-
机构
中国人民公安大学信息技术与网络安全学院
北京燧原智能科技有限公司
中国人民公安大学网络空间安全与法治协同创新中心
-
出处
《计算机应用与软件》
北大核心
2019年第12期156-161,183,共7页
-
基金
国家重点研发项目课题(2018YFC0809800)
公安部公安理论软科学项目(2018LLYJGADX014)
-
文摘
根据侧面人脸合成正面人脸一直是计算机视觉领域中的一个难题。对此设计基于条件流的人脸正面化生成对抗网络模型。采用Glow模型作为生成网络实现高效的推理和合成;采用条件实例归一化层(CIN)来控制正面人脸的生成;采用变分判别器瓶颈(VDB),以潜在变量对身份进行判别,生成身份一致的正面人脸。在Multi PIE数据集上进行实验,实验分析表明,该网络模型可以生成更具真实性和多样性的正面人脸图片。
-
关键词
人脸正面化
流模型
生产对抗网络
条件实例归一化层
变分判别器瓶颈
-
Keywords
Face frontalization
Flow model
Generative adversarial network
Conditional instance normalization layer
Variational discriminator bottleneck
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
-