期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于全相位滤波器组频带鉴别的生成对抗网络声码器设计
被引量:
1
1
作者
黄翔东
王俊芹
+1 位作者
马金英
张烜溢
《天津大学学报(自然科学与工程技术版)》
EI
CAS
CSCD
北大核心
2023年第8期815-822,共8页
为实现高质量、高效率、低成本的语音合成,设计开发了一种基于全相位滤波器组频带鉴别的生成对抗网络声码器APFB-GAN.该声码器以现有的HiFi-GAN为参考,在生成器中,削减了HiFi-GAN多感受野融合模块约60%的参数.在鉴别器中做了两点改进:...
为实现高质量、高效率、低成本的语音合成,设计开发了一种基于全相位滤波器组频带鉴别的生成对抗网络声码器APFB-GAN.该声码器以现有的HiFi-GAN为参考,在生成器中,削减了HiFi-GAN多感受野融合模块约60%的参数.在鉴别器中做了两点改进:一是将HiFi-GAN中多尺度鉴别器与多周期鉴别器替换为基于全相位滤波器组的鉴别器,克服了原有模型无法依据语音能量非均匀频带分布,灵活进行特征特征提取的缺点;二是提出基于频带加权的多窗长的短时傅里叶变换谱损失函数,配合鉴别器更好地稳定训练.实验结果表明:APFB-GAN声码器合成的语音质量可与HiFi-GAN相媲美,且其高频细节特征更为突出,模型参数只为HiFi-GAN的28.78%,在GPU上的合成速度是HiFi-GAN的2.4倍.
展开更多
关键词
语音合成
声码器
生成对抗网络
全相位滤波器组
下载PDF
职称材料
题名
基于全相位滤波器组频带鉴别的生成对抗网络声码器设计
被引量:
1
1
作者
黄翔东
王俊芹
马金英
张烜溢
机构
天津大学电气自动化与信息工程学院
天津职业技术师范大学电子工程学院
天津大学佐治亚理工深圳学院
出处
《天津大学学报(自然科学与工程技术版)》
EI
CAS
CSCD
北大核心
2023年第8期815-822,共8页
基金
青海省基础研究计划面上资助项目(2021-ZJ-910).
文摘
为实现高质量、高效率、低成本的语音合成,设计开发了一种基于全相位滤波器组频带鉴别的生成对抗网络声码器APFB-GAN.该声码器以现有的HiFi-GAN为参考,在生成器中,削减了HiFi-GAN多感受野融合模块约60%的参数.在鉴别器中做了两点改进:一是将HiFi-GAN中多尺度鉴别器与多周期鉴别器替换为基于全相位滤波器组的鉴别器,克服了原有模型无法依据语音能量非均匀频带分布,灵活进行特征特征提取的缺点;二是提出基于频带加权的多窗长的短时傅里叶变换谱损失函数,配合鉴别器更好地稳定训练.实验结果表明:APFB-GAN声码器合成的语音质量可与HiFi-GAN相媲美,且其高频细节特征更为突出,模型参数只为HiFi-GAN的28.78%,在GPU上的合成速度是HiFi-GAN的2.4倍.
关键词
语音合成
声码器
生成对抗网络
全相位滤波器组
Keywords
speech synthesis
vocoder
generative adversarial network(GAN)
all-phase filter bank(APFB)
分类号
TN912.33 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于全相位滤波器组频带鉴别的生成对抗网络声码器设计
黄翔东
王俊芹
马金英
张烜溢
《天津大学学报(自然科学与工程技术版)》
EI
CAS
CSCD
北大核心
2023
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部