期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于全相位滤波器组频带鉴别的生成对抗网络声码器设计 被引量:1
1
作者 黄翔东 王俊芹 +1 位作者 马金英 张烜溢 《天津大学学报(自然科学与工程技术版)》 EI CAS CSCD 北大核心 2023年第8期815-822,共8页
为实现高质量、高效率、低成本的语音合成,设计开发了一种基于全相位滤波器组频带鉴别的生成对抗网络声码器APFB-GAN.该声码器以现有的HiFi-GAN为参考,在生成器中,削减了HiFi-GAN多感受野融合模块约60%的参数.在鉴别器中做了两点改进:... 为实现高质量、高效率、低成本的语音合成,设计开发了一种基于全相位滤波器组频带鉴别的生成对抗网络声码器APFB-GAN.该声码器以现有的HiFi-GAN为参考,在生成器中,削减了HiFi-GAN多感受野融合模块约60%的参数.在鉴别器中做了两点改进:一是将HiFi-GAN中多尺度鉴别器与多周期鉴别器替换为基于全相位滤波器组的鉴别器,克服了原有模型无法依据语音能量非均匀频带分布,灵活进行特征特征提取的缺点;二是提出基于频带加权的多窗长的短时傅里叶变换谱损失函数,配合鉴别器更好地稳定训练.实验结果表明:APFB-GAN声码器合成的语音质量可与HiFi-GAN相媲美,且其高频细节特征更为突出,模型参数只为HiFi-GAN的28.78%,在GPU上的合成速度是HiFi-GAN的2.4倍. 展开更多
关键词 语音合成 声码器 生成对抗网络 全相位滤波器组
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部