一种轻量级全频带语音增强网络模型

A Light‑Weight Full‑Band Speech Enhancement Model

下载PDF

导出

摘要基于深度神经网络的全频带语音增强系统面临着计算资源需求高以及语音在各频段分布不平衡的困难。本文提出了一种轻量级全频带网络模型。该模型在双路径卷积循环网络模型的基础上,利用可学习的频谱压缩映射对高频段频谱信息进行有效压缩,同时利用多头注意力机制对频域的全局信息进行建模。实验结果表明本文模型只需0.89×106的参数即可实现有效的全频带语音增强,验证了本文模型的有效性。 Deep neural network based full-band speech enhancement systems face challenges of high demand of computational resources and imbalanced frequency distribution.In this paper,a light-weight full-band model is proposed based on dual path convolutional recurrent network with two dedicated strategies,i.e.,a learnable spectral compression mapping for more effective high-band spectral information compression,and the utilization of the multi-head attention mechanism for more effective modeling of the global spectral pattern.Experiments validate the efficacy of the proposed strategies and show that the proposed model achieves competitive performance with only 0.89×106 parameters.

作者胡沁雯侯仲舒乐笑怀卢晶 HU Qinwen;HOU Zhongshu;LE Xiaohuai;LU Jing(Key Laboratory of Modern Acoustics,Institute of Acoustics,Nanjing University,Nanjing 210093,China)

机构地区南京大学声学研究所

出处《数据采集与处理》 CSCD 北大核心 2023年第2期274-282,共9页 Journal of Data Acquisition and Processing

基金国家自然科学基金(12274221)。

关键词全频带语音增强深度学习多头注意力机制 full-band speech enhancement deep learning multi-head attention mechanism

分类号 TP301 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

1陈涛,陈迪霞,代亮.基于间歇采样的SAR盲移频干扰研究[J].天津大学学报（自然科学与工程技术版）,2023,56(2):207-213.
2王海麟,朱加良,何正熙,周新志.基于卷积径向基网络的多变量水位预测模型[J].水力发电学报,2023,42(3):70-81. 被引量：5
3刘敏,贾路生.农村水利工程施工中的水土流失与水土保持措施[J].中文科技期刊数据库（全文版）自然科学,2023(3):132-135.
4徐金凤.“再+V+数量”在汉语方言中的语序表达[J].花溪,2023(6):0098-0100.
5李厚新,曹超,赵鹏.动态秤安装环境振动测试与隔振系统设计[J].工业仪表与自动化装置,2023(2):80-83.
6梁裕铿,张学梅,万思成,韩忠彬.锂离子电池正极材料标准现状分析及整合建议[J].电池工业,2022,26(6):321-324. 被引量：2
7夏勇.中华人民共和国成立后地域总集整理出版之成就、问题与出路[J].南宁师范大学学报（哲学社会科学版）,2023,44(1):26-35.

数据采集与处理

2023年第2期

浏览历史

内容加载中请稍等...

一种轻量级全频带语音增强网络模型

相关作者

相关机构

相关主题

浏览历史