-
题名基于双路径循环神经网络的单通道语音增强
被引量:6
- 1
-
-
作者
王志杰
张学良
-
机构
内蒙古大学计算机学院
-
出处
《信号处理》
CSCD
北大核心
2021年第10期1872-1879,共8页
-
基金
国家自然科学基金项目(61876214)。
-
文摘
近年来,随着神经网络的应用,语音增强效果显著提升。但对关联性较强的长序列语音数据,单一的网络结构受到自身性能的限制可能无法继续提升增强效果。为了进一步提升神经网络对语音增强的效果,本文将一种被称为双路径循环神经网络(dual-path recurrent neural network,DPRNN)的复合网络结构应用在语音增强任务中。该复合网络结构由卷积神经网络(convolution neural network,CNN)和长短时记忆神经网络(Long short-term memory,LSTM)组成,网络的核心是两个LSTM组成的双路径循环神经网络块(DPRNN Block)。DPRNN将长序列语音数据分割为重叠帧数据块,利用DPRNN Block对这些数据块执行块内计算和块间计算,以此实现数据的局部和全局建模。实验结果表明,相比于单一网络结构,DPRNN在已知噪声和未知噪声条件下均取得最好结果。
-
关键词
语音增强
双路径循环神经网络
长短时记忆网络
卷积神经网络
-
Keywords
speech enhancement
dual-path recurrent neural network
long short-term memory
convolution neural network
-
分类号
TN912.35
[电子电信—通信与信息系统]
-
-
题名基于TasNet的单通道语音分离技术的研究综述
被引量:1
- 2
-
-
作者
陆炜
朱定局
-
机构
华南师范大学计算机学院
-
出处
《计算机与现代化》
2022年第11期119-126,共8页
-
基金
国家自然科学基金重点项目资助(U18112000)。
-
文摘
语音分离是声学信号处理中的一项基本任务,具有广泛的应用。得益于深度学习的发展,近年来单通道语音分离系统的性能有了显着提升。特别是,随着一种被称为时域音频网络(Time-domain audio separation Network,TasNet)的新语音分离方法被提出,语音分离技术的研究也逐步从基于时-频域的传统方法过渡至基于时域的方法。本文综述基于TasNet的单通道语音分离技术的研究现状与展望。在回顾基于时-频域的语音分离传统方法之后,本文重点介绍基于TasNet的Conv-TasNet模型以及DPRNN模型,并对比针对各模型的改进研究。最后,本文阐述目前基于TasNet的单通道语音分离模型的局限性,并从模型、数据集、说话人数量以及如何解决复杂场景下的语音分离等层面对未来的研究方向进行讨论。
-
关键词
语音分离
时域音频网络
全卷积时域音频网络
双路径循环神经网络
-
Keywords
speech separation
TasNet
Conv-TasNet
DPRNN
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
-