-
题名基于TasNet的单通道语音分离技术的研究综述
被引量:1
- 1
-
-
作者
陆炜
朱定局
-
机构
华南师范大学计算机学院
-
出处
《计算机与现代化》
2022年第11期119-126,共8页
-
基金
国家自然科学基金重点项目资助(U18112000)。
-
文摘
语音分离是声学信号处理中的一项基本任务,具有广泛的应用。得益于深度学习的发展,近年来单通道语音分离系统的性能有了显着提升。特别是,随着一种被称为时域音频网络(Time-domain audio separation Network,TasNet)的新语音分离方法被提出,语音分离技术的研究也逐步从基于时-频域的传统方法过渡至基于时域的方法。本文综述基于TasNet的单通道语音分离技术的研究现状与展望。在回顾基于时-频域的语音分离传统方法之后,本文重点介绍基于TasNet的Conv-TasNet模型以及DPRNN模型,并对比针对各模型的改进研究。最后,本文阐述目前基于TasNet的单通道语音分离模型的局限性,并从模型、数据集、说话人数量以及如何解决复杂场景下的语音分离等层面对未来的研究方向进行讨论。
-
关键词
语音分离
时域音频网络
全卷积时域音频网络
双路径循环神经网络
-
Keywords
speech separation
TasNet
Conv-TasNet
DPRNN
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
-