期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
A blind separation method of overlapped multi-components based on time varying AR model 被引量:1
1
作者 CAI QuanWei WEI Ping XlAO XianCi 《Science in China(Series F)》 2008年第1期81-92,共12页
A method utilizing single channel recordings to blindly separate the multicomponents overlapped in time and frequency domains is proposed in this paper. Based on the time varying AR model, the instantaneous frequency ... A method utilizing single channel recordings to blindly separate the multicomponents overlapped in time and frequency domains is proposed in this paper. Based on the time varying AR model, the instantaneous frequency and amplitude of each signal component are estimated respectively, thus the signal component separation is achieved. By using prolate spheroidal sequence as basis functions to expand the time varying parameters of the AR model, the method turns the problem of linear time varying parameters estimation to a linear time invariant parameter estimation problem, then the parameters are estimated by a recursive algorithm. The computation of this method is simple, and no prior knowledge of the signals is needed. Simulation results demonstrate validity and excellent performance of this method. 展开更多
关键词 time varying AR model time and frequency domains overlap single channel multi-components separation recursive algorithm
原文传递
基于卷积神经网络的时域语音盲分离方法研究 被引量:1
2
作者 景源 孙浩源 《辽宁大学学报(自然科学版)》 CAS 2021年第3期204-214,共11页
已有的语音分离方法大多都是通过混合信号的频域表示来处理分离问题,然而这些方法一直存在着包括信号的相位与幅度的解耦、语音分离时频表示的次优性以及计算频谱的高时间延迟等问题.为了探索处理上述问题的方法,在原有卷积时域网络(Con... 已有的语音分离方法大多都是通过混合信号的频域表示来处理分离问题,然而这些方法一直存在着包括信号的相位与幅度的解耦、语音分离时频表示的次优性以及计算频谱的高时间延迟等问题.为了探索处理上述问题的方法,在原有卷积时域网络(Conv-TasNet)的卷积运算中对语音信号的长期依赖性进行了重新建模.为了弥补零填充导致的有效数据损失,新的时间卷积块会采取以递补数据代替零填充以保持输入输出长度一致,用有效数据代替卷积中的零填充来增加底层片段两端的卷积参与率,并减少相邻语音片段的20%层叠部分以减少计算量.改进后的模块用于分离两说话人的混合语音,得到的目标语音在信噪比方面比原方法改善了0.6%,相对于已有的时频掩蔽方法在性能相近的前提下其模型缩小为时频掩蔽方法的五分之一. 展开更多
关键词 语音分离 深度神经网络 端到端模型 时间卷积网络 时域 递补填充
下载PDF
结合SE与BiSRU的Unet的音乐源分离方法 被引量:5
3
作者 张瑞峰 白金桐 +1 位作者 关欣 李锵 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2021年第11期106-115,134,共11页
音乐源分离在音乐信息检索领域有着重要的研究价值。传统音乐源分离方法存在依赖假设、模型复杂度有限、表示能力不足等问题。能应对这些问题的时域深度学习端到端网络模型训练耗时长,且分离性能有待提升。为进一步改善时域端到端分离... 音乐源分离在音乐信息检索领域有着重要的研究价值。传统音乐源分离方法存在依赖假设、模型复杂度有限、表示能力不足等问题。能应对这些问题的时域深度学习端到端网络模型训练耗时长,且分离性能有待提升。为进一步改善时域端到端分离模型的表示能力和计算效率,在目前时域分离性能最优的Demucs模型基础上进行改进,提出了一种端对端网络Unet-SE-BiSRU。该模型在广义编码层和解码层中引入了注意力机制,采用挤压-激励块(SE)根据待分离音频的种类有选择地提取特征;在一维卷积后增加组归一化,以应对在学习过程中可能出现的梯度爆炸或梯度消失问题;将双向长短期记忆网络改进为双向简单循环单元(BiSRU),进一步提高了学习的并行性,且降低了模型参数量。实验结果表明,改进后的网络模型的信噪比指标提升了0.34 dB,在目前检索到的文献的时域端对端方法中取得了最好的分离性能,并且训练时间缩短为源模型的2/5。 展开更多
关键词 音乐源分离 U型网络 时域端到端分离模型 简单循环单元 挤压-激励块 组归一化
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部