期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
6
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
结合LSTM与ResNet的声学回声消除
被引量:
1
1
作者
许春冬
徐锦武
+3 位作者
王茹霞
凌贤鹏
黄乔月
郭桥生
《传感器与微系统》
CSCD
北大核心
2023年第5期29-32,共4页
针对传统的声学回声消除(AEC)方法在双端讲话场景下较难实现快速收敛和动态自适应的问题,提出了一种结合长短时记忆(LSTM)与残差神经网络(ResNet)的AEC方法。通过使用LSTM和ResNet相结合的特征提取方法,同时提取到声学回声的时序特征和...
针对传统的声学回声消除(AEC)方法在双端讲话场景下较难实现快速收敛和动态自适应的问题,提出了一种结合长短时记忆(LSTM)与残差神经网络(ResNet)的AEC方法。通过使用LSTM和ResNet相结合的特征提取方法,同时提取到声学回声的时序特征和不同级别的抽象特征,且充分利用近端语音、近端麦克风语音和声学回声之间的幅度谱相似性的特点,引入它们之间的谱归一化互相关系数,构造了一种改进的理想二值掩蔽(iIBM)作为训练目标,此外引入深度可分离卷积使模型参数量减少了3.42 MB。实验结果表明:双端通话环境下所提出的方法相比参考算法取得了更高的客观评价得分。
展开更多
关键词
声学回声消除
双端讲话场景
长短时记忆网络
残差神经网络
理想二值掩蔽
深度可分离卷积
下载PDF
职称材料
结合HPSS的非负矩阵音乐分离方法
被引量:
7
2
作者
熊梅
张天骐
+1 位作者
张婷
杨凯
《计算机工程与设计》
北大核心
2018年第4期1089-1094,1154,共7页
为解决非负矩阵分解(NMF)在音乐分离中适应性差且过度依赖学习样本的问题,提出结合谐和与击打声源分离(HPSS)的非负矩阵音乐分离方法。在高分辨率下对音乐信号进行HPSS分离,保留谐和声源并利用灵活窗NMF对击打声源进行二次分离,对结合...
为解决非负矩阵分解(NMF)在音乐分离中适应性差且过度依赖学习样本的问题,提出结合谐和与击打声源分离(HPSS)的非负矩阵音乐分离方法。在高分辨率下对音乐信号进行HPSS分离,保留谐和声源并利用灵活窗NMF对击打声源进行二次分离,对结合理想二元掩蔽模型(IBM)分离出的伴奏及歌声的频谱做相应的傅里叶逆变换。利用公开音乐数据集进行实验仿真,实验结果表明,与传统的分离方法或者其它改进分离方法相比,该方法在分离性能上有明显提高。
展开更多
关键词
非负矩阵分解
音乐分离
谐和与击打声源分离
二次分离
二元掩蔽模型
下载PDF
职称材料
基于时间卷积网络的深度聚类说话人语音分离
被引量:
1
3
作者
王昕
蒋志翔
+3 位作者
张杨
寇金桥
常新旭
徐冬冬
《计算机工程与设计》
北大核心
2020年第9期2630-2635,共6页
“鸡尾酒会问题”在语音分离任务上一直是一个难题,主要因为这个问题属于一个说话人无关的语音分离问题,对于说话人事先不知道其先验信息。通过参考Jonathan等提出的深度聚类方法,在其基础上进行改进,提出基于时间卷及网络的深度聚类模...
“鸡尾酒会问题”在语音分离任务上一直是一个难题,主要因为这个问题属于一个说话人无关的语音分离问题,对于说话人事先不知道其先验信息。通过参考Jonathan等提出的深度聚类方法,在其基础上进行改进,提出基于时间卷及网络的深度聚类模型,以理想二值掩蔽作为分离目标并在公开中文语音数据集下进行实验。实验结果表明,相比传统深度聚类模型,所提模型在训练速度、分离后的语音质量和语音客观可懂度方面都得到了提升。
展开更多
关键词
语音分离
深度聚类模型
时间卷积网络
膨胀卷积
因果卷积
理想二值掩蔽
下载PDF
职称材料
基于CASA的噪声环境下的话者辨认
4
作者
李冬冬
唐建
+1 位作者
李然军
李辉
《小型微型计算机系统》
CSCD
北大核心
2016年第5期1107-1111,共5页
传统的说话人识别系统在噪声环境下的识别率较低.基于计算听觉场景分析得到的二值掩码可以对噪声占主导部分进行重建,从而将与说话人相关的被破坏的信息重建起来.但是重建的效果受到该帧中可靠帧的比例的影响.因此,根据提取的二值掩码...
传统的说话人识别系统在噪声环境下的识别率较低.基于计算听觉场景分析得到的二值掩码可以对噪声占主导部分进行重建,从而将与说话人相关的被破坏的信息重建起来.但是重建的效果受到该帧中可靠帧的比例的影响.因此,根据提取的二值掩码来设定阈值,从而对测试特征的帧进行选取,将测试特征的帧划分为三类,分别用于重建、保留和丢弃.最终使用重建后的帧和保留的帧进行后续处理,并用于识别过程.实验结果表明,相较于原来的重建系统,该算法的识别率有了一定的提高.
展开更多
关键词
计算听觉场景分析
Gammatone频率倒谱系数(GFCC)
理想二值掩码(
ibm
)
阈值
下载PDF
职称材料
基于不同时频掩模神经网络语音增强的研究
5
作者
邵榕梓
富晓乾
+2 位作者
田爱生
蒲俞姣
陈凯
《现代信息科技》
2020年第18期84-86,共3页
在基于时频掩模的深度神经网络语音增强系统中,学习目标的选择对于整体语音增强性能的影响极大,文章针对目前最常用的学习目标——理想二值掩模和理想浮值掩模在语音增强中的效果进行了研究,为验证不同时频掩消除噪声模性能的好坏,设计...
在基于时频掩模的深度神经网络语音增强系统中,学习目标的选择对于整体语音增强性能的影响极大,文章针对目前最常用的学习目标——理想二值掩模和理想浮值掩模在语音增强中的效果进行了研究,为验证不同时频掩消除噪声模性能的好坏,设计了多组对比实验,为以后深度学习训练过程中直接选择学习目标提供依据。仿真结果表明:在不同信噪比和不同噪声条件下,理想浮值掩模的性能均好过理想二值掩模。
展开更多
关键词
语音增强
学习目标
理想二值掩模
理想浮值掩模
下载PDF
职称材料
低信噪比下二值掩蔽算法性能分析
被引量:
3
6
作者
蒋毅
梁维谦
+1 位作者
周宏
冯振明
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2012年第5期636-641,共6页
基于计算听觉场景分析,对基于能量的二值掩蔽语音分离算法的性能进行分析,证明了理想二值掩蔽算法在信噪比下具有最佳的单元分离性能,并通过3种类型带噪语音的分离实验证实了该结论。采用理想二值掩蔽算法对8种噪声类型的低信噪比带噪...
基于计算听觉场景分析,对基于能量的二值掩蔽语音分离算法的性能进行分析,证明了理想二值掩蔽算法在信噪比下具有最佳的单元分离性能,并通过3种类型带噪语音的分离实验证实了该结论。采用理想二值掩蔽算法对8种噪声类型的低信噪比带噪语音进行了分离实验,信噪比平均提升幅度大于10dB,表明算法对低信噪比语音分离的有效性和普遍适用性;采用非均匀、均匀两种多子带分析滤波器组进行分离性能对比测试,结果表明子带均匀性对信噪比提升影响不大。分析滤波器组的子带数量应大于32以实现较好的分离性能。
展开更多
关键词
语音分离
听觉场景分析
理想二值掩蔽
gammatone滤波器组
原文传递
题名
结合LSTM与ResNet的声学回声消除
被引量:
1
1
作者
许春冬
徐锦武
王茹霞
凌贤鹏
黄乔月
郭桥生
机构
江西理工大学信息工程学院
安克创新科技股份有限公司
朝阳聚声泰(信丰)科技有限公司
出处
《传感器与微系统》
CSCD
北大核心
2023年第5期29-32,共4页
基金
国家自然科学基金资助项目(11864016,61671442)。
文摘
针对传统的声学回声消除(AEC)方法在双端讲话场景下较难实现快速收敛和动态自适应的问题,提出了一种结合长短时记忆(LSTM)与残差神经网络(ResNet)的AEC方法。通过使用LSTM和ResNet相结合的特征提取方法,同时提取到声学回声的时序特征和不同级别的抽象特征,且充分利用近端语音、近端麦克风语音和声学回声之间的幅度谱相似性的特点,引入它们之间的谱归一化互相关系数,构造了一种改进的理想二值掩蔽(iIBM)作为训练目标,此外引入深度可分离卷积使模型参数量减少了3.42 MB。实验结果表明:双端通话环境下所提出的方法相比参考算法取得了更高的客观评价得分。
关键词
声学回声消除
双端讲话场景
长短时记忆网络
残差神经网络
理想二值掩蔽
深度可分离卷积
Keywords
acoustic echo cancellation(AEC)
double-ended speech scenarios
long short-term memory(LSTM)
residual neural network(ResNet)
ideal
binary
mask
depthwise separable convolution(DSC)
分类号
TN912 [电子电信—通信与信息系统]
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
结合HPSS的非负矩阵音乐分离方法
被引量:
7
2
作者
熊梅
张天骐
张婷
杨凯
机构
重庆邮电大学信号与信息处理重庆市重点实验室
出处
《计算机工程与设计》
北大核心
2018年第4期1089-1094,1154,共7页
基金
国家自然科学基金项目(61671095
61371164)
+3 种基金
信号与信息处理重庆市市级重点实验室建设基金项目(CSTC2009CA2003)
重庆市教育委员会科研基金项目(KJ130524
KJ1600427
KJ1600429)
文摘
为解决非负矩阵分解(NMF)在音乐分离中适应性差且过度依赖学习样本的问题,提出结合谐和与击打声源分离(HPSS)的非负矩阵音乐分离方法。在高分辨率下对音乐信号进行HPSS分离,保留谐和声源并利用灵活窗NMF对击打声源进行二次分离,对结合理想二元掩蔽模型(IBM)分离出的伴奏及歌声的频谱做相应的傅里叶逆变换。利用公开音乐数据集进行实验仿真,实验结果表明,与传统的分离方法或者其它改进分离方法相比,该方法在分离性能上有明显提高。
关键词
非负矩阵分解
音乐分离
谐和与击打声源分离
二次分离
二元掩蔽模型
Keywords
non-negative matrix factorization
music separation
harmonic percussive source separation
two separations
ideal
binary
mask
ing
分类号
TN912.35 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
基于时间卷积网络的深度聚类说话人语音分离
被引量:
1
3
作者
王昕
蒋志翔
张杨
寇金桥
常新旭
徐冬冬
机构
中国航天科工集团第二研究院北京计算机技术及应用研究所
出处
《计算机工程与设计》
北大核心
2020年第9期2630-2635,共6页
基金
装备发展部信息系统局“十三五”预研课题基金项目(31511040401)
装备预研领域基金项目(61400040201)。
文摘
“鸡尾酒会问题”在语音分离任务上一直是一个难题,主要因为这个问题属于一个说话人无关的语音分离问题,对于说话人事先不知道其先验信息。通过参考Jonathan等提出的深度聚类方法,在其基础上进行改进,提出基于时间卷及网络的深度聚类模型,以理想二值掩蔽作为分离目标并在公开中文语音数据集下进行实验。实验结果表明,相比传统深度聚类模型,所提模型在训练速度、分离后的语音质量和语音客观可懂度方面都得到了提升。
关键词
语音分离
深度聚类模型
时间卷积网络
膨胀卷积
因果卷积
理想二值掩蔽
Keywords
speech separation
deep clustering model
temporal convolutional network
dilation convolutional
causal convolutional
ideal
binary
mask
ing
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
基于CASA的噪声环境下的话者辨认
4
作者
李冬冬
唐建
李然军
李辉
机构
中国科学技术大学电子科学与技术系语音信息处理实验室
出处
《小型微型计算机系统》
CSCD
北大核心
2016年第5期1107-1111,共5页
文摘
传统的说话人识别系统在噪声环境下的识别率较低.基于计算听觉场景分析得到的二值掩码可以对噪声占主导部分进行重建,从而将与说话人相关的被破坏的信息重建起来.但是重建的效果受到该帧中可靠帧的比例的影响.因此,根据提取的二值掩码来设定阈值,从而对测试特征的帧进行选取,将测试特征的帧划分为三类,分别用于重建、保留和丢弃.最终使用重建后的帧和保留的帧进行后续处理,并用于识别过程.实验结果表明,相较于原来的重建系统,该算法的识别率有了一定的提高.
关键词
计算听觉场景分析
Gammatone频率倒谱系数(GFCC)
理想二值掩码(
ibm
)
阈值
Keywords
computational auditory sense analysis ( CASA )
gammatone frequency cepstral coefficient ( GFCC )
ideal binary mask (ibm)
threshold
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于不同时频掩模神经网络语音增强的研究
5
作者
邵榕梓
富晓乾
田爱生
蒲俞姣
陈凯
机构
太原理工大学现代科技学院
出处
《现代信息科技》
2020年第18期84-86,共3页
基金
2020年山西省高等学校大学生创新创业训练计划项目(2020870)。
文摘
在基于时频掩模的深度神经网络语音增强系统中,学习目标的选择对于整体语音增强性能的影响极大,文章针对目前最常用的学习目标——理想二值掩模和理想浮值掩模在语音增强中的效果进行了研究,为验证不同时频掩消除噪声模性能的好坏,设计了多组对比实验,为以后深度学习训练过程中直接选择学习目标提供依据。仿真结果表明:在不同信噪比和不同噪声条件下,理想浮值掩模的性能均好过理想二值掩模。
关键词
语音增强
学习目标
理想二值掩模
理想浮值掩模
Keywords
speech enhancement
learning goals
ideal
binary
mask
ideal
floating
mask
分类号
TN912.3 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
低信噪比下二值掩蔽算法性能分析
被引量:
3
6
作者
蒋毅
梁维谦
周宏
冯振明
机构
清华大学电子工程系
总后勤部军需装备研究所
出处
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2012年第5期636-641,共6页
文摘
基于计算听觉场景分析,对基于能量的二值掩蔽语音分离算法的性能进行分析,证明了理想二值掩蔽算法在信噪比下具有最佳的单元分离性能,并通过3种类型带噪语音的分离实验证实了该结论。采用理想二值掩蔽算法对8种噪声类型的低信噪比带噪语音进行了分离实验,信噪比平均提升幅度大于10dB,表明算法对低信噪比语音分离的有效性和普遍适用性;采用非均匀、均匀两种多子带分析滤波器组进行分离性能对比测试,结果表明子带均匀性对信噪比提升影响不大。分析滤波器组的子带数量应大于32以实现较好的分离性能。
关键词
语音分离
听觉场景分析
理想二值掩蔽
gammatone滤波器组
Keywords
speech segregation
computational auditory scene analysis(CASA)
ideal
binary
mask
s
gammatone filter banks
分类号
TN912.35 [电子电信—通信与信息系统]
原文传递
题名
作者
出处
发文年
被引量
操作
1
结合LSTM与ResNet的声学回声消除
许春冬
徐锦武
王茹霞
凌贤鹏
黄乔月
郭桥生
《传感器与微系统》
CSCD
北大核心
2023
1
下载PDF
职称材料
2
结合HPSS的非负矩阵音乐分离方法
熊梅
张天骐
张婷
杨凯
《计算机工程与设计》
北大核心
2018
7
下载PDF
职称材料
3
基于时间卷积网络的深度聚类说话人语音分离
王昕
蒋志翔
张杨
寇金桥
常新旭
徐冬冬
《计算机工程与设计》
北大核心
2020
1
下载PDF
职称材料
4
基于CASA的噪声环境下的话者辨认
李冬冬
唐建
李然军
李辉
《小型微型计算机系统》
CSCD
北大核心
2016
0
下载PDF
职称材料
5
基于不同时频掩模神经网络语音增强的研究
邵榕梓
富晓乾
田爱生
蒲俞姣
陈凯
《现代信息科技》
2020
0
下载PDF
职称材料
6
低信噪比下二值掩蔽算法性能分析
蒋毅
梁维谦
周宏
冯振明
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2012
3
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部