期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
融合数据预滤波和频谱展宽的骨导语音增强方法
被引量:
1
1
作者
张玥
邦锦阳
+1 位作者
孙蒙
张雄伟
《陆军工程大学学报》
2022年第4期21-29,共9页
骨导语音具有天然的抗环境噪声能力,然而,受骨导麦克风佩戴位置和方式的影响,骨导语音在采集过程中常混入骨导麦克风与皮肤或衣服之间的摩擦声,导致现有基于深度学习的骨导语音增强方法鲁棒性不高、适应性不强。为提高骨导语音增强的鲁...
骨导语音具有天然的抗环境噪声能力,然而,受骨导麦克风佩戴位置和方式的影响,骨导语音在采集过程中常混入骨导麦克风与皮肤或衣服之间的摩擦声,导致现有基于深度学习的骨导语音增强方法鲁棒性不高、适应性不强。为提高骨导语音增强的鲁棒性,提出一种融合数据预滤波和频谱展宽的骨导语音增强方法。该方法首先通过低通滤波对骨导语音数据进行预处理以去除高频噪声,然后对预滤波后的骨导语音进行时频变换,并分别基于U-Net和CRNN两种深度网络进行频谱展宽,最后通过时频逆变换重构出全频带语音。仿真结果表明,与现有深度网络增强方法相比,所提方法可以取得更好的PESQ和STOI客观评价指标,主观听感具有更好的清晰度,且对不同说话人具有更好的适应性。
展开更多
关键词
骨导语音增强
数据预滤波
频谱展宽
深度学习
下载PDF
职称材料
基于时频注意力机制与U-Net的骨导语音鲁棒增强方法
2
作者
张玥
张雄伟
孙蒙
《信号处理》
CSCD
北大核心
2022年第10期2134-2143,共10页
近年来,基于神经网络的方法大量应用于骨导语音增强中。然而,由于骨导数据集样本较少,骨导语音高频部分缺失,不同说话人高频部分失真程度不同,神经网络难以有效学习骨导语音的频谱特征。因此,现有骨导语音增强模型对于未知说话人骨导语...
近年来,基于神经网络的方法大量应用于骨导语音增强中。然而,由于骨导数据集样本较少,骨导语音高频部分缺失,不同说话人高频部分失真程度不同,神经网络难以有效学习骨导语音的频谱特征。因此,现有骨导语音增强模型对于未知说话人骨导语音数据集增强效果不佳、鲁棒性不强。为充分利用骨导语音的时频信息,引导模型关注骨导语音的低频部分特征,提出一种基于时频注意力机制和U-Net的骨导语音增强方法。该方法将时频注意力机制引入U-Net结构中,首先根据骨导语音时间、频率方向特征信息的重要程度自动为其分配权重,而后以加权后的骨导语音谱作为输入,对应的气导语音谱作为目标进入U-Net结构训练,最后利用训练完成的增强模型重构骨导语音全频带的语音。仿真实验与可视化分析结果表明,对比基线U-Net结构与其他注意力机制,该方法对于未知说话人骨导语音数据集能够取得更高的PESQ和STOI客观评价指标,增强语音更加清晰。
展开更多
关键词
骨导语音增强
时频注意力机制
U-Net
下载PDF
职称材料
融合卷积网络与残差长短时记忆网络的轻量级骨导语音盲增强
被引量:
3
3
作者
邦锦阳
孙蒙
+1 位作者
张雄伟
郑昌艳
《数据采集与处理》
CSCD
北大核心
2021年第5期921-931,共11页
基于深度学习的骨导语音盲增强已经取得了较好的效果,但仍存在模型体积大、计算复杂度高等问题。为此提出一种融合卷积网络和残差长短时记忆网络的轻量级骨导语音增强深度学习模型,该模型在保持语音增强质量的前提下,能有效提升骨导语...
基于深度学习的骨导语音盲增强已经取得了较好的效果,但仍存在模型体积大、计算复杂度高等问题。为此提出一种融合卷积网络和残差长短时记忆网络的轻量级骨导语音增强深度学习模型,该模型在保持语音增强质量的前提下,能有效提升骨导语音盲增强的效率。该模型借助卷积网络参数量小、特征提取能力强等优点,在语谱图频率维度引入卷积结构,从而深入挖掘时频结构的细节和高低频信息间的关联关系以提取新型特征,并将此新型特征输入改进后的长短时记忆网络中,用于恢复高频成分信息并重构语音信号。通过在骨导语音数据库上实验,表明所提模型可以有效改善高频成分的时频结构,在提升增强效果的同时,降低了模型体积和推理的计算复杂度。
展开更多
关键词
骨
导
语音
盲
增强
卷积网络
长短时记忆网络
轻量级模型
下载PDF
职称材料
题名
融合数据预滤波和频谱展宽的骨导语音增强方法
被引量:
1
1
作者
张玥
邦锦阳
孙蒙
张雄伟
机构
陆军工程大学指挥控制工程学院
出处
《陆军工程大学学报》
2022年第4期21-29,共9页
基金
国家自然科学基金(62071484)。
文摘
骨导语音具有天然的抗环境噪声能力,然而,受骨导麦克风佩戴位置和方式的影响,骨导语音在采集过程中常混入骨导麦克风与皮肤或衣服之间的摩擦声,导致现有基于深度学习的骨导语音增强方法鲁棒性不高、适应性不强。为提高骨导语音增强的鲁棒性,提出一种融合数据预滤波和频谱展宽的骨导语音增强方法。该方法首先通过低通滤波对骨导语音数据进行预处理以去除高频噪声,然后对预滤波后的骨导语音进行时频变换,并分别基于U-Net和CRNN两种深度网络进行频谱展宽,最后通过时频逆变换重构出全频带语音。仿真结果表明,与现有深度网络增强方法相比,所提方法可以取得更好的PESQ和STOI客观评价指标,主观听感具有更好的清晰度,且对不同说话人具有更好的适应性。
关键词
骨导语音增强
数据预滤波
频谱展宽
深度学习
Keywords
bone-conducted speech enhancement
data prefiltering
spectrum extension
deep learning
分类号
TN912.3 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
基于时频注意力机制与U-Net的骨导语音鲁棒增强方法
2
作者
张玥
张雄伟
孙蒙
机构
中国人民解放军陆军工程大学指挥控制工程学院
出处
《信号处理》
CSCD
北大核心
2022年第10期2134-2143,共10页
基金
国家自然科学基金(62071484)。
文摘
近年来,基于神经网络的方法大量应用于骨导语音增强中。然而,由于骨导数据集样本较少,骨导语音高频部分缺失,不同说话人高频部分失真程度不同,神经网络难以有效学习骨导语音的频谱特征。因此,现有骨导语音增强模型对于未知说话人骨导语音数据集增强效果不佳、鲁棒性不强。为充分利用骨导语音的时频信息,引导模型关注骨导语音的低频部分特征,提出一种基于时频注意力机制和U-Net的骨导语音增强方法。该方法将时频注意力机制引入U-Net结构中,首先根据骨导语音时间、频率方向特征信息的重要程度自动为其分配权重,而后以加权后的骨导语音谱作为输入,对应的气导语音谱作为目标进入U-Net结构训练,最后利用训练完成的增强模型重构骨导语音全频带的语音。仿真实验与可视化分析结果表明,对比基线U-Net结构与其他注意力机制,该方法对于未知说话人骨导语音数据集能够取得更高的PESQ和STOI客观评价指标,增强语音更加清晰。
关键词
骨导语音增强
时频注意力机制
U-Net
Keywords
bone conducted speech enhancement
time-frequency domain attention mechanism
U-Net
分类号
TN912.3 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
融合卷积网络与残差长短时记忆网络的轻量级骨导语音盲增强
被引量:
3
3
作者
邦锦阳
孙蒙
张雄伟
郑昌艳
机构
陆军工程大学指挥控制工程学院
火箭军士官学校
出处
《数据采集与处理》
CSCD
北大核心
2021年第5期921-931,共11页
基金
国家自然科学基金(62071484)资助项目。
文摘
基于深度学习的骨导语音盲增强已经取得了较好的效果,但仍存在模型体积大、计算复杂度高等问题。为此提出一种融合卷积网络和残差长短时记忆网络的轻量级骨导语音增强深度学习模型,该模型在保持语音增强质量的前提下,能有效提升骨导语音盲增强的效率。该模型借助卷积网络参数量小、特征提取能力强等优点,在语谱图频率维度引入卷积结构,从而深入挖掘时频结构的细节和高低频信息间的关联关系以提取新型特征,并将此新型特征输入改进后的长短时记忆网络中,用于恢复高频成分信息并重构语音信号。通过在骨导语音数据库上实验,表明所提模型可以有效改善高频成分的时频结构,在提升增强效果的同时,降低了模型体积和推理的计算复杂度。
关键词
骨
导
语音
盲
增强
卷积网络
长短时记忆网络
轻量级模型
Keywords
bone-conducted speech blind enhancement
convolutional neural network
long short-term memory network
lightweight model
分类号
TN912 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
融合数据预滤波和频谱展宽的骨导语音增强方法
张玥
邦锦阳
孙蒙
张雄伟
《陆军工程大学学报》
2022
1
下载PDF
职称材料
2
基于时频注意力机制与U-Net的骨导语音鲁棒增强方法
张玥
张雄伟
孙蒙
《信号处理》
CSCD
北大核心
2022
0
下载PDF
职称材料
3
融合卷积网络与残差长短时记忆网络的轻量级骨导语音盲增强
邦锦阳
孙蒙
张雄伟
郑昌艳
《数据采集与处理》
CSCD
北大核心
2021
3
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部