期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于时频感知神经网络的语音频带扩展 被引量:1
1
作者 许春冬 凌贤鹏 +1 位作者 应冬文 王晶 《信号处理》 CSCD 北大核心 2021年第10期2004-2012,共9页
为了进一步提高基于深度学习的语音频带扩展性能,提出了一种基于编解码器的神经网络结构,编码器对数据进行深度特征提取,解码器进行宽带语音重构,并在编解码器中间设计了局部敏感哈希自注意力层,用于增强模型对深度特征的有效选择。编... 为了进一步提高基于深度学习的语音频带扩展性能,提出了一种基于编解码器的神经网络结构,编码器对数据进行深度特征提取,解码器进行宽带语音重构,并在编解码器中间设计了局部敏感哈希自注意力层,用于增强模型对深度特征的有效选择。编解码器内部使用了时间卷积网络,有效提升了模型对语音时序数据上下文依赖关系的学习能力。为了促进模型朝更加准确的方向训练,还提出了一种时频感知损失函数,有利于模型在时域、频域以及感知域获取窄带语音到宽带语音的最优映射解。通过主观和客观实验结果表明,该方法优于传统方法和近几年基于深度神经网络的语音频带扩展方法。 展开更多
关键词 语音频带扩展 时间卷积网络 时频感知目标损失 局部敏感哈希注意力机制
下载PDF
基于多尺度特征融合的语音频带扩展
2
作者 许春冬 朱诚 +1 位作者 应冬文 董桂官 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2023年第9期132-139,共8页
针对现有的深度学习模型在语音频带扩展领域数据特征利用不充分、训练周期长以及生成语音质量不高等问题,提出了一种新型的端到端神经网络模型,该模型通过融合不同数据维度特征促使网络模型利用更少的数据特征量,获取更多的低高频映射... 针对现有的深度学习模型在语音频带扩展领域数据特征利用不充分、训练周期长以及生成语音质量不高等问题,提出了一种新型的端到端神经网络模型,该模型通过融合不同数据维度特征促使网络模型利用更少的数据特征量,获取更多的低高频映射关系解,从而减少模型的整体训练周期.为了提高长时序数据中关键特征的权重占比,设计了一种残差多头自注意力机制,从而达到数据特征利用率的最大化.此外,提出了一种基于时频域和Mel频谱的混合损失函数对模型进行优化.实验结果表明:该方法重构的宽带语音在主客观的评价中均优于传统方法和近年来的一些基于神经网络的语音频带扩展方法. 展开更多
关键词 语音频带扩展 深度学习 自注意力机制 时频感知损失函数
原文传递
基于幅值掩膜时频神经网络的语音频带扩展
3
作者 许春冬 谭国武 应冬文 《华中科技大学学报(自然科学版)》 EI CAS 2024年第6期179-184,共6页
为了提高基于深度学习的语音频带扩展性能,提出一种结合幅值掩膜的时频神经网络模型.该模型既能利用语音的相位信息,又能通过幅值掩膜来优化预测语音的幅值.模型时域部分设计一种融合注意力机制的长短时记忆神经网络,该网络可以实现并... 为了提高基于深度学习的语音频带扩展性能,提出一种结合幅值掩膜的时频神经网络模型.该模型既能利用语音的相位信息,又能通过幅值掩膜来优化预测语音的幅值.模型时域部分设计一种融合注意力机制的长短时记忆神经网络,该网络可以实现并行计算,当预测高频语音时充分利用距离相近的前后语音帧之间的关系,舍弃对远距离语音帧之间关系的学习,从而减少模型的计算量.主客观实验表明该方法在信噪比和可懂度等度量上优于传统方法和基于深度神经网络的语音频带扩展方法. 展开更多
关键词 语音频带扩展 时频神经网络 长短时记忆神经网络 幅值掩膜 注意力机制
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部