期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
单声道语音降噪与去混响研究综述 被引量:17
1
作者 蓝天 彭川 +6 位作者 李森 叶文政 李萌 惠国强 吕忆蓝 钱宇欣 刘峤 《计算机研究与发展》 EI CSCD 北大核心 2020年第5期928-953,共26页
语音增强是提高语音质量与可懂度的关键技术,在语音识别、语音通话、电话会议和听力辅助等领域具有广泛应用前景与重要研究价值.从模型方法、数据集、特征、评估指标等方面,对单声道语音增强研究工作的发展现状进行了全面调研和深入分析... 语音增强是提高语音质量与可懂度的关键技术,在语音识别、语音通话、电话会议和听力辅助等领域具有广泛应用前景与重要研究价值.从模型方法、数据集、特征、评估指标等方面,对单声道语音增强研究工作的发展现状进行了全面调研和深入分析.1)对传统的与基于机器学习的单声道语音降噪以及语音去混响的已有研究工作进行了梳理分类,简要介绍了典型方法的研究思路,并对不同方法的实验结果进行了综合比较;2)对在实验与结果评估过程中所涉及到的常用数据集、常见特征、学习目标与评估指标等进行了整理与介绍;3)对目前单声道语音增强仍然面临的主要问题与挑战进行了总结. 展开更多
关键词 语音增强 语音降噪 语音去混响 机器学习 深度神经网络
下载PDF
采用上下文相关的注意力机制及循环神经网络的语音增强方法 被引量:4
2
作者 蓝天 惠国强 +2 位作者 李萌 吕忆蓝 刘峤 《声学学报》 EI CSCD 北大核心 2020年第6期897-905,共9页
提出了采用上下文相关的注意力机制及循环神经网络的语音增强方法。该方法在训练阶段联合训练计算注意力评分的多层感知机和增强语音的深度循环网络,在测试阶段计算每一帧语音的注意力向量并与该帧语音拼接输入深度循环网络增强。在不... 提出了采用上下文相关的注意力机制及循环神经网络的语音增强方法。该方法在训练阶段联合训练计算注意力评分的多层感知机和增强语音的深度循环网络,在测试阶段计算每一帧语音的注意力向量并与该帧语音拼接输入深度循环网络增强。在不同信噪比的实验中,该方法相比基线模型能更好地提高语音质量和可懂度,-6 dB下相对带噪语音短时客观可懂度(STOI)和语音质量感知评估(PESQ)可分别提高0.16和0.77,同时在未知噪声条件下该方法性能仍最优或接近最优。因此注意力机制可以有效强化模型对上下文信息的利用能力,从而提高模型增强性能。 展开更多
关键词 循环神经网络 注意力机制 多层感知机 可懂度 测试阶段 基线模型 语音增强 上下文信息
下载PDF
基于区域自适应多尺度卷积的单声道语音增强算法 被引量:1
3
作者 王钇翔 吕忆蓝 +2 位作者 台文鑫 孙建强 蓝天 《计算机应用研究》 CSCD 北大核心 2021年第11期3264-3267,共4页
卷积神经网络的感受野大小与卷积核的尺寸相关,传统的卷积采用了固定大小的卷积核,限制了网络模型的特征感知能力;此外,卷积神经网络使用参数共享机制,对空间区域中所有的样本点采用了相同的特征提取方式,然而带噪频谱图噪声信号与干净... 卷积神经网络的感受野大小与卷积核的尺寸相关,传统的卷积采用了固定大小的卷积核,限制了网络模型的特征感知能力;此外,卷积神经网络使用参数共享机制,对空间区域中所有的样本点采用了相同的特征提取方式,然而带噪频谱图噪声信号与干净语音信号的分布存在差异,特别是在复杂噪声环境下,使得传统卷积方式难以实现高质量的语音信号特征提取和过滤。为了解决上述问题,提出了多尺度区域自适应卷积模块,利用多尺度信息提升模型的特征感知能力;根据对应采样点的特征值自适应地分配区域卷积权重,实现区域自适应卷积,提升模型过滤噪声的能力。在TIMIT公开数据集上的实验表明,提出的算法在语音质量和可懂度的评价指标上取得了更优的实验结果。 展开更多
关键词 语音增强 卷积神经网络 多尺度卷积 区域自适应
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部