期刊文献+
共找到152篇文章
< 1 2 8 >
每页显示 20 50 100
基于FFT和Masking的实时语音通话降噪算法
1
作者 徐琳娜 《电声技术》 2024年第5期64-66,共3页
针对语音通话质量的提升问题,提出一种基于快速傅里叶变换(Fast Fourier Transform,FFT)和Masking技术的实时语音通话降噪算法。首先,提出一个实时语音通话降噪的基本框架,并研究了帧分割、窗函数处理及FFT的数学原理。其次,阐述了基于... 针对语音通话质量的提升问题,提出一种基于快速傅里叶变换(Fast Fourier Transform,FFT)和Masking技术的实时语音通话降噪算法。首先,提出一个实时语音通话降噪的基本框架,并研究了帧分割、窗函数处理及FFT的数学原理。其次,阐述了基于人耳听觉特性的Masking方法及其在频域中的应用。最后,通过逆快速傅里叶变换(Inverse Fast Fourier Transform,IFFT)将信号转换回时域,并进行实验分析。实验结果表明,该降噪算法可以有效改善语音的清晰度和整体感知质量。 展开更多
关键词 语音降噪 快速傅里叶变换(FFT) masking技术 频域处理
下载PDF
Single-channel speech enhancement method based on masking properties and minimum statistics
2
作者 JiangXiaoping YaoTianren FuHua 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2004年第2期217-224,共8页
A single-channel speech enhancement method of noisy speech signals at very low signal-to-noise ratios is presented, which is based on masking properties of the human auditory system and power spectral density estimati... A single-channel speech enhancement method of noisy speech signals at very low signal-to-noise ratios is presented, which is based on masking properties of the human auditory system and power spectral density estimation of non stationary noise. It allows for an automatic adaptation in time and frequency of the parametric enhancement system, and finds the best tradeoff among the amount of noise reduction, the speech distortion, and the level of musical residual noise based on a criterion correlated with perception and SNR. This leads to a significant reduction of the unnatural structure of the residual noise. The results with several noise types show that the enhanced speech is more pleasant to a human listener. 展开更多
关键词 auditory property masking varying SNR estimation speech enhancement minimum statistics.
下载PDF
双分支复频谱下多特征聚合的轻量化语音增强方法
3
作者 张天骐 沈夕文 +1 位作者 唐娟 谭霜 《仪器仪表学报》 EI CAS CSCD 北大核心 2024年第7期279-291,共13页
针对目前多种改进的卷积循环网络(CRN)在单掩蔽或单映射的编解码结构下提取特征单一、捕获全局特征不强、参数量较大等问题,提出一种多特征聚合卷积模块与高效Transformer融合注意力机制结合的复频谱联合掩蔽和映射的单通道语音增强高... 针对目前多种改进的卷积循环网络(CRN)在单掩蔽或单映射的编解码结构下提取特征单一、捕获全局特征不强、参数量较大等问题,提出一种多特征聚合卷积模块与高效Transformer融合注意力机制结合的复频谱联合掩蔽和映射的单通道语音增强高效网络。在编解码层设计一种双分支门控协作单元(DGCU),提取复频谱多层次特征后交互、聚合以弥补特征提取单一问题;中间层设计一种通道时频注意力融合模块,聚焦语音的时频、空间局部细节特征。最后在THCHS30数据集上进行消融和对比实验,实验结果表明,该网络以最低参数量、较低计算量实现了轻量化,在匹配和不匹配噪声下PESQ分别提升了10.5%~50.6%、16.3%~94.5%,客观、主观指标都优于其他对比的网络模型,表现出较高的降噪性能和网络泛化能力。 展开更多
关键词 语音增强 复频谱掩蔽和映射 多特征聚合 高效Transformer 轻量化
下载PDF
A Model-Based Soft Decision Approach for Speech Enhancement
4
作者 Xianyun Wang Changchun Bao Feng Bao 《China Communications》 SCIE CSCD 2017年第9期11-22,共12页
Many speech enhancement algorithms that deal with noise reduction are based on a binary masking decision(termed as the hard decision), which may cause some regions of the synthesized speech to be discarded. In view of... Many speech enhancement algorithms that deal with noise reduction are based on a binary masking decision(termed as the hard decision), which may cause some regions of the synthesized speech to be discarded. In view of the problem, a soft decision is often used as an optimal technique for speech restoration. In this paper, considering a new fashion of speech and noise models, we present two model-based soft decision techniques. One technique estimates a ratio mask generated by the exact Bayesian estimators of speech and noise. For the second technique, we consider one issue that an optimum local criterion(LC) for a certain SNR may not be appropriate for other SNRs. So we estimate a probabilistic mask with a variable LC. Experimental results show that the proposed method achieves a better performance than reference methods in speech quality. 展开更多
关键词 speech ENHANCEMENT SOFT masks CASA THRESHOLD
下载PDF
About Multichannel Speech Signal Extraction and Separation Techniques
5
作者 Adel Hidri Souad Meddeb Hamid Amiri 《Journal of Signal and Information Processing》 2012年第2期238-247,共10页
The extraction of a desired speech signal from a noisy environment has become a challenging issue. In the recent years, the scientific community has particularly focused on multichannel techniques which are dealt with... The extraction of a desired speech signal from a noisy environment has become a challenging issue. In the recent years, the scientific community has particularly focused on multichannel techniques which are dealt with in this review. In fact, this study tries to classify these multichannel techniques into three main ones: Beamforming, Independent Component Analysis (ICA) and Time Frequency (T-F) masking. This paper also highlights their advantages and drawbacks. However these previously mentioned techniques could not afford satisfactory results. This fact leads to the idea that a combination of those techniques, which is depicted along this study, may probably provide more efficient results. Indeed, giving the fact that those approaches are still be considered as being not totally efficient, has led us to review these mentioned above in the hope that further researches will provide this domain with suitable innovations. 展开更多
关键词 BEAMFORMING ICA T-F maskING BSS MULTICHANNEL speech Separation MICROPHONE Array
下载PDF
HM-BERT:一种采用分级掩码的风电语音文本纠正方法
6
作者 高永兵 郑伟业 +1 位作者 李春灿 姜春光 《内蒙古科技大学学报》 CAS 2023年第4期367-371,共5页
采用一种基于分级掩码策略的文本纠正方法来提高语音识别后的文本质量.以风电相关的语音为数据集,将其通过公开的语音识别SDK转为文本数据,利用BERT中的MLM机制实现文本纠正,并采用分级掩码策略,针对不同的内容采用不同的掩码方法,改进... 采用一种基于分级掩码策略的文本纠正方法来提高语音识别后的文本质量.以风电相关的语音为数据集,将其通过公开的语音识别SDK转为文本数据,利用BERT中的MLM机制实现文本纠正,并采用分级掩码策略,针对不同的内容采用不同的掩码方法,改进后的模型称为HM-BERT.实验证明:HM-BERT在提升纠正效果的同时还加强了纠正模型的鲁棒性,该方法对其他领域的文本纠正也提供了解决思路. 展开更多
关键词 BERT MLM 分级掩码 语音文本纠正
下载PDF
老龄化对F0轮廓线索在汉语言语识别去掩蔽作用的影响 被引量:1
7
作者 吴梅红 《心理学报》 CSCD 北大核心 2023年第1期94-105,共12页
动态基频(F0)轮廓有助于嘈杂环境下的言语识别,可以作为将目标语音从背景声中分离的知觉线索。本研究通过评估老年人与年轻人在言语掩蔽下聆听具有自然动态F0轮廓与对F0轮廓操作调节后的汉语语句的言语识别能力,探讨老龄化对F0轮廓线索... 动态基频(F0)轮廓有助于嘈杂环境下的言语识别,可以作为将目标语音从背景声中分离的知觉线索。本研究通过评估老年人与年轻人在言语掩蔽下聆听具有自然动态F0轮廓与对F0轮廓操作调节后的汉语语句的言语识别能力,探讨老龄化对F0轮廓线索在汉语言语识别去掩蔽作用中的影响。结果显示,在言语掩蔽下自然动态的F0轮廓比压扁或拉伸的F0轮廓更能帮助年轻人抵抗信息掩蔽识别目标言语;而老年人在言语掩蔽下却难以从动态F0轮廓线索中受益。研究结果揭示了老年人利用F0轮廓线索促进掩蔽下言语感知能力的老化特点。 展开更多
关键词 汉语言语识别 F0轮廓线索 老龄化 言语掩蔽 去掩蔽
下载PDF
复杂声音条件下言语理解的脑机制研究
8
作者 耿立波 薛紫炫 +3 位作者 蔡文鹏 赵欣雨 马勇 杨亦鸣 《中文信息学报》 CSCD 北大核心 2023年第5期32-43,共12页
文章使用ERPs技术,对比分析了汉语母语者在安静、白噪声、汉语噪声、英语噪声四种听觉条件下加工汉语句子的情况,以探究信息掩蔽条件下语义加工的神经机制。研究发现不同噪声条件下诱发的N400、LPC等ERPs成分具有不同的波形表现,据此该... 文章使用ERPs技术,对比分析了汉语母语者在安静、白噪声、汉语噪声、英语噪声四种听觉条件下加工汉语句子的情况,以探究信息掩蔽条件下语义加工的神经机制。研究发现不同噪声条件下诱发的N400、LPC等ERPs成分具有不同的波形表现,据此该文得出以下结论:(1)言语噪声的语言特征占用了目标声音加工所需的认知和心理资源,资源竞争导致听者对目标信号的识别能力降低,由此产生了“语言干扰”形式的信息掩蔽。(2)对于难度较大的语义加工,言语噪声的可懂度发挥着更关键的作用,当言语噪声为听者极其熟悉或完全陌生的语言,对语义加工的掩蔽干扰较小,当言语噪声为听者接触过的语言但不是母语或主要语言时,掩蔽效应更强。(3)可懂度或不确定性存在交互作用。言语噪声中出现频率较小但能够被听者理解的语义信息即为一种不确定因素,其出现与听者的预期相冲突,更容易引发听者的注意转移,加大了注意及认知资源的消耗。 展开更多
关键词 信息掩蔽 语义加工 噪声类型 言语可懂度 事件相关电位
下载PDF
基于CM-OMEMD和小波散射网络的语音情感识别 被引量:3
9
作者 孙聪珊 马琳 李海峰 《信号处理》 CSCD 北大核心 2023年第4期688-697,共10页
语音情感识别(Speech Emotion Recognition,SER)是人机交互的重要组成部分,具有广泛的研究和应用价值。针对当前SER中仍然存在着缺乏大规模语音情感数据集和语音情感特征的低鲁棒性而导致的语音情感识别准确率低等问题,提出了一种基于... 语音情感识别(Speech Emotion Recognition,SER)是人机交互的重要组成部分,具有广泛的研究和应用价值。针对当前SER中仍然存在着缺乏大规模语音情感数据集和语音情感特征的低鲁棒性而导致的语音情感识别准确率低等问题,提出了一种基于改进的经验模态分解方法(Empirical Mode Decomposition,EMD)和小波散射网络(Wavelet Scattering Network,WSN)的语音情感识别方法。首先,针对用于语音信号时频分析的EMD及其改进算法中存在的模态混叠问题(Mode Mixing)和噪声残余问题,提出了基于常数Q变换(Constant-Q Transform,CQT)和海洋捕食者算法(Marine Predator Algorithm,MPA)的优化掩模经验模态分解方法(Optimized Masking EMD based on CQT and MPA,CM-OMEMD)。采用CM-OMEMD算法对情感语音信号进行分解,得到固有模态函数(Intrinsic Mode Functions,IMFs),并从IMFs中提取了可以表征情感的时频特征作为第一个特征集。然后采用WSN提取了具有平移不变性和形变稳定性的散射系数特征作为第二个特征集。最后将两个特征集进行融合,采用支持向量机(Support Vector Machine,SVM)分类器进行分类。通过在含有七种情感状态的TESS数据集中的对比实验,证明了本文提出的系统的有效性。其中CM-OMEMD减小了模态混叠,提升了对情感语音信号时频分析的准确性,同时提出的SER系统显著提高了情绪识别的性能。 展开更多
关键词 语音情感识别 小波散射网络 优化掩模经验模态分解方法 模态混叠
下载PDF
基于局部上下文关键词的方面级情感分析 被引量:1
10
作者 曾碧卿 黄梓芃 《计算机系统应用》 2023年第6期1-11,共11页
针对目前大多数方面级情感分析方法存在着没有重点关注局部上下文中关键词特征的问题.本文提出了一种基于局部上下文关键词特征提取及增强的方面级情感分析模型LCPM (local context pos mask).首先提出了局部上下文词性掩码机制,提取方... 针对目前大多数方面级情感分析方法存在着没有重点关注局部上下文中关键词特征的问题.本文提出了一种基于局部上下文关键词特征提取及增强的方面级情感分析模型LCPM (local context pos mask).首先提出了局部上下文词性掩码机制,提取方面词周围重要词的特征,减少噪声词的干扰.其次对损失函数进行修改,让模型重点关注与方面词有关的局部上下文关键词特征,提升模型情感分类的表现.最后设计了一种门控机制,模型可以动态学习权重系数,给局部上下文关键词特征和全局上下文特征分配不同的权重系数.在4个公开数据集上的实验结果表明,与现有的方面级情感分析模型相比,准确率和MF1值都有提高,验证了局部上下文关键词提取及增强的有效性,在方面级情感分析任务上有较大的应用价值. 展开更多
关键词 方面级情感分析 关键词特征 词性掩码 损失函数 门控机制
下载PDF
基于渐进比率掩蔽目标的自适应噪声估计方法
11
作者 高建清 屠彦辉 +1 位作者 马峰 付中华 《计算机应用》 CSCD 北大核心 2023年第4期1303-1308,共6页
基于深度学习的语音增强算法的性能通常优于传统的基于噪声抑制的语音增强算法。然而当训练数据和测试数据之间存在不匹配时,基于深度学习的语音增强算法通常无法正常工作。针对上述问题,提出一种新的基于渐进比率掩蔽(PRM)的自适应噪... 基于深度学习的语音增强算法的性能通常优于传统的基于噪声抑制的语音增强算法。然而当训练数据和测试数据之间存在不匹配时,基于深度学习的语音增强算法通常无法正常工作。针对上述问题,提出一种新的基于渐进比率掩蔽(PRM)的自适应噪声估计(PRM-ANE)方法,并把它作为语音识别系统的预处理方法。所提方法综合利用了具有帧级别的噪声跟踪能力的改进最小统计量控制递归平均(IMCRA)算法和具有学习噪声和语音之间复杂非线性映射关系的渐进学习算法这两种算法。首先,使用二维卷积神经网络(2D-CNN)学习随信噪比(SNR)增加的PRM;其次,通过传统的帧级语音增强算法组合句子级估计的PRM,进行语音增强;最后,将基于多级别信息融合的增强语音直接作为语音识别系统的输入,从而提高识别系统性能。在CHiME-4真实测试集上的实验结果表明,所提方法可以实现7.42%的相对字识别错误率(WER),与IMCRA语音增强方法相比下降了51.41%,可见所提方法能够有效提升下游识别任务的性能。 展开更多
关键词 语音增强 深度学习 渐进比率掩蔽 语音识别 CHiME-4比赛
下载PDF
联合频谱映射与掩蔽估计的协作式语音增强方法
12
作者 罗庆予 张天骐 +1 位作者 方蓉 张慧芝 《电子测量与仪器学报》 CSCD 北大核心 2023年第10期14-23,共10页
为提高目前基于掩蔽与基于频谱映射的语音增强方法性能上界以及复杂环境下的泛化能力,提出了一种在联合复频谱与复掩蔽学习框架下的协作式单通道语音增强方法。该方法采用编码器-双分支解码器结构,在编解码部分设计了一种交互协作学习单... 为提高目前基于掩蔽与基于频谱映射的语音增强方法性能上界以及复杂环境下的泛化能力,提出了一种在联合复频谱与复掩蔽学习框架下的协作式单通道语音增强方法。该方法采用编码器-双分支解码器结构,在编解码部分设计了一种交互协作学习单元(ICU)来监督交互语音信息流,并提供有效的潜在特征空间;中间层则是设计出一种多尺度融合Transformer,以少量参数在空间-通道维度上多尺度地提取细节信息后融合输出,同时对语音子频带与全频带信息建模。在大、小数据集与115种噪声环境下进行实验,结果表明该方法仅以0.57 M的参数量,取得比大部分先进且相关方法更优的主、客观指标,具有良好的鲁棒性与有效性。 展开更多
关键词 语音增强 复频谱映射 复掩蔽 多尺度融合Transformer 轻量型网络
下载PDF
基于噪声被掩蔽概率的优化语音增强方法 被引量:16
13
作者 卜凡亮 王为民 +1 位作者 戴启军 陈砚圃 《电子与信息学报》 EI CSCD 北大核心 2005年第5期753-756,共4页
利用听觉系统的掩蔽特性,提出了一种优化的语音增强方法。研究表明,噪声被语音掩蔽的概率是噪声强度和听觉掩蔽阈值的函数。考虑到噪声在带噪语音中的出现具有不确定性,各语音谱分量的最终估计由对带噪语音的谱分量和用传统的增强方法... 利用听觉系统的掩蔽特性,提出了一种优化的语音增强方法。研究表明,噪声被语音掩蔽的概率是噪声强度和听觉掩蔽阈值的函数。考虑到噪声在带噪语音中的出现具有不确定性,各语音谱分量的最终估计由对带噪语音的谱分量和用传统的增强方法估计的谱分量的加权求得,加权因子由噪声被掩蔽概率确定。语音增强性能的评估结果表明,这种优化的语音增强方法在减少语音失真与加强噪声抑制之间取得了良好的折衷,减少了语音的听觉失真, 有效地抑制了音乐噪声,提高了增强语音的清晰度。 展开更多
关键词 语音增强 听觉掩蔽效应 语音清晰度 音乐噪声
下载PDF
Bark子带小波包自适应阈值语音去噪方法 被引量:6
14
作者 田玉静 左红伟 +1 位作者 董玉民 魏德生 《计算机应用》 CSCD 北大核心 2010年第11期3111-3114,共4页
为了克服低信噪比输入下,语音增强造成清音弱分量损失,导致信号重构失真的问题,提出了一种新的语音增强方法。该方法采用小波包拟合语音感知模型的临界带,按子带能量对语音清浊音分离,然后对清音和浊音信号分别作8层和4层小波包分解,在... 为了克服低信噪比输入下,语音增强造成清音弱分量损失,导致信号重构失真的问题,提出了一种新的语音增强方法。该方法采用小波包拟合语音感知模型的临界带,按子带能量对语音清浊音分离,然后对清音和浊音信号分别作8层和4层小波包分解,在阈值计算上采用Bark子带小波包自适应节点阈值算法,在Bark子带实时跟踪噪声水平,有效保护清音中高频弱分量,减少失真。通过与传统语音增强方法的仿真对比实验,证实该方法在低信噪比输入时,具有明显优势,输出信噪比高,语音失真度低。将该方法与谱减法相结合,进行语音二次增强,能进一步提比输入时,具有明显优势,输高增强语音质量。 展开更多
关键词 小波包 听觉掩蔽 语音增强 清音分离 自适应阈值
下载PDF
基于谱减法的听觉模拟的语音增强 被引量:5
15
作者 陶智 赵鹤鸣 +1 位作者 龚呈卉 吴迪 《计算机工程与应用》 CSCD 北大核心 2005年第4期57-59,104,共4页
提出了一种适于低信噪比下的语音增强算法。该算法以传统的谱减法为基础,所用减参数是根据人耳听觉掩蔽效应提出的且是自适应的。对该算法进行了客观和主观测试,结果表明:相对于传统的谱减法,该算法能更好地抑制残留噪声和背景噪声,特... 提出了一种适于低信噪比下的语音增强算法。该算法以传统的谱减法为基础,所用减参数是根据人耳听觉掩蔽效应提出的且是自适应的。对该算法进行了客观和主观测试,结果表明:相对于传统的谱减法,该算法能更好地抑制残留噪声和背景噪声,特别是对低信噪比的语音信号。 展开更多
关键词 听觉系统 掩蔽效应 语音增强 谱减法
下载PDF
基于广义回归神经网络的面罩语音矫正研究 被引量:3
16
作者 王霞 刘婕 +1 位作者 王光艳 王蒙军 《现代电子技术》 北大核心 2017年第17期60-63,共4页
为了提高面罩语音的清晰度和可懂度,提出一种基于广义回归神经网络(GRNN)对线谱对(LSP)参数进行非线性建模的面罩语音矫正方法。分别提取正常语音和面罩语音的LSP参数,其次利用LSP参数对GRNN进行训练,得到矫正模型,将面罩语音的LSP参数... 为了提高面罩语音的清晰度和可懂度,提出一种基于广义回归神经网络(GRNN)对线谱对(LSP)参数进行非线性建模的面罩语音矫正方法。分别提取正常语音和面罩语音的LSP参数,其次利用LSP参数对GRNN进行训练,得到矫正模型,将面罩语音的LSP参数通过矫正模型进行修正,并将结果作为参数用来合成新的语音。实验结果表明,利用GRNN训练出的矫正模型能够有效地调整面罩语音的LSP参数,在一定程度上能够恢复其频谱分布。 展开更多
关键词 面罩语音 线谱对 广义回归神经网络 语音合成
下载PDF
小波包自适应阈值语音降噪新算法 被引量:4
17
作者 田玉静 左红伟 +1 位作者 董玉民 王超 《应用声学》 CSCD 北大核心 2011年第1期72-80,共9页
为了克服低信噪比输入下,语音增强造成语音清音中的弱分量损失,造成重构信号包络失真的问题。论文提出了一种新的语音增强方法。该方法根据语音感知模型,采用不完全小波包分解拟合语音临界频带,并对语音按子带能量进行清浊音区分处理,... 为了克服低信噪比输入下,语音增强造成语音清音中的弱分量损失,造成重构信号包络失真的问题。论文提出了一种新的语音增强方法。该方法根据语音感知模型,采用不完全小波包分解拟合语音临界频带,并对语音按子带能量进行清浊音区分处理,在阈值计算上,提出了一种清浊音分离,基于子带信号能量的小波包自适应阈值算法。通过仿真实验,客观评测和听音测试表明,该算法在低信噪比输入时较传统算法,能够更加有效地减少重构信号包络失真,在不损伤语音清晰度和自然度的前提下,使输出信噪比明显提高。将该算法与能量谱减法结合,进行二次增强能进一步提高降噪输出的语音质量。 展开更多
关键词 语音降噪 小波包分解 自适应阈值算法 子带能量
下载PDF
基于噪声估计和听觉掩蔽效应的语音增强 被引量:2
18
作者 程塨 郭雷 +1 位作者 刘爱峰 赵天云 《计算机工程与应用》 CSCD 北大核心 2011年第7期146-148,共3页
针对非平稳噪声环境和低信噪比的情况,提出了一种基于低频区语音特性的非平稳噪声估计方法,通过构造一个时变的权值,实现对噪声的实时估计,同时结合人耳听觉掩蔽效应,利用估计出的噪声自适应设定增强系数。仿真实验表明,该方法能够较好... 针对非平稳噪声环境和低信噪比的情况,提出了一种基于低频区语音特性的非平稳噪声估计方法,通过构造一个时变的权值,实现对噪声的实时估计,同时结合人耳听觉掩蔽效应,利用估计出的噪声自适应设定增强系数。仿真实验表明,该方法能够较好地抑制背景噪声,提高信噪比,减少语音失真。 展开更多
关键词 非平稳噪声估计 听觉掩蔽 语音增强 信噪比
下载PDF
基于感知掩蔽的重构非负矩阵分解单通道语音增强算法 被引量:7
19
作者 李艳生 刘园 张毅 《计算机应用》 CSCD 北大核心 2019年第3期894-898,共5页
针对非负矩阵分解(NMF)语音增强算法在低信噪比(SNR)非稳定环境下存在噪声残留的问题,提出一种基于感知掩蔽的重构NMF(PM-RNMF)单通道语音增强算法。首先,将心理声学掩蔽特性应用于NMF语音增强算法中;其次,对不同频率位采用不同的掩蔽阈... 针对非负矩阵分解(NMF)语音增强算法在低信噪比(SNR)非稳定环境下存在噪声残留的问题,提出一种基于感知掩蔽的重构NMF(PM-RNMF)单通道语音增强算法。首先,将心理声学掩蔽特性应用于NMF语音增强算法中;其次,对不同频率位采用不同的掩蔽阈值,建立自适应感知掩蔽增益函数,通过阈值约束残余噪声能量和语音失真能量;最后,结合语音存在概率(SPP)进行感知增益修正,重构NMF算法,以此建立新的目标函数。仿真结果表明,在不同SNR的3种非稳定噪声环境下,与NMF、重构NMF(RNMF)、感知掩蔽深度神经网络(PM-DNN)算法相比,PM-RNMF算法的感知语音质量评估(PESQ)平均值分别提高了0.767、0.474、0.162,信源失真比(SDR)平均值分别提高了2.785、1.197、0.948。实验结果表明,无论是在低频还是高频PM-RNMF有更好的降噪效果。 展开更多
关键词 非负矩阵分解 感知掩蔽 语音增强 语音存在概率 单通道
下载PDF
基于Hilbert-Huang变换和听觉掩蔽的语音增强算法 被引量:6
20
作者 宋倩倩 于凤芹 《声学技术》 CSCD 2009年第3期280-283,共4页
Hilbert-Huang变换是一种新型的具有自适应性的时频分析方法,分析了HHT算法的原理,提出了一种基于HHT和听觉掩蔽的语音增强算法,首先将语音信号进行EMD分解得到各阶IMF分量,然后对高频IMF分量进行听觉掩蔽处理,最后将处理后的分量与剩... Hilbert-Huang变换是一种新型的具有自适应性的时频分析方法,分析了HHT算法的原理,提出了一种基于HHT和听觉掩蔽的语音增强算法,首先将语音信号进行EMD分解得到各阶IMF分量,然后对高频IMF分量进行听觉掩蔽处理,最后将处理后的分量与剩余分量叠加得到重构信号。仿真结果表明所提出的算法降低了语音失真测度值,提高了语音信号的信噪比、清晰度及可懂度,并与听觉掩蔽算法和谱减法进行了比较,显示了该算法的优越性。 展开更多
关键词 HILBERT-HUANG变换 经验模态分解 固有模态函数 听觉掩蔽 语音增强
下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部