期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
适应噪声强度突变的噪声估计加速方法 被引量:3
1
作者 夏丙寅 鲍长春 《信号处理》 CSCD 北大核心 2013年第10期1336-1345,共10页
为提高传统噪声估计方法对噪声强度突变的跟踪能力,本文在最小值控制递归平均(MCRA)方法基础上提出了噪声估计加速方法。该方法首先检测功率谱的突变,在检测到突变后设定具有自适应长度的拖尾段,并在拖尾段中利用对数似然比、谱熵和平... 为提高传统噪声估计方法对噪声强度突变的跟踪能力,本文在最小值控制递归平均(MCRA)方法基础上提出了噪声估计加速方法。该方法首先检测功率谱的突变,在检测到突变后设定具有自适应长度的拖尾段,并在拖尾段中利用对数似然比、谱熵和平均幅度差函数进行话音活动性检测(VAD),而后结合噪声估计与功率谱最小值比例等辅助参数判定是否对噪声估计进行强制更新。ITU-T G.160测试结果表明,噪声估计加速算法的引入未对噪声强度平稳情况下的语音增强算法性能产生影响,但显著降低了噪声强度突变时的收敛时间,并在很大程度上抑制了噪声估计收敛段中的音乐噪声。 展开更多
关键词 语音增强 噪声估计 话音活动性检测 谱熵 对数似然比 平均幅度差函数
下载PDF
基于高斯混合模型的压缩域语音增强方法 被引量:9
2
作者 梁岩 鲍长春 +3 位作者 夏丙寅 何玉文 周璇 李娜 《电子学报》 EI CAS CSCD 北大核心 2012年第10期2031-2038,共8页
为了有效利用纯净语音导抗谱频率参数(ISFs)的先验知识,本文针对ITU-T G.722.2宽带语音编码标准提出了一种基于高斯混合模型的压缩域语音增强方法.首先,将含噪语音、纯净语音的导抗谱频率参数,以及对应的增益调整因子构成特征矢量,并利... 为了有效利用纯净语音导抗谱频率参数(ISFs)的先验知识,本文针对ITU-T G.722.2宽带语音编码标准提出了一种基于高斯混合模型的压缩域语音增强方法.首先,将含噪语音、纯净语音的导抗谱频率参数,以及对应的增益调整因子构成特征矢量,并利用高斯混合模型拟合其概率密度;然后,在最小均方误差(MMSE)准则下对纯净语音的特征参数进行最优贝叶斯估计.为了兼容编码器中的非连续性传输模式,当处理信号为非语音信息时,算法在保持噪声帧谱包络参数不变的前提下,按固定比例调整对数帧能量;且若出现帧擦除情况,算法不调整接收到的码流,并按正常帧处理方式调整恢复后的参数以更新相关历史.本文采用ITU-T G.160标准进行了性能测试,结果表明,与参考方法相比,所提方法在保证信噪比提高能力的同时,可以达到更大的噪声衰减量,且增强语音的客观质量更优. 展开更多
关键词 语音增强 参数域 高斯混合模型 贝叶斯估计 非连续性传输 帧擦除
下载PDF
复杂环境下基于时延估计的声源定位技术研究 被引量:18
3
作者 张大威 鲍长春 夏丙寅 《通信学报》 EI CSCD 北大核心 2014年第1期183-190,共8页
为了改善在复杂环境下声源定位算法的性能,提出了一种新的时延估计(TDE)方法,即基于传递函数比的统计模型方法(ATFR-SM)。该方法采用统计模型去除噪声对传递函数(ATF)的影响,在计算传递函数时对功率谱密度(PSD)进行平滑和"白化&quo... 为了改善在复杂环境下声源定位算法的性能,提出了一种新的时延估计(TDE)方法,即基于传递函数比的统计模型方法(ATFR-SM)。该方法采用统计模型去除噪声对传递函数(ATF)的影响,在计算传递函数时对功率谱密度(PSD)进行平滑和"白化",以去除混响对传递函数的影响。同时,算法中引入话音激活检测(VAD)去除对求取传递函数无用的噪声段,以提高时延估计的准确性。此外,将所提时延估计方法与线性定位法相结合,构成一套完整的声源定位方法。实验结果表明,在复杂环境下,时延估计方法具有更低的异常点百分比(PAP)和均方根误差(RMSE),且明显优于传统的参考算法,同时声源定位方法具有更高的定位精度。 展开更多
关键词 时延估计 传递函数比 VAD 统计模型 声源定位
下载PDF
基于AR-HMM在线能量调整的语音增强方法 被引量:6
4
作者 何玉文 鲍长春 夏丙寅 《电子学报》 EI CAS CSCD 北大核心 2014年第10期1991-1997,共7页
针对单通道语音增强技术对非平稳噪声的跟踪不准确、噪声抑制效果较差的问题,本文提出一种基于在线能量调整的语音增强方法.该方法以归一化临界带能量为特征,采用高斯混合模型对背景噪声进行分类,利用对应类型噪声的自回归隐马尔可夫模... 针对单通道语音增强技术对非平稳噪声的跟踪不准确、噪声抑制效果较差的问题,本文提出一种基于在线能量调整的语音增强方法.该方法以归一化临界带能量为特征,采用高斯混合模型对背景噪声进行分类,利用对应类型噪声的自回归隐马尔可夫模型(Auto-Regressive Hidden Markov Model,AR-HMM)和纯净语音的AR-HMM,在最小均方误差准则下估计语音和噪声的功率谱.考虑到非平稳环境中训练集和测试集的差异性,需在线调整语音模型和噪声模型中的能量,语音模型的能量调整采用迭代的期望最大化算法;噪声模型的能量调整则利用的是模型训练过程中的能量重估方法,并以最小值控制的递归平均算法确定噪声能量调整的初始值.在ITU-T G.160标准下对算法进行性能测试,测试结果表明,本文方法对非平稳噪声的跟踪效果较好,对噪声衰减量较大,收敛时间较短. 展开更多
关键词 语音增强 非平稳噪声 隐马尔可夫模型 高斯混合模型
下载PDF
融合统计模型与EMD的宽带话音增强方法 被引量:3
5
作者 周璇 鲍长春 夏丙寅 《通信学报》 EI CSCD 北大核心 2013年第8期95-101,共7页
提出了一种融合统计模型和经验模态分解(EMD)的宽带话音增强方法。该方法首先用统计模型增强算法消除含噪话音中的主要噪声成分,然后用一种基于活动话音检测(VAD)的EMD增强算法做后处理进一步抑制残留噪声,从而使以上2种方法的优点有效... 提出了一种融合统计模型和经验模态分解(EMD)的宽带话音增强方法。该方法首先用统计模型增强算法消除含噪话音中的主要噪声成分,然后用一种基于活动话音检测(VAD)的EMD增强算法做后处理进一步抑制残留噪声,从而使以上2种方法的优点有效地结合。在ITU-T G.160标准下对算法进行了性能测试,测试结果表明,与经典的统计模型方法相比,在不同强度的背景噪声下,增强话音的信噪比提高都较为明显。同时,在低信噪比情况下,该方法能有效抑制增强话音高频部分的音乐噪声,提高了听觉舒适度。 展开更多
关键词 宽带话音增强 统计模型 EMD VAD
下载PDF
一种基于自适应噪声估计的宽带语音增强算法 被引量:1
6
作者 周璇 鲍长春 +2 位作者 夏丙寅 梁岩 何玉文 《信号处理》 CSCD 北大核心 2011年第9期1313-1318,共6页
为解决传统算法对噪声适应性较差,残留音乐噪声较强的问题,本文提出了一种基于自适应噪声估计的宽带语音增强算法。该算法可应用于宽带语音编码器,以提升在噪声环境下的编码质量。本文所提算法利用谱熵对噪声类型进行有效地判别,将背景... 为解决传统算法对噪声适应性较差,残留音乐噪声较强的问题,本文提出了一种基于自适应噪声估计的宽带语音增强算法。该算法可应用于宽带语音编码器,以提升在噪声环境下的编码质量。本文所提算法利用谱熵对噪声类型进行有效地判别,将背景噪声分为白噪声和有色噪声两类,并根据噪声特性选择适当的噪声估计方法。在白噪声背景下,选择一种谱平滑的方法;在有色噪声背景下,则选择经典的最小值控制递归平均算法。在此基础上结合经典的统计模型方法,构建一种具有较强噪声鲁棒性的宽带语音增强算法。在ITU-T G.160标准下对算法进行性能测试,测试结果表明,在不同强度的背景噪声环境下,增强语音的信噪比提高都较为明显。同时,在低信噪比情况下,该算法有效地抑制了严重影响听觉质量的音乐噪声现象。 展开更多
关键词 宽带语音增强 噪声估计 统计模型 谱熵
下载PDF
双麦克风噪声消除的高斯混合模型法 被引量:1
7
作者 陈浩 鲍长春 夏丙寅 《信号处理》 CSCD 北大核心 2014年第7期813-821,共9页
为了解决基于相位差滤波器(PBF)双麦克风方法残留噪声较多的问题,本文在PBF方法基础上提出一种基于高斯混合模型的双麦克风噪声消除方法。该方法首先采用高斯混合模型(GMM)对目标语音存在(l1)与目标语音不存(l0)在这两种情况进行建模。... 为了解决基于相位差滤波器(PBF)双麦克风方法残留噪声较多的问题,本文在PBF方法基础上提出一种基于高斯混合模型的双麦克风噪声消除方法。该方法首先采用高斯混合模型(GMM)对目标语音存在(l1)与目标语音不存(l0)在这两种情况进行建模。其次,在实时增强阶段,根据贝叶斯分类器计算每帧的目标语音存在概率(TSPP),随后根据噪声抑制最大化准则修正PBF的增益函数并得到改进的相位差滤波器(IPBF),最后将TSPP与IPBF的增益函数相结合,进而得到一种用于双麦克风噪声消除的掩蔽滤波器。实验结果表明:本文提出算法可有效抑制残留噪声,尤其是在目标语音不存在的时间段。 展开更多
关键词 噪声消除 双麦克风 相位差 高斯混合模型
下载PDF
基于辨别性深度信念网络的说话人分割 被引量:10
8
作者 马勇 鲍长春 夏丙寅 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2013年第6期804-807,812,共5页
该文基于语音信号的超矢量特征空间,提出了一种基于Fisher准则的可辨别性深度信念网络(discriminativedeep belief network,DDBN)训练方法,得到了优于传统深度信念网络(deep belief network,DBN)的说话人码本矢量特征,并利用这些码本特... 该文基于语音信号的超矢量特征空间,提出了一种基于Fisher准则的可辨别性深度信念网络(discriminativedeep belief network,DDBN)训练方法,得到了优于传统深度信念网络(deep belief network,DBN)的说话人码本矢量特征,并利用这些码本特征对多说话人的音段进行了聚类与分割。由TIMIT数据库生成的多说话人语音分割的实验结果表明,该基于Fisher准则函数的DDBN说话人分割算法的性能明显好于传统的Bayes信息判决(Bayesian informa-tion criterion,BIC)法和DBN法。 展开更多
关键词 说话人分割 辨别性深度信念网络 FISHER准则
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部