期刊文献+
共找到53篇文章
< 1 2 3 >
每页显示 20 50 100
VOICE ACTIVITY DETECTION UNDER RAYLEIGH DISTRIBUTION 被引量:1
1
作者 Li Yu Chen Jianming Tan Hongzhou 《Journal of Electronics(China)》 2009年第4期552-556,共5页
This paper presents an improved Voice Activity Detection (VAD) algorithm which uses the Signal-to-Noise Ratio (SNR) measure. We assume that noise Power Spectral Density (PSD) in each spectral bin follows a Rayle... This paper presents an improved Voice Activity Detection (VAD) algorithm which uses the Signal-to-Noise Ratio (SNR) measure. We assume that noise Power Spectral Density (PSD) in each spectral bin follows a Rayleigh distribution. Rayleigh distributions with its asymmetric tail characteristics give a better description of the noise PSD distribution than Gaussian distribution. Under this asstlmption, a new threshold updating expression is derived. Since the analytical integral of the false alarm probability, the threshold updating expression can be represented without the inverse complementary error function and low computational complexity is achieved in our system. Experimental results show that the proposed VAD outperforms or at least is comparable with the VAD scheme presented by Davis under several noise environments and has a lower computational complexity. 展开更多
关键词 statistical voice activity detection (vad Threshold update Rayleigh distribution Computational complexity
下载PDF
IMPROVING VOICE ACTIVITY DETECTION VIA WEIGHTING LIKELIHOOD AND DIMENSION REDUCTION
2
作者 Wang Huanliang Han Jiqing Li Haifeng Zheng Tieran 《Journal of Electronics(China)》 2008年第3期330-336,共7页
The performance of the traditional Voice Activity Detection (VAD) algorithms declines sharply in lower Signal-to-Noise Ratio (SNR) environments. In this paper, a feature weighting likelihood method is proposed for... The performance of the traditional Voice Activity Detection (VAD) algorithms declines sharply in lower Signal-to-Noise Ratio (SNR) environments. In this paper, a feature weighting likelihood method is proposed for noise-robust VAD. The contribution of dynamic features to likelihood score can be increased via the method, which improves consequently the noise robustness of VAD. Divergence based dimension reduction method is proposed for saving computation, which reduces these feature dimensions with smaller divergence value at the cost of degrading the performance a little. Experimental results on Aurora Ⅱ database show that the detection performance in noise environments can remarkably be improved by the proposed method when the model trained in clean data is used to detect speech endpoints. Using weighting likelihood on the dimension-reduced features obtains comparable, even better, performance compared to original full-dimensional feature. 展开更多
关键词 voice activity detection (vad Weighting likelihood DIVERGENCE Dimension reduction Noise robustness
下载PDF
Novel DTD and VAD assisted voice detection algorithm for VoIP systems
3
作者 Ming Meng Wang Ke Ji Hong 《The Journal of China Universities of Posts and Telecommunications》 EI CSCD 2016年第4期9-16,76,共9页
Echo cancellation plays an important role in current Internet protocol(IP) based voice interactive systems. Voice state detection is an essential part in echo cancellation. It mainly comprises two parts: double tal... Echo cancellation plays an important role in current Internet protocol(IP) based voice interactive systems. Voice state detection is an essential part in echo cancellation. It mainly comprises two parts: double talk detection(DTD) and voice activity detection(VAD). DTD is used to detect doubletalk and prevent filter divergence in the presence of near-end speech, and VAD is used to determine the near-end voice activity and output silence indicator when near-end is silent. However, DTD straightforwardly proceeded may mistakenly declare double talk under double silent condition, coefficients update under the far-end silence condition may lead to filter divergence, and current VAD algorithms may misjudge the residual echo from the near end to be far-end voice. Therefore, a voice detection algorithm combining DTD and far-end VAD is proposed. DTD is implemented when VAD declares far-end speech, filtering and coefficients update will be halted when VAD declares far-end silence, and the far-end VAD adopted is multi-feature VAD based on short-time energy and correlation. The new algorithm can improve the accuracy of DTD, prevent filter divergence, and exclude the circumstance that far-end signal only contains residual echo from near end. Actual test results show that the voice state decision of the new algorithm is accurate, and the performance of echo cancellation is improved. 展开更多
关键词 echo cancellation double talk detection(DTD) voice activity detection(vad adaptive filter
原文传递
基于复高斯混合模型的鲁棒VAD算法 被引量:2
4
作者 雷建军 杨震 +1 位作者 刘刚 郭军 《天津大学学报》 EI CAS CSCD 北大核心 2009年第4期353-356,共4页
针对语音激活检测的鲁棒性问题,提出在非平稳噪声环境下使用基于复高斯混合模型的鲁棒语音激活检测算法.算法中假设纯净语音谱满足复高斯混合模型,先验信噪比利用预先训练好的复高斯混合模型计算得到.复高斯混合模型的引入一方面提高了... 针对语音激活检测的鲁棒性问题,提出在非平稳噪声环境下使用基于复高斯混合模型的鲁棒语音激活检测算法.算法中假设纯净语音谱满足复高斯混合模型,先验信噪比利用预先训练好的复高斯混合模型计算得到.复高斯混合模型的引入一方面提高了语音激活检测的性能,另一方面避免了使用基于最小均方误差语音增强的先验信噪比估计过程.实验中使用NOISEX-92噪声库来验证系统在噪声环境下的性能.结果表明,该种算法在非平稳噪声环境下具有良好的检测性能. 展开更多
关键词 复高斯混合模型 语音激活检测 似然比测试
下载PDF
一种自适应建模的VAD方法 被引量:1
5
作者 腾潇琦 冯祥 张翼飞 《计算机技术与发展》 2016年第9期26-29,共4页
语音活动检测(Voice Activity Detection,VAD)是语音前端特征处理的一个重要环节,它直接影响到后续处理的效果和效率。主流的模型VAD对训练数据的依赖度过高,在不同场景下需要重新训练不同的模型,这带来的数据标注的工作量是非常惊人的... 语音活动检测(Voice Activity Detection,VAD)是语音前端特征处理的一个重要环节,它直接影响到后续处理的效果和效率。主流的模型VAD对训练数据的依赖度过高,在不同场景下需要重新训练不同的模型,这带来的数据标注的工作量是非常惊人的。一种自适应建模的VAD方法结合了能量VAD和模型VAD的优点,成功地解决了这个问题。它对每一条语音在线地训练出语音和非语音模型,根据每一帧在模型上的似然度得分给它们打上标签,经过平滑后就可以很好地找到语音的起点和终点。实验结果表明,该方法取得了很好的效果,F_1指标相比传统能量VAD提升了0.031,说话人分离错误率下降了0.45%。 展开更多
关键词 语音活动检测 能量vad 模型vad 自适应建模
下载PDF
连续汉语语音的自动切分研究
6
作者 李琦 张二华 《计算机与数字工程》 2023年第4期959-964,共6页
连续汉语语音的自动切分是语音识别的基础,准确的连续语音切分方法可以代替人工标记汉字音节。传统的连续汉语语音自动切分技术如双门限端点检测、基于倒谱的端点检测等方法的效果都难以满足语音识别的需要。论文在时间域、频域及倒谱... 连续汉语语音的自动切分是语音识别的基础,准确的连续语音切分方法可以代替人工标记汉字音节。传统的连续汉语语音自动切分技术如双门限端点检测、基于倒谱的端点检测等方法的效果都难以满足语音识别的需要。论文在时间域、频域及倒谱域等多个层次对连续语音信号进行分析,结合端点检测技术、频谱分析和倒等方法对音节切分点进行检测,研究了一种连续语音多级切分方法。相比传统的基于双门限和倒谱的端点检测方法,该方法将单字切分的正确率达到了92.8%。 展开更多
关键词 语音切分 端点检测 语谱图 双门限法 频带能量
下载PDF
RTP流音频回放技术在400 MHz数字列调系统中的应用
7
作者 赵文杰 《铁路通信信号工程技术》 2023年第12期43-46,共4页
介绍DRTD系统中无线列调语音业务的音频回放技术。DRTD系统有线通信基于SIP协议和R T P流进行音频传输,通过混音、加窗语音检测、缓存、格式转换、信令控制等处理流程,将音频流在无线空口上进行传输,并最终在移动终端上实现语音波形回放... 介绍DRTD系统中无线列调语音业务的音频回放技术。DRTD系统有线通信基于SIP协议和R T P流进行音频传输,通过混音、加窗语音检测、缓存、格式转换、信令控制等处理流程,将音频流在无线空口上进行传输,并最终在移动终端上实现语音波形回放,从而桥接无线列调中的有线通信和无线通信,为DRTD系统的核心业务提供支撑。 展开更多
关键词 400 MHz数字列调系统 实时传输协议 音频回放 语音活动性检测
下载PDF
一种自适应语音端点检测算法 被引量:6
8
作者 孙战先 储飞黄 王江 《计算机工程与应用》 CSCD 2014年第1期206-210,共5页
针对基于短时能量和短时过零率的语音端点检测算法不能自适应环境,在低信噪比时性能较差问题,提出了一种新算法。该算法利用最小短时能量评估环境噪声,优化参数提取算法,提高了参数本身的抗噪能力和自适应能力,再通过参数融合有效平衡... 针对基于短时能量和短时过零率的语音端点检测算法不能自适应环境,在低信噪比时性能较差问题,提出了一种新算法。该算法利用最小短时能量评估环境噪声,优化参数提取算法,提高了参数本身的抗噪能力和自适应能力,再通过参数融合有效平衡了音节之间的差异,放大了语音与噪声之间的差异,最后通过一个动态检测门限,实现了不同信噪比下的端点检测。 展开更多
关键词 语音活动检测(端点检测) 自适应 噪声评估 特征融合 voice activity detection(vad)
下载PDF
基于Fisher线性判别分析的语音信号端点检测方法 被引量:19
9
作者 王明合 张二华 +1 位作者 唐振民 许昊 《电子与信息学报》 EI CSCD 北大核心 2015年第6期1343-1349,共7页
传统的语音端点检测方法对辅音,特别是受到噪声污染的清音部分与背景噪声之间分离能力不足。针对上述问题,该文提出一种基于Fisher线性判别分析的梅尔频率倒谱系数(F-MFCC)端点检测方法。将清音信号和背景噪声视为两类分类问题,采用Fis... 传统的语音端点检测方法对辅音,特别是受到噪声污染的清音部分与背景噪声之间分离能力不足。针对上述问题,该文提出一种基于Fisher线性判别分析的梅尔频率倒谱系数(F-MFCC)端点检测方法。将清音信号和背景噪声视为两类分类问题,采用Fisher准则求解具有判别信息的最佳投影方向,使得投影后的特征参数具有最小类内散度和最大类间散度,从而增大清音与背景噪声的可分离性。在不同语音库上的实验结果表明,F-MFCC能够在不同信噪比和背景噪声条件下提高语音端点检测的准确率。 展开更多
关键词 语音处理 语音端点检测 梅尔频率倒谱系数 FISHER线性判别分析
下载PDF
基于幅度谱高阶统计量的鲁棒语音端点检测算法 被引量:6
10
作者 徐耀华 郭英 +2 位作者 王刚 王博 杨旺高 《数据采集与处理》 CSCD 北大核心 2008年第4期390-396,共7页
在频域应用高阶统计量(High order statistics,HOS),提出一种基于幅度谱HOS新特征的语音端点检测(Voice activity detection,VAD)算法。算法利用相邻帧获取当前帧的统计信息,并用幅度谱构造独立零均值高斯随机序列,通过计算此序列的归... 在频域应用高阶统计量(High order statistics,HOS),提出一种基于幅度谱HOS新特征的语音端点检测(Voice activity detection,VAD)算法。算法利用相邻帧获取当前帧的统计信息,并用幅度谱构造独立零均值高斯随机序列,通过计算此序列的归一化偏度来得到HOS特征。新特征利用了噪声的长时平稳特性和无序性的先验信息,借用语音生成模型来分析噪声模型,并通过合理的假定,提取潜藏在幅度谱中的高斯信息。因此相比传统HOS特征只能用于高斯或准高斯白噪声检测,幅度谱HOS适用范围扩展到包括有色噪声在内的所有平稳随机噪声。同时新特征表现出许多优异的特性,如:平稳噪声的特征值趋近于零;语音间隙噪声段和语音结束时呈现出负峰特性等。利用这些特性可以建立适用于不同类型、不同信噪比、且具有随机切入点的强鲁棒性能的VAD算法。文章详细阐述了新特征的原理以及特性,并结合判决准则构造了一个简单的VAD算法。实验结果表明,对于平稳噪声基于幅度谱HOS的VAD算法,在检测的准确性和算法鲁棒性的综合性能上优于基于传统特征的算法。 展开更多
关键词 语音端点检测 高阶累计量 偏度 集成双谱
下载PDF
基于Mel倒谱特征顺序统计滤波的语音端点检测算法 被引量:17
11
作者 陈振锋 吴蔚澜 +1 位作者 刘加 夏善红 《中国科学院大学学报(中英文)》 CAS CSCD 北大核心 2014年第4期524-529,共6页
为提高噪声环境下语音端点检测的准确性,提出一种基于Mel倒谱距离顺序统计滤波的端点检测算法.该算法首先提取每帧语音信号的Mel频率倒谱系数,以前16帧估算背景噪声,计算每帧语音与背景噪声的倒谱距离;然后将当前帧前后相继若干帧的倒... 为提高噪声环境下语音端点检测的准确性,提出一种基于Mel倒谱距离顺序统计滤波的端点检测算法.该算法首先提取每帧语音信号的Mel频率倒谱系数,以前16帧估算背景噪声,计算每帧语音与背景噪声的倒谱距离;然后将当前帧前后相继若干帧的倒谱距离,经过一组顺序统计滤波器得到加权倒谱距离;最后根据各帧加权倒谱距离对输入语音进行分类.在TIMIT语音库上的实验结果表明,该方法在白噪声、粉噪声、汽车噪声和战斗机噪声等噪声环境下,均能得到理想的端点检测结果,且在低信噪比时依然有效. 展开更多
关键词 倒谱特征 顺序统计滤波 语音端点检测 高噪声 MFCC
下载PDF
基于动态特性的D-LTSV语音端点检测方法 被引量:3
12
作者 赵欢 冯璐 +1 位作者 陈佐 张希翔 《计算机工程》 CAS CSCD 2014年第12期277-281,共5页
端点检测是语音信号处理的一个关键环节。为提高语音在低性噪比以及非平稳噪声环境下的端点检测性能,在长时信号变化特征(LTSV)的基础上提出一种新的D-LTSV语音端点检测方法。采用Bartlett-Welch方法估计语音谱,分析语音谱在长时域上的... 端点检测是语音信号处理的一个关键环节。为提高语音在低性噪比以及非平稳噪声环境下的端点检测性能,在长时信号变化特征(LTSV)的基础上提出一种新的D-LTSV语音端点检测方法。采用Bartlett-Welch方法估计语音谱,分析语音谱在长时域上的熵,利用倒谱的动态特性分析方法提取连续帧熵值的动态变化特征。实验结果表明,D-LTSV综合考虑了语音的非平稳性和帧间非平稳性的动态变化情况,具有比LTSV更好的分辨能力,特别是在低性噪比和非平稳噪声的环境下,D-LTSV的分辨能力提升了50.77%,能够准确地进行端点检测,具有更强的鲁棒性。 展开更多
关键词 语音端点检测 语音谱 长时特征 动态特性 分辨力
下载PDF
基于盲源分离理论的麦克风阵列信号有音/无音检测方法 被引量:4
13
作者 马晓红 梁丽丽 殷福亮 《电子与信息学报》 EI CSCD 北大核心 2007年第3期589-592,共4页
该文提出一种在方向性噪声场中多路麦克风信号同时进行有音/无音检测(VAD)的方法。在方向性噪声场中,由于各个麦克风接收信号中的噪声彼此之间相关,因而,可以利用盲源分离理论将方向噪声与语音源信号分离,从而获得相对比较纯净的语音源... 该文提出一种在方向性噪声场中多路麦克风信号同时进行有音/无音检测(VAD)的方法。在方向性噪声场中,由于各个麦克风接收信号中的噪声彼此之间相关,因而,可以利用盲源分离理论将方向噪声与语音源信号分离,从而获得相对比较纯净的语音源信号。对分离出的语音源信号进行有音/无音检测,获得VAD结果,同时估计出各个麦克风信号相对于该信号的时延值。以相对纯净语音源信号的VAD检测结果为参考,将其分别平移相应的时延值,即可同时获得多路麦克风信号的VAD结果。计算机模拟结果表明,在方向性噪声场的多种情况下,该方法对具有加性噪声的多路麦克风信号均具有较好的有音/无音检测能力。 展开更多
关键词 有音/无音检测 盲源分离 时延估计 广义互相关 四阶统计量
下载PDF
基于高阶统计方法改进的自适应多速率话音激活检测算法 被引量:5
14
作者 陈东 赵胜辉 匡镜明 《电子与信息学报》 EI CSCD 北大核心 2003年第5期626-632,共7页
该文提出了基于高阶统计方法改进的自适应多速率话音激活检测算法,该算法可应用于第三代移动通信系统。实验证明:这种算法可以有效检测实际移动通信环境中高斯或非高斯对称分布的背景噪声。
关键词 高阶统计方法 自适应多速率 话音激活检测算法 移动通信系统 背景噪声
下载PDF
一种基于马可夫过程统计模型的语音激活检测方法 被引量:5
15
作者 徐筱麟 张兴国 《解放军理工大学学报(自然科学版)》 EI 2003年第1期7-10,共4页
根据语音的特点 ,以一阶马可夫过程统计模型对语音进行建模 ,并在此基础上对语音的激活检测进行了性能分析。在方案的实现过程中 ,采用了多种平滑因子 ,进一步改进了语音判决的正确性。与通常所用的检测方法相比 。
关键词 统计模型 检测方法 语音激活检测 马可夫过程 似然比检测 语音信号处理 平滑因子
下载PDF
基于噪声倒谱阈值频谱估计的语音活动检测 被引量:3
16
作者 李宇 郭雷勇 谭洪舟 《计算机工程》 CAS CSCD 北大核心 2011年第14期140-142,共3页
针对低方差频谱估计的语音活动检测(VAD)中Welch频谱估计方法计算量大的问题,提出利用倒谱阈值方法估计VAD中的噪声功率谱。该方法在静音时期为噪声的倒谱设置阈值,利用快速傅里叶变换计算频谱,再更新VAD中的判决阈值。算法复杂度分析... 针对低方差频谱估计的语音活动检测(VAD)中Welch频谱估计方法计算量大的问题,提出利用倒谱阈值方法估计VAD中的噪声功率谱。该方法在静音时期为噪声的倒谱设置阈值,利用快速傅里叶变换计算频谱,再更新VAD中的判决阈值。算法复杂度分析与仿真结果表明,该方法的检测性能与Welch方法相当,计算量降低约18%,同时降低整个VAD的时间复杂度。 展开更多
关键词 语音活动检测 频谱估计 倒谱阈值方法 功率谱密度 快速傅里叶变换
下载PDF
基于Rayleigh噪声统计分布的有音区检测 被引量:3
17
作者 李宇 陈建铭 +1 位作者 谭洪舟 陈明 《信号处理》 CSCD 北大核心 2009年第11期1809-1813,共5页
依据噪声能量谱密度(PSD)分布的拖尾特性,本文采用瑞利(Rayleigh)分布表示噪声能量谱密度的分布,推导出基于Rayleigh分布的新判决阈值更新表达式,并提出一种改进的有音区检测(VAD)算法。由于Rayleigh分布下虚警概率具有解析表达式,从而... 依据噪声能量谱密度(PSD)分布的拖尾特性,本文采用瑞利(Rayleigh)分布表示噪声能量谱密度的分布,推导出基于Rayleigh分布的新判决阈值更新表达式,并提出一种改进的有音区检测(VAD)算法。由于Rayleigh分布下虚警概率具有解析表达式,从而避免了计算逆互补误差函数,降低了算法的复杂度。实验结果表明,在非平稳噪声环境下,其性能指标值优于文献[8]的算法。 展开更多
关键词 统计有音区检测 自适应判决阈值 瑞利分布 算法复杂度
下载PDF
基于小波变分辨率频谱特征的静音检测 被引量:2
18
作者 薛卫 都思丹 叶迎宪 《计算机工程》 CAS CSCD 北大核心 2009年第13期232-233,236,共3页
针对静音检测提出基于小波变分辨率频谱特征的检测算法。算法采用多门限过零率对静音进行初判,并提取多个语音感觉特征与基于小波变分辨率频谱的Mel频率倒谱系数(MFCC)组合成语音特征,通过二分类支持向量机对该特征进行分类实现静音检... 针对静音检测提出基于小波变分辨率频谱特征的检测算法。算法采用多门限过零率对静音进行初判,并提取多个语音感觉特征与基于小波变分辨率频谱的Mel频率倒谱系数(MFCC)组合成语音特征,通过二分类支持向量机对该特征进行分类实现静音检测。测试结果表明,该算法在不同信噪比下语音识别正确率高于G.729b,MFCC特征静音检测算法,基于该算法的视频会议服务器运算量低于使用G.729b静音检测算法的视频系统。 展开更多
关键词 静音检测 小波 变分辨率频谱 支持向量机
下载PDF
基于子带二次谱熵的语音端点检测 被引量:3
19
作者 朱建伟 孙水发 +1 位作者 但志平 雷帮军 《微电子学与计算机》 CSCD 北大核心 2011年第3期77-80,共4页
为了提高在强噪声环境下语音端点检测的准确度,提出基于子带二次谱熵的端点检测算法.该算法把子带二次谱熵作为端点检测新的特征参数,首先计算每帧语音信号的二次谱,再多子带分析,计算二次谱熵;引入顺序统计滤波对二次谱熵平滑处理;将... 为了提高在强噪声环境下语音端点检测的准确度,提出基于子带二次谱熵的端点检测算法.该算法把子带二次谱熵作为端点检测新的特征参数,首先计算每帧语音信号的二次谱,再多子带分析,计算二次谱熵;引入顺序统计滤波对二次谱熵平滑处理;将有限状态机判别方法与子带二次谱熵相合,形成新的语音/噪声判别算法,有效地解决单门限法易出现的两类误判.实验表明:与传统的两种方法相比,提出的端点检测算法具有准确性高、抗噪性强等优点. 展开更多
关键词 端点检测 子带二次谱熵 有限状态机 顺序统计滤波
下载PDF
一种用于3G系统中复杂背景噪声环境下的话音激活检测算法 被引量:2
20
作者 陈东 赵胜辉 匡镜明 《通信学报》 EI CSCD 北大核心 2001年第4期45-50,共6页
本文讨论了一种新的应用在 3G自适应多速率系统中复杂背景噪声环境下的话音激活检测算法。这种算法基于谱估计理论和周期信号检测方法 ,应用一个IIR滤波器组把输入窄带语音信号分成九个频带 ,进而估计每个频带的语音信号和背景噪声的电... 本文讨论了一种新的应用在 3G自适应多速率系统中复杂背景噪声环境下的话音激活检测算法。这种算法基于谱估计理论和周期信号检测方法 ,应用一个IIR滤波器组把输入窄带语音信号分成九个频带 ,进而估计每个频带的语音信号和背景噪声的电平 ,结合基音和音调检测 ,在区分语音和移动环境中的大多数背景噪声时表现得足够健壮。最后 ,基于欧洲电信标准委员会建议的 3G平台对这种算法进行了仿真评估 。 展开更多
关键词 话音激活检测 复杂背景噪声估计 第三代移动通信 CDMA
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部