期刊文献+
共找到51篇文章
< 1 2 3 >
每页显示 20 50 100
VOICE ACTIVITY DETECTION UNDER RAYLEIGH DISTRIBUTION 被引量:1
1
作者 Li Yu Chen Jianming Tan Hongzhou 《Journal of Electronics(China)》 2009年第4期552-556,共5页
This paper presents an improved Voice Activity Detection (VAD) algorithm which uses the Signal-to-Noise Ratio (SNR) measure. We assume that noise Power Spectral Density (PSD) in each spectral bin follows a Rayle... This paper presents an improved Voice Activity Detection (VAD) algorithm which uses the Signal-to-Noise Ratio (SNR) measure. We assume that noise Power Spectral Density (PSD) in each spectral bin follows a Rayleigh distribution. Rayleigh distributions with its asymmetric tail characteristics give a better description of the noise PSD distribution than Gaussian distribution. Under this asstlmption, a new threshold updating expression is derived. Since the analytical integral of the false alarm probability, the threshold updating expression can be represented without the inverse complementary error function and low computational complexity is achieved in our system. Experimental results show that the proposed VAD outperforms or at least is comparable with the VAD scheme presented by Davis under several noise environments and has a lower computational complexity. 展开更多
关键词 Statistical voice activity detection vad Threshold update Rayleigh distribution Computational complexity
下载PDF
IMPROVING VOICE ACTIVITY DETECTION VIA WEIGHTING LIKELIHOOD AND DIMENSION REDUCTION
2
作者 Wang Huanliang Han Jiqing Li Haifeng Zheng Tieran 《Journal of Electronics(China)》 2008年第3期330-336,共7页
The performance of the traditional Voice Activity Detection (VAD) algorithms declines sharply in lower Signal-to-Noise Ratio (SNR) environments. In this paper, a feature weighting likelihood method is proposed for... The performance of the traditional Voice Activity Detection (VAD) algorithms declines sharply in lower Signal-to-Noise Ratio (SNR) environments. In this paper, a feature weighting likelihood method is proposed for noise-robust VAD. The contribution of dynamic features to likelihood score can be increased via the method, which improves consequently the noise robustness of VAD. Divergence based dimension reduction method is proposed for saving computation, which reduces these feature dimensions with smaller divergence value at the cost of degrading the performance a little. Experimental results on Aurora Ⅱ database show that the detection performance in noise environments can remarkably be improved by the proposed method when the model trained in clean data is used to detect speech endpoints. Using weighting likelihood on the dimension-reduced features obtains comparable, even better, performance compared to original full-dimensional feature. 展开更多
关键词 voice activity detection vad Weighting likelihood DIVERGENCE Dimension reduction Noise robustness
下载PDF
基于复高斯混合模型的鲁棒VAD算法 被引量:2
3
作者 雷建军 杨震 +1 位作者 刘刚 郭军 《天津大学学报》 EI CAS CSCD 北大核心 2009年第4期353-356,共4页
针对语音激活检测的鲁棒性问题,提出在非平稳噪声环境下使用基于复高斯混合模型的鲁棒语音激活检测算法.算法中假设纯净语音谱满足复高斯混合模型,先验信噪比利用预先训练好的复高斯混合模型计算得到.复高斯混合模型的引入一方面提高了... 针对语音激活检测的鲁棒性问题,提出在非平稳噪声环境下使用基于复高斯混合模型的鲁棒语音激活检测算法.算法中假设纯净语音谱满足复高斯混合模型,先验信噪比利用预先训练好的复高斯混合模型计算得到.复高斯混合模型的引入一方面提高了语音激活检测的性能,另一方面避免了使用基于最小均方误差语音增强的先验信噪比估计过程.实验中使用NOISEX-92噪声库来验证系统在噪声环境下的性能.结果表明,该种算法在非平稳噪声环境下具有良好的检测性能. 展开更多
关键词 复高斯混合模型 语音激活检测 似然比测试
下载PDF
一种自适应建模的VAD方法 被引量:1
4
作者 腾潇琦 冯祥 张翼飞 《计算机技术与发展》 2016年第9期26-29,共4页
语音活动检测(Voice Activity Detection,VAD)是语音前端特征处理的一个重要环节,它直接影响到后续处理的效果和效率。主流的模型VAD对训练数据的依赖度过高,在不同场景下需要重新训练不同的模型,这带来的数据标注的工作量是非常惊人的... 语音活动检测(Voice Activity Detection,VAD)是语音前端特征处理的一个重要环节,它直接影响到后续处理的效果和效率。主流的模型VAD对训练数据的依赖度过高,在不同场景下需要重新训练不同的模型,这带来的数据标注的工作量是非常惊人的。一种自适应建模的VAD方法结合了能量VAD和模型VAD的优点,成功地解决了这个问题。它对每一条语音在线地训练出语音和非语音模型,根据每一帧在模型上的似然度得分给它们打上标签,经过平滑后就可以很好地找到语音的起点和终点。实验结果表明,该方法取得了很好的效果,F_1指标相比传统能量VAD提升了0.031,说话人分离错误率下降了0.45%。 展开更多
关键词 语音活动检测 能量vad 模型vad 自适应建模
下载PDF
Novel DTD and VAD assisted voice detection algorithm for VoIP systems
5
作者 Ming Meng Wang Ke Ji Hong 《The Journal of China Universities of Posts and Telecommunications》 EI CSCD 2016年第4期9-16,76,共9页
Echo cancellation plays an important role in current Internet protocol(IP) based voice interactive systems. Voice state detection is an essential part in echo cancellation. It mainly comprises two parts: double tal... Echo cancellation plays an important role in current Internet protocol(IP) based voice interactive systems. Voice state detection is an essential part in echo cancellation. It mainly comprises two parts: double talk detection(DTD) and voice activity detection(VAD). DTD is used to detect doubletalk and prevent filter divergence in the presence of near-end speech, and VAD is used to determine the near-end voice activity and output silence indicator when near-end is silent. However, DTD straightforwardly proceeded may mistakenly declare double talk under double silent condition, coefficients update under the far-end silence condition may lead to filter divergence, and current VAD algorithms may misjudge the residual echo from the near end to be far-end voice. Therefore, a voice detection algorithm combining DTD and far-end VAD is proposed. DTD is implemented when VAD declares far-end speech, filtering and coefficients update will be halted when VAD declares far-end silence, and the far-end VAD adopted is multi-feature VAD based on short-time energy and correlation. The new algorithm can improve the accuracy of DTD, prevent filter divergence, and exclude the circumstance that far-end signal only contains residual echo from near end. Actual test results show that the voice state decision of the new algorithm is accurate, and the performance of echo cancellation is improved. 展开更多
关键词 echo cancellation double talk detection(DTD) voice activity detectionvad adaptive filter
原文传递
连续汉语语音的自动切分研究
6
作者 李琦 张二华 《计算机与数字工程》 2023年第4期959-964,共6页
连续汉语语音的自动切分是语音识别的基础,准确的连续语音切分方法可以代替人工标记汉字音节。传统的连续汉语语音自动切分技术如双门限端点检测、基于倒谱的端点检测等方法的效果都难以满足语音识别的需要。论文在时间域、频域及倒谱... 连续汉语语音的自动切分是语音识别的基础,准确的连续语音切分方法可以代替人工标记汉字音节。传统的连续汉语语音自动切分技术如双门限端点检测、基于倒谱的端点检测等方法的效果都难以满足语音识别的需要。论文在时间域、频域及倒谱域等多个层次对连续语音信号进行分析,结合端点检测技术、频谱分析和倒等方法对音节切分点进行检测,研究了一种连续语音多级切分方法。相比传统的基于双门限和倒谱的端点检测方法,该方法将单字切分的正确率达到了92.8%。 展开更多
关键词 语音切分 端点检测 语谱图 双门限法 频带能量
下载PDF
RTP流音频回放技术在400 MHz数字列调系统中的应用
7
作者 赵文杰 《铁路通信信号工程技术》 2023年第12期43-46,共4页
介绍DRTD系统中无线列调语音业务的音频回放技术。DRTD系统有线通信基于SIP协议和R T P流进行音频传输,通过混音、加窗语音检测、缓存、格式转换、信令控制等处理流程,将音频流在无线空口上进行传输,并最终在移动终端上实现语音波形回放... 介绍DRTD系统中无线列调语音业务的音频回放技术。DRTD系统有线通信基于SIP协议和R T P流进行音频传输,通过混音、加窗语音检测、缓存、格式转换、信令控制等处理流程,将音频流在无线空口上进行传输,并最终在移动终端上实现语音波形回放,从而桥接无线列调中的有线通信和无线通信,为DRTD系统的核心业务提供支撑。 展开更多
关键词 400 MHz数字列调系统 实时传输协议 音频回放 语音活动性检测
下载PDF
一种自适应语音端点检测算法 被引量:6
8
作者 孙战先 储飞黄 王江 《计算机工程与应用》 CSCD 2014年第1期206-210,共5页
针对基于短时能量和短时过零率的语音端点检测算法不能自适应环境,在低信噪比时性能较差问题,提出了一种新算法。该算法利用最小短时能量评估环境噪声,优化参数提取算法,提高了参数本身的抗噪能力和自适应能力,再通过参数融合有效平衡... 针对基于短时能量和短时过零率的语音端点检测算法不能自适应环境,在低信噪比时性能较差问题,提出了一种新算法。该算法利用最小短时能量评估环境噪声,优化参数提取算法,提高了参数本身的抗噪能力和自适应能力,再通过参数融合有效平衡了音节之间的差异,放大了语音与噪声之间的差异,最后通过一个动态检测门限,实现了不同信噪比下的端点检测。 展开更多
关键词 语音活动检测(端点检测) 自适应 噪声评估 特征融合 voice activity detection(vad)
下载PDF
基于Fisher线性判别分析的语音信号端点检测方法 被引量:20
9
作者 王明合 张二华 +1 位作者 唐振民 许昊 《电子与信息学报》 EI CSCD 北大核心 2015年第6期1343-1349,共7页
传统的语音端点检测方法对辅音,特别是受到噪声污染的清音部分与背景噪声之间分离能力不足。针对上述问题,该文提出一种基于Fisher线性判别分析的梅尔频率倒谱系数(F-MFCC)端点检测方法。将清音信号和背景噪声视为两类分类问题,采用Fis... 传统的语音端点检测方法对辅音,特别是受到噪声污染的清音部分与背景噪声之间分离能力不足。针对上述问题,该文提出一种基于Fisher线性判别分析的梅尔频率倒谱系数(F-MFCC)端点检测方法。将清音信号和背景噪声视为两类分类问题,采用Fisher准则求解具有判别信息的最佳投影方向,使得投影后的特征参数具有最小类内散度和最大类间散度,从而增大清音与背景噪声的可分离性。在不同语音库上的实验结果表明,F-MFCC能够在不同信噪比和背景噪声条件下提高语音端点检测的准确率。 展开更多
关键词 语音处理 语音端点检测 梅尔频率倒谱系数 FISHER线性判别分析
下载PDF
基于动态特性的D-LTSV语音端点检测方法 被引量:3
10
作者 赵欢 冯璐 +1 位作者 陈佐 张希翔 《计算机工程》 CAS CSCD 2014年第12期277-281,共5页
端点检测是语音信号处理的一个关键环节。为提高语音在低性噪比以及非平稳噪声环境下的端点检测性能,在长时信号变化特征(LTSV)的基础上提出一种新的D-LTSV语音端点检测方法。采用Bartlett-Welch方法估计语音谱,分析语音谱在长时域上的... 端点检测是语音信号处理的一个关键环节。为提高语音在低性噪比以及非平稳噪声环境下的端点检测性能,在长时信号变化特征(LTSV)的基础上提出一种新的D-LTSV语音端点检测方法。采用Bartlett-Welch方法估计语音谱,分析语音谱在长时域上的熵,利用倒谱的动态特性分析方法提取连续帧熵值的动态变化特征。实验结果表明,D-LTSV综合考虑了语音的非平稳性和帧间非平稳性的动态变化情况,具有比LTSV更好的分辨能力,特别是在低性噪比和非平稳噪声的环境下,D-LTSV的分辨能力提升了50.77%,能够准确地进行端点检测,具有更强的鲁棒性。 展开更多
关键词 语音端点检测 语音谱 长时特征 动态特性 分辨力
下载PDF
一种基于马可夫过程统计模型的语音激活检测方法 被引量:5
11
作者 徐筱麟 张兴国 《解放军理工大学学报(自然科学版)》 EI 2003年第1期7-10,共4页
根据语音的特点 ,以一阶马可夫过程统计模型对语音进行建模 ,并在此基础上对语音的激活检测进行了性能分析。在方案的实现过程中 ,采用了多种平滑因子 ,进一步改进了语音判决的正确性。与通常所用的检测方法相比 。
关键词 统计模型 检测方法 语音激活检测 马可夫过程 似然比检测 语音信号处理 平滑因子
下载PDF
基于盲源分离理论的麦克风阵列信号有音/无音检测方法 被引量:4
12
作者 马晓红 梁丽丽 殷福亮 《电子与信息学报》 EI CSCD 北大核心 2007年第3期589-592,共4页
该文提出一种在方向性噪声场中多路麦克风信号同时进行有音/无音检测(VAD)的方法。在方向性噪声场中,由于各个麦克风接收信号中的噪声彼此之间相关,因而,可以利用盲源分离理论将方向噪声与语音源信号分离,从而获得相对比较纯净的语音源... 该文提出一种在方向性噪声场中多路麦克风信号同时进行有音/无音检测(VAD)的方法。在方向性噪声场中,由于各个麦克风接收信号中的噪声彼此之间相关,因而,可以利用盲源分离理论将方向噪声与语音源信号分离,从而获得相对比较纯净的语音源信号。对分离出的语音源信号进行有音/无音检测,获得VAD结果,同时估计出各个麦克风信号相对于该信号的时延值。以相对纯净语音源信号的VAD检测结果为参考,将其分别平移相应的时延值,即可同时获得多路麦克风信号的VAD结果。计算机模拟结果表明,在方向性噪声场的多种情况下,该方法对具有加性噪声的多路麦克风信号均具有较好的有音/无音检测能力。 展开更多
关键词 有音/无音检测 盲源分离 时延估计 广义互相关 四阶统计量
下载PDF
改进的参数自适应的维纳滤波语音增强算法 被引量:8
13
作者 孟欣 马建芬 张雪英 《计算机工程与设计》 北大核心 2017年第3期714-718,共5页
为探究不同的噪声对语音增强算法性能的不同影响,提出一种参数自适应维纳滤波语音增强算法,根据不同的噪声类型,设置不同的参数初始值,做不同的噪声功率谱评估。使用深度神经网络对噪声进行分类,得到准确的分类结果;对不同的噪声,得到... 为探究不同的噪声对语音增强算法性能的不同影响,提出一种参数自适应维纳滤波语音增强算法,根据不同的噪声类型,设置不同的参数初始值,做不同的噪声功率谱评估。使用深度神经网络对噪声进行分类,得到准确的分类结果;对不同的噪声,得到维纳滤波算法与使用声音活动检测(VAD)进行噪声功率谱评估相结合的语音增强算法的最优系数组合。进行系列实验,客观的评价结果表明,该算法在Babble噪声下,5db的信噪比时,能够将PESQ值提高0.25,针对其它的噪声与不同信噪比情况,PESQ值也有相应的提高。 展开更多
关键词 深度神经网络 噪声分类 语音增强 维纳滤波算法 声音活动检测
下载PDF
基于噪声倒谱阈值频谱估计的语音活动检测 被引量:3
14
作者 李宇 郭雷勇 谭洪舟 《计算机工程》 CAS CSCD 北大核心 2011年第14期140-142,共3页
针对低方差频谱估计的语音活动检测(VAD)中Welch频谱估计方法计算量大的问题,提出利用倒谱阈值方法估计VAD中的噪声功率谱。该方法在静音时期为噪声的倒谱设置阈值,利用快速傅里叶变换计算频谱,再更新VAD中的判决阈值。算法复杂度分析... 针对低方差频谱估计的语音活动检测(VAD)中Welch频谱估计方法计算量大的问题,提出利用倒谱阈值方法估计VAD中的噪声功率谱。该方法在静音时期为噪声的倒谱设置阈值,利用快速傅里叶变换计算频谱,再更新VAD中的判决阈值。算法复杂度分析与仿真结果表明,该方法的检测性能与Welch方法相当,计算量降低约18%,同时降低整个VAD的时间复杂度。 展开更多
关键词 语音活动检测 频谱估计 倒谱阈值方法 功率谱密度 快速傅里叶变换
下载PDF
基于小波变分辨率频谱特征的静音检测 被引量:2
15
作者 薛卫 都思丹 叶迎宪 《计算机工程》 CAS CSCD 北大核心 2009年第13期232-233,236,共3页
针对静音检测提出基于小波变分辨率频谱特征的检测算法。算法采用多门限过零率对静音进行初判,并提取多个语音感觉特征与基于小波变分辨率频谱的Mel频率倒谱系数(MFCC)组合成语音特征,通过二分类支持向量机对该特征进行分类实现静音检... 针对静音检测提出基于小波变分辨率频谱特征的检测算法。算法采用多门限过零率对静音进行初判,并提取多个语音感觉特征与基于小波变分辨率频谱的Mel频率倒谱系数(MFCC)组合成语音特征,通过二分类支持向量机对该特征进行分类实现静音检测。测试结果表明,该算法在不同信噪比下语音识别正确率高于G.729b,MFCC特征静音检测算法,基于该算法的视频会议服务器运算量低于使用G.729b静音检测算法的视频系统。 展开更多
关键词 静音检测 小波 变分辨率频谱 支持向量机
下载PDF
基于小波变换C_0复杂度的语音端点检测方法 被引量:3
16
作者 王纲金 赵欢 胡炼 《计算机工程与应用》 CSCD 北大核心 2010年第29期134-136,195,共4页
对传统的C0复杂度语音端点检测方法改进,提出一种基于小波变换的C0复杂度(WC0)方法,其特征门限估计采用模糊C均值聚类算法和贝叶斯信息准则算法,并采用双门限法进行语音端点检测。在TIMIT连续语音库上的实验表明,在低信噪比环境下,WC0... 对传统的C0复杂度语音端点检测方法改进,提出一种基于小波变换的C0复杂度(WC0)方法,其特征门限估计采用模糊C均值聚类算法和贝叶斯信息准则算法,并采用双门限法进行语音端点检测。在TIMIT连续语音库上的实验表明,在低信噪比环境下,WC0法的检测性能明显优于基于传统的C0复杂度法,特别是在车辆噪声和车内噪声环境下,WC0法表现出更好的检测性能。 展开更多
关键词 语音端点检测 C0复杂度 小波变换 模糊C均值聚类算法 贝叶斯信息准则算法
下载PDF
一种用于3G系统中复杂背景噪声环境下的话音激活检测算法 被引量:2
17
作者 陈东 赵胜辉 匡镜明 《通信学报》 EI CSCD 北大核心 2001年第4期45-50,共6页
本文讨论了一种新的应用在 3G自适应多速率系统中复杂背景噪声环境下的话音激活检测算法。这种算法基于谱估计理论和周期信号检测方法 ,应用一个IIR滤波器组把输入窄带语音信号分成九个频带 ,进而估计每个频带的语音信号和背景噪声的电... 本文讨论了一种新的应用在 3G自适应多速率系统中复杂背景噪声环境下的话音激活检测算法。这种算法基于谱估计理论和周期信号检测方法 ,应用一个IIR滤波器组把输入窄带语音信号分成九个频带 ,进而估计每个频带的语音信号和背景噪声的电平 ,结合基音和音调检测 ,在区分语音和移动环境中的大多数背景噪声时表现得足够健壮。最后 ,基于欧洲电信标准委员会建议的 3G平台对这种算法进行了仿真评估 。 展开更多
关键词 话音激活检测 复杂背景噪声估计 第三代移动通信 CDMA
下载PDF
一种基于灰关联分析法的语音激活检测算法 被引量:1
18
作者 陈功 张雄伟 +1 位作者 李耀波 朱流泉 《解放军理工大学学报(自然科学版)》 EI 2007年第1期10-14,共5页
为在有色非高斯噪声背景下实时、有效地区分语音信号与各种背景噪声,提出了一种基于灰关联分析的语音激活检测(VAD)算法。该算法提取语音信号过零率、线性预测系数、倒谱系数和转移倒谱系数4种特征参数作为关联参数,通过跟踪语音与噪声... 为在有色非高斯噪声背景下实时、有效地区分语音信号与各种背景噪声,提出了一种基于灰关联分析的语音激活检测(VAD)算法。该算法提取语音信号过零率、线性预测系数、倒谱系数和转移倒谱系数4种特征参数作为关联参数,通过跟踪语音与噪声灰关联度的变化确定判决门限,实现语音激活检测。仿真结果表明:该算法在无噪声背景中识别率为100%,在-5 dB噪声背景环境,识别率可达80%以上。此算法对有色非高斯背景噪声不敏感,而且计算简单、可靠性高,在语音激活检测中具有可行性。 展开更多
关键词 非高斯 语音激活检测 灰关联分析 特征
下载PDF
基于隐马尔可夫模型的语音激活检测算法 被引量:4
19
作者 李强 陈浩 陈丁当 《计算机应用》 CSCD 北大核心 2016年第11期3212-3216,共5页
针对现有基于隐马尔可夫模型(HMM)的语音激活检测(VAD)算法对噪声的跟踪性能不佳的问题,提出采用Baum-Welch算法对具有不同特性的噪声进行训练,并生成相应噪声模型,建立噪声库的方法。在语音激活检测时,根据待测语音背景噪声的不同,动... 针对现有基于隐马尔可夫模型(HMM)的语音激活检测(VAD)算法对噪声的跟踪性能不佳的问题,提出采用Baum-Welch算法对具有不同特性的噪声进行训练,并生成相应噪声模型,建立噪声库的方法。在语音激活检测时,根据待测语音背景噪声的不同,动态地匹配噪声库中的噪声模型;同时,为了适应语音信号的实时处理,降低了语音参数提取的复杂度,并对判决阈值提出改进,以保证语音信号帧间的相关性。在不同噪声环境下对改进算法进行性能测试并与自适应多速率编码(AMR)标准、国际电信联盟电信标准分局(ITU-T)的G.729B标准比较,测试结果表明,改进算法在实时语音信号处理中能够有效提高检测的准确率及噪声跟踪能力。 展开更多
关键词 隐马尔可夫模型 语音激活检测 Baum-Welch算法 噪声库 阈值
下载PDF
基于概率密度并联距离的话音检测算法 被引量:1
20
作者 吴其前 张雄伟 邹霞 《电子与信息学报》 EI CSCD 北大核心 2008年第12期2886-2889,共4页
该文提出了一种基于概率密度并联距离的话音激活检测算法。算法根据语音信号和噪声信号的Mel域子带能量概率密度的不同特性,引入并联距离定义构造判决函数,通过判断该函数的值来进行语音激活检测。实验结果表明,在不同信噪比情况下,该... 该文提出了一种基于概率密度并联距离的话音激活检测算法。算法根据语音信号和噪声信号的Mel域子带能量概率密度的不同特性,引入并联距离定义构造判决函数,通过判断该函数的值来进行语音激活检测。实验结果表明,在不同信噪比情况下,该文算法性能优于G.729BVAD算法。 展开更多
关键词 话音激活检测 概率密度 并联距离
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部