在频域应用高阶统计量(High order statistics,HOS),提出一种基于幅度谱HOS新特征的语音端点检测(Voice activity detection,VAD)算法。算法利用相邻帧获取当前帧的统计信息,并用幅度谱构造独立零均值高斯随机序列,通过计算此序列的归...在频域应用高阶统计量(High order statistics,HOS),提出一种基于幅度谱HOS新特征的语音端点检测(Voice activity detection,VAD)算法。算法利用相邻帧获取当前帧的统计信息,并用幅度谱构造独立零均值高斯随机序列,通过计算此序列的归一化偏度来得到HOS特征。新特征利用了噪声的长时平稳特性和无序性的先验信息,借用语音生成模型来分析噪声模型,并通过合理的假定,提取潜藏在幅度谱中的高斯信息。因此相比传统HOS特征只能用于高斯或准高斯白噪声检测,幅度谱HOS适用范围扩展到包括有色噪声在内的所有平稳随机噪声。同时新特征表现出许多优异的特性,如:平稳噪声的特征值趋近于零;语音间隙噪声段和语音结束时呈现出负峰特性等。利用这些特性可以建立适用于不同类型、不同信噪比、且具有随机切入点的强鲁棒性能的VAD算法。文章详细阐述了新特征的原理以及特性,并结合判决准则构造了一个简单的VAD算法。实验结果表明,对于平稳噪声基于幅度谱HOS的VAD算法,在检测的准确性和算法鲁棒性的综合性能上优于基于传统特征的算法。展开更多
针对低信噪比条件下语音端点检测精度受噪声干扰严重的问题,提出了一种基于投影分类的语音端点检测方法。该方法首先利用长时语音信号变化率测度特征进行低信噪比环境中的语音特征计算,充分利用语音信号和非语音信号的不同来增强低信噪...针对低信噪比条件下语音端点检测精度受噪声干扰严重的问题,提出了一种基于投影分类的语音端点检测方法。该方法首先利用长时语音信号变化率测度特征进行低信噪比环境中的语音特征计算,充分利用语音信号和非语音信号的不同来增强低信噪比条件下的区分度;接着,采用Fisher准则对语音和背景噪声进行分类识别,确保投影后的特征参数类内散度最小、类间散度最大。实验结果表明,方法具有较高的检测精度,在信噪比为-10 d B的白噪声干扰情况下仍然保持了86.7%以上的正确检测率。展开更多
文摘在频域应用高阶统计量(High order statistics,HOS),提出一种基于幅度谱HOS新特征的语音端点检测(Voice activity detection,VAD)算法。算法利用相邻帧获取当前帧的统计信息,并用幅度谱构造独立零均值高斯随机序列,通过计算此序列的归一化偏度来得到HOS特征。新特征利用了噪声的长时平稳特性和无序性的先验信息,借用语音生成模型来分析噪声模型,并通过合理的假定,提取潜藏在幅度谱中的高斯信息。因此相比传统HOS特征只能用于高斯或准高斯白噪声检测,幅度谱HOS适用范围扩展到包括有色噪声在内的所有平稳随机噪声。同时新特征表现出许多优异的特性,如:平稳噪声的特征值趋近于零;语音间隙噪声段和语音结束时呈现出负峰特性等。利用这些特性可以建立适用于不同类型、不同信噪比、且具有随机切入点的强鲁棒性能的VAD算法。文章详细阐述了新特征的原理以及特性,并结合判决准则构造了一个简单的VAD算法。实验结果表明,对于平稳噪声基于幅度谱HOS的VAD算法,在检测的准确性和算法鲁棒性的综合性能上优于基于传统特征的算法。
文摘针对低信噪比条件下语音端点检测精度受噪声干扰严重的问题,提出了一种基于投影分类的语音端点检测方法。该方法首先利用长时语音信号变化率测度特征进行低信噪比环境中的语音特征计算,充分利用语音信号和非语音信号的不同来增强低信噪比条件下的区分度;接着,采用Fisher准则对语音和背景噪声进行分类识别,确保投影后的特征参数类内散度最小、类间散度最大。实验结果表明,方法具有较高的检测精度,在信噪比为-10 d B的白噪声干扰情况下仍然保持了86.7%以上的正确检测率。