期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
应用ResNet和CatBoost检测重放语声 被引量:1
1
作者 孙晓川 付景昌 +2 位作者 宋晓婷 宗利芳 李志刚 《应用声学》 CSCD 北大核心 2023年第4期861-870,共10页
针对短语声指令声频信息少、不适用句子级重放语声检测的问题以及近距离录声后用高质量重放设备重放的语声难以检测的问题,提出了一种适用于词级重放语声检测的模型。首先,利用短时傅里叶变换、低频平均能量计算和帧排序等方法选择声频... 针对短语声指令声频信息少、不适用句子级重放语声检测的问题以及近距离录声后用高质量重放设备重放的语声难以检测的问题,提出了一种适用于词级重放语声检测的模型。首先,利用短时傅里叶变换、低频平均能量计算和帧排序等方法选择声频帧,然后提取这些帧的伽马通频率倒谱系数。其次,用基于自注意机制的残差网络模型进一步提取伽马通频率倒谱系数中的信息,并转化为特征向量。最后,将提取后的特征向量用CatBoost分类,从而提高检测性能。在POCO数据集上的实验结果表明,提出的方法可以以87.54%的准确率和12.53%的等错误率检测重放语声,优于基线和现有的方法。该文提出的方法在ASVspoof2019 PA数据集上的等错误率与串联检测代价函数分别为4.92%和0.1418,证明该文方法也适用于多种设置的重放语声检测。 展开更多
关键词 重放语声检测 气爆杂声 残差网络 CatBoost
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部