期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于ResNet的音频场景声替换造假的检测算法
1
作者 董明宇 严迪群 《计算机应用》 CSCD 北大核心 2022年第6期1724-1728,共5页
针对造假成本低、不易察觉的音频场景声替换的造假样本检测问题,提出了基于ResNet的造假样本检测算法。该算法首先提取音频的常数Q频谱系数(CQCC)特征,之后由残差网络(ResNet)结构学习输入的特征,结合网络的多层的残差块以及特征归一化... 针对造假成本低、不易察觉的音频场景声替换的造假样本检测问题,提出了基于ResNet的造假样本检测算法。该算法首先提取音频的常数Q频谱系数(CQCC)特征,之后由残差网络(ResNet)结构学习输入的特征,结合网络的多层的残差块以及特征归一化,最后输出分类结果。在TIMIT和Voicebank数据库上,所提算法的检测准确率最高可达100%,错误接收率最低仅为1.37%。在现实场景下检测由多种不同录音设备录制的带有设备本底噪声以及原始场景声音频,该算法的检测准确率最高可达99.27%。实验结果表明,在合适的模型下利用音频的CQCC特征来检测音频的场景替换痕迹是有效的。 展开更多
关键词 音频造假 音频场景声替换 残差网络 常数Q频谱系数
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部