-
题名基于ResNet的音频场景声替换造假的检测算法
- 1
-
-
作者
董明宇
严迪群
-
机构
宁波大学信息科学与工程学院
东南数字经济发展研究院
-
出处
《计算机应用》
CSCD
北大核心
2022年第6期1724-1728,共5页
-
基金
国家自然科学基金资助项目(U1736215,61901237)
浙江省自然科学基金资助项目(LY20F020010,LY17F020010)
宁波市自然科学基金资助项目(202003N4089)。
-
文摘
针对造假成本低、不易察觉的音频场景声替换的造假样本检测问题,提出了基于ResNet的造假样本检测算法。该算法首先提取音频的常数Q频谱系数(CQCC)特征,之后由残差网络(ResNet)结构学习输入的特征,结合网络的多层的残差块以及特征归一化,最后输出分类结果。在TIMIT和Voicebank数据库上,所提算法的检测准确率最高可达100%,错误接收率最低仅为1.37%。在现实场景下检测由多种不同录音设备录制的带有设备本底噪声以及原始场景声音频,该算法的检测准确率最高可达99.27%。实验结果表明,在合适的模型下利用音频的CQCC特征来检测音频的场景替换痕迹是有效的。
-
关键词
音频造假
音频场景声替换
残差网络
常数Q频谱系数
-
Keywords
audio falsification
audio scene sound replacement
Residual Network(ResNet)
Constant Q Cepstral Coefficient(CQCC)
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-