-
题名深度伪造音频检测综述
- 1
-
-
作者
谢元坤
程皓楠
叶龙
-
机构
中国传媒大学
-
出处
《中国传媒大学学报(自然科学版)》
2024年第3期26-33,共8页
-
基金
国家自然科学基金(62201524)
国家重点研发计划项目(2021YFF0900504)。
-
文摘
随着生成式人工智能技术的快速普及和发展,社交媒体领域充斥着大量由语音合成、语音转换等技术生成的深度伪造音频。这些高自然度的深度伪造音频为真伪媒体内容分辨带来了巨大挑战。为了解决这一问题,国内外已经组织了多样化深度伪造音频检测挑战赛,以促进音频反欺骗领域的发展。区别于已有综述局限于音频真伪二分类,本文跨越传统二分类,对深度伪造音频检测领域的相关工作做出了全面的总结。即将深度伪造音频检测领域分为三个子领域:全局伪造音频检测、局部伪造音频定位、深度伪造音频溯源,分别对三个子领域现有的数据集领域问题、解决方法进行了梳理和总结。最后,提出了深度伪造音频检测领域可能面临的挑战,对下一阶段的研究进行展望,期望为未来研究人员提供可靠参考。
-
关键词
深度伪造音频检测
全局检测
局部定位
伪造溯源
-
Keywords
audio deepfake detection
global deepfake audio detection
local deepfake audio localization
deepfake audio source tracing
-
分类号
TP393.2
[自动化与计算机技术—计算机应用技术]
-
-
题名说话人音频攻击与对抗技术研究综述
- 2
-
-
作者
孙知信
赵杰
王恩良
刘晨磊
范连成
刘畅
-
机构
南京邮电大学江苏省邮政大数据技术与应用工程研究中心
南京邮电大学国家邮政局邮政行业技术研发中心(物联网技术)
南京邮电大学宽带无线通信与传感网技术教育部重点实验室
安徽南陵县邮政业发展中心
-
出处
《南京邮电大学学报(自然科学版)》
北大核心
2024年第4期17-29,共13页
-
基金
国家自然科学基金(61972208,62272239)资助项目。
-
文摘
文中概括了说话人音频攻击与对抗技术的最新进展。由于说话人音频攻击已经成为语音应用安全的严重威胁,以WaveNet、Transformer和GAN三种模型在音频攻击技术中的应用作为节点,分别介绍以其为基础的音频攻击技术。音频对抗技术则以涵盖的攻击技术分为3类,分别是基础音频攻击、重放攻击和深度伪造攻击。系统地阐述了音频攻击与对抗技术的最新研究成果,并分析比较了各算法在不同条件下的优劣,同时还介绍了音频技术常用的数据集。最后结合该领域目前的研究现状,提出了说话人音频攻防对抗技术研究中亟待关注与研究的问题。
-
关键词
说话人音频
音频伪造
音频鉴伪
音频数据集
深度学习
-
Keywords
speaker audio
audio forgery
audio forensics
audio datasets
deep learning
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-