-
题名基于注意力机制的端到端合成语音检测
被引量:2
- 1
-
-
作者
王锦阳
华光
黄双
-
机构
武汉大学电子信息学院
武汉第二船舶设计研究所
-
出处
《信号处理》
CSCD
北大核心
2022年第9期1975-1987,共13页
-
基金
国家自然科学基金(61802284)。
-
文摘
近年来深度伪造(Deepfake)技术的迅猛发展使合成语音的自然度和拟人度有了显著提升,对合成语音检测研究提出了更大挑战。本文将五种轻量级注意力模块中的机制改进为适用于语音序列的通道注意力机制和一维空间注意力机制,然后将模块分别嵌入到Inc-TSSDNet网络中,提出基于注意力机制的端到端合成语音检测系统。结果表明,改进系统能够重点关注某些对于检测真伪更关键的通道或区域来提高检测性能,相比于基线模型,引入注意力机制的十种模型在增加的参数量较少的情况下,ASVspoof2019测试集的等错误率(Equal Error Rate,EER)和最小串联检测代价函数(Minimum Tandem Detection Cost Function,min t-DCF)都有所降低,其中在池化层之前嵌入CBAM(Convolutional Block Attention Module)的模型测试集EER最低且具有较强的泛化性,在池化层之前嵌入ECA(Efficient Channel Attention)模块的模型测试集min t-DCF最低且统计性能较基线模型有显著提升。
-
关键词
合成语音检测
端到端
通道注意力机制
一维空间注意力机制
-
Keywords
synthetic speech detection
end-to-end
channel attention mechanism
one-dimensional spatial attention mechanism
-
分类号
TN912
[电子电信—通信与信息系统]
-