针对现有视频伪造数据集缺少多模态伪造场景与部分伪造场景的问题,构建一个综合使用多种音、视频伪造方法的、伪造比例可调的多模态部分伪造数据集PartialFAVCeleb。所提数据集基于FakeAVCeleb多模态伪造数据集,并通过拼接真伪数据构建...针对现有视频伪造数据集缺少多模态伪造场景与部分伪造场景的问题,构建一个综合使用多种音、视频伪造方法的、伪造比例可调的多模态部分伪造数据集PartialFAVCeleb。所提数据集基于FakeAVCeleb多模态伪造数据集,并通过拼接真伪数据构建,其中伪造数据由FaceSwap、FSGAN(Face Swapping Generative Adversarial Network)、Wav2Lip(Wave to Lip)和SV2TTS(Speaker Verification to Text-To-Speech)这4种方法生成。在拼接过程中,使用概率方法生成伪造片段在时域与模态上的定位,并对边界进行随机化处理以贴合实际伪造场景,并通过素材筛选避免背景跳变现象。最终生成的数据集对于每个伪造比例可产生3970条视频数据。在基准检测中,使用多种音视频特征提取器,并分别进行强、弱监督两种条件下的测试,其中弱监督测试基于层次多示例学习(HMIL)方法实现。测试结果显示,各个测试模型在伪造比例较低数据上的性能表现显著低于在伪造比例较高数据上的性能,且弱监督条件下各模型的性能表现显著低于强监督条件下的表现,这验证了该部分伪造数据集的弱监督检测困难性。以上结果表明,以所提数据集为代表的多模态部分伪造场景有充分的研究价值。展开更多
研究了使用垂直线列阵情况下,浅海环境中的模态空间检测器(modal space detector,MSD)的检测性能.推导了MSD的处理增益,结果表明其处理增益随波导环境中传播模态数的增多而减小,进而其检测性能也随之下降.利用各阶模态深度函数之间的正...研究了使用垂直线列阵情况下,浅海环境中的模态空间检测器(modal space detector,MSD)的检测性能.推导了MSD的处理增益,结果表明其处理增益随波导环境中传播模态数的增多而减小,进而其检测性能也随之下降.利用各阶模态深度函数之间的正交性,将MSD分解为若干阶模态子空间检测器(modal subspace detector,MSSD).推导了各阶MSSD的处理增益,发现其随各阶模态衰减系数的增大而减小.根据各阶模态的衰减规律设计加权系数,提出一种加权模态子空间检测器(weighted modal subspace detector,WMSSD).以处理增益作为比较参量,通过理论和仿真实验分析了声源位置和声速剖面对WMSSD检测性能的影响.结果表明:(1)当声源位于负梯度声速波导的近海面区域和正梯度声速波导的近海底区域时,由于低阶模态深度函数存在反转点,WMSSD的处理增益弱于MSD,而当声源位于其他大部分观测区域时,WMSSD的处理增益都优于或显著优于MSD;(2)在等声速梯度波导中,各阶模态深度函数不存在反转点,在所有观测区域WMSSD的处理增益都显著优于MSD.展开更多
文摘针对现有视频伪造数据集缺少多模态伪造场景与部分伪造场景的问题,构建一个综合使用多种音、视频伪造方法的、伪造比例可调的多模态部分伪造数据集PartialFAVCeleb。所提数据集基于FakeAVCeleb多模态伪造数据集,并通过拼接真伪数据构建,其中伪造数据由FaceSwap、FSGAN(Face Swapping Generative Adversarial Network)、Wav2Lip(Wave to Lip)和SV2TTS(Speaker Verification to Text-To-Speech)这4种方法生成。在拼接过程中,使用概率方法生成伪造片段在时域与模态上的定位,并对边界进行随机化处理以贴合实际伪造场景,并通过素材筛选避免背景跳变现象。最终生成的数据集对于每个伪造比例可产生3970条视频数据。在基准检测中,使用多种音视频特征提取器,并分别进行强、弱监督两种条件下的测试,其中弱监督测试基于层次多示例学习(HMIL)方法实现。测试结果显示,各个测试模型在伪造比例较低数据上的性能表现显著低于在伪造比例较高数据上的性能,且弱监督条件下各模型的性能表现显著低于强监督条件下的表现,这验证了该部分伪造数据集的弱监督检测困难性。以上结果表明,以所提数据集为代表的多模态部分伪造场景有充分的研究价值。