期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
利用密集卷积神经网络的语音变换欺骗检测
1
作者 王泳 苏卓艺 朱铮宇 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2021年第4期168-175,共8页
语音变换欺骗是指利用语音处理算法改变原说话人的语音特征,从而导致说话人识别系统产生极高的错误拒绝率,达到隐藏说话人身份的目的。其实现成本低廉,并且已集成在众多的音频处理工具中,对社会安全带来严重威胁。然而,目前对于变换欺... 语音变换欺骗是指利用语音处理算法改变原说话人的语音特征,从而导致说话人识别系统产生极高的错误拒绝率,达到隐藏说话人身份的目的。其实现成本低廉,并且已集成在众多的音频处理工具中,对社会安全带来严重威胁。然而,目前对于变换欺骗的检测研究仍然不足。为此,提出了一种基于密集卷积神经网络的语音变换欺骗检测方法,以区分欺骗语音和真实语音。该网络总共包含135层的网络层,通过最大化短路径地连接强化数据传输,可同时利用深层和浅层的边缘特征进行分类,抑制退化现象,从而进一步提高检测的准确率。实验结果表明,该算法对不同欺骗因子下的欺骗语音的检测准确率超过了98%。 展开更多
关键词 语音变换欺骗 安全 检测 神经网络
下载PDF
基于唇重构与三维耦合CNN的多视角音唇一致性判别
2
作者 朱铮宇 罗超 +3 位作者 贺前华 彭炜锋 毛志炜 张顺四 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2023年第5期70-77,共8页
针对传统音唇一致性判别方法主要对正面唇动视频进行处理,未考虑视频采集角度变化对结果的影响,且容易忽略唇动过程中的时空特性等不足,文中以唇部角度变化对一致性判别的影响为研究重心,结合三维卷积神经网络在非线性表示和时空维度特... 针对传统音唇一致性判别方法主要对正面唇动视频进行处理,未考虑视频采集角度变化对结果的影响,且容易忽略唇动过程中的时空特性等不足,文中以唇部角度变化对一致性判别的影响为研究重心,结合三维卷积神经网络在非线性表示和时空维度特征提取上的优势,提出了基于正面唇重构与三维耦合卷积神经网络的多视角音唇一致性判别方法。该方法先通过在生成器中引入自映射损失来提高正面重建效果,并采用基于自映射监督循环一致性生成对抗网络(SMS-CycleGAN)的唇重构方法对多视角唇图进行角度分类及正面重构;然后设计两个异构三维卷积神经网络,分别用来描述音频和视频信号,并提取包含长时时空关联信息的三维卷积特征;最后引入对比损失函数作为音视频信号匹配的相关度鉴别度量,将音视频网络输出耦合到同一表示空间,并进行一致性判别。实验结果表明,文中方法能重建出更高质量的正面唇图,一致性判别性能优于多种不同类型的比较方法。 展开更多
关键词 一致性判别 生成对抗网络 卷积神经网络 正面重构 多模态
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部