期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
使用全局自注意Teager能量倒谱系数检测重放欺骗语音
1
作者 陈铭 陈雪勤 《声学学报》 EI CAS CSCD 北大核心 2024年第5期1122-1130,共9页
提出了一种基于能量的前端特征提取方法,旨在应对自动说话人验证系统中面临的重放攻击威胁。该方法实现了全频段上的可变分辨率,以充分利用重放语音与真实语音在子带能量上的高鉴别非线性信息。首先,通过采用F-ratio方法统计分析了多种... 提出了一种基于能量的前端特征提取方法,旨在应对自动说话人验证系统中面临的重放攻击威胁。该方法实现了全频段上的可变分辨率,以充分利用重放语音与真实语音在子带能量上的高鉴别非线性信息。首先,通过采用F-ratio方法统计分析了多种录音和播放设备。接着,根据统计结果在全频段上设计了一组滤波器,旨在捕获高鉴别能量信息。最后,利用Teager能量算子计算子带滤波信号的能量,提出了全局自注意Teager能量倒谱系数(GSTECC)。为了验证所提方法的有效性,采用高斯混合模型作为分类器,在ASVspoof 2017 V2和ASVspoof 2021 PA数据库上进行了一系列测试实验。实验结果表明,相对于其他先进特征提取方法,所提GSTECC特征在检测重放攻击方面表现出更优异的性能。 展开更多
关键词 说话人验证 重放攻击检测 全局自注意特征 Teager 能量倒谱系数 非线性滤波器组
下载PDF
基于VMD和Teager能量算子倒谱的方言语种识别 被引量:1
2
作者 付英 刘增力 《通信技术》 2022年第4期435-442,共8页
针对汉语方言识别率低和在噪声环境下鲁棒性差问题,将特征提取与语音增强结合,提出一种基于变分模态分解(Variational Mode Decomposition,VMD)的改进梅尔频率倒谱系数(MelFrequency Cepstral Coefficients,MFCC)和Teager能量算子倒谱系... 针对汉语方言识别率低和在噪声环境下鲁棒性差问题,将特征提取与语音增强结合,提出一种基于变分模态分解(Variational Mode Decomposition,VMD)的改进梅尔频率倒谱系数(MelFrequency Cepstral Coefficients,MFCC)和Teager能量算子倒谱系数(Teager Energy Operator Cepstral Coefficient,TEOCC)融合的特征提取算法。该算法先将方言信号经VMD改进算法提取特征后再与TEOCC融合,最后通过高斯混合通用背景模型(Gaussian Mixture Model-Universal Background Model,GMM-UBM)进行方言语种识别。实验结果表明:相对于单一的MFCC特征,所提方法在无噪和有噪环境下识别率均有所提升,验证了改进算法在方言语种识别中的有效性。 展开更多
关键词 方言识别 变分模态分解 Teager能量算子谱系 语音增强
下载PDF
基于Gammatone滤波器和子带能量规整的语音特征提取 被引量:2
3
作者 龙乐凯 周萍 杨海燕 《测控技术》 CSCD 2017年第5期21-24,28,共5页
为了改善传统语音特征参数在复杂环境下识别性能不足的问题,提出了一种基于Gammatone滤波器和子带能量规整的语音特征提取方法。该方法以能量规整倒谱系数(PNCC)特征算法为基础,在前端引入平滑幅度包络和归一化Gammatone滤波器组,并通... 为了改善传统语音特征参数在复杂环境下识别性能不足的问题,提出了一种基于Gammatone滤波器和子带能量规整的语音特征提取方法。该方法以能量规整倒谱系数(PNCC)特征算法为基础,在前端引入平滑幅度包络和归一化Gammatone滤波器组,并通过子带能量规整方法抑制真实环境的背景噪声,最后在后端进行特征弯折和信道补偿处理加以改进。实验采用高斯混合通用背景分类器模型(GMM-UBM)将该算法和其他特征参数进行对比。结果表明,在多种噪声环境中相比其他特征参数,本文方法表现出良好的抗噪能力,即使在低信噪比下仍有较好的识别效果。 展开更多
关键词 特征提取 Gammatone滤波器 子带能量规整 能量规整谱系 信道补偿
下载PDF
基于计算听觉场景分析的说话人转换检测 被引量:1
4
作者 杨登舟 刘加 夏善红 《计算机工程》 CAS CSCD 北大核心 2018年第2期316-321,共6页
在短时语音说话人快速转变的说话人转换检测中,用于训练说话人模型的连续语音较短导致模型不稳健,致使说话人转换检测的性能较差。为此,提出一种新的说话人转换检测方法。借鉴人耳听觉处理机制将语音信号分解为多个子带,可以得到准确的... 在短时语音说话人快速转变的说话人转换检测中,用于训练说话人模型的连续语音较短导致模型不稳健,致使说话人转换检测的性能较差。为此,提出一种新的说话人转换检测方法。借鉴人耳听觉处理机制将语音信号分解为多个子带,可以得到准确的浊、清音边界,实现对零散清、浊音子段的拼接。利用贝叶斯信息准则判决语音子段间的疑似转换点,并运用音高特征做区间验证。实验结果表明,该方法在平均语音子段时长为1.34 s的极短语音条件下,可使说话人转换检测的等错率降至23.2%,F1值达到70%。 展开更多
关键词 说话人转换检测 计算听觉场景分析 伽马通能量倒谱系数 音高 贝叶斯信息准则
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部