期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
使用全局自注意Teager能量倒谱系数检测重放欺骗语音
1
作者
陈铭
陈雪勤
《声学学报》
EI
CAS
CSCD
北大核心
2024年第5期1122-1130,共9页
提出了一种基于能量的前端特征提取方法,旨在应对自动说话人验证系统中面临的重放攻击威胁。该方法实现了全频段上的可变分辨率,以充分利用重放语音与真实语音在子带能量上的高鉴别非线性信息。首先,通过采用F-ratio方法统计分析了多种...
提出了一种基于能量的前端特征提取方法,旨在应对自动说话人验证系统中面临的重放攻击威胁。该方法实现了全频段上的可变分辨率,以充分利用重放语音与真实语音在子带能量上的高鉴别非线性信息。首先,通过采用F-ratio方法统计分析了多种录音和播放设备。接着,根据统计结果在全频段上设计了一组滤波器,旨在捕获高鉴别能量信息。最后,利用Teager能量算子计算子带滤波信号的能量,提出了全局自注意Teager能量倒谱系数(GSTECC)。为了验证所提方法的有效性,采用高斯混合模型作为分类器,在ASVspoof 2017 V2和ASVspoof 2021 PA数据库上进行了一系列测试实验。实验结果表明,相对于其他先进特征提取方法,所提GSTECC特征在检测重放攻击方面表现出更优异的性能。
展开更多
关键词
说话人验证
重放攻击检测
全局自注意特征
Teager
能量倒谱系数
非线性滤波器组
下载PDF
职称材料
基于VMD和Teager能量算子倒谱的方言语种识别
被引量:
1
2
作者
付英
刘增力
《通信技术》
2022年第4期435-442,共8页
针对汉语方言识别率低和在噪声环境下鲁棒性差问题,将特征提取与语音增强结合,提出一种基于变分模态分解(Variational Mode Decomposition,VMD)的改进梅尔频率倒谱系数(MelFrequency Cepstral Coefficients,MFCC)和Teager能量算子倒谱系...
针对汉语方言识别率低和在噪声环境下鲁棒性差问题,将特征提取与语音增强结合,提出一种基于变分模态分解(Variational Mode Decomposition,VMD)的改进梅尔频率倒谱系数(MelFrequency Cepstral Coefficients,MFCC)和Teager能量算子倒谱系数(Teager Energy Operator Cepstral Coefficient,TEOCC)融合的特征提取算法。该算法先将方言信号经VMD改进算法提取特征后再与TEOCC融合,最后通过高斯混合通用背景模型(Gaussian Mixture Model-Universal Background Model,GMM-UBM)进行方言语种识别。实验结果表明:相对于单一的MFCC特征,所提方法在无噪和有噪环境下识别率均有所提升,验证了改进算法在方言语种识别中的有效性。
展开更多
关键词
方言识别
变分模态分解
Teager
能量
算子
倒
谱系
数
语音增强
下载PDF
职称材料
基于Gammatone滤波器和子带能量规整的语音特征提取
被引量:
2
3
作者
龙乐凯
周萍
杨海燕
《测控技术》
CSCD
2017年第5期21-24,28,共5页
为了改善传统语音特征参数在复杂环境下识别性能不足的问题,提出了一种基于Gammatone滤波器和子带能量规整的语音特征提取方法。该方法以能量规整倒谱系数(PNCC)特征算法为基础,在前端引入平滑幅度包络和归一化Gammatone滤波器组,并通...
为了改善传统语音特征参数在复杂环境下识别性能不足的问题,提出了一种基于Gammatone滤波器和子带能量规整的语音特征提取方法。该方法以能量规整倒谱系数(PNCC)特征算法为基础,在前端引入平滑幅度包络和归一化Gammatone滤波器组,并通过子带能量规整方法抑制真实环境的背景噪声,最后在后端进行特征弯折和信道补偿处理加以改进。实验采用高斯混合通用背景分类器模型(GMM-UBM)将该算法和其他特征参数进行对比。结果表明,在多种噪声环境中相比其他特征参数,本文方法表现出良好的抗噪能力,即使在低信噪比下仍有较好的识别效果。
展开更多
关键词
特征提取
Gammatone滤波器
子带
能量
规整
能量
规整
倒
谱系
数
信道补偿
下载PDF
职称材料
基于计算听觉场景分析的说话人转换检测
被引量:
1
4
作者
杨登舟
刘加
夏善红
《计算机工程》
CAS
CSCD
北大核心
2018年第2期316-321,共6页
在短时语音说话人快速转变的说话人转换检测中,用于训练说话人模型的连续语音较短导致模型不稳健,致使说话人转换检测的性能较差。为此,提出一种新的说话人转换检测方法。借鉴人耳听觉处理机制将语音信号分解为多个子带,可以得到准确的...
在短时语音说话人快速转变的说话人转换检测中,用于训练说话人模型的连续语音较短导致模型不稳健,致使说话人转换检测的性能较差。为此,提出一种新的说话人转换检测方法。借鉴人耳听觉处理机制将语音信号分解为多个子带,可以得到准确的浊、清音边界,实现对零散清、浊音子段的拼接。利用贝叶斯信息准则判决语音子段间的疑似转换点,并运用音高特征做区间验证。实验结果表明,该方法在平均语音子段时长为1.34 s的极短语音条件下,可使说话人转换检测的等错率降至23.2%,F1值达到70%。
展开更多
关键词
说话人转换检测
计算听觉场景分析
伽马通
能量倒谱系数
音高
贝叶斯信息准则
下载PDF
职称材料
题名
使用全局自注意Teager能量倒谱系数检测重放欺骗语音
1
作者
陈铭
陈雪勤
机构
苏州大学电子信息学院
出处
《声学学报》
EI
CAS
CSCD
北大核心
2024年第5期1122-1130,共9页
基金
国家自然科学基金项目(61340004)资助。
文摘
提出了一种基于能量的前端特征提取方法,旨在应对自动说话人验证系统中面临的重放攻击威胁。该方法实现了全频段上的可变分辨率,以充分利用重放语音与真实语音在子带能量上的高鉴别非线性信息。首先,通过采用F-ratio方法统计分析了多种录音和播放设备。接着,根据统计结果在全频段上设计了一组滤波器,旨在捕获高鉴别能量信息。最后,利用Teager能量算子计算子带滤波信号的能量,提出了全局自注意Teager能量倒谱系数(GSTECC)。为了验证所提方法的有效性,采用高斯混合模型作为分类器,在ASVspoof 2017 V2和ASVspoof 2021 PA数据库上进行了一系列测试实验。实验结果表明,相对于其他先进特征提取方法,所提GSTECC特征在检测重放攻击方面表现出更优异的性能。
关键词
说话人验证
重放攻击检测
全局自注意特征
Teager
能量倒谱系数
非线性滤波器组
Keywords
Speaker verification
Replay attack detection
Global self-attention feature
Teager energy cepstral coefficients
Nonlinear filter bank
分类号
TP3 [自动化与计算机技术—计算机科学与技术]
下载PDF
职称材料
题名
基于VMD和Teager能量算子倒谱的方言语种识别
被引量:
1
2
作者
付英
刘增力
机构
昆明理工大学信息工程与自动化学院
昆明理工大学云南省人工智能重点实验室
出处
《通信技术》
2022年第4期435-442,共8页
基金
国家自然科学基金项目(61271007)。
文摘
针对汉语方言识别率低和在噪声环境下鲁棒性差问题,将特征提取与语音增强结合,提出一种基于变分模态分解(Variational Mode Decomposition,VMD)的改进梅尔频率倒谱系数(MelFrequency Cepstral Coefficients,MFCC)和Teager能量算子倒谱系数(Teager Energy Operator Cepstral Coefficient,TEOCC)融合的特征提取算法。该算法先将方言信号经VMD改进算法提取特征后再与TEOCC融合,最后通过高斯混合通用背景模型(Gaussian Mixture Model-Universal Background Model,GMM-UBM)进行方言语种识别。实验结果表明:相对于单一的MFCC特征,所提方法在无噪和有噪环境下识别率均有所提升,验证了改进算法在方言语种识别中的有效性。
关键词
方言识别
变分模态分解
Teager
能量
算子
倒
谱系
数
语音增强
Keywords
dialect recognition
VMD(Variational Mode Decomposition)
TEOCC(Teager Energy Operator Cepstral Coefficients)
speech enhancement
分类号
TN912.3 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
基于Gammatone滤波器和子带能量规整的语音特征提取
被引量:
2
3
作者
龙乐凯
周萍
杨海燕
机构
桂林电子科技大学信息与通信学院
桂林电子科技大学电子工程与自动化学院
出处
《测控技术》
CSCD
2017年第5期21-24,28,共5页
基金
广西省自然科学基金项目(2012GXNSFAA053221)
广西千亿元产业产学研用合作项目(信科院0168)
文摘
为了改善传统语音特征参数在复杂环境下识别性能不足的问题,提出了一种基于Gammatone滤波器和子带能量规整的语音特征提取方法。该方法以能量规整倒谱系数(PNCC)特征算法为基础,在前端引入平滑幅度包络和归一化Gammatone滤波器组,并通过子带能量规整方法抑制真实环境的背景噪声,最后在后端进行特征弯折和信道补偿处理加以改进。实验采用高斯混合通用背景分类器模型(GMM-UBM)将该算法和其他特征参数进行对比。结果表明,在多种噪声环境中相比其他特征参数,本文方法表现出良好的抗噪能力,即使在低信噪比下仍有较好的识别效果。
关键词
特征提取
Gammatone滤波器
子带
能量
规整
能量
规整
倒
谱系
数
信道补偿
Keywords
feature extraction
Gammatone filter bank
sub-band power normalized
PNCC
channel compensation
分类号
TN912.34 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
基于计算听觉场景分析的说话人转换检测
被引量:
1
4
作者
杨登舟
刘加
夏善红
机构
中国科学院电子学研究所
中国科学院大学
清华大学电子工程系
出处
《计算机工程》
CAS
CSCD
北大核心
2018年第2期316-321,共6页
基金
国家自然科学基金"噪声和短语音条件下的说话人识别"(61370034)
文摘
在短时语音说话人快速转变的说话人转换检测中,用于训练说话人模型的连续语音较短导致模型不稳健,致使说话人转换检测的性能较差。为此,提出一种新的说话人转换检测方法。借鉴人耳听觉处理机制将语音信号分解为多个子带,可以得到准确的浊、清音边界,实现对零散清、浊音子段的拼接。利用贝叶斯信息准则判决语音子段间的疑似转换点,并运用音高特征做区间验证。实验结果表明,该方法在平均语音子段时长为1.34 s的极短语音条件下,可使说话人转换检测的等错率降至23.2%,F1值达到70%。
关键词
说话人转换检测
计算听觉场景分析
伽马通
能量倒谱系数
音高
贝叶斯信息准则
Keywords
Speaker Change Detection(SCD)
Computational Auditory Scene Analysis(CASA)
Gammatone Energy Cepstral Coefficients(GECC)
pitch
Bayesian Information Criterion(BCI)
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
使用全局自注意Teager能量倒谱系数检测重放欺骗语音
陈铭
陈雪勤
《声学学报》
EI
CAS
CSCD
北大核心
2024
0
下载PDF
职称材料
2
基于VMD和Teager能量算子倒谱的方言语种识别
付英
刘增力
《通信技术》
2022
1
下载PDF
职称材料
3
基于Gammatone滤波器和子带能量规整的语音特征提取
龙乐凯
周萍
杨海燕
《测控技术》
CSCD
2017
2
下载PDF
职称材料
4
基于计算听觉场景分析的说话人转换检测
杨登舟
刘加
夏善红
《计算机工程》
CAS
CSCD
北大核心
2018
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部