-
题名基于听皮层神经元感受野的强噪声环境下说话人识别
被引量:3
- 1
-
-
作者
牛晓可
黄伊鑫
徐华兴
蒋震阳
-
机构
郑州大学电气工程学院
河南省脑科学与脑机接口技术重点实验室(郑州大学)
-
出处
《计算机应用》
CSCD
北大核心
2020年第10期3034-3040,共7页
-
基金
国家自然科学基金资助项目(11804309)。
-
文摘
针对说话人识别易受环境噪声影响的问题,借鉴生物听皮层神经元频谱-时间感受野(STRF)的时空滤波机制,提出一种新的声纹特征提取方法。在该方法中,对基于STRF获得的听觉尺度-速率图进行了二次特征提取,并与传统梅尔倒谱系数(MFCC)进行组合,获得了对环境噪声具有强容忍的声纹特征。采用支持向量机(SVM)作为分类器,对不同信噪比(SNR)语音数据进行测试的结果表明,基于STRF的特征对噪声的鲁棒性普遍高于MFCC系数,但识别正确率较低;组合特征提升了语音识别的正确率,同时对环境噪声具有良好的鲁棒性。该结果说明所提方法在强噪声环境下说话人识别上是有效的。
-
关键词
听皮层
频谱-时间感受野
梅尔倒谱系数
含噪说话人识别
支持向量机
-
Keywords
auditory cortex
Spectral-Temporal Receptive Field(STRF)
Mel-Frequency Ceptral Coefficient(MFCC)
noisy speaker recognition
Support Vector Machine(SVM)
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-