期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于均值特征和改进深度神经网络的说话人识别算法 被引量:2
1
作者 罗春梅 张风雷 《声学技术》 CSCD 北大核心 2021年第4期503-507,共5页
为提高神经网络在说话人识别应用中的识别性能,提出基于高斯增值矩阵特征和改进深度卷积神经网络的说话人识别算法。算法首先通过最大后验概率提取基于梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)特征的高斯均值矩阵,... 为提高神经网络在说话人识别应用中的识别性能,提出基于高斯增值矩阵特征和改进深度卷积神经网络的说话人识别算法。算法首先通过最大后验概率提取基于梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)特征的高斯均值矩阵,并对特征进行噪声适应性补偿,以增强信号的帧间关联和说话人特征信息,然后采用改进的深度卷积神经网络进一步对准帧间信息,以提高说话人识别特征对背景噪声的适应性。实验结果表明,相比于高斯混合模型-通用背景模型等识别框架及传统MFCC等特征,该算法可取得更高的识别准确率和最小的识别均方误差。 展开更多
关键词 说话人识别 梅尔频率倒谱系数(MFCC) 深度卷积神经网络 高斯均值矩阵
下载PDF
基于卷积神经网络的鲁棒性说话人识别方法 被引量:9
2
作者 曾春艳 马超峰 +1 位作者 王志锋 孔祥斌 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2020年第6期39-44,共6页
为了提升说话人识别技术在复杂噪声环境下的识别性能,提出了一种基于高斯均值矩阵和卷积神经网络的鲁棒性说话人识别方法,应用于纯净语音训练出的模型上测试含噪语音的场景.其中高斯均值矩阵是采用最大后验概率(MAP)对传统的梅尔频率倒... 为了提升说话人识别技术在复杂噪声环境下的识别性能,提出了一种基于高斯均值矩阵和卷积神经网络的鲁棒性说话人识别方法,应用于纯净语音训练出的模型上测试含噪语音的场景.其中高斯均值矩阵是采用最大后验概率(MAP)对传统的梅尔频率倒谱系数(MFCC)特征进行自适应操作得到的,这一操作增加了帧与帧之间的关联性,使特征携带更丰富的说话人身份信息.同时采用卷积神经网络进一步对帧层面的信息进行对准,并从数据中学习到更有利于说话人识别的特征表示,从而提升说话人识别的鲁棒性.实验结果表明在Libri语音数据集上,所提出方法的鲁棒性优于GMM-UBM和GSV-SVM算法. 展开更多
关键词 说话人识别 鲁棒性 卷积神经网络 高斯均值矩阵 最大后验概率
原文传递
基于改进MFCC与RCNN的说话人识别算法 被引量:6
3
作者 罗春梅 《数学的实践与认识》 2021年第17期102-110,共9页
为提高传统MFCC等声学特征及深度卷积神经网络的识别性能和对背景噪声的适应性,提出基于改进MFCC特征和改进RCNN网络的说话人识别算法.算法首先提取说话人语音的改进MFCC特征并进行了特征补偿和特征降维,以优化说话人的特征提取性能;然... 为提高传统MFCC等声学特征及深度卷积神经网络的识别性能和对背景噪声的适应性,提出基于改进MFCC特征和改进RCNN网络的说话人识别算法.算法首先提取说话人语音的改进MFCC特征并进行了特征补偿和特征降维,以优化说话人的特征提取性能;然后采用池化层优化和残差卷积改进的DCNN网络进一步对准帧间信息,以提高说话人识别的特征学习准确性和对复杂背景干扰的适应性.实验结果表明,相比于i-vector和GMM-UBM识别框架及传统MFCC特征,文中算法取得最优的识别准确率和识别均方误差. 展开更多
关键词 说话人识别 梅尔频率倒谱系数 深度卷积神经网络 高斯均值矩阵
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部