期刊文献+
共找到55篇文章
< 1 2 3 >
每页显示 20 50 100
基于多尺度梅尔倒谱系数的转辙机声信号状态识别方法 被引量:1
1
作者 姜琦 冯庆胜 《科学技术与工程》 北大核心 2022年第16期6680-6686,共7页
为了准确地识别铁路转辙机所处的工作状态,保证列车能够安全行驶并转向,提出了一种基于声音信号的转辙机状态识别方法。首先将声音信号预处理后提取其梅尔倒谱系数(Mel frequency cepstrum coefficient,MFCC);为更加全面表征转辙机声信... 为了准确地识别铁路转辙机所处的工作状态,保证列车能够安全行驶并转向,提出了一种基于声音信号的转辙机状态识别方法。首先将声音信号预处理后提取其梅尔倒谱系数(Mel frequency cepstrum coefficient,MFCC);为更加全面表征转辙机声信号的特点,对MFCC进行改进得到多尺度MFCC特征;引入卷积神经网络(convolutional neural network,CNN)构建转辙机声信号识别模型,并采用五折交叉验证法获得两种特征的识别准确率。将S700K型转辙机在4种状态下运行时采集的真实声音信号进行训练和测试。结果表明:多尺度MFCC特征可使转辙机声音状态识别准确率至少提高7.5%。并且在低信噪比(signal-to-noise ratio,SNR)下,多尺度MFCC特征也有更好的表现,其准确率相较传统MFCC可提升35%。 展开更多
关键词 梅尔系数(mfcc) 卷积神经网络(CNN) 交叉验证 状态识别 转辙机
下载PDF
采用复倒谱峰值滤波GMM识别混响语音
2
作者 孔荣 吴迪 +3 位作者 廖启鹏 朱俊杰 周强 陶智 《计算机工程与应用》 CSCD 2014年第15期191-193,203,共4页
针对混响环境下语音识别系统性能急剧下降问题,提出一种采用复倒谱峰值滤波GMM识别混响语音的方法。通过训练纯净语音的MFCC特征参数构建高斯混合模型,在识别混响语音前引入复倒谱峰值滤波器以减少混响引起的语音失真而提高混响环境下... 针对混响环境下语音识别系统性能急剧下降问题,提出一种采用复倒谱峰值滤波GMM识别混响语音的方法。通过训练纯净语音的MFCC特征参数构建高斯混合模型,在识别混响语音前引入复倒谱峰值滤波器以减少混响引起的语音失真而提高混响环境下语音识别率。经实验验证,该方法避免了在现实条件下准确估计房间冲击响应函数的麻烦,降低了计算难度,提高了混响环境下至少4%的系统识别率。 展开更多
关键词 高斯混合模型 Mel频率系数(mfcc)
下载PDF
融合倒谱特征的脑电(EEG)情感分类 被引量:7
3
作者 周奕隽 李冬冬 +1 位作者 王喆 高大启 《计算机工程与应用》 CSCD 北大核心 2020年第21期164-169,共6页
近年来,通过分析脑电图(EEG)信号来实现情感识别的课题越来越被研究者所重视。为了丰富特征的表示能力,获得更高的情感识别分类准确率,尝试将语音信号特征梅尔频率倒谱系数MFCC应用于脑电信号。在对EEG信号小波变换的基础上将提取得到的... 近年来,通过分析脑电图(EEG)信号来实现情感识别的课题越来越被研究者所重视。为了丰富特征的表示能力,获得更高的情感识别分类准确率,尝试将语音信号特征梅尔频率倒谱系数MFCC应用于脑电信号。在对EEG信号小波变换的基础上将提取得到的MFCC特征与EEG特征相互融合,通过利用深度残差网络(ResNet18)的特性进行情感分类识别。实验结果表明,比起传统的单一利用EEG特征,添加了MFCC特征使得情感维度Arousal和Valence两者的识别准确率分别提升了6%和4%,达到了86.01%和85.46%,从而提升了情感的识别准确度。 展开更多
关键词 脑电信号 梅尔系数(mfcc) 特征融合 深度残差网络
下载PDF
基于鲁棒主成分分析和MFCC反复结构的歌声分离方法
4
作者 熊天 张天骐 +1 位作者 闻斌 吴超 《声学技术》 CSCD 北大核心 2023年第6期794-803,共10页
针对单一传统方法对歌声分离不彻底的问题,文章提出了一种基于鲁棒主成分分析(Robust Principal Component Analysis,RPCA)和梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficients,MFCC)反复结构的两步歌声伴奏分离模型。该模型有效... 针对单一传统方法对歌声分离不彻底的问题,文章提出了一种基于鲁棒主成分分析(Robust Principal Component Analysis,RPCA)和梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficients,MFCC)反复结构的两步歌声伴奏分离模型。该模型有效地改善了鲁棒主成分分析对歌声分离不完全和梅尔频率倒谱系数反复结构歌声在低频处分离不佳的问题。首先使用鲁棒主成分分析将混合音乐信号分解为低秩矩阵和稀疏矩阵,然后分别对其提取梅尔频率倒谱系数特征参数并且对其进行相似运算,构建相似矩阵及建立梅尔频率倒谱系数反复结构模型并通过反复结构模型分别得到低秩矩阵和稀疏矩阵相关的掩蔽矩阵,最后根据构建的掩蔽矩阵模型以及傅里叶逆变换得到背景音乐和歌声。在公开数据集上进行了实验,实验结果表明本文算法在歌声分离性能上与比较算法相比,平均信号干扰比值最高有接近7 dB的提高。 展开更多
关键词 鲁棒主成分分析(RPCA) 梅尔频率系数(mfcc) 歌声伴奏分离 反复结构
下载PDF
基于MFCC的空中交通管制语音指令的特征提取研究
5
作者 王兴林 《电声技术》 2023年第6期68-72,共5页
随着人工智能技术的不断应用,智能安全与智慧民航不断深入发展,通过科技手段提高空中交通飞行安全成为全球民航的共同选择。空中交通管制语音数据作为民航新型生产要素,对语音信号进行深入研究并合理运用,对于提高飞行安全具有重要意义... 随着人工智能技术的不断应用,智能安全与智慧民航不断深入发展,通过科技手段提高空中交通飞行安全成为全球民航的共同选择。空中交通管制语音数据作为民航新型生产要素,对语音信号进行深入研究并合理运用,对于提高飞行安全具有重要意义。文章介绍空中交通管制指令的基本要求,详细分析语音信号特征提取的各个环节,通过梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)提取语音信号的特征,再使用高斯混合模型(Gaussian Mixture Model,GMM)进行训练和分类,从而实现语音信号的识别,具有一定的实际运用价值。 展开更多
关键词 语音信号 特征提取 梅尔频率系数(mfcc) 高斯混合模型(GMM) 模型训练
下载PDF
混合MFCC特征参数应用于语音情感识别 被引量:18
6
作者 周萍 李晓盼 +1 位作者 李杰 景新幸 《计算机测量与控制》 北大核心 2013年第7期1966-1968,1986,共4页
引入两种新的特征参数Mid-MFCC和IMFCC,采用MFCC、Mid-MFCC和IMFCC相结合的改进算法,解决MFCC特征参数在语音识别中对中、高频信号的识别精度不高的特点,并使用增减分量法计算MFCC、Mid-MFCC和IMFCC各阶倒谱分量对语音情感识别的贡献,提... 引入两种新的特征参数Mid-MFCC和IMFCC,采用MFCC、Mid-MFCC和IMFCC相结合的改进算法,解决MFCC特征参数在语音识别中对中、高频信号的识别精度不高的特点,并使用增减分量法计算MFCC、Mid-MFCC和IMFCC各阶倒谱分量对语音情感识别的贡献,提取3个特征参数贡献最高的几阶倒谱分量组成了新的特征参数;实验结果表明,在相同环境下新的特征参数比经典MFCC特征参数的语音情感的识别率稍高。 展开更多
关键词 Mel频率系数(mfcc) 增减分量法 特征提取
下载PDF
基于声音特征的隧道衬砌空洞识别方法研究
7
作者 代晓景 暴学志 +2 位作者 柴雪松 周城光 阎兆立 《声学技术》 CSCD 北大核心 2024年第1期135-141,共7页
目前隧道衬砌空洞检测以人工敲击判断为主,检测过程中由于受到检测人员水平、注意力等主观因素影响,检测结果存在较大不确定性,因此有必要研制一种智能化的检测装置实现空洞自动识别。文章开展了衬砌空洞敲击回声智能识别算法研究,通过... 目前隧道衬砌空洞检测以人工敲击判断为主,检测过程中由于受到检测人员水平、注意力等主观因素影响,检测结果存在较大不确定性,因此有必要研制一种智能化的检测装置实现空洞自动识别。文章开展了衬砌空洞敲击回声智能识别算法研究,通过提取隧道衬砌冲击回波的梅尔倒谱系数(Mel Frequency Cepstral Coefficient,MFCC)作为特征,针对敲击回声脉冲信号长度不一的特点,提出了变帧长MFCC优化算法,并面向小样本条件,建立了支持向量机(Support Vector Machine,SVM)的识别模型。试验结果表明,该模型对衬砌空洞识别准确率可达89.9%。 展开更多
关键词 隧道衬砌空洞 声学信号处理 梅尔系数(mfcc) 支持向量机(SVM)
下载PDF
改进的混合MFCC语音识别算法研究 被引量:18
8
作者 袁正午 肖旺辉 《计算机工程与应用》 CSCD 北大核心 2009年第33期108-110,共3页
针对MFCC特征参数在语音识别中对中高频信号的识别精度不高的特点,提出采用IMFCC,MIDMFCC,MFCC相结合的改进算法,使用混合滤波器组,提高在语音中高频区域中的识别精度。实验结果表明,改进之后的算法与经典算法比较,在相同环境下对语音... 针对MFCC特征参数在语音识别中对中高频信号的识别精度不高的特点,提出采用IMFCC,MIDMFCC,MFCC相结合的改进算法,使用混合滤波器组,提高在语音中高频区域中的识别精度。实验结果表明,改进之后的算法与经典算法比较,在相同环境下对语音信息的识别率都有一定程度的提高。 展开更多
关键词 Mel频率系数(mfcc) 语音识别 特征提取
下载PDF
结合MFCC分析和仿生模式识别的语音识别研究 被引量:4
9
作者 王宪保 陈勇 汤丽平 《计算机工程与应用》 CSCD 北大核心 2011年第12期20-22,26,共4页
提出了一种基于MFCC系数分析和仿生模式识别的语音识别方法,该方法对训练样本MFCC相同分量在各类语音间距离进行了分析,并通过与传统选取方法的比较实验,说明在小词汇量的语音识别中,选取合适的MFCC系数,不仅能减小计算量,正确识别率也... 提出了一种基于MFCC系数分析和仿生模式识别的语音识别方法,该方法对训练样本MFCC相同分量在各类语音间距离进行了分析,并通过与传统选取方法的比较实验,说明在小词汇量的语音识别中,选取合适的MFCC系数,不仅能减小计算量,正确识别率也会得到一定程度的提高。运用仿生模式识别理论中同类样本连续的观点,通过在特征空间中对训练样本进行有效的覆盖,大大提高了识别结果。 展开更多
关键词 仿生模式识别 语音识别 Mel频率系数(mfcc)
下载PDF
采用MFCC和DTW的咳嗽干湿性自动分类技术 被引量:3
10
作者 李文 莫鸿强 +2 位作者 田联房 阳国清 郑则广 《计算机工程与应用》 CSCD 北大核心 2010年第13期209-212,共4页
咳嗽是一种在呼吸疾病中常见的症状。对病人的咳嗽类型进行分类和统计对病人的病理分析将有极大帮助。提出了一种基于MFCC特征和DTW模板匹配的方法来对病人的咳嗽进行自动干湿性分类。通过训练咳嗽样本,使用特征提取算法得到它们的MFCC... 咳嗽是一种在呼吸疾病中常见的症状。对病人的咳嗽类型进行分类和统计对病人的病理分析将有极大帮助。提出了一种基于MFCC特征和DTW模板匹配的方法来对病人的咳嗽进行自动干湿性分类。通过训练咳嗽样本,使用特征提取算法得到它们的MFCC特征参数从而生成用于比较的参考模板库。然后对需要进行分类的咳嗽信号进行同样的特征提取过程,并将参数和模板库中的进行匹配从而得出咳嗽的干湿性类别。文中对78个未知类型的咳嗽样本进行分类,得出干性咳嗽57个,湿性咳嗽21个,分类错误率为7.69%。经进一步处理,可以将分类错误率减少到仅为2.56%。 展开更多
关键词 咳嗽自动分类 mel频率系数(mfcc) 动态时间规整(DTW)
下载PDF
结合节拍语义和MFCC声学特征的音乐流派分类 被引量:7
11
作者 庄严 于凤芹 《计算机工程与应用》 CSCD 北大核心 2015年第3期197-201,共5页
由于音乐节拍的强度、快慢、持续时间等是反映音乐不同流派风格的重要语义特征,而音乐节拍多属于由打击乐器所产生的低频部分,为此利用小波变换对音乐信号进行6层分解来提取低频节拍特征;针对节拍特征差异不明显的音乐流派,提出用描述... 由于音乐节拍的强度、快慢、持续时间等是反映音乐不同流派风格的重要语义特征,而音乐节拍多属于由打击乐器所产生的低频部分,为此利用小波变换对音乐信号进行6层分解来提取低频节拍特征;针对节拍特征差异不明显的音乐流派,提出用描述频域能量包络的MFCC声学特征与节拍特征结合,并用基于音乐流派机理分析的8阶MFCC代替常用的12阶MFCC。对8类音乐流派实验仿真结果表明,基于语义特征和声学特征结合的方法,总体分类准确率可达68.37%,同时特征维数增加对分类时间影响很小。 展开更多
关键词 音乐流派分类 节拍特征 Mel频率系数(mfcc) 小波分解 支持向量机
下载PDF
短时谱特征的汉语重音检测方法研究 被引量:2
12
作者 赵云雪 张珑 郑世杰 《计算机科学与探索》 CSCD 2014年第9期1120-1128,共9页
重音是语言交流中不可或缺的部分,在语言交流中扮演着非常重要的角色。为了验证基于听觉模型的短时谱特征集在汉语重音检测方法中的应用效果,使用MFCC(Mel frequency cepstrum coefficient)和RASTAPLP(relative spectra perceptual line... 重音是语言交流中不可或缺的部分,在语言交流中扮演着非常重要的角色。为了验证基于听觉模型的短时谱特征集在汉语重音检测方法中的应用效果,使用MFCC(Mel frequency cepstrum coefficient)和RASTAPLP(relative spectra perceptual linear prediction)算法提取每个语音段的短时谱信息,分别构建了基于MFCC算法的短时谱特征集和基于RASTA-PLP算法的短时谱特征集;选用NaiveBayes分类器对这两类特征集进行建模,把具有最大后验概率的类作为该对象所属的类,这种分类方法充分利用了当前语音段的相关语音特性;基于MFCC的短时谱特征集和基于RASTA-PLP的短时谱特征集在ASCCD(annotated speech corpus of Chinese discourse)上能够分别得到82.1%和80.8%的汉语重音检测正确率。实验结果证明,基于MFCC的短时谱特征和基于RASTA-PLP的短时谱特征能用于汉语重音检测研究。 展开更多
关键词 重音检测 Mel频率系数(mfcc) 相关感知线性预测(RASTA-PLP) 短时特征
下载PDF
用于说话人识别的MFCC的改进算法 被引量:8
13
作者 张伟伟 杨鼎才 《电子测量技术》 2009年第8期118-121,共4页
在说话人识别系统中,MFCC参数是使用最多的特征参数之一。MFCC参数主要描述了表征声道特性的谱包络特征,而忽略了基音频率对它的影响。基音频率会影响MFCC参数对声道特性的准确描述,进而影响说话人识别系统的性能。本文提出了一种基于... 在说话人识别系统中,MFCC参数是使用最多的特征参数之一。MFCC参数主要描述了表征声道特性的谱包络特征,而忽略了基音频率对它的影响。基音频率会影响MFCC参数对声道特性的准确描述,进而影响说话人识别系统的性能。本文提出了一种基于平滑幅度谱包络的MFCC的改进参数,该参数不直接对语音短时幅度谱进行提取,而是先对幅度谱进行平滑,在谱包络的基础上计算MFCC参数,以降低基音频率对其的影响。 展开更多
关键词 说话人识别 梅尔系数(mfcc) 基音频率
下载PDF
采用GW-MFCC模型空间参数的语音情感识别 被引量:1
14
作者 沈燕 肖仲喆 +3 位作者 李冰洁 周孝进 周强 陶智 《计算机工程与应用》 CSCD 北大核心 2015年第10期219-222,226,共5页
针对单一语音特征对语音情感表达不完整的问题,将具有良好量化和插值特性的LSF参数与体现人耳听觉特性的MFCC参数相融合,提出基于线谱权重的MFCC(WMFCC)新特征。同时,通过高斯混合模型来对该参数建立模型空间,进一步得到GW-MFCC模型空... 针对单一语音特征对语音情感表达不完整的问题,将具有良好量化和插值特性的LSF参数与体现人耳听觉特性的MFCC参数相融合,提出基于线谱权重的MFCC(WMFCC)新特征。同时,通过高斯混合模型来对该参数建立模型空间,进一步得到GW-MFCC模型空间参数,以获取更高维的细节信息,进一步提高情感识别性能。采用柏林情感语料库进行验证,新参数的识别率比传统的MFCC和LSF分别有5.7%和6.9%的提高。实验结果表明,提出的WMFCC以及GW-MFCC参数可以有效地表现语音情感信息,提高语音情感识别率。 展开更多
关键词 语音情感识别 线对频率(LSF) Mel频率系数(mfcc) 高斯混合模型 模型空间
下载PDF
基于MFCC的汽车敲击异响识别 被引量:1
15
作者 黄凯 郑瑶辰 邓兆祥 《振动与冲击》 EI CSCD 北大核心 2022年第13期275-282,共8页
现阶段,汽车异响的诊断主要依赖有经验的工程师进行主观评判,存在不准确、易错判、易漏判的问题。针对汽车敲击异响实测信号进行统计分析得到梅尔倒谱系数(Mel frequency cepstrum coefficient,MFCC),并以此作为表征异响来源的特征向量... 现阶段,汽车异响的诊断主要依赖有经验的工程师进行主观评判,存在不准确、易错判、易漏判的问题。针对汽车敲击异响实测信号进行统计分析得到梅尔倒谱系数(Mel frequency cepstrum coefficient,MFCC),并以此作为表征异响来源的特征向量,基于最大似然估计法构建其联合概率分布高斯混合模型(Gaussian mixture model,GMM),从而针对未知实测异响信号可利用该GMM模型进行似然判别。指出了说话人识别技术与敲击异响识别的不同之处即Mel三角滤波器个数和离散余弦变换输出系数个数的选取方式,并对方法的可行性进行分析,最后试验加以验证。结果显示此方法的识别率达100%,拒绝率达100%以上,为汽车异响的客观评价方法打下基础。 展开更多
关键词 说话人识别 敲击异响 梅尔系数(mfcc) 高斯混合模型(GMM)
下载PDF
语音识别的MFCC算法研究 被引量:2
16
作者 熊伟 罗云贵 《现代商贸工业》 2010年第3期291-292,共2页
详细介绍了一种在语音识别中取得一定良好效果的Mel倒谱提取的改进算法。在语音识别系统中,MFCC参数是经常使用的特征参数之一。MFCC参数主要描述了表征声道特性的谱包络特征,而忽略了基音频率对它的影响。然而基音频率会影响MFCC参数... 详细介绍了一种在语音识别中取得一定良好效果的Mel倒谱提取的改进算法。在语音识别系统中,MFCC参数是经常使用的特征参数之一。MFCC参数主要描述了表征声道特性的谱包络特征,而忽略了基音频率对它的影响。然而基音频率会影响MFCC参数对声道特性的准确描述,进一步影响语音识别系统的性能。提出了一种MFCC的改进参数,该参数并不直接对语音短时幅度谱进行提取,而是首先对幅度谱进行平滑,在谱包络的基础上计算MFCC参数,从而降低基音频率对其的影响。 展开更多
关键词 语音识别 梅尔系数(mfcc) 端点检测
下载PDF
基于MFCC特征和GWO-SVM的托辊故障诊断 被引量:3
17
作者 贺志军 李军霞 +2 位作者 张伟 樊文瑞 李振华 《机床与液压》 北大核心 2022年第15期188-193,共6页
针对目前带式输送机托辊故障诊断方法存在接触式测量、准确率低、井下大范围检测困难等问题,提出了一种基于MFCC特征和参数优化SVM的托辊故障诊断方法。利用变分模态分解(VMD)将采集到的托辊声音信号分解为若干本征模态分量(IMF),并基... 针对目前带式输送机托辊故障诊断方法存在接触式测量、准确率低、井下大范围检测困难等问题,提出了一种基于MFCC特征和参数优化SVM的托辊故障诊断方法。利用变分模态分解(VMD)将采集到的托辊声音信号分解为若干本征模态分量(IMF),并基于包络熵和峭度组成的复合指标优选IMF分量;提取所选分量的梅尔倒频谱系数(MFCC)作为特征,利用灰狼优化算法(GWO)优化SVM参数;将样本特征向量输入GWO-SVM中进行故障分类。结果表明:对于正常托辊、托辊内圈故障、托辊外圈故障、托辊卡死4种工况,该方法故障识别平均准确率在95%以上。与单一指标相比,复合指标提取的IMF分量故障特性代表性更好;与其他优化算法相比,该方法的识别准确率更高,分类速度更快。 展开更多
关键词 声音信号 梅尔频率系数(mfcc) 托辊 灰狼算法 故障诊断
下载PDF
基于MFCC均值特征的电台语言类节目相似度比对算法研究
18
作者 聂晨淅 《电声技术》 2022年第4期50-53,58,共5页
为了提高广播语言类节目的播出安全,提出一种基于梅尔频率倒谱系数(Mel-scale Frequency Cepstral Coefficients,MFCC)的算法,对两段音频信号进行相似度比对。通过对音频频谱特征提取得到均值特征参数,再计算两者的特征参数矩阵的欧式距... 为了提高广播语言类节目的播出安全,提出一种基于梅尔频率倒谱系数(Mel-scale Frequency Cepstral Coefficients,MFCC)的算法,对两段音频信号进行相似度比对。通过对音频频谱特征提取得到均值特征参数,再计算两者的特征参数矩阵的欧式距离,根据欧氏距离的大小判定两段音频的相似度来完成对比任务。实践证明,该方法对于语言类音频比对具有较高的准确性。 展开更多
关键词 播出安全 特征提取 梅尔频率系数(mfcc) 欧氏距离 音频比对
下载PDF
一种舰载低信噪比环境下的音频端点检测算法 被引量:1
19
作者 王中正 王鉴 +1 位作者 韩焱 韩星程 《兵器装备工程学报》 CAS CSCD 北大核心 2023年第3期197-203,共7页
针对舰载环境下音频端点检测准确率及鲁棒性较低的问题,提出了一种谱减法和朴素贝叶斯分类器相结合的音频端点检测算法。首先提取纯净音频信号MFCC0与GFCC0构建融合特征,与能熵比特征一同作为朴素贝叶斯分类器的输入进行训练及建模,再... 针对舰载环境下音频端点检测准确率及鲁棒性较低的问题,提出了一种谱减法和朴素贝叶斯分类器相结合的音频端点检测算法。首先提取纯净音频信号MFCC0与GFCC0构建融合特征,与能熵比特征一同作为朴素贝叶斯分类器的输入进行训练及建模,再利用多窗谱谱减法提升待测含噪信号信噪比,提取信号相关特征,朴素贝叶斯分类器根据待测信号特征判断该信号的类别。仿真实验结果表明,该算法针对舰载低信噪比含噪音频信号与传统方法相比有效降低了虚检和漏检,具有更好的准确性及鲁棒性。 展开更多
关键词 音频端点检测 多窗减法 Mel频率系数(mfcc) Gammatone频率系数(GFCC) 朴素贝叶斯
下载PDF
基于神经网络的视觉语音识别系统
20
作者 张晋宁 《电声技术》 2023年第11期101-104,共4页
视觉语音识别(Audio-Visual Speech Recognition,AVSR)系统结合音频和视觉信息,提供可靠的语音识别功能。为了提高AVSR系统在低信噪比(Signal-to-Noise Ratio,SNR)环境下的识别准确率,提出一种基于循环神经网络(Recurrent Neural Networ... 视觉语音识别(Audio-Visual Speech Recognition,AVSR)系统结合音频和视觉信息,提供可靠的语音识别功能。为了提高AVSR系统在低信噪比(Signal-to-Noise Ratio,SNR)环境下的识别准确率,提出一种基于循环神经网络(Recurrent Neural Network,RNN)的AVSR系统。该系统由音频特征提取模块、视觉特征提取模块以及音频和视觉特征联合模块3部分组成。特征联合模块利用RNN将基于梅尔频率倒谱系数的音频特征与OpenCV库中的Haar级联检测提取的视觉信息相结合,以提高系统识别率。实验结果表明,在低信噪比条件下,所提系统的正确识别率保持在89%左右。 展开更多
关键词 视觉语音识别 循环神经网络(RNN) 梅尔频率系数(mfcc) 信噪比(SNR)
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部