期刊文献+
共找到69篇文章
< 1 2 4 >
每页显示 20 50 100
基于Mel频率倒谱参数相似度的语音端点检测算法 被引量:16
1
作者 王宏志 徐玉超 李美静 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2012年第5期1331-1335,共5页
为提高噪声环境下语音端点检测的精确性,提出了一种基于Mel频率倒谱参数(MF-CC)相似度的端点检测方法。提取了每帧语音信号的Mel频率倒谱参数,然后将前十帧作为背景噪声,计算测试帧和背景噪声的MFCC相关系数距离,最后用得到的MFCC相似... 为提高噪声环境下语音端点检测的精确性,提出了一种基于Mel频率倒谱参数(MF-CC)相似度的端点检测方法。提取了每帧语音信号的Mel频率倒谱参数,然后将前十帧作为背景噪声,计算测试帧和背景噪声的MFCC相关系数距离,最后用得到的MFCC相似度距离曲线进行端点检测。实验结果表明,该方法在白噪声和粉噪声环境下均可得到理想的端点检测效果,并且在低信噪比时仍然有效。 展开更多
关键词 通信技术 端点检测 Mel频率参数 相关系数
下载PDF
基于基音周期与清浊音信息的梅尔倒谱参数 被引量:1
2
作者 郭武 王仁华 戴礼荣 《数据采集与处理》 CSCD 北大核心 2007年第2期229-233,共5页
提出一种在浊音部分不固定帧长的梅尔倒谱参数(Mel-cepstrum)提取的方法。针对浊音和清音所包含信息量不同,对浊音进行双倍的加权,从而将基音与清浊音信息融合进梅尔倒谱参数。将这种动态的梅尔倒谱参数应用在说话人确认中,在混合高斯模... 提出一种在浊音部分不固定帧长的梅尔倒谱参数(Mel-cepstrum)提取的方法。针对浊音和清音所包含信息量不同,对浊音进行双倍的加权,从而将基音与清浊音信息融合进梅尔倒谱参数。将这种动态的梅尔倒谱参数应用在说话人确认中,在混合高斯模型(Gaussian mixture models,GMM)的情况下,取得了比常用的梅尔刻度式倒频谱参数(Mel-frequency cepstral coefficient,MFCC)更高的识别率,在NIST 2002年测试数据库中,512个混合高斯下能够将等错误率(EER)由9.4%降低到8.3%,2 048个混合高斯下能够将等错误率由7.8%降低到6.9%。 展开更多
关键词 说话人确认 梅尔参数 基音频率 清浊音信息
下载PDF
采用Mel倒谱参数的咳嗽声识别方法 被引量:2
3
作者 尹永 莫鸿强 《信息技术》 2012年第10期85-91,共7页
在诊断一个有慢性咳嗽的病人时,他的咳嗽强度和频率评估能提供很有价值的信息。因此提高咳嗽识别率,对疾病的诊断有着重要意义。从语音识别中被广泛应用的Mel倒谱参数出发,寻找咳嗽和语音在Mel倒谱参数中的区别。基于Mel倒谱参数的原理... 在诊断一个有慢性咳嗽的病人时,他的咳嗽强度和频率评估能提供很有价值的信息。因此提高咳嗽识别率,对疾病的诊断有着重要意义。从语音识别中被广泛应用的Mel倒谱参数出发,寻找咳嗽和语音在Mel倒谱参数中的区别。基于Mel倒谱参数的原理,将其计算过程中的Mel刻度滤波器对数能量的极值数分布情况提取出来作为咳嗽的识别特征。在病房环境下对录音文件进行实验,得到的咳嗽识别率为90%以上,同时能够将语音等非咳嗽信号有效地剔除,实验结果显示90%以上的语音信号被排除。在录音设备及环境等各项参数不变的条件下,对不同病人样本,可使用同一阈值对咳嗽进行识别。该方法过程简单,数据计算量小,便于快速识别。 展开更多
关键词 Mel参数(Mel-Frequency CEPSTRUM Coefficient mfcc) Mel刻度滤波器对数能量 咳嗽识别
下载PDF
混合MFCC特征参数应用于语音情感识别 被引量:19
4
作者 周萍 李晓盼 +1 位作者 李杰 景新幸 《计算机测量与控制》 北大核心 2013年第7期1966-1968,1986,共4页
引入两种新的特征参数Mid-MFCC和IMFCC,采用MFCC、Mid-MFCC和IMFCC相结合的改进算法,解决MFCC特征参数在语音识别中对中、高频信号的识别精度不高的特点,并使用增减分量法计算MFCC、Mid-MFCC和IMFCC各阶倒谱分量对语音情感识别的贡献,提... 引入两种新的特征参数Mid-MFCC和IMFCC,采用MFCC、Mid-MFCC和IMFCC相结合的改进算法,解决MFCC特征参数在语音识别中对中、高频信号的识别精度不高的特点,并使用增减分量法计算MFCC、Mid-MFCC和IMFCC各阶倒谱分量对语音情感识别的贡献,提取3个特征参数贡献最高的几阶倒谱分量组成了新的特征参数;实验结果表明,在相同环境下新的特征参数比经典MFCC特征参数的语音情感的识别率稍高。 展开更多
关键词 Mel频率系数(mfcc) 增减分量法 特征提取
下载PDF
采用复倒谱峰值滤波GMM识别混响语音
5
作者 孔荣 吴迪 +3 位作者 廖启鹏 朱俊杰 周强 陶智 《计算机工程与应用》 CSCD 2014年第15期191-193,203,共4页
针对混响环境下语音识别系统性能急剧下降问题,提出一种采用复倒谱峰值滤波GMM识别混响语音的方法。通过训练纯净语音的MFCC特征参数构建高斯混合模型,在识别混响语音前引入复倒谱峰值滤波器以减少混响引起的语音失真而提高混响环境下... 针对混响环境下语音识别系统性能急剧下降问题,提出一种采用复倒谱峰值滤波GMM识别混响语音的方法。通过训练纯净语音的MFCC特征参数构建高斯混合模型,在识别混响语音前引入复倒谱峰值滤波器以减少混响引起的语音失真而提高混响环境下语音识别率。经实验验证,该方法避免了在现实条件下准确估计房间冲击响应函数的麻烦,降低了计算难度,提高了混响环境下至少4%的系统识别率。 展开更多
关键词 高斯混合模型 Mel频率系数(mfcc)
下载PDF
基于GFCC和能量算子倒谱的语种识别 被引量:4
6
作者 刘晶 邵玉斌 +1 位作者 龙华 李一民 《云南大学学报(自然科学版)》 CAS CSCD 北大核心 2022年第2期254-261,共8页
为了提高低信噪比下语种识别的准确率,引入一种新的特征提取融合方法.在前端加入有声段检测,并基于人耳听觉感知模型提取伽玛通频率倒谱系数(Gammatone Frequency Cepstrum Coefficient,GFCC)特征,通过主成分分析对特征进行压缩、降噪,... 为了提高低信噪比下语种识别的准确率,引入一种新的特征提取融合方法.在前端加入有声段检测,并基于人耳听觉感知模型提取伽玛通频率倒谱系数(Gammatone Frequency Cepstrum Coefficient,GFCC)特征,通过主成分分析对特征进行压缩、降噪,融合每个有声段的Teager能量算子倒谱参数,通过高斯混合通用背景模型进行语种识别验证.实验结果表明,在信噪比为-5~0 dB时,相对于基于对数梅尔尺度滤波器组能量特征方法,融合特征集方法对5种语言的识别率,分别提升了23.7%~34.0%,其他信噪比等级下识别率也有明显的提升. 展开更多
关键词 语种识别 伽玛通频率系数 有声无声段检测 Teager能量算子参数 主成分分析
下载PDF
基于MFCC相似度和谱熵的端点检测算法 被引量:6
7
作者 邓瑞 肖纯智 高勇 《现代电子技术》 2013年第21期67-69,共3页
为提高低信噪比环境下语音端点检测的准确率,提出了一种基于Mel倒谱参数相似度和谱熵的端点检测算法。首先,提取语音帧的的Mel频率倒谱参数,将前十帧声信号作为背景噪声,然后计算每一帧语音和噪声MFCC的相关系数距离,结合MFCC相似距离... 为提高低信噪比环境下语音端点检测的准确率,提出了一种基于Mel倒谱参数相似度和谱熵的端点检测算法。首先,提取语音帧的的Mel频率倒谱参数,将前十帧声信号作为背景噪声,然后计算每一帧语音和噪声MFCC的相关系数距离,结合MFCC相似距离与谱熵做综合判决。实验结果表明,在低信噪比环境下此方法相对谱熵法能够提高检测准确率。 展开更多
关键词 语音信号处理 端点检测 Mel频率参数 相关系数
下载PDF
采用GW-MFCC模型空间参数的语音情感识别 被引量:1
8
作者 沈燕 肖仲喆 +3 位作者 李冰洁 周孝进 周强 陶智 《计算机工程与应用》 CSCD 北大核心 2015年第10期219-222,226,共5页
针对单一语音特征对语音情感表达不完整的问题,将具有良好量化和插值特性的LSF参数与体现人耳听觉特性的MFCC参数相融合,提出基于线谱权重的MFCC(WMFCC)新特征。同时,通过高斯混合模型来对该参数建立模型空间,进一步得到GW-MFCC模型空... 针对单一语音特征对语音情感表达不完整的问题,将具有良好量化和插值特性的LSF参数与体现人耳听觉特性的MFCC参数相融合,提出基于线谱权重的MFCC(WMFCC)新特征。同时,通过高斯混合模型来对该参数建立模型空间,进一步得到GW-MFCC模型空间参数,以获取更高维的细节信息,进一步提高情感识别性能。采用柏林情感语料库进行验证,新参数的识别率比传统的MFCC和LSF分别有5.7%和6.9%的提高。实验结果表明,提出的WMFCC以及GW-MFCC参数可以有效地表现语音情感信息,提高语音情感识别率。 展开更多
关键词 语音情感识别 线频率(LSF) Mel频率系数(mfcc) 高斯混合模型 模型空间
下载PDF
基于MFCC与CNN的机械故障声音自动识别
9
作者 黄炜 罗谢飞 《电声技术》 2024年第6期129-131,共3页
针对机械故障自动识别问题,提出一种结合梅尔频率倒谱系数(Mel Frequency Cepstral Coefficient,MFCC)与一维卷积神经网络(Convolutional Neural Networks,CNN)的机械故障声音自动识别方法,并通过实验验证该方法的有效性。实验结果表明... 针对机械故障自动识别问题,提出一种结合梅尔频率倒谱系数(Mel Frequency Cepstral Coefficient,MFCC)与一维卷积神经网络(Convolutional Neural Networks,CNN)的机械故障声音自动识别方法,并通过实验验证该方法的有效性。实验结果表明,该方法在机械故障声音识别中具有较高的准确率、精确率及召回率,能够有效识别故障案例。 展开更多
关键词 机械故障 声音识别 梅尔频率系数(mfcc) 卷积神经网络(CNN)
下载PDF
基于MFCC和HMM的语音识别优化方法研究
10
作者 郭佳淇 张继通 《电声技术》 2024年第10期83-85,共3页
为探究基于梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC)和隐马尔可夫模型(Hidden Markov Model,HMM)的语音识别优化方法,首先探讨语音识别系统的基本框架设计,其次分析MFCC特征提取方法,再次引入期望最大化(Expectatio... 为探究基于梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC)和隐马尔可夫模型(Hidden Markov Model,HMM)的语音识别优化方法,首先探讨语音识别系统的基本框架设计,其次分析MFCC特征提取方法,再次引入期望最大化(Expectation Maximization,EM)算法优化HMM参数,最后利用THCHS-30数据集进行实验验证。结果表明,引入EM算法优化HMM,可有效克服传统HMM在复杂语音环境下的识别困难问题,显著提升系统的识别精度和健壮性。 展开更多
关键词 语音识别 梅尔频率系数(mfcc) 隐马尔可夫模型(HMM) 期望最大化(EM)
下载PDF
基于特征参数融合的语音情感识别方法 被引量:10
11
作者 陈明义 余伶俐 +1 位作者 朱晗 周昆湘 《微电子学与计算机》 CSCD 北大核心 2006年第12期168-171,174,共5页
语音情感识别是人工智能的重要研究领域之一,特征参数提取的准确性直接影响识别的效果。分析了发音持续时间、平均振幅、基音频率,第一共振峰和Mel频率倒谱参数,并基于模糊熵理论提取了各参数的权重。再利用模糊熵进行有效的度量融合,... 语音情感识别是人工智能的重要研究领域之一,特征参数提取的准确性直接影响识别的效果。分析了发音持续时间、平均振幅、基音频率,第一共振峰和Mel频率倒谱参数,并基于模糊熵理论提取了各参数的权重。再利用模糊熵进行有效的度量融合,最后通过改进后综合判决对情感语句做出识别判定。研究发现融合后的参数增强了情感识别的效果。 展开更多
关键词 语音情感识别 模糊熵 Mel频率 参数融合
下载PDF
改进的混合MFCC语音识别算法研究 被引量:18
12
作者 袁正午 肖旺辉 《计算机工程与应用》 CSCD 北大核心 2009年第33期108-110,共3页
针对MFCC特征参数在语音识别中对中高频信号的识别精度不高的特点,提出采用IMFCC,MIDMFCC,MFCC相结合的改进算法,使用混合滤波器组,提高在语音中高频区域中的识别精度。实验结果表明,改进之后的算法与经典算法比较,在相同环境下对语音... 针对MFCC特征参数在语音识别中对中高频信号的识别精度不高的特点,提出采用IMFCC,MIDMFCC,MFCC相结合的改进算法,使用混合滤波器组,提高在语音中高频区域中的识别精度。实验结果表明,改进之后的算法与经典算法比较,在相同环境下对语音信息的识别率都有一定程度的提高。 展开更多
关键词 Mel频率系数(mfcc) 语音识别 特征提取
下载PDF
结合MFCC分析和仿生模式识别的语音识别研究 被引量:4
13
作者 王宪保 陈勇 汤丽平 《计算机工程与应用》 CSCD 北大核心 2011年第12期20-22,26,共4页
提出了一种基于MFCC系数分析和仿生模式识别的语音识别方法,该方法对训练样本MFCC相同分量在各类语音间距离进行了分析,并通过与传统选取方法的比较实验,说明在小词汇量的语音识别中,选取合适的MFCC系数,不仅能减小计算量,正确识别率也... 提出了一种基于MFCC系数分析和仿生模式识别的语音识别方法,该方法对训练样本MFCC相同分量在各类语音间距离进行了分析,并通过与传统选取方法的比较实验,说明在小词汇量的语音识别中,选取合适的MFCC系数,不仅能减小计算量,正确识别率也会得到一定程度的提高。运用仿生模式识别理论中同类样本连续的观点,通过在特征空间中对训练样本进行有效的覆盖,大大提高了识别结果。 展开更多
关键词 仿生模式识别 语音识别 Mel频率系数(mfcc)
下载PDF
结合节拍语义和MFCC声学特征的音乐流派分类 被引量:7
14
作者 庄严 于凤芹 《计算机工程与应用》 CSCD 北大核心 2015年第3期197-201,共5页
由于音乐节拍的强度、快慢、持续时间等是反映音乐不同流派风格的重要语义特征,而音乐节拍多属于由打击乐器所产生的低频部分,为此利用小波变换对音乐信号进行6层分解来提取低频节拍特征;针对节拍特征差异不明显的音乐流派,提出用描述... 由于音乐节拍的强度、快慢、持续时间等是反映音乐不同流派风格的重要语义特征,而音乐节拍多属于由打击乐器所产生的低频部分,为此利用小波变换对音乐信号进行6层分解来提取低频节拍特征;针对节拍特征差异不明显的音乐流派,提出用描述频域能量包络的MFCC声学特征与节拍特征结合,并用基于音乐流派机理分析的8阶MFCC代替常用的12阶MFCC。对8类音乐流派实验仿真结果表明,基于语义特征和声学特征结合的方法,总体分类准确率可达68.37%,同时特征维数增加对分类时间影响很小。 展开更多
关键词 音乐流派分类 节拍特征 Mel频率系数(mfcc) 小波分解 支持向量机
下载PDF
新型MFCC和波动模型相结合的二层环境声音识别 被引量:2
15
作者 李勇 李应 余清清 《计算机工程与应用》 CSCD 北大核心 2011年第30期132-135,139,共5页
对生态环境中各种不同的声音进行快速准确的识别有重要的现实意义,但是因其具有较高背景噪声加大了识别的难度。提出一种具有良好抗噪能力和较高识别性能的两层音频识别技术。选择经过改进的新型的MFCC参数以及波动模型作为生态环境声... 对生态环境中各种不同的声音进行快速准确的识别有重要的现实意义,但是因其具有较高背景噪声加大了识别的难度。提出一种具有良好抗噪能力和较高识别性能的两层音频识别技术。选择经过改进的新型的MFCC参数以及波动模型作为生态环境声音的特征集合。利用这种新型的MFCC系数构造音频信号的高斯分布模型,并且计算未知音频信号与样本音频信号的高斯分布模型之间的Kullback-Leibler距离,随后计算它们的波动模型之间的欧几里德距离。根据计算出的Kullback-Leibler距离和欧几里德距离实现两层音频识别系统。实验结果表明两层音频识别技术即使在噪声的影响下也能保持较高的识别率。 展开更多
关键词 生态环境 声音识别 改进的Mel频率参数 波动模型 Kullback-Leibler距离
下载PDF
基于频率段的语音识别算法设计与实现 被引量:1
16
作者 袁正午 肖旺辉 《计算机工程与设计》 CSCD 北大核心 2011年第2期659-662,共4页
线性预测倒谱参数(LPCC)能很好的体现人的声道特性,而梅尔倒谱参数(MFCC)能很好的模拟人耳的听觉效应。针对MFCC在不同频率段的识别精度不一致和LPCC不能准确模拟人的听觉系统问题,将MFCC参数和IMFCC参数分别作为语音不同频率段的特征参... 线性预测倒谱参数(LPCC)能很好的体现人的声道特性,而梅尔倒谱参数(MFCC)能很好的模拟人耳的听觉效应。针对MFCC在不同频率段的识别精度不一致和LPCC不能准确模拟人的听觉系统问题,将MFCC参数和IMFCC参数分别作为语音不同频率段的特征参数,结合线性预测参数(LPCC),均衡滤波器的分布,完整覆盖到整个频率段范围。将梅尔倒谱参数和线性预测参数结合起来作为语音识别的特征提取参数。实验结果表明,改进之后的算法从效率上和识别率上都有不同程度的提高。 展开更多
关键词 线性预测参数(LPCC) 梅尔系数(mfcc) 逆梅尔系数(Imfcc) 语音识别 特征提取
下载PDF
基于听觉特性的语音特征参数提取方法研究 被引量:4
17
作者 白燕燕 苏静 《自动化技术与应用》 2015年第4期40-43,49,共5页
特征提取是说话人识别系统中最关键的一个步骤。特征提取通俗的来说是提取代表说话人个性的语音特征。直接关乎识别系统的准确率。通常人们能从说话人声音的品质,频率的高低,音量的大小等信息中感知说话人的个性特点。文章采用Mel频率... 特征提取是说话人识别系统中最关键的一个步骤。特征提取通俗的来说是提取代表说话人个性的语音特征。直接关乎识别系统的准确率。通常人们能从说话人声音的品质,频率的高低,音量的大小等信息中感知说话人的个性特点。文章采用Mel频率倒谱域参数,是因为Mel频率尺度更加贴近人耳的听觉特性。Mel频率倒谱域参数不仅具有低频段高谱分辨率的优势,而且对噪声鲁棒能力很强。文章以声道模型和听觉模型为例,对比了LPC参数和MFCC参数分布。得出了MFCC不受全极点模型限制,对环境的适应性更强,且可降低不同人说话引起的差异度的影响。其参数性能优于LPC参数。 展开更多
关键词 特征提取 Mel频率参数 LPC 分辨率 鲁棒
下载PDF
声门下共鸣的谱规整用于非特定人的语音识别
18
作者 侯丽敏 黄振华 谢娟敏 《声学学报》 EI CSCD 北大核心 2010年第5期580-586,共7页
提出在参数的提取过程中用不同的感知规整因子对不同人的参数归一化,从而实现在非特定人语音识别中对不同人的归一化处理。感知规整因子是基于声门上和声门下之间耦合作用产生声门下共鸣频率来估算的,与采用声道第三共振峰作为基准频率... 提出在参数的提取过程中用不同的感知规整因子对不同人的参数归一化,从而实现在非特定人语音识别中对不同人的归一化处理。感知规整因子是基于声门上和声门下之间耦合作用产生声门下共鸣频率来估算的,与采用声道第三共振峰作为基准频率的方法比较,它能较多的滤除语义信息的影响,更好地体现说话人的个性特征。本文提取抗噪性能优于Mel倒谱参数的感知最小方差无失真参数作为识别特征,语音模型用经典的隐马尔可夫模型(HMM)。实验证明,本文方法与传统的语音识别参数和用声道第三共振峰进行谱规整的方法相比,在干净语音中单词错误识别率分别下降了4%和3%,在噪声环境下分别下降了9%和5%,有效地改善了非特定人语音识别系统的性能。 展开更多
关键词 非特定人语音识别 共鸣 Mel参数 隐马尔可夫模型 归一化处理 语音识别系统 提取过程 基准频率
下载PDF
采用MFCC和DTW的咳嗽干湿性自动分类技术 被引量:3
19
作者 李文 莫鸿强 +2 位作者 田联房 阳国清 郑则广 《计算机工程与应用》 CSCD 北大核心 2010年第13期209-212,共4页
咳嗽是一种在呼吸疾病中常见的症状。对病人的咳嗽类型进行分类和统计对病人的病理分析将有极大帮助。提出了一种基于MFCC特征和DTW模板匹配的方法来对病人的咳嗽进行自动干湿性分类。通过训练咳嗽样本,使用特征提取算法得到它们的MFCC... 咳嗽是一种在呼吸疾病中常见的症状。对病人的咳嗽类型进行分类和统计对病人的病理分析将有极大帮助。提出了一种基于MFCC特征和DTW模板匹配的方法来对病人的咳嗽进行自动干湿性分类。通过训练咳嗽样本,使用特征提取算法得到它们的MFCC特征参数从而生成用于比较的参考模板库。然后对需要进行分类的咳嗽信号进行同样的特征提取过程,并将参数和模板库中的进行匹配从而得出咳嗽的干湿性类别。文中对78个未知类型的咳嗽样本进行分类,得出干性咳嗽57个,湿性咳嗽21个,分类错误率为7.69%。经进一步处理,可以将分类错误率减少到仅为2.56%。 展开更多
关键词 咳嗽自动分类 mel频率系数(mfcc) 动态时间规整(DTW)
下载PDF
短时谱特征的汉语重音检测方法研究 被引量:2
20
作者 赵云雪 张珑 郑世杰 《计算机科学与探索》 CSCD 2014年第9期1120-1128,共9页
重音是语言交流中不可或缺的部分,在语言交流中扮演着非常重要的角色。为了验证基于听觉模型的短时谱特征集在汉语重音检测方法中的应用效果,使用MFCC(Mel frequency cepstrum coefficient)和RASTAPLP(relative spectra perceptual line... 重音是语言交流中不可或缺的部分,在语言交流中扮演着非常重要的角色。为了验证基于听觉模型的短时谱特征集在汉语重音检测方法中的应用效果,使用MFCC(Mel frequency cepstrum coefficient)和RASTAPLP(relative spectra perceptual linear prediction)算法提取每个语音段的短时谱信息,分别构建了基于MFCC算法的短时谱特征集和基于RASTA-PLP算法的短时谱特征集;选用NaiveBayes分类器对这两类特征集进行建模,把具有最大后验概率的类作为该对象所属的类,这种分类方法充分利用了当前语音段的相关语音特性;基于MFCC的短时谱特征集和基于RASTA-PLP的短时谱特征集在ASCCD(annotated speech corpus of Chinese discourse)上能够分别得到82.1%和80.8%的汉语重音检测正确率。实验结果证明,基于MFCC的短时谱特征和基于RASTA-PLP的短时谱特征能用于汉语重音检测研究。 展开更多
关键词 重音检测 Mel频率系数(mfcc) 相关感知线性预测(RASTA-PLP) 短时特征
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部