期刊文献+
共找到54篇文章
< 1 2 3 >
每页显示 20 50 100
说话人识别技术中Mel倒谱参数改进算法的C程序实现
1
作者 叶蕾 方鹏 《计算机与现代化》 2007年第11期26-28,共3页
基于语音信号的频谱特性,本文对说话人识别技术中Mel倒谱参数做了改进,并通过Microsoft Visual C++6.0验证了在低信噪比时使用改进后的Mel倒谱参数可以提高说话人识别系统的正确识别率。
关键词 说话人识别 mel参数
下载PDF
基于Mel频率倒谱参数相似度的语音端点检测算法 被引量:16
2
作者 王宏志 徐玉超 李美静 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2012年第5期1331-1335,共5页
为提高噪声环境下语音端点检测的精确性,提出了一种基于Mel频率倒谱参数(MF-CC)相似度的端点检测方法。提取了每帧语音信号的Mel频率倒谱参数,然后将前十帧作为背景噪声,计算测试帧和背景噪声的MFCC相关系数距离,最后用得到的MFCC相似... 为提高噪声环境下语音端点检测的精确性,提出了一种基于Mel频率倒谱参数(MF-CC)相似度的端点检测方法。提取了每帧语音信号的Mel频率倒谱参数,然后将前十帧作为背景噪声,计算测试帧和背景噪声的MFCC相关系数距离,最后用得到的MFCC相似度距离曲线进行端点检测。实验结果表明,该方法在白噪声和粉噪声环境下均可得到理想的端点检测效果,并且在低信噪比时仍然有效。 展开更多
关键词 通信技术 端点检测 mel频率参数 相关系数
下载PDF
采用Mel倒谱参数的咳嗽声识别方法 被引量:2
3
作者 尹永 莫鸿强 《信息技术》 2012年第10期85-91,共7页
在诊断一个有慢性咳嗽的病人时,他的咳嗽强度和频率评估能提供很有价值的信息。因此提高咳嗽识别率,对疾病的诊断有着重要意义。从语音识别中被广泛应用的Mel倒谱参数出发,寻找咳嗽和语音在Mel倒谱参数中的区别。基于Mel倒谱参数的原理... 在诊断一个有慢性咳嗽的病人时,他的咳嗽强度和频率评估能提供很有价值的信息。因此提高咳嗽识别率,对疾病的诊断有着重要意义。从语音识别中被广泛应用的Mel倒谱参数出发,寻找咳嗽和语音在Mel倒谱参数中的区别。基于Mel倒谱参数的原理,将其计算过程中的Mel刻度滤波器对数能量的极值数分布情况提取出来作为咳嗽的识别特征。在病房环境下对录音文件进行实验,得到的咳嗽识别率为90%以上,同时能够将语音等非咳嗽信号有效地剔除,实验结果显示90%以上的语音信号被排除。在录音设备及环境等各项参数不变的条件下,对不同病人样本,可使用同一阈值对咳嗽进行识别。该方法过程简单,数据计算量小,便于快速识别。 展开更多
关键词 mel参数(mel-Frequency CEPSTRUM Coefficient mfcc) mel刻度滤波器对数能量 咳嗽识别
下载PDF
混合MFCC特征参数应用于语音情感识别 被引量:19
4
作者 周萍 李晓盼 +1 位作者 李杰 景新幸 《计算机测量与控制》 北大核心 2013年第7期1966-1968,1986,共4页
引入两种新的特征参数Mid-MFCC和IMFCC,采用MFCC、Mid-MFCC和IMFCC相结合的改进算法,解决MFCC特征参数在语音识别中对中、高频信号的识别精度不高的特点,并使用增减分量法计算MFCC、Mid-MFCC和IMFCC各阶倒谱分量对语音情感识别的贡献,提... 引入两种新的特征参数Mid-MFCC和IMFCC,采用MFCC、Mid-MFCC和IMFCC相结合的改进算法,解决MFCC特征参数在语音识别中对中、高频信号的识别精度不高的特点,并使用增减分量法计算MFCC、Mid-MFCC和IMFCC各阶倒谱分量对语音情感识别的贡献,提取3个特征参数贡献最高的几阶倒谱分量组成了新的特征参数;实验结果表明,在相同环境下新的特征参数比经典MFCC特征参数的语音情感的识别率稍高。 展开更多
关键词 mel频率系数(mfcc) 增减分量法 特征提取
下载PDF
采用复倒谱峰值滤波GMM识别混响语音
5
作者 孔荣 吴迪 +3 位作者 廖启鹏 朱俊杰 周强 陶智 《计算机工程与应用》 CSCD 2014年第15期191-193,203,共4页
针对混响环境下语音识别系统性能急剧下降问题,提出一种采用复倒谱峰值滤波GMM识别混响语音的方法。通过训练纯净语音的MFCC特征参数构建高斯混合模型,在识别混响语音前引入复倒谱峰值滤波器以减少混响引起的语音失真而提高混响环境下... 针对混响环境下语音识别系统性能急剧下降问题,提出一种采用复倒谱峰值滤波GMM识别混响语音的方法。通过训练纯净语音的MFCC特征参数构建高斯混合模型,在识别混响语音前引入复倒谱峰值滤波器以减少混响引起的语音失真而提高混响环境下语音识别率。经实验验证,该方法避免了在现实条件下准确估计房间冲击响应函数的麻烦,降低了计算难度,提高了混响环境下至少4%的系统识别率。 展开更多
关键词 高斯混合模型 mel频率系数(mfcc)
下载PDF
基于MFCC相似度和谱熵的端点检测算法 被引量:6
6
作者 邓瑞 肖纯智 高勇 《现代电子技术》 2013年第21期67-69,共3页
为提高低信噪比环境下语音端点检测的准确率,提出了一种基于Mel倒谱参数相似度和谱熵的端点检测算法。首先,提取语音帧的的Mel频率倒谱参数,将前十帧声信号作为背景噪声,然后计算每一帧语音和噪声MFCC的相关系数距离,结合MFCC相似距离... 为提高低信噪比环境下语音端点检测的准确率,提出了一种基于Mel倒谱参数相似度和谱熵的端点检测算法。首先,提取语音帧的的Mel频率倒谱参数,将前十帧声信号作为背景噪声,然后计算每一帧语音和噪声MFCC的相关系数距离,结合MFCC相似距离与谱熵做综合判决。实验结果表明,在低信噪比环境下此方法相对谱熵法能够提高检测准确率。 展开更多
关键词 语音信号处理 端点检测 mel频率参数 相关系数
下载PDF
采用GW-MFCC模型空间参数的语音情感识别 被引量:1
7
作者 沈燕 肖仲喆 +3 位作者 李冰洁 周孝进 周强 陶智 《计算机工程与应用》 CSCD 北大核心 2015年第10期219-222,226,共5页
针对单一语音特征对语音情感表达不完整的问题,将具有良好量化和插值特性的LSF参数与体现人耳听觉特性的MFCC参数相融合,提出基于线谱权重的MFCC(WMFCC)新特征。同时,通过高斯混合模型来对该参数建立模型空间,进一步得到GW-MFCC模型空... 针对单一语音特征对语音情感表达不完整的问题,将具有良好量化和插值特性的LSF参数与体现人耳听觉特性的MFCC参数相融合,提出基于线谱权重的MFCC(WMFCC)新特征。同时,通过高斯混合模型来对该参数建立模型空间,进一步得到GW-MFCC模型空间参数,以获取更高维的细节信息,进一步提高情感识别性能。采用柏林情感语料库进行验证,新参数的识别率比传统的MFCC和LSF分别有5.7%和6.9%的提高。实验结果表明,提出的WMFCC以及GW-MFCC参数可以有效地表现语音情感信息,提高语音情感识别率。 展开更多
关键词 语音情感识别 线对频率(LSF) mel频率系数(mfcc) 高斯混合模型 模型空间
下载PDF
基于特征参数融合的语音情感识别方法 被引量:10
8
作者 陈明义 余伶俐 +1 位作者 朱晗 周昆湘 《微电子学与计算机》 CSCD 北大核心 2006年第12期168-171,174,共5页
语音情感识别是人工智能的重要研究领域之一,特征参数提取的准确性直接影响识别的效果。分析了发音持续时间、平均振幅、基音频率,第一共振峰和Mel频率倒谱参数,并基于模糊熵理论提取了各参数的权重。再利用模糊熵进行有效的度量融合,... 语音情感识别是人工智能的重要研究领域之一,特征参数提取的准确性直接影响识别的效果。分析了发音持续时间、平均振幅、基音频率,第一共振峰和Mel频率倒谱参数,并基于模糊熵理论提取了各参数的权重。再利用模糊熵进行有效的度量融合,最后通过改进后综合判决对情感语句做出识别判定。研究发现融合后的参数增强了情感识别的效果。 展开更多
关键词 语音情感识别 模糊熵 mel频率 参数融合
下载PDF
改进的混合MFCC语音识别算法研究 被引量:18
9
作者 袁正午 肖旺辉 《计算机工程与应用》 CSCD 北大核心 2009年第33期108-110,共3页
针对MFCC特征参数在语音识别中对中高频信号的识别精度不高的特点,提出采用IMFCC,MIDMFCC,MFCC相结合的改进算法,使用混合滤波器组,提高在语音中高频区域中的识别精度。实验结果表明,改进之后的算法与经典算法比较,在相同环境下对语音... 针对MFCC特征参数在语音识别中对中高频信号的识别精度不高的特点,提出采用IMFCC,MIDMFCC,MFCC相结合的改进算法,使用混合滤波器组,提高在语音中高频区域中的识别精度。实验结果表明,改进之后的算法与经典算法比较,在相同环境下对语音信息的识别率都有一定程度的提高。 展开更多
关键词 mel频率系数(mfcc) 语音识别 特征提取
下载PDF
语音MFCC特征计算的改进算法 被引量:6
10
作者 章熙春 曹燕 +1 位作者 张军 韦岗 《数据采集与处理》 CSCD 北大核心 2005年第2期161-165,共5页
提出了一种计算Mel频倒谱参数(Melfrequencycepstralcoefficient,MFCC)特征的改进算法,该算法采用了加权滤波器分析(WrappeddiscreteFouriertransform,WDFT)技术来提高语音信号低频部分的频谱分辨率,使之更符合人类听觉系统的特性。同... 提出了一种计算Mel频倒谱参数(Melfrequencycepstralcoefficient,MFCC)特征的改进算法,该算法采用了加权滤波器分析(WrappeddiscreteFouriertransform,WDFT)技术来提高语音信号低频部分的频谱分辨率,使之更符合人类听觉系统的特性。同时还运用了加权滤波器分析(Weightedfilterbankanalysis,WFBA)技术,以提高MFCC的鲁棒性。对TIMIT连续语音数据库中DR1集的音素识别结果表明,本文提出的改进算法比传统MFCC算法具有更好的识别率。 展开更多
关键词 语音识别 弯折离散傅里叶变换(WDFT) mel频标参数 加权滤波器分析
下载PDF
结合MFCC分析和仿生模式识别的语音识别研究 被引量:4
11
作者 王宪保 陈勇 汤丽平 《计算机工程与应用》 CSCD 北大核心 2011年第12期20-22,26,共4页
提出了一种基于MFCC系数分析和仿生模式识别的语音识别方法,该方法对训练样本MFCC相同分量在各类语音间距离进行了分析,并通过与传统选取方法的比较实验,说明在小词汇量的语音识别中,选取合适的MFCC系数,不仅能减小计算量,正确识别率也... 提出了一种基于MFCC系数分析和仿生模式识别的语音识别方法,该方法对训练样本MFCC相同分量在各类语音间距离进行了分析,并通过与传统选取方法的比较实验,说明在小词汇量的语音识别中,选取合适的MFCC系数,不仅能减小计算量,正确识别率也会得到一定程度的提高。运用仿生模式识别理论中同类样本连续的观点,通过在特征空间中对训练样本进行有效的覆盖,大大提高了识别结果。 展开更多
关键词 仿生模式识别 语音识别 mel频率系数(mfcc)
下载PDF
结合节拍语义和MFCC声学特征的音乐流派分类 被引量:7
12
作者 庄严 于凤芹 《计算机工程与应用》 CSCD 北大核心 2015年第3期197-201,共5页
由于音乐节拍的强度、快慢、持续时间等是反映音乐不同流派风格的重要语义特征,而音乐节拍多属于由打击乐器所产生的低频部分,为此利用小波变换对音乐信号进行6层分解来提取低频节拍特征;针对节拍特征差异不明显的音乐流派,提出用描述... 由于音乐节拍的强度、快慢、持续时间等是反映音乐不同流派风格的重要语义特征,而音乐节拍多属于由打击乐器所产生的低频部分,为此利用小波变换对音乐信号进行6层分解来提取低频节拍特征;针对节拍特征差异不明显的音乐流派,提出用描述频域能量包络的MFCC声学特征与节拍特征结合,并用基于音乐流派机理分析的8阶MFCC代替常用的12阶MFCC。对8类音乐流派实验仿真结果表明,基于语义特征和声学特征结合的方法,总体分类准确率可达68.37%,同时特征维数增加对分类时间影响很小。 展开更多
关键词 音乐流派分类 节拍特征 mel频率系数(mfcc) 小波分解 支持向量机
下载PDF
新型MFCC和波动模型相结合的二层环境声音识别 被引量:2
13
作者 李勇 李应 余清清 《计算机工程与应用》 CSCD 北大核心 2011年第30期132-135,139,共5页
对生态环境中各种不同的声音进行快速准确的识别有重要的现实意义,但是因其具有较高背景噪声加大了识别的难度。提出一种具有良好抗噪能力和较高识别性能的两层音频识别技术。选择经过改进的新型的MFCC参数以及波动模型作为生态环境声... 对生态环境中各种不同的声音进行快速准确的识别有重要的现实意义,但是因其具有较高背景噪声加大了识别的难度。提出一种具有良好抗噪能力和较高识别性能的两层音频识别技术。选择经过改进的新型的MFCC参数以及波动模型作为生态环境声音的特征集合。利用这种新型的MFCC系数构造音频信号的高斯分布模型,并且计算未知音频信号与样本音频信号的高斯分布模型之间的Kullback-Leibler距离,随后计算它们的波动模型之间的欧几里德距离。根据计算出的Kullback-Leibler距离和欧几里德距离实现两层音频识别系统。实验结果表明两层音频识别技术即使在噪声的影响下也能保持较高的识别率。 展开更多
关键词 生态环境 声音识别 改进的mel频率参数 波动模型 Kullback-Leibler距离
下载PDF
加性白噪声环境下语音特征参数鲁棒性的研究 被引量:1
14
作者 孙林慧 杨震 《南京邮电学院学报(自然科学版)》 EI 2005年第5期53-56,共4页
随着说话人识别技术的发展,实用有效的说话人识别系统越来越成为研究的重点。语音特征参数的鲁棒性直接影响一个说话人识别系统的具体性能,过去主要针对移动通信环境下存在信道失真的问题,研究差分倒谱的鲁棒性。文中则主要在加性白噪... 随着说话人识别技术的发展,实用有效的说话人识别系统越来越成为研究的重点。语音特征参数的鲁棒性直接影响一个说话人识别系统的具体性能,过去主要针对移动通信环境下存在信道失真的问题,研究差分倒谱的鲁棒性。文中则主要在加性白噪声环境下研究M el倒谱参数、M el差分倒谱参数的顽健性以及它们经过倒谱系数零均值化(CMN)处理后识别性能的改进。从仿真结果可以看出:在加性白噪声环境下,差分倒谱参数具有很好的鲁棒性;倒谱系数零均值化能有效的除去加性白噪声。 展开更多
关键词 鲁棒性 mel参数 mel差分 系数零均值化
下载PDF
基于听觉特性的语音特征参数提取方法研究 被引量:4
15
作者 白燕燕 苏静 《自动化技术与应用》 2015年第4期40-43,49,共5页
特征提取是说话人识别系统中最关键的一个步骤。特征提取通俗的来说是提取代表说话人个性的语音特征。直接关乎识别系统的准确率。通常人们能从说话人声音的品质,频率的高低,音量的大小等信息中感知说话人的个性特点。文章采用Mel频率... 特征提取是说话人识别系统中最关键的一个步骤。特征提取通俗的来说是提取代表说话人个性的语音特征。直接关乎识别系统的准确率。通常人们能从说话人声音的品质,频率的高低,音量的大小等信息中感知说话人的个性特点。文章采用Mel频率倒谱域参数,是因为Mel频率尺度更加贴近人耳的听觉特性。Mel频率倒谱域参数不仅具有低频段高谱分辨率的优势,而且对噪声鲁棒能力很强。文章以声道模型和听觉模型为例,对比了LPC参数和MFCC参数分布。得出了MFCC不受全极点模型限制,对环境的适应性更强,且可降低不同人说话引起的差异度的影响。其参数性能优于LPC参数。 展开更多
关键词 特征提取 mel频率参数 LPC 分辨率 鲁棒
下载PDF
声门下共鸣的谱规整用于非特定人的语音识别
16
作者 侯丽敏 黄振华 谢娟敏 《声学学报》 EI CSCD 北大核心 2010年第5期580-586,共7页
提出在参数的提取过程中用不同的感知规整因子对不同人的参数归一化,从而实现在非特定人语音识别中对不同人的归一化处理。感知规整因子是基于声门上和声门下之间耦合作用产生声门下共鸣频率来估算的,与采用声道第三共振峰作为基准频率... 提出在参数的提取过程中用不同的感知规整因子对不同人的参数归一化,从而实现在非特定人语音识别中对不同人的归一化处理。感知规整因子是基于声门上和声门下之间耦合作用产生声门下共鸣频率来估算的,与采用声道第三共振峰作为基准频率的方法比较,它能较多的滤除语义信息的影响,更好地体现说话人的个性特征。本文提取抗噪性能优于Mel倒谱参数的感知最小方差无失真参数作为识别特征,语音模型用经典的隐马尔可夫模型(HMM)。实验证明,本文方法与传统的语音识别参数和用声道第三共振峰进行谱规整的方法相比,在干净语音中单词错误识别率分别下降了4%和3%,在噪声环境下分别下降了9%和5%,有效地改善了非特定人语音识别系统的性能。 展开更多
关键词 非特定人语音识别 共鸣 mel参数 隐马尔可夫模型 归一化处理 语音识别系统 提取过程 基准频率
下载PDF
采用MFCC和DTW的咳嗽干湿性自动分类技术 被引量:3
17
作者 李文 莫鸿强 +2 位作者 田联房 阳国清 郑则广 《计算机工程与应用》 CSCD 北大核心 2010年第13期209-212,共4页
咳嗽是一种在呼吸疾病中常见的症状。对病人的咳嗽类型进行分类和统计对病人的病理分析将有极大帮助。提出了一种基于MFCC特征和DTW模板匹配的方法来对病人的咳嗽进行自动干湿性分类。通过训练咳嗽样本,使用特征提取算法得到它们的MFCC... 咳嗽是一种在呼吸疾病中常见的症状。对病人的咳嗽类型进行分类和统计对病人的病理分析将有极大帮助。提出了一种基于MFCC特征和DTW模板匹配的方法来对病人的咳嗽进行自动干湿性分类。通过训练咳嗽样本,使用特征提取算法得到它们的MFCC特征参数从而生成用于比较的参考模板库。然后对需要进行分类的咳嗽信号进行同样的特征提取过程,并将参数和模板库中的进行匹配从而得出咳嗽的干湿性类别。文中对78个未知类型的咳嗽样本进行分类,得出干性咳嗽57个,湿性咳嗽21个,分类错误率为7.69%。经进一步处理,可以将分类错误率减少到仅为2.56%。 展开更多
关键词 咳嗽自动分类 mel频率系数(mfcc) 动态时间规整(DTW)
下载PDF
分布式语音识别参数提取的改进算法及实现
18
作者 叶蕾 方鹏 《福建电脑》 2007年第5期91-91,78,共2页
本文介绍了分布式语音识别系统,对该系统中参数提取算法做了两种改进,并用Microsoft Visual C++6.0验证这两种改进算法可以提高噪声环境下识别系统的正确识别率。
关键词 分布式语音识别 mel参数 GMM模型
下载PDF
短时谱特征的汉语重音检测方法研究 被引量:2
19
作者 赵云雪 张珑 郑世杰 《计算机科学与探索》 CSCD 2014年第9期1120-1128,共9页
重音是语言交流中不可或缺的部分,在语言交流中扮演着非常重要的角色。为了验证基于听觉模型的短时谱特征集在汉语重音检测方法中的应用效果,使用MFCC(Mel frequency cepstrum coefficient)和RASTAPLP(relative spectra perceptual line... 重音是语言交流中不可或缺的部分,在语言交流中扮演着非常重要的角色。为了验证基于听觉模型的短时谱特征集在汉语重音检测方法中的应用效果,使用MFCC(Mel frequency cepstrum coefficient)和RASTAPLP(relative spectra perceptual linear prediction)算法提取每个语音段的短时谱信息,分别构建了基于MFCC算法的短时谱特征集和基于RASTA-PLP算法的短时谱特征集;选用NaiveBayes分类器对这两类特征集进行建模,把具有最大后验概率的类作为该对象所属的类,这种分类方法充分利用了当前语音段的相关语音特性;基于MFCC的短时谱特征集和基于RASTA-PLP的短时谱特征集在ASCCD(annotated speech corpus of Chinese discourse)上能够分别得到82.1%和80.8%的汉语重音检测正确率。实验结果证明,基于MFCC的短时谱特征和基于RASTA-PLP的短时谱特征能用于汉语重音检测研究。 展开更多
关键词 重音检测 mel频率系数(mfcc) 相关感知线性预测(RASTA-PLP) 短时特征
下载PDF
基于MFCC的心音信号特征提取及识别研究 被引量:7
20
作者 刘翔 孙静 +1 位作者 赵洋 王威廉 《电子测量技术》 2018年第2期1-5,共5页
研究心音信号的特征提取,对不同病理性心音信号进行分类,为心脏病临床诊断提供可靠参考。对心音信号进行去噪、包络提取、分段定位等预处理后,采用语音信号中的Mel频率倒谱特征参数来提取心音信号的特征参数,最后利用在生物识别中广泛... 研究心音信号的特征提取,对不同病理性心音信号进行分类,为心脏病临床诊断提供可靠参考。对心音信号进行去噪、包络提取、分段定位等预处理后,采用语音信号中的Mel频率倒谱特征参数来提取心音信号的特征参数,最后利用在生物识别中广泛应用的高斯混合模型来进行病理性心音信号的训练识别。从采集到的心音信号库中筛选出250例信号质量较好的心音信号进行训练识别,准确率达到79.2%。通过Mel频率倒谱特征参数对心音信号特征参数进行提取和高斯混合模型对其进行训练识别,具有较好的结果。 展开更多
关键词 心音信号 包络提取 mel频率特征参数 高斯混合模型 信号识别
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部