期刊文献+
共找到80篇文章
< 1 2 4 >
每页显示 20 50 100
基于多窗频谱估计和平滑幅度谱包络的Mel频率倒谱系数(MFCC)改进算法 被引量:6
1
作者 张怡然 白静 王力 《科学技术与工程》 北大核心 2014年第19期253-256,274,共5页
语音的特征提取是说话人识别系统中的关键问题。在传统的Mel频率倒谱系数(MFCC)参数的基础上,提出一种改进的MFCC特征提取算法。该算法着眼于语音的前端处理,在预处理阶段,利用SWCE窗函数,对信号进行多窗频谱估计。并对得到的频谱进行... 语音的特征提取是说话人识别系统中的关键问题。在传统的Mel频率倒谱系数(MFCC)参数的基础上,提出一种改进的MFCC特征提取算法。该算法着眼于语音的前端处理,在预处理阶段,利用SWCE窗函数,对信号进行多窗频谱估计。并对得到的频谱进行平滑处理,得到信号的谱包络。然后对信号的谱包络进行计算,得到改进的MFCC参数。实验表明,在不同噪声环境下,与传统的MFCC算法相比,改进的算法识别率提高四个百分点以上。 展开更多
关键词 mel频率系数 多窗频估计 滑动平均滤波 包络 说话人识别
下载PDF
说话人识别技术中Mel倒谱参数改进算法的C程序实现
2
作者 叶蕾 方鹏 《计算机与现代化》 2007年第11期26-28,共3页
基于语音信号的频谱特性,本文对说话人识别技术中Mel倒谱参数做了改进,并通过Microsoft Visual C++6.0验证了在低信噪比时使用改进后的Mel倒谱参数可以提高说话人识别系统的正确识别率。
关键词 说话人识别 mel参数
下载PDF
基于Mel频率倒谱参数相似度的语音端点检测算法 被引量:16
3
作者 王宏志 徐玉超 李美静 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2012年第5期1331-1335,共5页
为提高噪声环境下语音端点检测的精确性,提出了一种基于Mel频率倒谱参数(MF-CC)相似度的端点检测方法。提取了每帧语音信号的Mel频率倒谱参数,然后将前十帧作为背景噪声,计算测试帧和背景噪声的MFCC相关系数距离,最后用得到的MFCC相似... 为提高噪声环境下语音端点检测的精确性,提出了一种基于Mel频率倒谱参数(MF-CC)相似度的端点检测方法。提取了每帧语音信号的Mel频率倒谱参数,然后将前十帧作为背景噪声,计算测试帧和背景噪声的MFCC相关系数距离,最后用得到的MFCC相似度距离曲线进行端点检测。实验结果表明,该方法在白噪声和粉噪声环境下均可得到理想的端点检测效果,并且在低信噪比时仍然有效。 展开更多
关键词 通信技术 端点检测 mel频率参数 相关系数
下载PDF
差分和加权Mel倒谱混合参数应用于说话人识别 被引量:14
4
作者 柯晶晶 周萍 +1 位作者 景新幸 杨青 《微电子学与计算机》 CSCD 北大核心 2014年第9期88-91,共4页
说话人识别是信息技术和生物学的新一代身份验证方式,在说话人识别的研究中,特征参数的提取直接影响到识别系统最终的识别效率.通过对Mel频率倒谱系数特征参数进行分析研究,基于Mel频率倒谱系数改进加权函数,将体现个人语音特性的加权... 说话人识别是信息技术和生物学的新一代身份验证方式,在说话人识别的研究中,特征参数的提取直接影响到识别系统最终的识别效率.通过对Mel频率倒谱系数特征参数进行分析研究,基于Mel频率倒谱系数改进加权函数,将体现个人语音特性的加权特征参数与反映语音帧间变化的差分Mel频率倒谱系数进行维度筛选,再进行参数混合.实验结果表明,通过改进加权函数提取得到的特征参数与差分Mel频率倒谱系数的混合参数在矢量量化的说话人识别系统中,码本容量为16和32时可以达到100%的识别率. 展开更多
关键词 说话人识别 加权mel频率系数 混合参数 矢量量化
下载PDF
基于经验模态分解结合傅氏变换与Wigner分布的Mel频率倒谱系数提取 被引量:2
5
作者 曾以成 陈雨莺 +1 位作者 毛燕湖 谢小娟 《湘潭大学自然科学学报》 CAS 北大核心 2015年第2期20-26,共7页
根据语音信号的非平稳特点,用经验模态分解方法把语音信号分解成一系列固有模态函数(Intrinsic Mode Function,IMF),一个IMF只含有语音信号的一部分信息,不同IMF分量携带的特征信息不同,对这些IMFs进行加权处理,得到新的语音,再对其进... 根据语音信号的非平稳特点,用经验模态分解方法把语音信号分解成一系列固有模态函数(Intrinsic Mode Function,IMF),一个IMF只含有语音信号的一部分信息,不同IMF分量携带的特征信息不同,对这些IMFs进行加权处理,得到新的语音,再对其进行后续处理.Wigner-Ville分布能精确地定位信号的时频结构,而传统傅氏变换不能反映信号的瞬时变化情况,但多分量信号的Wigner-Ville分布受困于交叉项的干扰,因此利用Wigner-Ville分布的优点,采用Wigner-Ville谱与傅氏谱结合来代替单独的傅氏谱作为每帧的特征,进行Mel频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)提取.实验表明,经改进后的MFCC参数较传统的MFCC参数应用于说话人识别系统,识别率有较大提升,且鲁棒性较好. 展开更多
关键词 经验模态分解 Wigner-Ville 傅氏变换 mel频率系数
下载PDF
采用Mel倒谱参数的咳嗽声识别方法 被引量:2
6
作者 尹永 莫鸿强 《信息技术》 2012年第10期85-91,共7页
在诊断一个有慢性咳嗽的病人时,他的咳嗽强度和频率评估能提供很有价值的信息。因此提高咳嗽识别率,对疾病的诊断有着重要意义。从语音识别中被广泛应用的Mel倒谱参数出发,寻找咳嗽和语音在Mel倒谱参数中的区别。基于Mel倒谱参数的原理... 在诊断一个有慢性咳嗽的病人时,他的咳嗽强度和频率评估能提供很有价值的信息。因此提高咳嗽识别率,对疾病的诊断有着重要意义。从语音识别中被广泛应用的Mel倒谱参数出发,寻找咳嗽和语音在Mel倒谱参数中的区别。基于Mel倒谱参数的原理,将其计算过程中的Mel刻度滤波器对数能量的极值数分布情况提取出来作为咳嗽的识别特征。在病房环境下对录音文件进行实验,得到的咳嗽识别率为90%以上,同时能够将语音等非咳嗽信号有效地剔除,实验结果显示90%以上的语音信号被排除。在录音设备及环境等各项参数不变的条件下,对不同病人样本,可使用同一阈值对咳嗽进行识别。该方法过程简单,数据计算量小,便于快速识别。 展开更多
关键词 mel参数(mel-Frequency CEPSTRUM Coefficient MFCC) mel刻度滤波器对数能量 咳嗽识别
下载PDF
基于基音周期与清浊音信息的梅尔倒谱参数 被引量:1
7
作者 郭武 王仁华 戴礼荣 《数据采集与处理》 CSCD 北大核心 2007年第2期229-233,共5页
提出一种在浊音部分不固定帧长的梅尔倒谱参数(Mel-cepstrum)提取的方法。针对浊音和清音所包含信息量不同,对浊音进行双倍的加权,从而将基音与清浊音信息融合进梅尔倒谱参数。将这种动态的梅尔倒谱参数应用在说话人确认中,在混合高斯模... 提出一种在浊音部分不固定帧长的梅尔倒谱参数(Mel-cepstrum)提取的方法。针对浊音和清音所包含信息量不同,对浊音进行双倍的加权,从而将基音与清浊音信息融合进梅尔倒谱参数。将这种动态的梅尔倒谱参数应用在说话人确认中,在混合高斯模型(Gaussian mixture models,GMM)的情况下,取得了比常用的梅尔刻度式倒频谱参数(Mel-frequency cepstral coefficient,MFCC)更高的识别率,在NIST 2002年测试数据库中,512个混合高斯下能够将等错误率(EER)由9.4%降低到8.3%,2 048个混合高斯下能够将等错误率由7.8%降低到6.9%。 展开更多
关键词 说话人确认 梅尔参数 基音频率 清浊音信息
下载PDF
利用抗噪幂归一化倒谱系数的鸟类声音识别 被引量:17
8
作者 颜鑫 李应 《电子学报》 EI CAS CSCD 北大核心 2013年第2期295-300,共6页
针对真实环境中各种背景噪声下的鸟类声音识别问题,提出了一种基于新型抗噪特征提取的鸟类声音识别技术.首先,根据适用于高度非平稳环境下的噪声估计算法求出噪声功率谱.其次,使用多频带谱减法对声音功率谱进行降噪处理.接着,结合降噪... 针对真实环境中各种背景噪声下的鸟类声音识别问题,提出了一种基于新型抗噪特征提取的鸟类声音识别技术.首先,根据适用于高度非平稳环境下的噪声估计算法求出噪声功率谱.其次,使用多频带谱减法对声音功率谱进行降噪处理.接着,结合降噪的声音功率谱提取抗噪幂归一化倒谱系数(APNCC).最后,采用支持向量机(SVM)分别对提取的APNCC,幂归一化倒谱系数(PNCC)和Mel频率倒谱系数(MFCC)对34种鸟类声音进行不同环境和信噪比情况下的对比实验.实验表明,提取的APNCC具有较好的平均识别效果及较强的噪声鲁棒性,更适用于信噪比低于30dB环境下的鸟类声音识别. 展开更多
关键词 鸟类声音识别 非平稳噪声估计 多频带减法 抗噪幂归一化系数 mel频率系数
下载PDF
基于改进GFCC特征参数的广播音频语种识别 被引量:1
9
作者 邵玉斌 陈亮 +1 位作者 龙华 杜庆治 《吉林大学学报(理学版)》 CAS 北大核心 2022年第2期417-424,共8页
针对广播音频语种识别中与语种识别无关的特征对识别结果产生影响的问题,提出一种基于伽马频率倒谱系数的改进特征参数的语种识别方法.通过提取每帧信号的能量谱包络,去除部分与说话人相关的特征,采用Gammatone滤波器组滤波,经离散余弦... 针对广播音频语种识别中与语种识别无关的特征对识别结果产生影响的问题,提出一种基于伽马频率倒谱系数的改进特征参数的语种识别方法.通过提取每帧信号的能量谱包络,去除部分与说话人相关的特征,采用Gammatone滤波器组滤波,经离散余弦变换后再进行倒谱提升,得到改进的伽马频率倒谱系数特征参数.将广播音频信号提取特征参数输入隐Markov模型中进行训练测试,得到的语种识别结果表明,该方法有效提升了广播音频语种识别的准确率,优于目前使用的伽马频率倒谱系数特征及其衍生方法. 展开更多
关键词 广播音频语种识别 能量包络 提升 改进伽马频率系数
下载PDF
采用复倒谱峰值滤波GMM识别混响语音
10
作者 孔荣 吴迪 +3 位作者 廖启鹏 朱俊杰 周强 陶智 《计算机工程与应用》 CSCD 2014年第15期191-193,203,共4页
针对混响环境下语音识别系统性能急剧下降问题,提出一种采用复倒谱峰值滤波GMM识别混响语音的方法。通过训练纯净语音的MFCC特征参数构建高斯混合模型,在识别混响语音前引入复倒谱峰值滤波器以减少混响引起的语音失真而提高混响环境下... 针对混响环境下语音识别系统性能急剧下降问题,提出一种采用复倒谱峰值滤波GMM识别混响语音的方法。通过训练纯净语音的MFCC特征参数构建高斯混合模型,在识别混响语音前引入复倒谱峰值滤波器以减少混响引起的语音失真而提高混响环境下语音识别率。经实验验证,该方法避免了在现实条件下准确估计房间冲击响应函数的麻烦,降低了计算难度,提高了混响环境下至少4%的系统识别率。 展开更多
关键词 高斯混合模型 mel频率系数(MFCC)
下载PDF
基于MFCC倒谱距离的语音端点检测方法 被引量:1
11
作者 杨龙 《信息通信》 2015年第7期31-32,共2页
在一个语音信号处理系统中,端点检测是对语音预处理阶段最重要的环节,好的检测效果可提高后续语音处理的效率。文章结合语音信号特性,采用根据人耳听觉机理Mel频率倒谱系数(Mel Frequency Coefficient,MFCC)对带噪语音进行端点检测,通... 在一个语音信号处理系统中,端点检测是对语音预处理阶段最重要的环节,好的检测效果可提高后续语音处理的效率。文章结合语音信号特性,采用根据人耳听觉机理Mel频率倒谱系数(Mel Frequency Coefficient,MFCC)对带噪语音进行端点检测,通过仿真实验的方式证明其可行性。 展开更多
关键词 语音端点检测 mel频率参数 mel频率系数
下载PDF
分布式语音识别参数提取的改进算法及实现
12
作者 叶蕾 方鹏 《福建电脑》 2007年第5期91-91,78,共2页
本文介绍了分布式语音识别系统,对该系统中参数提取算法做了两种改进,并用Microsoft Visual C++6.0验证这两种改进算法可以提高噪声环境下识别系统的正确识别率。
关键词 分布式语音识别 mel参数 GMM模型
下载PDF
基于GFCC和能量算子倒谱的语种识别 被引量:3
13
作者 刘晶 邵玉斌 +1 位作者 龙华 李一民 《云南大学学报(自然科学版)》 CAS CSCD 北大核心 2022年第2期254-261,共8页
为了提高低信噪比下语种识别的准确率,引入一种新的特征提取融合方法.在前端加入有声段检测,并基于人耳听觉感知模型提取伽玛通频率倒谱系数(Gammatone Frequency Cepstrum Coefficient,GFCC)特征,通过主成分分析对特征进行压缩、降噪,... 为了提高低信噪比下语种识别的准确率,引入一种新的特征提取融合方法.在前端加入有声段检测,并基于人耳听觉感知模型提取伽玛通频率倒谱系数(Gammatone Frequency Cepstrum Coefficient,GFCC)特征,通过主成分分析对特征进行压缩、降噪,融合每个有声段的Teager能量算子倒谱参数,通过高斯混合通用背景模型进行语种识别验证.实验结果表明,在信噪比为-5~0 dB时,相对于基于对数梅尔尺度滤波器组能量特征方法,融合特征集方法对5种语言的识别率,分别提升了23.7%~34.0%,其他信噪比等级下识别率也有明显的提升. 展开更多
关键词 语种识别 伽玛通频率系数 有声无声段检测 Teager能量算子参数 主成分分析
下载PDF
基于特征参数融合的语音情感识别方法 被引量:10
14
作者 陈明义 余伶俐 +1 位作者 朱晗 周昆湘 《微电子学与计算机》 CSCD 北大核心 2006年第12期168-171,174,共5页
语音情感识别是人工智能的重要研究领域之一,特征参数提取的准确性直接影响识别的效果。分析了发音持续时间、平均振幅、基音频率,第一共振峰和Mel频率倒谱参数,并基于模糊熵理论提取了各参数的权重。再利用模糊熵进行有效的度量融合,... 语音情感识别是人工智能的重要研究领域之一,特征参数提取的准确性直接影响识别的效果。分析了发音持续时间、平均振幅、基音频率,第一共振峰和Mel频率倒谱参数,并基于模糊熵理论提取了各参数的权重。再利用模糊熵进行有效的度量融合,最后通过改进后综合判决对情感语句做出识别判定。研究发现融合后的参数增强了情感识别的效果。 展开更多
关键词 语音情感识别 模糊熵 mel频率 参数融合
下载PDF
混合MFCC特征参数应用于语音情感识别 被引量:19
15
作者 周萍 李晓盼 +1 位作者 李杰 景新幸 《计算机测量与控制》 北大核心 2013年第7期1966-1968,1986,共4页
引入两种新的特征参数Mid-MFCC和IMFCC,采用MFCC、Mid-MFCC和IMFCC相结合的改进算法,解决MFCC特征参数在语音识别中对中、高频信号的识别精度不高的特点,并使用增减分量法计算MFCC、Mid-MFCC和IMFCC各阶倒谱分量对语音情感识别的贡献,提... 引入两种新的特征参数Mid-MFCC和IMFCC,采用MFCC、Mid-MFCC和IMFCC相结合的改进算法,解决MFCC特征参数在语音识别中对中、高频信号的识别精度不高的特点,并使用增减分量法计算MFCC、Mid-MFCC和IMFCC各阶倒谱分量对语音情感识别的贡献,提取3个特征参数贡献最高的几阶倒谱分量组成了新的特征参数;实验结果表明,在相同环境下新的特征参数比经典MFCC特征参数的语音情感的识别率稍高。 展开更多
关键词 mel频率系数(MFCC) 增减分量法 特征提取
下载PDF
语音MFCC特征计算的改进算法 被引量:6
16
作者 章熙春 曹燕 +1 位作者 张军 韦岗 《数据采集与处理》 CSCD 北大核心 2005年第2期161-165,共5页
提出了一种计算Mel频倒谱参数(Melfrequencycepstralcoefficient,MFCC)特征的改进算法,该算法采用了加权滤波器分析(WrappeddiscreteFouriertransform,WDFT)技术来提高语音信号低频部分的频谱分辨率,使之更符合人类听觉系统的特性。同... 提出了一种计算Mel频倒谱参数(Melfrequencycepstralcoefficient,MFCC)特征的改进算法,该算法采用了加权滤波器分析(WrappeddiscreteFouriertransform,WDFT)技术来提高语音信号低频部分的频谱分辨率,使之更符合人类听觉系统的特性。同时还运用了加权滤波器分析(Weightedfilterbankanalysis,WFBA)技术,以提高MFCC的鲁棒性。对TIMIT连续语音数据库中DR1集的音素识别结果表明,本文提出的改进算法比传统MFCC算法具有更好的识别率。 展开更多
关键词 语音识别 弯折离散傅里叶变换(WDFT) mel频标参数 加权滤波器分析
下载PDF
改进的混合MFCC语音识别算法研究 被引量:18
17
作者 袁正午 肖旺辉 《计算机工程与应用》 CSCD 北大核心 2009年第33期108-110,共3页
针对MFCC特征参数在语音识别中对中高频信号的识别精度不高的特点,提出采用IMFCC,MIDMFCC,MFCC相结合的改进算法,使用混合滤波器组,提高在语音中高频区域中的识别精度。实验结果表明,改进之后的算法与经典算法比较,在相同环境下对语音... 针对MFCC特征参数在语音识别中对中高频信号的识别精度不高的特点,提出采用IMFCC,MIDMFCC,MFCC相结合的改进算法,使用混合滤波器组,提高在语音中高频区域中的识别精度。实验结果表明,改进之后的算法与经典算法比较,在相同环境下对语音信息的识别率都有一定程度的提高。 展开更多
关键词 mel频率系数(MFCC) 语音识别 特征提取
下载PDF
基于多带解调分析和瞬时频率估计的耳语音话者识别 被引量:12
18
作者 王敏 赵鹤鸣 《声学学报》 EI CSCD 北大核心 2010年第4期471-476,共6页
为了改善耳语音话者识别的稳健性,提出了一种基于调幅-调频(AM-FM)模型的耳语音特征参数,瞬时频率估计(IFE)。根据语音产生的共振峰调制理论,采用多带解调分析(MDA)获得语音的瞬时包络和频率;然后根据包络幅度和频率的加权估计,得到语... 为了改善耳语音话者识别的稳健性,提出了一种基于调幅-调频(AM-FM)模型的耳语音特征参数,瞬时频率估计(IFE)。根据语音产生的共振峰调制理论,采用多带解调分析(MDA)获得语音的瞬时包络和频率;然后根据包络幅度和频率的加权估计,得到语音的特征IFE来描绘语音的频率结构。将该特征用于耳语话者识别并和传统的Mel倒谱系数(MFCC)进行了比较。实验结果表明,随着测试人数的增加,IFE的识别效果略好于MFCC;在测试信道改变的情况下,与MFCC相比IFE的稳健性得到了有效的提高。 展开更多
关键词 瞬时频率估计 话者识别 解调分析 耳语音 语音特征参数 mel系数 调制理论 加权估计
下载PDF
基于MFCC特征组合参数的说话人识别研究 被引量:3
19
作者 曾霞霞 徐戈 吴征远 《集美大学学报(自然科学版)》 CAS 2016年第4期317-320,共4页
为提高说话人识别系统的识别率,提出了一种提取Mel频率倒谱系数(MFCC)与差分特征组合参数的方法:先对传统的MFCC参数进行特征分量归一化处理,提升MFCC系数的噪声鲁棒性;再用高斯混合模型(GMM)构建了说话人识别系统。使用TIMIT语音库进... 为提高说话人识别系统的识别率,提出了一种提取Mel频率倒谱系数(MFCC)与差分特征组合参数的方法:先对传统的MFCC参数进行特征分量归一化处理,提升MFCC系数的噪声鲁棒性;再用高斯混合模型(GMM)构建了说话人识别系统。使用TIMIT语音库进行实验测试,并比较了不同高斯混合数的MFCC特征参数组合对识别率的影响。结果表明:使用改进的MFCC混合参数明显地提高了说话人的识别率。 展开更多
关键词 说话人识别 mel频率系数 高斯混合模型 特征参数 特征向量
下载PDF
基于MFCC与GFCC混合特征参数的说话人识别 被引量:44
20
作者 周萍 沈昊 郑凯鹏 《应用科学学报》 CAS CSCD 北大核心 2019年第1期24-32,共9页
针对说话人识别中单一参数表征不够全面的特点,将抗噪性能一般的传统MFCC参数与鲁棒性更强的GFCC参数相互融合,并结合它们的动态特性构成一种新的混合参数.针对特征参数维数过高造成的冗余,研究了每种特征参数各分量与识别结果的关系,... 针对说话人识别中单一参数表征不够全面的特点,将抗噪性能一般的传统MFCC参数与鲁棒性更强的GFCC参数相互融合,并结合它们的动态特性构成一种新的混合参数.针对特征参数维数过高造成的冗余,研究了每种特征参数各分量与识别结果的关系,舍弃其中贡献较低的分量以实现特征参数降维的目的,并将混合参数应用于基于高斯混合模型的说话人识别系统.仿真实验表明,该混合特征参数具有更好的识别性能和抗噪性. 展开更多
关键词 说话人识别 混合特征参数 mel频率系数 Gammatone滤波器
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部