期刊文献+
共找到79篇文章
< 1 2 4 >
每页显示 20 50 100
基于Mel频率倒谱参数相似度的语音端点检测算法 被引量:16
1
作者 王宏志 徐玉超 李美静 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2012年第5期1331-1335,共5页
为提高噪声环境下语音端点检测的精确性,提出了一种基于Mel频率倒谱参数(MF-CC)相似度的端点检测方法。提取了每帧语音信号的Mel频率倒谱参数,然后将前十帧作为背景噪声,计算测试帧和背景噪声的MFCC相关系数距离,最后用得到的MFCC相似... 为提高噪声环境下语音端点检测的精确性,提出了一种基于Mel频率倒谱参数(MF-CC)相似度的端点检测方法。提取了每帧语音信号的Mel频率倒谱参数,然后将前十帧作为背景噪声,计算测试帧和背景噪声的MFCC相关系数距离,最后用得到的MFCC相似度距离曲线进行端点检测。实验结果表明,该方法在白噪声和粉噪声环境下均可得到理想的端点检测效果,并且在低信噪比时仍然有效。 展开更多
关键词 通信技术 端点检测 mel频率参数 相关系数
下载PDF
差分和加权Mel倒谱混合参数应用于说话人识别 被引量:14
2
作者 柯晶晶 周萍 +1 位作者 景新幸 杨青 《微电子学与计算机》 CSCD 北大核心 2014年第9期88-91,共4页
说话人识别是信息技术和生物学的新一代身份验证方式,在说话人识别的研究中,特征参数的提取直接影响到识别系统最终的识别效率.通过对Mel频率倒谱系数特征参数进行分析研究,基于Mel频率倒谱系数改进加权函数,将体现个人语音特性的加权... 说话人识别是信息技术和生物学的新一代身份验证方式,在说话人识别的研究中,特征参数的提取直接影响到识别系统最终的识别效率.通过对Mel频率倒谱系数特征参数进行分析研究,基于Mel频率倒谱系数改进加权函数,将体现个人语音特性的加权特征参数与反映语音帧间变化的差分Mel频率倒谱系数进行维度筛选,再进行参数混合.实验结果表明,通过改进加权函数提取得到的特征参数与差分Mel频率倒谱系数的混合参数在矢量量化的说话人识别系统中,码本容量为16和32时可以达到100%的识别率. 展开更多
关键词 说话人识别 加权mel频率系数 混合参数 矢量量化
下载PDF
基于多窗频谱估计和平滑幅度谱包络的Mel频率倒谱系数(MFCC)改进算法 被引量:6
3
作者 张怡然 白静 王力 《科学技术与工程》 北大核心 2014年第19期253-256,274,共5页
语音的特征提取是说话人识别系统中的关键问题。在传统的Mel频率倒谱系数(MFCC)参数的基础上,提出一种改进的MFCC特征提取算法。该算法着眼于语音的前端处理,在预处理阶段,利用SWCE窗函数,对信号进行多窗频谱估计。并对得到的频谱进行... 语音的特征提取是说话人识别系统中的关键问题。在传统的Mel频率倒谱系数(MFCC)参数的基础上,提出一种改进的MFCC特征提取算法。该算法着眼于语音的前端处理,在预处理阶段,利用SWCE窗函数,对信号进行多窗频谱估计。并对得到的频谱进行平滑处理,得到信号的谱包络。然后对信号的谱包络进行计算,得到改进的MFCC参数。实验表明,在不同噪声环境下,与传统的MFCC算法相比,改进的算法识别率提高四个百分点以上。 展开更多
关键词 mel频率系数 多窗频估计 滑动平均滤波 包络 说话人识别
下载PDF
基于经验模态分解结合傅氏变换与Wigner分布的Mel频率倒谱系数提取 被引量:2
4
作者 曾以成 陈雨莺 +1 位作者 毛燕湖 谢小娟 《湘潭大学自然科学学报》 CAS 北大核心 2015年第2期20-26,共7页
根据语音信号的非平稳特点,用经验模态分解方法把语音信号分解成一系列固有模态函数(Intrinsic Mode Function,IMF),一个IMF只含有语音信号的一部分信息,不同IMF分量携带的特征信息不同,对这些IMFs进行加权处理,得到新的语音,再对其进... 根据语音信号的非平稳特点,用经验模态分解方法把语音信号分解成一系列固有模态函数(Intrinsic Mode Function,IMF),一个IMF只含有语音信号的一部分信息,不同IMF分量携带的特征信息不同,对这些IMFs进行加权处理,得到新的语音,再对其进行后续处理.Wigner-Ville分布能精确地定位信号的时频结构,而传统傅氏变换不能反映信号的瞬时变化情况,但多分量信号的Wigner-Ville分布受困于交叉项的干扰,因此利用Wigner-Ville分布的优点,采用Wigner-Ville谱与傅氏谱结合来代替单独的傅氏谱作为每帧的特征,进行Mel频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)提取.实验表明,经改进后的MFCC参数较传统的MFCC参数应用于说话人识别系统,识别率有较大提升,且鲁棒性较好. 展开更多
关键词 经验模态分解 Wigner-Ville 傅氏变换 mel频率系数
下载PDF
说话人识别技术中Mel倒谱参数改进算法的C程序实现
5
作者 叶蕾 方鹏 《计算机与现代化》 2007年第11期26-28,共3页
基于语音信号的频谱特性,本文对说话人识别技术中Mel倒谱参数做了改进,并通过Microsoft Visual C++6.0验证了在低信噪比时使用改进后的Mel倒谱参数可以提高说话人识别系统的正确识别率。
关键词 说话人识别 mel参数
下载PDF
采用Mel倒谱参数的咳嗽声识别方法 被引量:2
6
作者 尹永 莫鸿强 《信息技术》 2012年第10期85-91,共7页
在诊断一个有慢性咳嗽的病人时,他的咳嗽强度和频率评估能提供很有价值的信息。因此提高咳嗽识别率,对疾病的诊断有着重要意义。从语音识别中被广泛应用的Mel倒谱参数出发,寻找咳嗽和语音在Mel倒谱参数中的区别。基于Mel倒谱参数的原理... 在诊断一个有慢性咳嗽的病人时,他的咳嗽强度和频率评估能提供很有价值的信息。因此提高咳嗽识别率,对疾病的诊断有着重要意义。从语音识别中被广泛应用的Mel倒谱参数出发,寻找咳嗽和语音在Mel倒谱参数中的区别。基于Mel倒谱参数的原理,将其计算过程中的Mel刻度滤波器对数能量的极值数分布情况提取出来作为咳嗽的识别特征。在病房环境下对录音文件进行实验,得到的咳嗽识别率为90%以上,同时能够将语音等非咳嗽信号有效地剔除,实验结果显示90%以上的语音信号被排除。在录音设备及环境等各项参数不变的条件下,对不同病人样本,可使用同一阈值对咳嗽进行识别。该方法过程简单,数据计算量小,便于快速识别。 展开更多
关键词 mel参数(mel-Frequency CEPSTRUM Coefficient MFCC) mel刻度滤波器对数能量 咳嗽识别
下载PDF
基于基音周期与清浊音信息的梅尔倒谱参数 被引量:1
7
作者 郭武 王仁华 戴礼荣 《数据采集与处理》 CSCD 北大核心 2007年第2期229-233,共5页
提出一种在浊音部分不固定帧长的梅尔倒谱参数(Mel-cepstrum)提取的方法。针对浊音和清音所包含信息量不同,对浊音进行双倍的加权,从而将基音与清浊音信息融合进梅尔倒谱参数。将这种动态的梅尔倒谱参数应用在说话人确认中,在混合高斯模... 提出一种在浊音部分不固定帧长的梅尔倒谱参数(Mel-cepstrum)提取的方法。针对浊音和清音所包含信息量不同,对浊音进行双倍的加权,从而将基音与清浊音信息融合进梅尔倒谱参数。将这种动态的梅尔倒谱参数应用在说话人确认中,在混合高斯模型(Gaussian mixture models,GMM)的情况下,取得了比常用的梅尔刻度式倒频谱参数(Mel-frequency cepstral coefficient,MFCC)更高的识别率,在NIST 2002年测试数据库中,512个混合高斯下能够将等错误率(EER)由9.4%降低到8.3%,2 048个混合高斯下能够将等错误率由7.8%降低到6.9%。 展开更多
关键词 说话人确认 梅尔参数 基音频率 清浊音信息
下载PDF
利用抗噪幂归一化倒谱系数的鸟类声音识别 被引量:17
8
作者 颜鑫 李应 《电子学报》 EI CAS CSCD 北大核心 2013年第2期295-300,共6页
针对真实环境中各种背景噪声下的鸟类声音识别问题,提出了一种基于新型抗噪特征提取的鸟类声音识别技术.首先,根据适用于高度非平稳环境下的噪声估计算法求出噪声功率谱.其次,使用多频带谱减法对声音功率谱进行降噪处理.接着,结合降噪... 针对真实环境中各种背景噪声下的鸟类声音识别问题,提出了一种基于新型抗噪特征提取的鸟类声音识别技术.首先,根据适用于高度非平稳环境下的噪声估计算法求出噪声功率谱.其次,使用多频带谱减法对声音功率谱进行降噪处理.接着,结合降噪的声音功率谱提取抗噪幂归一化倒谱系数(APNCC).最后,采用支持向量机(SVM)分别对提取的APNCC,幂归一化倒谱系数(PNCC)和Mel频率倒谱系数(MFCC)对34种鸟类声音进行不同环境和信噪比情况下的对比实验.实验表明,提取的APNCC具有较好的平均识别效果及较强的噪声鲁棒性,更适用于信噪比低于30dB环境下的鸟类声音识别. 展开更多
关键词 鸟类声音识别 非平稳噪声估计 多频带减法 抗噪幂归一化系数 mel频率系数
下载PDF
采用复倒谱峰值滤波GMM识别混响语音
9
作者 孔荣 吴迪 +3 位作者 廖启鹏 朱俊杰 周强 陶智 《计算机工程与应用》 CSCD 2014年第15期191-193,203,共4页
针对混响环境下语音识别系统性能急剧下降问题,提出一种采用复倒谱峰值滤波GMM识别混响语音的方法。通过训练纯净语音的MFCC特征参数构建高斯混合模型,在识别混响语音前引入复倒谱峰值滤波器以减少混响引起的语音失真而提高混响环境下... 针对混响环境下语音识别系统性能急剧下降问题,提出一种采用复倒谱峰值滤波GMM识别混响语音的方法。通过训练纯净语音的MFCC特征参数构建高斯混合模型,在识别混响语音前引入复倒谱峰值滤波器以减少混响引起的语音失真而提高混响环境下语音识别率。经实验验证,该方法避免了在现实条件下准确估计房间冲击响应函数的麻烦,降低了计算难度,提高了混响环境下至少4%的系统识别率。 展开更多
关键词 高斯混合模型 mel频率系数(MFCC)
下载PDF
基于MFCC倒谱距离的语音端点检测方法 被引量:1
10
作者 杨龙 《信息通信》 2015年第7期31-32,共2页
在一个语音信号处理系统中,端点检测是对语音预处理阶段最重要的环节,好的检测效果可提高后续语音处理的效率。文章结合语音信号特性,采用根据人耳听觉机理Mel频率倒谱系数(Mel Frequency Coefficient,MFCC)对带噪语音进行端点检测,通... 在一个语音信号处理系统中,端点检测是对语音预处理阶段最重要的环节,好的检测效果可提高后续语音处理的效率。文章结合语音信号特性,采用根据人耳听觉机理Mel频率倒谱系数(Mel Frequency Coefficient,MFCC)对带噪语音进行端点检测,通过仿真实验的方式证明其可行性。 展开更多
关键词 语音端点检测 mel频率参数 mel频率系数
下载PDF
基于GFCC和能量算子倒谱的语种识别 被引量:4
11
作者 刘晶 邵玉斌 +1 位作者 龙华 李一民 《云南大学学报(自然科学版)》 CAS CSCD 北大核心 2022年第2期254-261,共8页
为了提高低信噪比下语种识别的准确率,引入一种新的特征提取融合方法.在前端加入有声段检测,并基于人耳听觉感知模型提取伽玛通频率倒谱系数(Gammatone Frequency Cepstrum Coefficient,GFCC)特征,通过主成分分析对特征进行压缩、降噪,... 为了提高低信噪比下语种识别的准确率,引入一种新的特征提取融合方法.在前端加入有声段检测,并基于人耳听觉感知模型提取伽玛通频率倒谱系数(Gammatone Frequency Cepstrum Coefficient,GFCC)特征,通过主成分分析对特征进行压缩、降噪,融合每个有声段的Teager能量算子倒谱参数,通过高斯混合通用背景模型进行语种识别验证.实验结果表明,在信噪比为-5~0 dB时,相对于基于对数梅尔尺度滤波器组能量特征方法,融合特征集方法对5种语言的识别率,分别提升了23.7%~34.0%,其他信噪比等级下识别率也有明显的提升. 展开更多
关键词 语种识别 伽玛通频率系数 有声无声段检测 Teager能量算子参数 主成分分析
下载PDF
基于听觉特性的语音特征参数提取方法研究 被引量:4
12
作者 白燕燕 苏静 《自动化技术与应用》 2015年第4期40-43,49,共5页
特征提取是说话人识别系统中最关键的一个步骤。特征提取通俗的来说是提取代表说话人个性的语音特征。直接关乎识别系统的准确率。通常人们能从说话人声音的品质,频率的高低,音量的大小等信息中感知说话人的个性特点。文章采用Mel频率... 特征提取是说话人识别系统中最关键的一个步骤。特征提取通俗的来说是提取代表说话人个性的语音特征。直接关乎识别系统的准确率。通常人们能从说话人声音的品质,频率的高低,音量的大小等信息中感知说话人的个性特点。文章采用Mel频率倒谱域参数,是因为Mel频率尺度更加贴近人耳的听觉特性。Mel频率倒谱域参数不仅具有低频段高谱分辨率的优势,而且对噪声鲁棒能力很强。文章以声道模型和听觉模型为例,对比了LPC参数和MFCC参数分布。得出了MFCC不受全极点模型限制,对环境的适应性更强,且可降低不同人说话引起的差异度的影响。其参数性能优于LPC参数。 展开更多
关键词 特征提取 mel频率倒谱域参数 LPC 分辨率 鲁棒
下载PDF
基于特征参数融合的语音情感识别方法 被引量:10
13
作者 陈明义 余伶俐 +1 位作者 朱晗 周昆湘 《微电子学与计算机》 CSCD 北大核心 2006年第12期168-171,174,共5页
语音情感识别是人工智能的重要研究领域之一,特征参数提取的准确性直接影响识别的效果。分析了发音持续时间、平均振幅、基音频率,第一共振峰和Mel频率倒谱参数,并基于模糊熵理论提取了各参数的权重。再利用模糊熵进行有效的度量融合,... 语音情感识别是人工智能的重要研究领域之一,特征参数提取的准确性直接影响识别的效果。分析了发音持续时间、平均振幅、基音频率,第一共振峰和Mel频率倒谱参数,并基于模糊熵理论提取了各参数的权重。再利用模糊熵进行有效的度量融合,最后通过改进后综合判决对情感语句做出识别判定。研究发现融合后的参数增强了情感识别的效果。 展开更多
关键词 语音情感识别 模糊熵 mel频率 参数融合
下载PDF
混合MFCC特征参数应用于语音情感识别 被引量:19
14
作者 周萍 李晓盼 +1 位作者 李杰 景新幸 《计算机测量与控制》 北大核心 2013年第7期1966-1968,1986,共4页
引入两种新的特征参数Mid-MFCC和IMFCC,采用MFCC、Mid-MFCC和IMFCC相结合的改进算法,解决MFCC特征参数在语音识别中对中、高频信号的识别精度不高的特点,并使用增减分量法计算MFCC、Mid-MFCC和IMFCC各阶倒谱分量对语音情感识别的贡献,提... 引入两种新的特征参数Mid-MFCC和IMFCC,采用MFCC、Mid-MFCC和IMFCC相结合的改进算法,解决MFCC特征参数在语音识别中对中、高频信号的识别精度不高的特点,并使用增减分量法计算MFCC、Mid-MFCC和IMFCC各阶倒谱分量对语音情感识别的贡献,提取3个特征参数贡献最高的几阶倒谱分量组成了新的特征参数;实验结果表明,在相同环境下新的特征参数比经典MFCC特征参数的语音情感的识别率稍高。 展开更多
关键词 mel频率系数(MFCC) 增减分量法 特征提取
下载PDF
基于多带解调分析和瞬时频率估计的耳语音话者识别 被引量:12
15
作者 王敏 赵鹤鸣 《声学学报》 EI CSCD 北大核心 2010年第4期471-476,共6页
为了改善耳语音话者识别的稳健性,提出了一种基于调幅-调频(AM-FM)模型的耳语音特征参数,瞬时频率估计(IFE)。根据语音产生的共振峰调制理论,采用多带解调分析(MDA)获得语音的瞬时包络和频率;然后根据包络幅度和频率的加权估计,得到语... 为了改善耳语音话者识别的稳健性,提出了一种基于调幅-调频(AM-FM)模型的耳语音特征参数,瞬时频率估计(IFE)。根据语音产生的共振峰调制理论,采用多带解调分析(MDA)获得语音的瞬时包络和频率;然后根据包络幅度和频率的加权估计,得到语音的特征IFE来描绘语音的频率结构。将该特征用于耳语话者识别并和传统的Mel倒谱系数(MFCC)进行了比较。实验结果表明,随着测试人数的增加,IFE的识别效果略好于MFCC;在测试信道改变的情况下,与MFCC相比IFE的稳健性得到了有效的提高。 展开更多
关键词 瞬时频率估计 话者识别 解调分析 耳语音 语音特征参数 mel系数 调制理论 加权估计
下载PDF
基于循环谱分析的LPI信号特征检测新方法研究 被引量:4
16
作者 戴幻尧 蒋鸿宇 李群 《信号处理》 CSCD 北大核心 2009年第5期781-786,共6页
本文提出一种LPI信号特征提取和参数估计的新方法,通过对LPI信号进行采用频域平滑周期图法估计循环谱,建立并采用"循环频率-谱频率域"分析信号内部特征,得到了LPI信号在该域内明显的分类特征和多维参数估计的方法。计算机仿... 本文提出一种LPI信号特征提取和参数估计的新方法,通过对LPI信号进行采用频域平滑周期图法估计循环谱,建立并采用"循环频率-谱频率域"分析信号内部特征,得到了LPI信号在该域内明显的分类特征和多维参数估计的方法。计算机仿真实验和性能分析均表明,该估计方法避免了多维搜索,计算量小,估计精度高,且不需要知道信号的先验信息,对于多种LPI信号具有良好的适应性,为LPI信号的截获接收和处理提供了一个新的思路,具有一定的工程意义。 展开更多
关键词 循环分析 LPI信号 循环频率-频率 特征提取 参数估计
下载PDF
基于MFCC特征组合参数的说话人识别研究 被引量:3
17
作者 曾霞霞 徐戈 吴征远 《集美大学学报(自然科学版)》 CAS 2016年第4期317-320,共4页
为提高说话人识别系统的识别率,提出了一种提取Mel频率倒谱系数(MFCC)与差分特征组合参数的方法:先对传统的MFCC参数进行特征分量归一化处理,提升MFCC系数的噪声鲁棒性;再用高斯混合模型(GMM)构建了说话人识别系统。使用TIMIT语音库进... 为提高说话人识别系统的识别率,提出了一种提取Mel频率倒谱系数(MFCC)与差分特征组合参数的方法:先对传统的MFCC参数进行特征分量归一化处理,提升MFCC系数的噪声鲁棒性;再用高斯混合模型(GMM)构建了说话人识别系统。使用TIMIT语音库进行实验测试,并比较了不同高斯混合数的MFCC特征参数组合对识别率的影响。结果表明:使用改进的MFCC混合参数明显地提高了说话人的识别率。 展开更多
关键词 说话人识别 mel频率系数 高斯混合模型 特征参数 特征向量
下载PDF
基于MFCC与GFCC混合特征参数的说话人识别 被引量:44
18
作者 周萍 沈昊 郑凯鹏 《应用科学学报》 CAS CSCD 北大核心 2019年第1期24-32,共9页
针对说话人识别中单一参数表征不够全面的特点,将抗噪性能一般的传统MFCC参数与鲁棒性更强的GFCC参数相互融合,并结合它们的动态特性构成一种新的混合参数.针对特征参数维数过高造成的冗余,研究了每种特征参数各分量与识别结果的关系,... 针对说话人识别中单一参数表征不够全面的特点,将抗噪性能一般的传统MFCC参数与鲁棒性更强的GFCC参数相互融合,并结合它们的动态特性构成一种新的混合参数.针对特征参数维数过高造成的冗余,研究了每种特征参数各分量与识别结果的关系,舍弃其中贡献较低的分量以实现特征参数降维的目的,并将混合参数应用于基于高斯混合模型的说话人识别系统.仿真实验表明,该混合特征参数具有更好的识别性能和抗噪性. 展开更多
关键词 说话人识别 混合特征参数 mel频率系数 Gammatone滤波器
下载PDF
基于AMR编码参数的语音识别 被引量:1
19
作者 杨吉斌 曹铁勇 张雄伟 《解放军理工大学学报(自然科学版)》 EI 2002年第5期6-9,共4页
基于语音编码系统的语音识别 ,由于受编码的影响其识别效果在编码速率下降时显著降低。传统的识别方法从重构语音波形中提取特征参数 ,并针对该特征参数进行训练和识别。比较了基于编码语音的识别准确率和基于编码参数的识别准确率 ,并... 基于语音编码系统的语音识别 ,由于受编码的影响其识别效果在编码速率下降时显著降低。传统的识别方法从重构语音波形中提取特征参数 ,并针对该特征参数进行训练和识别。比较了基于编码语音的识别准确率和基于编码参数的识别准确率 ,并研究了编码参数对识别准确率的影响。在此基础上 ,通过选择受编码影响较小的编码参数 ,直接将 LPC参数和残差信号参数组合起来构成特征参数进行语音识别。实验结果表明 ,采用这种方法的 AMR语音识别系统 ,其识别效果接近于基于原始语音的识别效果。 展开更多
关键词 编码参数 AMR声码器 语音识别 mel频率系数 语音编码系统 编码速度
下载PDF
加性白噪声环境下语音特征参数鲁棒性的研究 被引量:1
20
作者 孙林慧 杨震 《南京邮电学院学报(自然科学版)》 EI 2005年第5期53-56,共4页
随着说话人识别技术的发展,实用有效的说话人识别系统越来越成为研究的重点。语音特征参数的鲁棒性直接影响一个说话人识别系统的具体性能,过去主要针对移动通信环境下存在信道失真的问题,研究差分倒谱的鲁棒性。文中则主要在加性白噪... 随着说话人识别技术的发展,实用有效的说话人识别系统越来越成为研究的重点。语音特征参数的鲁棒性直接影响一个说话人识别系统的具体性能,过去主要针对移动通信环境下存在信道失真的问题,研究差分倒谱的鲁棒性。文中则主要在加性白噪声环境下研究M el倒谱参数、M el差分倒谱参数的顽健性以及它们经过倒谱系数零均值化(CMN)处理后识别性能的改进。从仿真结果可以看出:在加性白噪声环境下,差分倒谱参数具有很好的鲁棒性;倒谱系数零均值化能有效的除去加性白噪声。 展开更多
关键词 鲁棒性 mel参数 mel差分 系数零均值化
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部