期刊文献+
共找到76篇文章
< 1 2 4 >
每页显示 20 50 100
一种基于加权Mel倒谱的语音信号共振峰提取算法 被引量:6
1
作者 杨鸿武 赵涛涛 《西北师范大学学报(自然科学版)》 CAS 北大核心 2014年第1期53-57,共5页
提出了一种利用加权Mel倒谱提取语音信号共振峰的算法.首先对短时语音信号进行加权Mel倒谱分析,获得包含频谱主要成分的加权Mel倒谱系数;然后利用离散余弦平滑算法,从加权Mel倒谱系数获得谱包络,并从谱包络的峰值位置获得候选共振峰;最... 提出了一种利用加权Mel倒谱提取语音信号共振峰的算法.首先对短时语音信号进行加权Mel倒谱分析,获得包含频谱主要成分的加权Mel倒谱系数;然后利用离散余弦平滑算法,从加权Mel倒谱系数获得谱包络,并从谱包络的峰值位置获得候选共振峰;最后根据共振峰的连续性约束条件和频率范围,从候选共振峰筛选得到共振峰的估计值.实验结果表明,本算法比倒谱法提取的共振峰误差更小,在噪声环境下具有较好的鲁棒性. 展开更多
关键词 加权mel倒谱 共振峰 DCT变换 鲁棒性
下载PDF
结合EMD和加权Mel倒谱的语音共振峰提取算法 被引量:7
2
作者 赵涛涛 杨鸿武 《计算机工程与应用》 CSCD 北大核心 2015年第9期207-212,共6页
提出了一种利用经验模态分解(Empirical Mode Decomposition,EMD)和加权Mel倒谱(Weighted Mel-Cepstrum coefficients,WMCEP)提取语音信号共振峰的算法。对语音信号进行EMD分解,找出含有共振峰的固有模态函数(Intrinsic Mode Function,I... 提出了一种利用经验模态分解(Empirical Mode Decomposition,EMD)和加权Mel倒谱(Weighted Mel-Cepstrum coefficients,WMCEP)提取语音信号共振峰的算法。对语音信号进行EMD分解,找出含有共振峰的固有模态函数(Intrinsic Mode Function,IMF),并将其重构得到一个新的重构语音信号。对重构语音信号进行加权Mel倒谱分析,获得包含频谱主要成分的加权Mel倒谱系数;利用离散余弦平滑算法,从加权Mel倒谱系数获得谱包络,并从谱包络的峰值位置获得候选共振峰;根据共振峰的连续性约束条件和频率范围,从候选共振峰筛选得到共振峰的估计值。实验结果表明,该算法比单独使用WMCEP提取的共振峰误差更小,而且在信噪比小于20 d B时仍然能够准确提取出共振峰。 展开更多
关键词 共振峰 经验模态分解 固有模态函数 加权mel倒谱 离散余弦变换
下载PDF
基于加权Mel倒谱系数的说话人识别 被引量:3
3
作者 刘亚丽 杨鸿武 黄德智 《计算机应用与软件》 CSCD 2009年第9期24-27,共4页
说话人识别中的首要问题是从语音信号中提取能唯一表现说话人个性特征的有效而稳定可靠的特征参数。把感知加权技术应用到Mel倒谱分析中,通过对基于心理声学模型计算得到的信号掩蔽比插值获得权重函数,并将权重函数应用到Mel倒谱分析中... 说话人识别中的首要问题是从语音信号中提取能唯一表现说话人个性特征的有效而稳定可靠的特征参数。把感知加权技术应用到Mel倒谱分析中,通过对基于心理声学模型计算得到的信号掩蔽比插值获得权重函数,并将权重函数应用到Mel倒谱分析中获得加权Mel倒谱系数(WMCEP),以此为特征进行说话人识别。实验结果表明,WMCEP比MFCC和Mel倒谱系数(MCEP)能更好地逼近说话人的谱包络,在噪声环境下的鲁棒性更好,因此其识别性能要优于MFCC和MCEP。 展开更多
关键词 特征提取 说话人识别 加权 mel倒谱
下载PDF
基于Mel倒谱和BP神经网络的船舶目标分类研究 被引量:2
4
作者 王易川 李智忠 《传感器与微系统》 CSCD 北大核心 2011年第6期55-57,67,共4页
Mel倒谱系数分析依据人耳听觉特性,可以提取有利于船舶目标分类的特征。前向神经网络的反向传播算法对类别数目小但分类困难的模式识别问题有良好的分类效果。针对Mel倒谱系数分析提取的船舶目标分类识别特征,采用前向神经网络的反向传... Mel倒谱系数分析依据人耳听觉特性,可以提取有利于船舶目标分类的特征。前向神经网络的反向传播算法对类别数目小但分类困难的模式识别问题有良好的分类效果。针对Mel倒谱系数分析提取的船舶目标分类识别特征,采用前向神经网络的反向传播算法,可以有效对船舶目标进行分类。 展开更多
关键词 mel倒谱 BP神经网络 船舶辐射噪声 目标分类
下载PDF
说话人识别技术中Mel倒谱参数改进算法的C程序实现
5
作者 叶蕾 方鹏 《计算机与现代化》 2007年第11期26-28,共3页
基于语音信号的频谱特性,本文对说话人识别技术中Mel倒谱参数做了改进,并通过Microsoft Visual C++6.0验证了在低信噪比时使用改进后的Mel倒谱参数可以提高说话人识别系统的正确识别率。
关键词 说话人识别 mel倒谱参数
下载PDF
基于Mel倒谱的某型飞机发动机振动故障的模式识别 被引量:2
6
作者 陈晓 马建仓 《计算机测量与控制》 CSCD 北大核心 2012年第8期2028-2030,2033,共4页
根据人耳听觉特性,利用Mel倒谱系数提取有利于发动机振动故障识别的特征;前向神经网络的反向传播算法对类别数目小、但分类困难的模式识别问题有良好的分类效果;针对Mel倒谱系数分析提取的发动机振动故障分类的特征,分别采用BP网络和RB... 根据人耳听觉特性,利用Mel倒谱系数提取有利于发动机振动故障识别的特征;前向神经网络的反向传播算法对类别数目小、但分类困难的模式识别问题有良好的分类效果;针对Mel倒谱系数分析提取的发动机振动故障分类的特征,分别采用BP网络和RBF网络对飞机发动机振动故障进行识别;结果表明:Mel倒谱系数的维数可以改变,选择合适的的Mel特征参数可以有效地提高发动机故障的识别率;RBF网络的故障识别率较高。 展开更多
关键词 mel倒谱 发动机振动故障 BP神经网络 RBF神经网络 模式识别
下载PDF
采用Mel倒谱参数的咳嗽声识别方法 被引量:2
7
作者 尹永 莫鸿强 《信息技术》 2012年第10期85-91,共7页
在诊断一个有慢性咳嗽的病人时,他的咳嗽强度和频率评估能提供很有价值的信息。因此提高咳嗽识别率,对疾病的诊断有着重要意义。从语音识别中被广泛应用的Mel倒谱参数出发,寻找咳嗽和语音在Mel倒谱参数中的区别。基于Mel倒谱参数的原理... 在诊断一个有慢性咳嗽的病人时,他的咳嗽强度和频率评估能提供很有价值的信息。因此提高咳嗽识别率,对疾病的诊断有着重要意义。从语音识别中被广泛应用的Mel倒谱参数出发,寻找咳嗽和语音在Mel倒谱参数中的区别。基于Mel倒谱参数的原理,将其计算过程中的Mel刻度滤波器对数能量的极值数分布情况提取出来作为咳嗽的识别特征。在病房环境下对录音文件进行实验,得到的咳嗽识别率为90%以上,同时能够将语音等非咳嗽信号有效地剔除,实验结果显示90%以上的语音信号被排除。在录音设备及环境等各项参数不变的条件下,对不同病人样本,可使用同一阈值对咳嗽进行识别。该方法过程简单,数据计算量小,便于快速识别。 展开更多
关键词 mel倒谱参数(mel-Frequency CEPSTRUM Coefficient MFCC) mel刻度滤波器对数能量 咳嗽识别
下载PDF
基于Mel倒谱特征和RBF神经网络的语音识别改进 被引量:2
8
作者 祝进云 张明 《现代计算机(中旬刊)》 2016年第6期3-8,共6页
在科技快速发展的今天,人工智能技术日益成熟,包括机器人、语音识别、图像识别以及大师系统的等技术也在被不断地尝试使用在人们生活的各个方面。语音识别技术在现如今不管是PC端还是移动端都有很多应用,从苹果公司采用的Siri语音助手... 在科技快速发展的今天,人工智能技术日益成熟,包括机器人、语音识别、图像识别以及大师系统的等技术也在被不断地尝试使用在人们生活的各个方面。语音识别技术在现如今不管是PC端还是移动端都有很多应用,从苹果公司采用的Siri语音助手到今天微软的小娜语音助手,越来越证实语音识别技术在将来有很大的发展空间。基于Mel倒谱特征和RBF神经网络的语音识别改进算法结果表明,与现有的语音识别技术对比时,语音识别率有较大的提高,能够达到语音识别的改进的预期效果。 展开更多
关键词 mel倒谱特征 RBF神经网络算法 语音识别
下载PDF
基于Mel频率倒谱参数相似度的语音端点检测算法 被引量:16
9
作者 王宏志 徐玉超 李美静 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2012年第5期1331-1335,共5页
为提高噪声环境下语音端点检测的精确性,提出了一种基于Mel频率倒谱参数(MF-CC)相似度的端点检测方法。提取了每帧语音信号的Mel频率倒谱参数,然后将前十帧作为背景噪声,计算测试帧和背景噪声的MFCC相关系数距离,最后用得到的MFCC相似... 为提高噪声环境下语音端点检测的精确性,提出了一种基于Mel频率倒谱参数(MF-CC)相似度的端点检测方法。提取了每帧语音信号的Mel频率倒谱参数,然后将前十帧作为背景噪声,计算测试帧和背景噪声的MFCC相关系数距离,最后用得到的MFCC相似度距离曲线进行端点检测。实验结果表明,该方法在白噪声和粉噪声环境下均可得到理想的端点检测效果,并且在低信噪比时仍然有效。 展开更多
关键词 通信技术 端点检测 mel频率参数 相关系数
下载PDF
一种改进的基于倒谱特征的带噪端点检测方法 被引量:13
10
作者 于迎霞 史家茂 《计算机工程》 CAS CSCD 北大核心 2004年第19期85-87,共3页
影响语音识别性能的一个关键因素是端点检测的准确性。实际应用中的信噪比较低,使得某些高信噪比下性能好的检测算法不能有效地工作,影响系统的识别率。该文针对基于倒谱特征的带噪端点检测算法提出了3点改进:(1) 将语音信号经滤波后分... 影响语音识别性能的一个关键因素是端点检测的准确性。实际应用中的信噪比较低,使得某些高信噪比下性能好的检测算法不能有效地工作,影响系统的识别率。该文针对基于倒谱特征的带噪端点检测算法提出了3点改进:(1) 将语音信号经滤波后分成高低频两子带,分别进行分析;(2) 用LPC美尔倒谱特征LPCCMCC代替常规倒谱特征作为特征参数;(3) 改进噪声估计,使其具有自适应性。实验结果表明本方法在低信噪比下有较好的检测性能。 展开更多
关键词 端点检测 LPC美尔系数 语音识别 滤波 mel倒谱距离
下载PDF
基于倒谱加权的说话人识别技术
11
作者 孙林慧 李平安 《西安邮电学院学报》 2006年第3期9-12,共4页
提出一种通过加不同权值来考察语音各阶参数的抗噪性强弱的方法,采用此方法分析了对干净语音和加白噪声语音的Mel倒谱各阶参数加不同权值后对识别系统性能的影响。得出结论:高阶Mel倒谱参数抗噪性较差而低阶倒谱参数抗噪性较好。因此可... 提出一种通过加不同权值来考察语音各阶参数的抗噪性强弱的方法,采用此方法分析了对干净语音和加白噪声语音的Mel倒谱各阶参数加不同权值后对识别系统性能的影响。得出结论:高阶Mel倒谱参数抗噪性较差而低阶倒谱参数抗噪性较好。因此可以根据抗噪性的强弱对该倒谱各阶参数进行合理加权,以便突出抗噪性强的参数对说话人识别系统的贡献。 展开更多
关键词 权值 抗噪性 mel倒谱 说话人识别
下载PDF
基于LPC美尔倒谱特征的带噪语音端点检测 被引量:6
12
作者 古丽拉.阿东别克 于迎霞 《电声技术》 北大核心 2004年第2期53-55,58,共4页
复杂的噪声环境是语音识别系统在实际应用中性能下降的原因之一,识别预处理中的带噪端点检测作为关键技术,其性能的优劣某种程度上决定了识别率的高低。笔者提出了基于LPC美尔倒谱特征的带噪端点检测方法,对语音信号分高低频段分别提取... 复杂的噪声环境是语音识别系统在实际应用中性能下降的原因之一,识别预处理中的带噪端点检测作为关键技术,其性能的优劣某种程度上决定了识别率的高低。笔者提出了基于LPC美尔倒谱特征的带噪端点检测方法,对语音信号分高低频段分别提取LPC美尔倒谱特征分析,根据Mel倒谱距离判决,采用自适应噪声估计,实验结果表明,该方法计算效率较高,低信噪比下有较好的检测性能。 展开更多
关键词 语音识别 带噪端点检测 LPC美尔特征 mel倒谱距离
下载PDF
两种倒谱特征提取技术在水声目标识别中的应用 被引量:11
13
作者 柳革命 孙超 杨益新 《西北工业大学学报》 EI CAS CSCD 北大核心 2008年第3期276-281,共6页
按照声纳员的感受,被动声纳目标被看作为一个发声体,目标噪声信号表示为激励噪声源与发声体冲激响应的卷积,在这一模型下,使用倒谱分析水声目标噪声的时域特征。提出利用线性预测倒谱和考虑人耳听觉特点的美尔倒谱分析发声体的冲激响应... 按照声纳员的感受,被动声纳目标被看作为一个发声体,目标噪声信号表示为激励噪声源与发声体冲激响应的卷积,在这一模型下,使用倒谱分析水声目标噪声的时域特征。提出利用线性预测倒谱和考虑人耳听觉特点的美尔倒谱分析发声体的冲激响应在倒谱域中的表示,据此对水声噪声信号提取这两种倒谱的特征,进行分类识别。设计了神经网络分类器,利用实测数据对三类目标进行分类。分析比较两种方法的分类结果,验证了基于倒谱的水声目标特征提取方法的可行性。 展开更多
关键词 被动声纳目标识别 线性预测(LPC) 美尔(mel) 特征提取
下载PDF
采用复倒谱峰值滤波GMM识别混响语音
14
作者 孔荣 吴迪 +3 位作者 廖启鹏 朱俊杰 周强 陶智 《计算机工程与应用》 CSCD 2014年第15期191-193,203,共4页
针对混响环境下语音识别系统性能急剧下降问题,提出一种采用复倒谱峰值滤波GMM识别混响语音的方法。通过训练纯净语音的MFCC特征参数构建高斯混合模型,在识别混响语音前引入复倒谱峰值滤波器以减少混响引起的语音失真而提高混响环境下... 针对混响环境下语音识别系统性能急剧下降问题,提出一种采用复倒谱峰值滤波GMM识别混响语音的方法。通过训练纯净语音的MFCC特征参数构建高斯混合模型,在识别混响语音前引入复倒谱峰值滤波器以减少混响引起的语音失真而提高混响环境下语音识别率。经实验验证,该方法避免了在现实条件下准确估计房间冲击响应函数的麻烦,降低了计算难度,提高了混响环境下至少4%的系统识别率。 展开更多
关键词 高斯混合模型 mel频率系数(MFCC)
下载PDF
基于感知模型的美尔谱失真测度 被引量:4
15
作者 陈华伟 靳蕃 《西南交通大学学报》 EI CSCD 北大核心 2006年第6期723-728,共6页
为了有效评价通信系统中的语音质量,基于语音感知分析,提出了M el域上一种新的语音信号特征表示方法———MFSC(美尔谱系数).MFSC既考虑人耳对频率的非线性感知特性,又结合了声音强度-响度非线性变换特性,符合语音感知分析.基于MFSC特... 为了有效评价通信系统中的语音质量,基于语音感知分析,提出了M el域上一种新的语音信号特征表示方法———MFSC(美尔谱系数).MFSC既考虑人耳对频率的非线性感知特性,又结合了声音强度-响度非线性变换特性,符合语音感知分析.基于MFSC特征参数的提取,提出了用于语音质量客观评价的美尔谱失真测度(M el-SD),并将其应用于干扰条件下的无线通信系统语音质量评价.实验结果表明,M el-SD的平均相关值为0.942,分别比M el-CD和PESQ(语音质量感知评价)提高了0.089和0.031. 展开更多
关键词 语音质量 客观评价 美尔系数 mel失真测度 mel倒谱距离测度
下载PDF
基于Mel系数和SVM的语音识别技术研究 被引量:3
16
作者 陈婷 敖茂尧 陈贺璋 《广西职业技术学院学报》 2010年第5期1-4,共4页
本文研究了一种运用Mel频标倒谱系数作为特征参数和多分类支持向量机进行语音识别的方法。根据已有的分类方法,尝试将一种基于二叉树的多分类支持向量机用于语音识别。实验表明,基于Mel倒谱和多分类支持向量机的语音识别方法使系统的性... 本文研究了一种运用Mel频标倒谱系数作为特征参数和多分类支持向量机进行语音识别的方法。根据已有的分类方法,尝试将一种基于二叉树的多分类支持向量机用于语音识别。实验表明,基于Mel倒谱和多分类支持向量机的语音识别方法使系统的性能和速度大大提高,具有理想的识别效果和应用价值。 展开更多
关键词 语音识别 mel倒谱 支持向量机 核函数
下载PDF
声门下共鸣的谱规整用于非特定人的语音识别
17
作者 侯丽敏 黄振华 谢娟敏 《声学学报》 EI CSCD 北大核心 2010年第5期580-586,共7页
提出在参数的提取过程中用不同的感知规整因子对不同人的参数归一化,从而实现在非特定人语音识别中对不同人的归一化处理。感知规整因子是基于声门上和声门下之间耦合作用产生声门下共鸣频率来估算的,与采用声道第三共振峰作为基准频率... 提出在参数的提取过程中用不同的感知规整因子对不同人的参数归一化,从而实现在非特定人语音识别中对不同人的归一化处理。感知规整因子是基于声门上和声门下之间耦合作用产生声门下共鸣频率来估算的,与采用声道第三共振峰作为基准频率的方法比较,它能较多的滤除语义信息的影响,更好地体现说话人的个性特征。本文提取抗噪性能优于Mel倒谱参数的感知最小方差无失真参数作为识别特征,语音模型用经典的隐马尔可夫模型(HMM)。实验证明,本文方法与传统的语音识别参数和用声道第三共振峰进行谱规整的方法相比,在干净语音中单词错误识别率分别下降了4%和3%,在噪声环境下分别下降了9%和5%,有效地改善了非特定人语音识别系统的性能。 展开更多
关键词 非特定人语音识别 共鸣 mel倒谱参数 隐马尔可夫模型 归一化处理 语音识别系统 提取过程 基准频率
下载PDF
基于Mel-TEO的带噪语音端点检测算法 被引量:5
18
作者 王茂蓉 周萍 +1 位作者 景新幸 杨青 《微电子学与计算机》 CSCD 北大核心 2016年第4期46-49,共4页
针对短时TEO能量算法抗噪性差的缺点,提出了一种强噪声下的端点检测新算法.该算法在短时TEO能量端点检测的基础上,增加Mel倒谱距离判断环节,采用先粗判后精判的互补性两级判决机制.首先利用强抗噪性Mel倒谱距离进行端点粗判,然后再利用... 针对短时TEO能量算法抗噪性差的缺点,提出了一种强噪声下的端点检测新算法.该算法在短时TEO能量端点检测的基础上,增加Mel倒谱距离判断环节,采用先粗判后精判的互补性两级判决机制.首先利用强抗噪性Mel倒谱距离进行端点粗判,然后再利用体现语音信号时域特征与语音共振峰特性的短时TEO能量进行端点精判.实验表明,在信噪比相对较低的环境下,该改进算法与传统的双门限法和短时TEO能量相比,在没有增加运算复杂度的同时提高了检测系统的准确度. 展开更多
关键词 语音端点检测 说话人识别 TEAGER能量算子 mel倒谱距离 噪声
下载PDF
基于MFCC相似度和谱熵的端点检测算法 被引量:6
19
作者 邓瑞 肖纯智 高勇 《现代电子技术》 2013年第21期67-69,共3页
为提高低信噪比环境下语音端点检测的准确率,提出了一种基于Mel倒谱参数相似度和谱熵的端点检测算法。首先,提取语音帧的的Mel频率倒谱参数,将前十帧声信号作为背景噪声,然后计算每一帧语音和噪声MFCC的相关系数距离,结合MFCC相似距离... 为提高低信噪比环境下语音端点检测的准确率,提出了一种基于Mel倒谱参数相似度和谱熵的端点检测算法。首先,提取语音帧的的Mel频率倒谱参数,将前十帧声信号作为背景噪声,然后计算每一帧语音和噪声MFCC的相关系数距离,结合MFCC相似距离与谱熵做综合判决。实验结果表明,在低信噪比环境下此方法相对谱熵法能够提高检测准确率。 展开更多
关键词 语音信号处理 端点检测 mel频率参数 相关系数
下载PDF
短时谱特征的汉语重音检测方法研究 被引量:2
20
作者 赵云雪 张珑 郑世杰 《计算机科学与探索》 CSCD 2014年第9期1120-1128,共9页
重音是语言交流中不可或缺的部分,在语言交流中扮演着非常重要的角色。为了验证基于听觉模型的短时谱特征集在汉语重音检测方法中的应用效果,使用MFCC(Mel frequency cepstrum coefficient)和RASTAPLP(relative spectra perceptual line... 重音是语言交流中不可或缺的部分,在语言交流中扮演着非常重要的角色。为了验证基于听觉模型的短时谱特征集在汉语重音检测方法中的应用效果,使用MFCC(Mel frequency cepstrum coefficient)和RASTAPLP(relative spectra perceptual linear prediction)算法提取每个语音段的短时谱信息,分别构建了基于MFCC算法的短时谱特征集和基于RASTA-PLP算法的短时谱特征集;选用NaiveBayes分类器对这两类特征集进行建模,把具有最大后验概率的类作为该对象所属的类,这种分类方法充分利用了当前语音段的相关语音特性;基于MFCC的短时谱特征集和基于RASTA-PLP的短时谱特征集在ASCCD(annotated speech corpus of Chinese discourse)上能够分别得到82.1%和80.8%的汉语重音检测正确率。实验结果证明,基于MFCC的短时谱特征和基于RASTA-PLP的短时谱特征能用于汉语重音检测研究。 展开更多
关键词 重音检测 mel频率系数(MFCC) 相关感知线性预测(RASTA-PLP) 短时特征
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部