期刊文献+
共找到25篇文章
< 1 2 >
每页显示 20 50 100
说话人识别技术中Mel倒谱参数改进算法的C程序实现
1
作者 叶蕾 方鹏 《计算机与现代化》 2007年第11期26-28,共3页
基于语音信号的频谱特性,本文对说话人识别技术中Mel倒谱参数做了改进,并通过Microsoft Visual C++6.0验证了在低信噪比时使用改进后的Mel倒谱参数可以提高说话人识别系统的正确识别率。
关键词 说话人识别 mel倒谱参数
下载PDF
采用Mel倒谱参数的咳嗽声识别方法 被引量:2
2
作者 尹永 莫鸿强 《信息技术》 2012年第10期85-91,共7页
在诊断一个有慢性咳嗽的病人时,他的咳嗽强度和频率评估能提供很有价值的信息。因此提高咳嗽识别率,对疾病的诊断有着重要意义。从语音识别中被广泛应用的Mel倒谱参数出发,寻找咳嗽和语音在Mel倒谱参数中的区别。基于Mel倒谱参数的原理... 在诊断一个有慢性咳嗽的病人时,他的咳嗽强度和频率评估能提供很有价值的信息。因此提高咳嗽识别率,对疾病的诊断有着重要意义。从语音识别中被广泛应用的Mel倒谱参数出发,寻找咳嗽和语音在Mel倒谱参数中的区别。基于Mel倒谱参数的原理,将其计算过程中的Mel刻度滤波器对数能量的极值数分布情况提取出来作为咳嗽的识别特征。在病房环境下对录音文件进行实验,得到的咳嗽识别率为90%以上,同时能够将语音等非咳嗽信号有效地剔除,实验结果显示90%以上的语音信号被排除。在录音设备及环境等各项参数不变的条件下,对不同病人样本,可使用同一阈值对咳嗽进行识别。该方法过程简单,数据计算量小,便于快速识别。 展开更多
关键词 mel倒谱参数(mel-Frequency CEPSTRUM Coefficient MFCC) mel刻度滤波器对数能量 咳嗽识别
下载PDF
基于Mel频率倒谱参数相似度的语音端点检测算法 被引量:16
3
作者 王宏志 徐玉超 李美静 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2012年第5期1331-1335,共5页
为提高噪声环境下语音端点检测的精确性,提出了一种基于Mel频率倒谱参数(MF-CC)相似度的端点检测方法。提取了每帧语音信号的Mel频率倒谱参数,然后将前十帧作为背景噪声,计算测试帧和背景噪声的MFCC相关系数距离,最后用得到的MFCC相似... 为提高噪声环境下语音端点检测的精确性,提出了一种基于Mel频率倒谱参数(MF-CC)相似度的端点检测方法。提取了每帧语音信号的Mel频率倒谱参数,然后将前十帧作为背景噪声,计算测试帧和背景噪声的MFCC相关系数距离,最后用得到的MFCC相似度距离曲线进行端点检测。实验结果表明,该方法在白噪声和粉噪声环境下均可得到理想的端点检测效果,并且在低信噪比时仍然有效。 展开更多
关键词 通信技术 端点检测 mel频率参数 相关系数
下载PDF
加性白噪声环境下语音特征参数鲁棒性的研究 被引量:1
4
作者 孙林慧 杨震 《南京邮电学院学报(自然科学版)》 EI 2005年第5期53-56,共4页
随着说话人识别技术的发展,实用有效的说话人识别系统越来越成为研究的重点。语音特征参数的鲁棒性直接影响一个说话人识别系统的具体性能,过去主要针对移动通信环境下存在信道失真的问题,研究差分倒谱的鲁棒性。文中则主要在加性白噪... 随着说话人识别技术的发展,实用有效的说话人识别系统越来越成为研究的重点。语音特征参数的鲁棒性直接影响一个说话人识别系统的具体性能,过去主要针对移动通信环境下存在信道失真的问题,研究差分倒谱的鲁棒性。文中则主要在加性白噪声环境下研究M el倒谱参数、M el差分倒谱参数的顽健性以及它们经过倒谱系数零均值化(CMN)处理后识别性能的改进。从仿真结果可以看出:在加性白噪声环境下,差分倒谱参数具有很好的鲁棒性;倒谱系数零均值化能有效的除去加性白噪声。 展开更多
关键词 鲁棒性 mel倒谱参数 mel差分 系数零均值化
下载PDF
声门下共鸣的谱规整用于非特定人的语音识别
5
作者 侯丽敏 黄振华 谢娟敏 《声学学报》 EI CSCD 北大核心 2010年第5期580-586,共7页
提出在参数的提取过程中用不同的感知规整因子对不同人的参数归一化,从而实现在非特定人语音识别中对不同人的归一化处理。感知规整因子是基于声门上和声门下之间耦合作用产生声门下共鸣频率来估算的,与采用声道第三共振峰作为基准频率... 提出在参数的提取过程中用不同的感知规整因子对不同人的参数归一化,从而实现在非特定人语音识别中对不同人的归一化处理。感知规整因子是基于声门上和声门下之间耦合作用产生声门下共鸣频率来估算的,与采用声道第三共振峰作为基准频率的方法比较,它能较多的滤除语义信息的影响,更好地体现说话人的个性特征。本文提取抗噪性能优于Mel倒谱参数的感知最小方差无失真参数作为识别特征,语音模型用经典的隐马尔可夫模型(HMM)。实验证明,本文方法与传统的语音识别参数和用声道第三共振峰进行谱规整的方法相比,在干净语音中单词错误识别率分别下降了4%和3%,在噪声环境下分别下降了9%和5%,有效地改善了非特定人语音识别系统的性能。 展开更多
关键词 非特定人语音识别 共鸣 mel倒谱参数 隐马尔可夫模型 归一化处理 语音识别系统 提取过程 基准频率
下载PDF
分布式语音识别参数提取的改进算法及实现
6
作者 叶蕾 方鹏 《福建电脑》 2007年第5期91-91,78,共2页
本文介绍了分布式语音识别系统,对该系统中参数提取算法做了两种改进,并用Microsoft Visual C++6.0验证这两种改进算法可以提高噪声环境下识别系统的正确识别率。
关键词 分布式语音识别 mel倒谱参数 GMM模型
下载PDF
用于分布式识别的语音参数的提取和性能分析 被引量:1
7
作者 郑清 杨震 《南京邮电学院学报(自然科学版)》 2003年第2期31-34,共4页
主要研究用于分布式语音识别(DSR)的语音参数的提取方法以及参数性能分析。以前所用到的语音参数大部分是LPC倒谱参数,但其抗噪声性能较差。文中主要讨论了MEL倒谱参数,并在移动通信环境下,比较了两者的性能。
关键词 分布式语音识别 DSR Q-CELP语音编码 mel倒谱参数 LPC参数
下载PDF
基于听觉特性的语音特征参数提取方法研究 被引量:4
8
作者 白燕燕 苏静 《自动化技术与应用》 2015年第4期40-43,49,共5页
特征提取是说话人识别系统中最关键的一个步骤。特征提取通俗的来说是提取代表说话人个性的语音特征。直接关乎识别系统的准确率。通常人们能从说话人声音的品质,频率的高低,音量的大小等信息中感知说话人的个性特点。文章采用Mel频率... 特征提取是说话人识别系统中最关键的一个步骤。特征提取通俗的来说是提取代表说话人个性的语音特征。直接关乎识别系统的准确率。通常人们能从说话人声音的品质,频率的高低,音量的大小等信息中感知说话人的个性特点。文章采用Mel频率倒谱域参数,是因为Mel频率尺度更加贴近人耳的听觉特性。Mel频率倒谱域参数不仅具有低频段高谱分辨率的优势,而且对噪声鲁棒能力很强。文章以声道模型和听觉模型为例,对比了LPC参数和MFCC参数分布。得出了MFCC不受全极点模型限制,对环境的适应性更强,且可降低不同人说话引起的差异度的影响。其参数性能优于LPC参数。 展开更多
关键词 特征提取 mel频率参数 LPC 分辨率 鲁棒
下载PDF
基于MFCC相似度和谱熵的端点检测算法 被引量:6
9
作者 邓瑞 肖纯智 高勇 《现代电子技术》 2013年第21期67-69,共3页
为提高低信噪比环境下语音端点检测的准确率,提出了一种基于Mel倒谱参数相似度和谱熵的端点检测算法。首先,提取语音帧的的Mel频率倒谱参数,将前十帧声信号作为背景噪声,然后计算每一帧语音和噪声MFCC的相关系数距离,结合MFCC相似距离... 为提高低信噪比环境下语音端点检测的准确率,提出了一种基于Mel倒谱参数相似度和谱熵的端点检测算法。首先,提取语音帧的的Mel频率倒谱参数,将前十帧声信号作为背景噪声,然后计算每一帧语音和噪声MFCC的相关系数距离,结合MFCC相似距离与谱熵做综合判决。实验结果表明,在低信噪比环境下此方法相对谱熵法能够提高检测准确率。 展开更多
关键词 语音信号处理 端点检测 mel频率参数 相关系数
下载PDF
语音识别中DTW改进算法的研究 被引量:13
10
作者 胡金平 陈若珠 李战明 《微型机与应用》 2011年第3期30-32,共3页
动态时间规整DTW是语音识别中的一种经典算法。对此算法提出了一种改进的端点检测算法,特征提取采用了Mel频率倒谱系数MFCC,并采用计算量相对较小的改进的动态时间规整算法实现语音参数模板匹配,能够实现孤立词、特定人、小词汇量的语... 动态时间规整DTW是语音识别中的一种经典算法。对此算法提出了一种改进的端点检测算法,特征提取采用了Mel频率倒谱系数MFCC,并采用计算量相对较小的改进的动态时间规整算法实现语音参数模板匹配,能够实现孤立词、特定人、小词汇量的语音识别,并用Matlab进行了算法仿真。试验结果表明,改进后的算法能够有效地提高系统对语音的识别率。 展开更多
关键词 语音识别 端点检测 mel倒谱参数 动态时间规整
下载PDF
混响声场中语音识别方法研究 被引量:9
11
作者 栗学丽 徐柏龄 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2003年第4期525-531,共7页
免提式话筒语音识别系统是语音识别走向实用的目标之一,实现这一系统,首先要解决房间效应引起的混响问题。通过讨论室内混响声场中语音的特点,提出用鲁棒性特征参数——滤波规整的Mel频率倒谱参数(FNMFCC),即MFCC参数在对数功率谱域进... 免提式话筒语音识别系统是语音识别走向实用的目标之一,实现这一系统,首先要解决房间效应引起的混响问题。通过讨论室内混响声场中语音的特点,提出用鲁棒性特征参数——滤波规整的Mel频率倒谱参数(FNMFCC),即MFCC参数在对数功率谱域进行低通滤波,倒谱域进行均值减,并用标准差加权进行非线性规整,采用这3种措施来消除混响引起的语音参数的变化,识别方法用矢量量化法,用4组无混响数码语音进行训练,对特定人无混响和4种混响声场中共150组数码音的平均识别率达到98.7%。提出的这一新方法在不降低无混响音识别率的情况下,提高了混响声场的语音识别率。该方法不仅识别率高,而且运算量小、所需内存空间小,易于做成小型实用的快速识别系统。 展开更多
关键词 语音识别 混响声场 房间效应 滤波规整 mel频率参数 矢量量化
下载PDF
语音MFCC特征计算的改进算法 被引量:6
12
作者 章熙春 曹燕 +1 位作者 张军 韦岗 《数据采集与处理》 CSCD 北大核心 2005年第2期161-165,共5页
提出了一种计算Mel频倒谱参数(Melfrequencycepstralcoefficient,MFCC)特征的改进算法,该算法采用了加权滤波器分析(WrappeddiscreteFouriertransform,WDFT)技术来提高语音信号低频部分的频谱分辨率,使之更符合人类听觉系统的特性。同... 提出了一种计算Mel频倒谱参数(Melfrequencycepstralcoefficient,MFCC)特征的改进算法,该算法采用了加权滤波器分析(WrappeddiscreteFouriertransform,WDFT)技术来提高语音信号低频部分的频谱分辨率,使之更符合人类听觉系统的特性。同时还运用了加权滤波器分析(Weightedfilterbankanalysis,WFBA)技术,以提高MFCC的鲁棒性。对TIMIT连续语音数据库中DR1集的音素识别结果表明,本文提出的改进算法比传统MFCC算法具有更好的识别率。 展开更多
关键词 语音识别 弯折离散傅里叶变换(WDFT) mel频标参数 加权滤波器分析
下载PDF
新型MFCC和波动模型相结合的二层环境声音识别 被引量:2
13
作者 李勇 李应 余清清 《计算机工程与应用》 CSCD 北大核心 2011年第30期132-135,139,共5页
对生态环境中各种不同的声音进行快速准确的识别有重要的现实意义,但是因其具有较高背景噪声加大了识别的难度。提出一种具有良好抗噪能力和较高识别性能的两层音频识别技术。选择经过改进的新型的MFCC参数以及波动模型作为生态环境声... 对生态环境中各种不同的声音进行快速准确的识别有重要的现实意义,但是因其具有较高背景噪声加大了识别的难度。提出一种具有良好抗噪能力和较高识别性能的两层音频识别技术。选择经过改进的新型的MFCC参数以及波动模型作为生态环境声音的特征集合。利用这种新型的MFCC系数构造音频信号的高斯分布模型,并且计算未知音频信号与样本音频信号的高斯分布模型之间的Kullback-Leibler距离,随后计算它们的波动模型之间的欧几里德距离。根据计算出的Kullback-Leibler距离和欧几里德距离实现两层音频识别系统。实验结果表明两层音频识别技术即使在噪声的影响下也能保持较高的识别率。 展开更多
关键词 生态环境 声音识别 改进的mel频率参数 波动模型 Kullback-Leibler距离
下载PDF
基于EMD的音频信号检索
14
作者 李晋 徐盛 胡剑凌 《电声技术》 2005年第7期48-51,共4页
介绍了一种基于Mel倒谱参数和EarthMover'sDistance(EMD)度量的音频检索方法,它利用了人耳的感知特性,并结合特征分布之间的距离度量EMD,获得了良好的性能,具有广阔的发展前景。
关键词 音频检索 EMD mel倒谱参数 K-均值聚类
下载PDF
语音分组识别技术的研究 被引量:4
15
作者 李云 鲍鸿 《广东工业大学学报》 CAS 2014年第2期54-57,共4页
为了减少语音识别时间,降低系统资源耗费,提出一种针对非特定人、孤立词、大词汇量的语音分组识别算法.运用K均值聚类算法对语音分组,并对语音分组特征进行置信度检验,使分组稳定,保证分组后识别率不下降.通过对非特定人孤立词的语音识... 为了减少语音识别时间,降低系统资源耗费,提出一种针对非特定人、孤立词、大词汇量的语音分组识别算法.运用K均值聚类算法对语音分组,并对语音分组特征进行置信度检验,使分组稳定,保证分组后识别率不下降.通过对非特定人孤立词的语音识别的实验,证实了该方法的有效性. 展开更多
关键词 mel频率特征参数 K均值聚类 置信度
下载PDF
基于改进的WMFCC在声目标识别中的应用
16
作者 刘贞 石振刚 +1 位作者 胡玉兰 赵子铭 《科技创新导报》 2018年第14期167-168,共2页
针对环境噪声背景下,声目标的识别率大大降低的问题,本文提出了一种基于改进的MFCC特征参数提取方法,小波变换用来替代MFCC参数提取过程中的快速傅立叶变换,结合矢量量化识别的方法在不同的噪声比情况下来检测和识别目标声信号。实验结... 针对环境噪声背景下,声目标的识别率大大降低的问题,本文提出了一种基于改进的MFCC特征参数提取方法,小波变换用来替代MFCC参数提取过程中的快速傅立叶变换,结合矢量量化识别的方法在不同的噪声比情况下来检测和识别目标声信号。实验结果表明,改进的MFCC特征参数在单一的噪声环境下的识别率优于MFCC特征参数,可以更准确的分辨出不同的声目标信号。 展开更多
关键词 mel倒谱参数(MFCC) 小波变换 声目标识别 矢量量化(VQ)
下载PDF
基于因特网的说话人识别技术研究
17
作者 叶蕾 方鹏 杨震 《南京邮电学院学报(自然科学版)》 2004年第3期45-48,52,共5页
比较了基于因特网的说话人识别技术中Mel倒谱特征各阶参数的抗噪性能,并分析和验证了交织及丢失数据替代技术对改善基于因特网的说话人识别系统性能的重要作用。
关键词 因特网 说话人识别 分组丢失 交织 mel倒谱参数
下载PDF
基于VQ的说话人识别系统实现
18
作者 郭春霞 《电脑知识与技术(过刊)》 2009年第10X期8256-8257,共2页
说话人识别是根据包含在语音中的同说话人有关的信息来自动识别说话人。随着信息技术和通信技术的迅速发展,说话人识别技术越来越受到重视。论文改进了基本的VQ的识别算法,研究了一种加权的VQ识别算法。通过验证,这种方法比基本的VQ的... 说话人识别是根据包含在语音中的同说话人有关的信息来自动识别说话人。随着信息技术和通信技术的迅速发展,说话人识别技术越来越受到重视。论文改进了基本的VQ的识别算法,研究了一种加权的VQ识别算法。通过验证,这种方法比基本的VQ的识别率高。 展开更多
关键词 说话人识别 矢量量化 特征提取 mel倒谱参数 训练
下载PDF
基于神经网络的语音增强系统设计
19
作者 邹大勇 赵建军 《科技广场》 2006年第1期21-23,共3页
利用神经网络设计语音信号增强处理系统,在无噪和含噪条件下,提取语音信号的MFCC系数,用于BP神经网络的训练和识别,最终达到语音信号消噪和提高可懂度的目的。自适应神经网络系统具有非线性映射和自学习能力,能够用于噪声信号的非线性... 利用神经网络设计语音信号增强处理系统,在无噪和含噪条件下,提取语音信号的MFCC系数,用于BP神经网络的训练和识别,最终达到语音信号消噪和提高可懂度的目的。自适应神经网络系统具有非线性映射和自学习能力,能够用于噪声信号的非线性建模。它不仅能够获取信号的最佳估计,并且能够克服信号处理中存在的不确定性。仿真结果表明,该自适应噪声抵消器的设计方法,不仅实现简单,而且节省运行时间,语音增强效果很好。 展开更多
关键词 语音增强 神经网络 mel频率参数
下载PDF
基于高斯混合模型的语音性别识别 被引量:1
20
作者 张超琼 苗夺谦 岳晓冬 《计算机应用》 CSCD 北大核心 2008年第S2期360-362,365,共4页
利用高斯混合模型(GMM)方法进行语音的性别识别。首先概述了特征提取、识别方法及性别识别的过程;然后通过减少提取特征的语音帧数和降低高斯混合模型的混合阶数来提高性别识别速度;最后,将由M el频率倒谱参数(MFCC)特征和基音频率特征... 利用高斯混合模型(GMM)方法进行语音的性别识别。首先概述了特征提取、识别方法及性别识别的过程;然后通过减少提取特征的语音帧数和降低高斯混合模型的混合阶数来提高性别识别速度;最后,将由M el频率倒谱参数(MFCC)特征和基音频率特征两种方法得到的测试样本后验概率结合,提出新的计算测试样本后验概率的方法。实验表明依据此后验概率能有效提高识别的正确率。 展开更多
关键词 基音频率 高斯混合模型 性别识别 mel频率参数
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部