期刊文献+
共找到27篇文章
< 1 2 >
每页显示 20 50 100
基于LPC美尔倒谱特征的带噪语音端点检测 被引量:6
1
作者 古丽拉.阿东别克 于迎霞 《电声技术》 北大核心 2004年第2期53-55,58,共4页
复杂的噪声环境是语音识别系统在实际应用中性能下降的原因之一,识别预处理中的带噪端点检测作为关键技术,其性能的优劣某种程度上决定了识别率的高低。笔者提出了基于LPC美尔倒谱特征的带噪端点检测方法,对语音信号分高低频段分别提取... 复杂的噪声环境是语音识别系统在实际应用中性能下降的原因之一,识别预处理中的带噪端点检测作为关键技术,其性能的优劣某种程度上决定了识别率的高低。笔者提出了基于LPC美尔倒谱特征的带噪端点检测方法,对语音信号分高低频段分别提取LPC美尔倒谱特征分析,根据Mel倒谱距离判决,采用自适应噪声估计,实验结果表明,该方法计算效率较高,低信噪比下有较好的检测性能。 展开更多
关键词 语音识别 带噪端点检测 LPC美尔倒谱特征 Mel距离
下载PDF
两种倒谱特征提取技术在水声目标识别中的应用 被引量:11
2
作者 柳革命 孙超 杨益新 《西北工业大学学报》 EI CAS CSCD 北大核心 2008年第3期276-281,共6页
按照声纳员的感受,被动声纳目标被看作为一个发声体,目标噪声信号表示为激励噪声源与发声体冲激响应的卷积,在这一模型下,使用倒谱分析水声目标噪声的时域特征。提出利用线性预测倒谱和考虑人耳听觉特点的美尔倒谱分析发声体的冲激响应... 按照声纳员的感受,被动声纳目标被看作为一个发声体,目标噪声信号表示为激励噪声源与发声体冲激响应的卷积,在这一模型下,使用倒谱分析水声目标噪声的时域特征。提出利用线性预测倒谱和考虑人耳听觉特点的美尔倒谱分析发声体的冲激响应在倒谱域中的表示,据此对水声噪声信号提取这两种倒谱的特征,进行分类识别。设计了神经网络分类器,利用实测数据对三类目标进行分类。分析比较两种方法的分类结果,验证了基于倒谱的水声目标特征提取方法的可行性。 展开更多
关键词 被动声纳目标识别 线性预测(LPC) 美尔(Mel) 特征提取
下载PDF
噪声背景下语音识别特征参数选择研究 被引量:3
3
作者 刘顺兰 窦园园 应娜 《杭州电子科技大学学报(自然科学版)》 2011年第4期73-76,共4页
为提高语音识别系统的实用性与实时性,该文采用缺失特征分量的方法研究了美尔频率倒谱系数静态特征及其一阶差分各分量对识别率的影响。在不同信噪比情况下,分别对含白噪声、粉红噪声、车载噪声和工厂噪声这四种典型噪声的语音进行了实... 为提高语音识别系统的实用性与实时性,该文采用缺失特征分量的方法研究了美尔频率倒谱系数静态特征及其一阶差分各分量对识别率的影响。在不同信噪比情况下,分别对含白噪声、粉红噪声、车载噪声和工厂噪声这四种典型噪声的语音进行了实验研究,结果表明:在保证系统有较高识别率的情况下,在低信噪比时,含白噪声的语音信号缺失美尔频率倒谱系数静态特征及其一阶差分的低阶分量,有助于提升识别率;含粉红噪声的语音识别系统和含工厂噪声的语音识别系统,不能缺失美尔倒谱频率系数和美尔倒谱频率系数的一阶差分的任何特征分量;含车载噪声的语音可以缺失部分高阶MFCC分量和部分一阶差分分量。 展开更多
关键词 语音识别 特征提取 美尔倒谱频率系数 美尔倒谱频率系数的一阶差分
下载PDF
多特征相结合的带噪语音端点检测算法的研究 被引量:13
4
作者 张君昌 姜菲 刘红 《计算机工程与应用》 CSCD 北大核心 2009年第32期114-116,共3页
提出了一种抗噪声的端点检测新方法。针对谱熵特征对清音的检测性能以及抗噪声性能较差的缺点,结合对清音检测性能较好的短时过零率特征,以及抗噪声性能良好的美尔倒谱距离特征,实现了基于多种特征相结合的抗噪声的语音端点检测。仿真... 提出了一种抗噪声的端点检测新方法。针对谱熵特征对清音的检测性能以及抗噪声性能较差的缺点,结合对清音检测性能较好的短时过零率特征,以及抗噪声性能良好的美尔倒谱距离特征,实现了基于多种特征相结合的抗噪声的语音端点检测。仿真实验表明,该方法能显著提高端点检测在高噪声环境下的检测性能。 展开更多
关键词 高噪声 美尔倒谱距离 短时过零率 端点检测
下载PDF
基于改进的MFCC战场被动声目标识别 被引量:7
5
作者 蒋永生 张雄伟 +2 位作者 闵刚 刘光云 陈功 《弹箭与制导学报》 CSCD 北大核心 2008年第6期231-234,共4页
从战场声信号与语音信号特征的相似性出发,提出基于MFCC参数的战场声目标识别方法。针对战场环境存在强噪声干扰情况,提出一种改进的MFCC特征参数(DWTMFCC)提取方法,该方法将小波分析和Mel倒谱分析结合,提高了特征参数的鲁棒性。仿真结... 从战场声信号与语音信号特征的相似性出发,提出基于MFCC参数的战场声目标识别方法。针对战场环境存在强噪声干扰情况,提出一种改进的MFCC特征参数(DWTMFCC)提取方法,该方法将小波分析和Mel倒谱分析结合,提高了特征参数的鲁棒性。仿真结果表明:在噪声条件下,利用DWTMFCC参数进行声目标识别,平均识别率比MFCC参数高出3.134个百分点,信噪比为5dB时,识别率仍达到93.67%。 展开更多
关键词 被动声目标 目标识别 美尔倒谱参数 离散小波变换 鲁棒性
下载PDF
基于MATLAB GUI的语音信号特征提取系统设计 被引量:11
6
作者 王光艳 赵晓群 王霞 《河北工业大学学报》 CAS 北大核心 2010年第4期14-18,共5页
语音信号的典型时频特性和核心处理算法是语音识别、合成和说话人识别等系统中的关键问题.结合线性预测分析技术(LPC)和美尔倒谱参数(MFCC)的算法原理,基于MATLAB GUI技术,设计完成了语音信号典型特征提取系统的界面平台,可实现语音信... 语音信号的典型时频特性和核心处理算法是语音识别、合成和说话人识别等系统中的关键问题.结合线性预测分析技术(LPC)和美尔倒谱参数(MFCC)的算法原理,基于MATLAB GUI技术,设计完成了语音信号典型特征提取系统的界面平台,可实现语音信号的装载、播放和波形显示,LPC和MFCC的计算结果显示和数据存储等功能.界面的人机交互性好,操作简单方便,可提高对算法或数据处理效果的直观认识,对语音信号分析和处理等各个研究领域具有重要的现实意义. 展开更多
关键词 语音信号 线性预测分析(LPC) 美尔倒谱系数(MFCC) MATLABGUI
下载PDF
基于心理声学模型的高性能语音质量评价算法 被引量:1
7
作者 张军 张德运 +1 位作者 高磊 赵东平 《西安交通大学学报》 EI CAS CSCD 北大核心 2006年第4期437-440,共4页
提出了一种高效心理声学模型语音质量评价(EPM-SQE)算法.该算法采用12阶美尔倒谱参数(MFCC)作为语音信号特征向量,其空间复杂度小于巴克谱.对MFCC进行相对谱(RASTA)滤波,可以突出快变信号对听觉感知的影响.将滤波后的参数映射为响度,由... 提出了一种高效心理声学模型语音质量评价(EPM-SQE)算法.该算法采用12阶美尔倒谱参数(MFCC)作为语音信号特征向量,其空间复杂度小于巴克谱.对MFCC进行相对谱(RASTA)滤波,可以突出快变信号对听觉感知的影响.将滤波后的参数映射为响度,由此模拟人的感知过程.计算原始语音和受损语音响度之间的感知扰动,并依次在频域和时域进行聚合,从而获得单一的扰动值,该值再经认知模型计算,可以得到最终的客观评分.实验表明,所提算法的平均运行时间比国际电信联盟提出的语音质量感知评价算法减少了41%,内存占用降低了51%,而仅比主观评价的相关度下降6.8%. 展开更多
关键词 心理声学模型 美尔倒谱 感知扰动 质量评价
下载PDF
基于声信号分析的开关柜局部放电检测算法研究 被引量:14
8
作者 唐云辉 胡曦琳 《电子器件》 CAS 北大核心 2018年第3期644-648,共5页
有效检测高压开关柜故障是影响电网安全的因素之一。早期基于超声波检测的方法,存在设备昂贵,有效检测范围小的问题。为此,提出一种基于语谱特征的开关柜局部放电检测算法。算法首先计算放电声信号的语谱图,然后计算其2阶归一化中心矩;... 有效检测高压开关柜故障是影响电网安全的因素之一。早期基于超声波检测的方法,存在设备昂贵,有效检测范围小的问题。为此,提出一种基于语谱特征的开关柜局部放电检测算法。算法首先计算放电声信号的语谱图,然后计算其2阶归一化中心矩;并以此为特征,构建自编码深度学习网络,并通过稀疏化处理提高模型的识别能力。在开关柜局部放电检测实验中,所提的语谱特征有助于改善故障检测效率。相比于基于美尔倒谱特征的算法,放电检测识别率提高2.5%。结合深度学习网络算法后,识别率能达到99.8%。 展开更多
关键词 局部放电 深度学习网络 美尔倒谱特征
下载PDF
低空目标被动声识别关键技术研究 被引量:6
9
作者 雷鸣 乔柯 《计算机与数字工程》 2017年第4期645-649,共5页
低空目标被动声探测技术在现代战争中发挥着越来越重要的作用。针对低空目标被动声识别的一些关键技术进行了研究。首先从低空目标声信号与语音信号特征的相似性出发,论证了低空目标被动声识别与语音识别可以采用同样的方法。然后对四... 低空目标被动声探测技术在现代战争中发挥着越来越重要的作用。针对低空目标被动声识别的一些关键技术进行了研究。首先从低空目标声信号与语音信号特征的相似性出发,论证了低空目标被动声识别与语音识别可以采用同样的方法。然后对四旋翼飞行器的声音信号进行了时频分析,提出基于MFCC参数的低空目标识别方法。最后论述了低空目标声音识别技术中的关键技术,重点分析了特征提取中的MFCC技术以及使用动态时间规整(DTW)算法进行仿真识别实验,为低空目标声音识别系统的开发奠定了基础。 展开更多
关键词 被动声识别 端点检测 美尔倒谱参数 动态时间规整
下载PDF
孤立词语音识别系统的DSP实现 被引量:1
10
作者 郑德忠 宋婧婧 周朝霞 《微计算机信息》 2010年第26期118-119,133,共3页
传统语音识别系统存在识别率低、接口复杂、功耗大等缺点。针对这一问题,可以采用TI公司生产的TMS320C6201B DSP开发非特定人孤立词语音识别系统。DSP主机接口部分与单片机89C51相连。由单片机控制LCD显示电路和USB与PC的通信。USB2.0... 传统语音识别系统存在识别率低、接口复杂、功耗大等缺点。针对这一问题,可以采用TI公司生产的TMS320C6201B DSP开发非特定人孤立词语音识别系统。DSP主机接口部分与单片机89C51相连。由单片机控制LCD显示电路和USB与PC的通信。USB2.0总线标准数据传输速率高、接口方便。软件部分采用传统的双门限端点检测算法和DHMM识别算法。实验结果表明,该系统功耗低、体积小,并且具有较高的识别率。 展开更多
关键词 数字信号处理 孤立词识别 离散隐马尔可夫模型 双门限端点检测算法 线性预测分析美尔倒谱参数
下载PDF
一种基于Gammatone滤波的语音质量评价算法 被引量:1
11
作者 梁超 《长春工业大学学报》 CAS 2010年第4期432-436,共5页
提出了一种利用Gammatone滤波器组对基底膜进行仿真的方法,代替了Mel谱中的三角滤波器,提高了与主观评测的相似度,降低了对于共振峰的频移敏感度,增强了客观测度在噪声环境中提取共振峰参数的能力。实验表明,所提算法能有效提高与MOS值... 提出了一种利用Gammatone滤波器组对基底膜进行仿真的方法,代替了Mel谱中的三角滤波器,提高了与主观评测的相似度,降低了对于共振峰的频移敏感度,增强了客观测度在噪声环境中提取共振峰参数的能力。实验表明,所提算法能有效提高与MOS值的相似度。 展开更多
关键词 语音质量评价 美尔倒谱 Gammatone滤波
下载PDF
基于频域ICA的语音特征增强
12
作者 吕钊 吴小培 李密 《振动与冲击》 EI CSCD 北大核心 2011年第2期238-242,257,共6页
为了降低卷积噪声对语音特征所产生的影响,提高语音识别正确率,在此提出了一种基于频域ICA(Independent Component Analysis,独立分量分析)的语音特征增强算法。该算法首先使用频域ICA方法作对噪声进行估计,然后在倒谱域内将带噪语音信... 为了降低卷积噪声对语音特征所产生的影响,提高语音识别正确率,在此提出了一种基于频域ICA(Independent Component Analysis,独立分量分析)的语音特征增强算法。该算法首先使用频域ICA方法作对噪声进行估计,然后在倒谱域内将带噪语音信号的短时谱减去所估计噪声的短时谱,最后根据去噪后语音信号的短时谱计算美尔倒谱系数(MFCC)作为特征参数。在仿真和真实环境下的语音识别实验中,所提出的语音特征参数相比较传统的MFCC其识别正确率分别提升了38.2%和35.8%。实验结果表明该算法能够较好地解决卷积噪声环境下训练与识别特征不匹配的问题,有效提高了语音识别系统的识别正确率。 展开更多
关键词 频域ICA 语音 特征增强 美尔倒谱系数(MFCC)
下载PDF
文本无关的说话人识别系统抗噪方法研究
13
作者 叶蕾 方鹏 《计算机与现代化》 2010年第10期16-19,共4页
研究了基于美尔倒谱特征参数及高斯混合模型的文本无关的说话人识别系统,为了提高噪声环境下识别系统的识别率,从两个角度研究改善该系统抗噪性能的方法,即利用语音识别将文本无关的系统转化为文本有关的说话人识别方法和通过选择鲁棒... 研究了基于美尔倒谱特征参数及高斯混合模型的文本无关的说话人识别系统,为了提高噪声环境下识别系统的识别率,从两个角度研究改善该系统抗噪性能的方法,即利用语音识别将文本无关的系统转化为文本有关的说话人识别方法和通过选择鲁棒性较强的帧进行说话人识别的方法,分析了以上方法对系统识别性能的改善作用,并通过实验验证上述方法确实可以提高系统在噪声环境下的识别率。 展开更多
关键词 语音识别 说话人识别 文本无关 美尔倒谱参数 高斯混合模型
下载PDF
基于快速提升小波变换的语音特征提取方法 被引量:1
14
作者 欧瑞清 徐晨 +1 位作者 卢少平 宋广为 《计算机辅助工程》 2006年第3期102-105,共4页
为提高语音识别系统对环境噪声的鲁棒性,在快速提升小波的基础上,结合感知频域上的滤波与倒谱均值归一化技术,提出一种语音特征参数提取方法.仿真实验表明,与传统方法相比,噪声鲁棒性显著提高;在语音信号的信噪比相近情况下,与传统小波... 为提高语音识别系统对环境噪声的鲁棒性,在快速提升小波的基础上,结合感知频域上的滤波与倒谱均值归一化技术,提出一种语音特征参数提取方法.仿真实验表明,与传统方法相比,噪声鲁棒性显著提高;在语音信号的信噪比相近情况下,与传统小波方法相比,该方法计算简便、易于编程、计算速度快. 展开更多
关键词 快速提升小波 语音识别 均值归一化 美尔倒谱
下载PDF
提高MFCC鲁棒性的方法 被引量:1
15
作者 韩春光 李华 《计算机工程与设计》 CSCD 北大核心 2008年第1期160-162,180,共4页
在噪声环境中,基于笔记本电脑录音的情况下,采用特征参数加窗的方法,以提高系统的噪声鲁棒性。在Matlab环境下,建立了基于高斯混合模型(GMM)的说话人辨认系统,并进行实验。通过对多种窗口的正识率比较,发现对美尔倒谱(MFCC)高阶参数的... 在噪声环境中,基于笔记本电脑录音的情况下,采用特征参数加窗的方法,以提高系统的噪声鲁棒性。在Matlab环境下,建立了基于高斯混合模型(GMM)的说话人辨认系统,并进行实验。通过对多种窗口的正识率比较,发现对美尔倒谱(MFCC)高阶参数的加窗提升,可以改善系统的鲁棒性。实验结果表明,采用加窗后的系统识别率得到了明显改善。 展开更多
关键词 美尔倒谱参数 说话人辨认 高斯混合模型 加窗提升 噪声鲁棒性
下载PDF
采用遗传算法的文本无关说话人识别 被引量:1
16
作者 陈良柱 王健 《计算机辅助工程》 2008年第3期69-71,共3页
为解决在说话人识别方法的矢量量化(Vector Quantization,VQ)系统中,K-均值法的码本设计很容易陷入局部最优,而且初始码本的选取对最佳码本设计影响很大的问题,将遗传算法(Genetic Algorithm,GA)与基于非参数模型的VQ相结合,得到1种VQ... 为解决在说话人识别方法的矢量量化(Vector Quantization,VQ)系统中,K-均值法的码本设计很容易陷入局部最优,而且初始码本的选取对最佳码本设计影响很大的问题,将遗传算法(Genetic Algorithm,GA)与基于非参数模型的VQ相结合,得到1种VQ码本设计的GA-K算法.该算法利用GA的全局优化能力得到最优的VQ码本,避免LBG算法极易收敛于局部最优点的问题;通过GA自身参数,结合K-均值法收敛速度快的优点,搜索出训练矢量空间中全局最优的码本.实验结果表明,GA-K算法优于LBG算法,可以很好地协调收敛性和识别率之间的关系. 展开更多
关键词 说话人识别 GA-K算法 K-均值法 码本设计 遗传算法 矢量量化 美尔倒谱因数
下载PDF
与文本无关说话人识别特征提取的改进 被引量:1
17
作者 田克平 曾庆宁 《电声技术》 2008年第11期51-55,共5页
将主分量分析(PCA)方法结合到说话人识别的特征提取中,去除MFCC特征各维分量之间的相关性和冗余信息,达到去相关、降维、降噪的目的,节省后续阶段的计算开销。研究了2种PCA与说话人识别结合的方法,取得了较好的效果。
关键词 主分量分析 美尔倒谱特征 矢量量化 特征提取
下载PDF
GMM文本无关的说话人识别系统研究 被引量:27
18
作者 蒋晔 唐振民 《计算机工程与应用》 CSCD 北大核心 2010年第11期179-182,195,共5页
在高斯混合模型(Gaussian Mixture Model,GMM)训练时,对传统的模型参数初始化方法(随机法、K均值聚类法)进行改进,提出分裂法与K均值聚类相结合的新方法。实验表明,采用改进的方法与传统方法相比,系统平均识别率有15.47%和7.5%的提高。... 在高斯混合模型(Gaussian Mixture Model,GMM)训练时,对传统的模型参数初始化方法(随机法、K均值聚类法)进行改进,提出分裂法与K均值聚类相结合的新方法。实验表明,采用改进的方法与传统方法相比,系统平均识别率有15.47%和7.5%的提高。研究了GMM的阶数、协方差阈值、预加重系数对系统识别率的影响。对实验结果进行详细分析,并根据实验数据,取它们各自表现最好的值,从而使构建的说话人识别系统获得一个较高的识别率。实验表明,在规定的实验条件下,系统可达到90%以上的识别率。 展开更多
关键词 说话人识别 高斯混合模型 美尔频率系数(MFCC) 分裂法与K均值聚类结合法
下载PDF
基于元音检测的汉语连续语音端点检测方法 被引量:3
19
作者 张利平 冯宏伟 王艳 《计算机工程与应用》 CSCD 北大核心 2010年第27期114-116,共3页
在汉语连续语音识别中,准确检测出音节的始点和终点是很重要的一步,传统的端点检测方法在非连续语音中检测准确度很高,但在连续语音中检测准确度会大幅度降低。利用MFCC0参数和汉语元音的共振峰能量设计了一种新的端点检测方法,可以准... 在汉语连续语音识别中,准确检测出音节的始点和终点是很重要的一步,传统的端点检测方法在非连续语音中检测准确度很高,但在连续语音中检测准确度会大幅度降低。利用MFCC0参数和汉语元音的共振峰能量设计了一种新的端点检测方法,可以准确检测出汉语连续语音中的音节端点。实验结果表明:这种端点检测方法在低信噪比下也有很高的检测正确率。 展开更多
关键词 连续语音识别 端点检测 美尔频标系数(MFCC) 共振峰
下载PDF
分组网络环境下的实时语音质量客观评价 被引量:2
20
作者 张军 张德运 《西安交通大学学报》 EI CAS CSCD 北大核心 2006年第8期936-939,共4页
提出了一种利用前馈随机神经网络在分组网络中进行实时语音质量评价的新方法.从接收到的语音分组中提取美尔频率倒谱系数向量,利用实时传输控制协议计算语音分组传输过程中的丢包率、延迟和抖动,构成网络传输参数向量.将随机神经元组织... 提出了一种利用前馈随机神经网络在分组网络中进行实时语音质量评价的新方法.从接收到的语音分组中提取美尔频率倒谱系数向量,利用实时传输控制协议计算语音分组传输过程中的丢包率、延迟和抖动,构成网络传输参数向量.将随机神经元组织成具有1个输入层、1个隐含层和1个输出层的3层前馈网络结构,再以上述2种向量作为输入的多类别信号,以相应的主观平均意见(MOS)评分值作为输出对网络进行训练,从而获得稳定的权值矩阵.利用训练过的网络进行多类别信号的语音质量评分映射,并将映射结果与MOS进行二次多项式拟合,得到最终的语音质量评分值.实验表明,所提算法与主观评价之间的平均相关度可达到0.881. 展开更多
关键词 分组网络 美尔频率 随机神经网络 语音质量评价
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部