期刊文献+
共找到34篇文章
< 1 2 >
每页显示 20 50 100
使用全局自注意Teager能量倒谱系数检测重放欺骗语音
1
作者 陈铭 陈雪勤 《声学学报》 EI CAS CSCD 北大核心 2024年第5期1122-1130,共9页
提出了一种基于能量的前端特征提取方法,旨在应对自动说话人验证系统中面临的重放攻击威胁。该方法实现了全频段上的可变分辨率,以充分利用重放语音与真实语音在子带能量上的高鉴别非线性信息。首先,通过采用F-ratio方法统计分析了多种... 提出了一种基于能量的前端特征提取方法,旨在应对自动说话人验证系统中面临的重放攻击威胁。该方法实现了全频段上的可变分辨率,以充分利用重放语音与真实语音在子带能量上的高鉴别非线性信息。首先,通过采用F-ratio方法统计分析了多种录音和播放设备。接着,根据统计结果在全频段上设计了一组滤波器,旨在捕获高鉴别能量信息。最后,利用Teager能量算子计算子带滤波信号的能量,提出了全局自注意Teager能量倒谱系数(GSTECC)。为了验证所提方法的有效性,采用高斯混合模型作为分类器,在ASVspoof 2017 V2和ASVspoof 2021 PA数据库上进行了一系列测试实验。实验结果表明,相对于其他先进特征提取方法,所提GSTECC特征在检测重放攻击方面表现出更优异的性能。 展开更多
关键词 说话人验证 重放攻击检测 全局自注意特征 teager 能量谱系 非线性滤波器组
下载PDF
基于耳蜗倒谱系数和Teager能量算子相位融合的说话人识别系统 被引量:4
2
作者 茅正冲 王俊俊 《南京理工大学学报》 EI CAS CSCD 北大核心 2018年第1期82-88,共7页
为了提高说话人识别系统的性能,该文在传统特征的基础上提出利用相位特征对听觉倒谱特征进行补偿的方法。该方法利用Teager能量算子(Teager energy operator,TEO)能够真实反映气流在通过声道系统呈现的涡流非线性作用的模型,再利用希尔... 为了提高说话人识别系统的性能,该文在传统特征的基础上提出利用相位特征对听觉倒谱特征进行补偿的方法。该方法利用Teager能量算子(Teager energy operator,TEO)能够真实反映气流在通过声道系统呈现的涡流非线性作用的模型,再利用希尔伯特变换从TEO导出分析信号的瞬时相位信息,结合耳蜗倒谱系数(Cochlear filter cepstral coefficients,CFCC)得到融合特征参数。实现了对特征参数的补偿,提高了说话人识别系统的识别率。使用NIST-2002说话者识别评估(Speakers recognition evaluation,SRE)数据库,在高斯混合模型-通用背景模型(Gaussian mixture model-universal background model,GMM-UBM)的说话人识别系统上进行实验。实验结果表明TEO相位与CFCC的结合比单独CFCC更好,其识别精度比现有的CFCC特征和线性预测梅尔频率倒谱系数(Linear prediction Meyer frequency cepstral coefficient,LPMFCC)分别提高了8.32%和3.15%。这表明TEO相位包含与CFCC特征互补的信息,且具有较高的识别率。 展开更多
关键词 能量算子 耳蜗谱系 高斯混合模型-通用背景模型 说话人识别
下载PDF
融合CFCC和Teager能量算子倒谱参数的语音识别 被引量:8
3
作者 史燕燕 白静 《计算机科学》 CSCD 北大核心 2019年第5期286-289,共4页
针对现有表征语音特性的特征提取不完善的问题,提出了一种耳蜗滤波倒谱系数(Cochlear Filter Cepstral Coefficients,CFCC)和Teager能量算子倒谱参数(Teager Energy Operators Cepstral Coefficients,TEOCC)相互融合的方法。该方法将表... 针对现有表征语音特性的特征提取不完善的问题,提出了一种耳蜗滤波倒谱系数(Cochlear Filter Cepstral Coefficients,CFCC)和Teager能量算子倒谱参数(Teager Energy Operators Cepstral Coefficients,TEOCC)相互融合的方法。该方法将表征人耳听觉特性的CFCC和体现非线性能量特性的TEOCC的融合特征应用到语音识别系统中,并联合主成分分析(Principal Components Analysis,PCA)对该融合特征进行特征选择和优化,最后通过支持向量机进行语音识别。实验结果表明:该融合特征与单一特征相比具有更佳的语音识别性能,结合PCA后其语音识别的准确率平均提高了3.7%。 展开更多
关键词 耳蜗滤波谱系 teager能量算子谱参 主成分分析 语音识别
下载PDF
基于VMD和Teager能量算子倒谱的方言语种识别 被引量:1
4
作者 付英 刘增力 《通信技术》 2022年第4期435-442,共8页
针对汉语方言识别率低和在噪声环境下鲁棒性差问题,将特征提取与语音增强结合,提出一种基于变分模态分解(Variational Mode Decomposition,VMD)的改进梅尔频率倒谱系数(MelFrequency Cepstral Coefficients,MFCC)和Teager能量算子倒谱系... 针对汉语方言识别率低和在噪声环境下鲁棒性差问题,将特征提取与语音增强结合,提出一种基于变分模态分解(Variational Mode Decomposition,VMD)的改进梅尔频率倒谱系数(MelFrequency Cepstral Coefficients,MFCC)和Teager能量算子倒谱系数(Teager Energy Operator Cepstral Coefficient,TEOCC)融合的特征提取算法。该算法先将方言信号经VMD改进算法提取特征后再与TEOCC融合,最后通过高斯混合通用背景模型(Gaussian Mixture Model-Universal Background Model,GMM-UBM)进行方言语种识别。实验结果表明:相对于单一的MFCC特征,所提方法在无噪和有噪环境下识别率均有所提升,验证了改进算法在方言语种识别中的有效性。 展开更多
关键词 方言识别 变分模态分解 teager能量算子倒谱系数 语音增强
下载PDF
Teager能量算子增强倒阶次谱提取轴承微弱故障特征 被引量:30
5
作者 杨青乐 梅检民 +2 位作者 肖静 张玲玲 肖云魁 《振动与冲击》 EI CSCD 北大核心 2015年第6期1-5,共5页
针对变速器加速过程下轴承故障特征易于暴露难以提取问题,提出一种Teager能量算子增强倒阶次谱方法。计算加速过程等角度重采样信号的Teager能量算子,对Teager能量算子输出进行倒谱分析,获得Teager能量算子增强倒阶次谱。对加速过程滚... 针对变速器加速过程下轴承故障特征易于暴露难以提取问题,提出一种Teager能量算子增强倒阶次谱方法。计算加速过程等角度重采样信号的Teager能量算子,对Teager能量算子输出进行倒谱分析,获得Teager能量算子增强倒阶次谱。对加速过程滚动轴承外圈、内圈剥落故障信号进行分析,结果表明,Teager能量算子能有效增强冲击成分,抑制非冲击成分;倒阶次谱能从干扰中准确识别被增强的故障冲击特征,提取轴承微弱故障特征。 展开更多
关键词 teager能量算子 阶次谱 滚动轴承 故障诊断
下载PDF
基于梅尔频率倒谱系数与短时能量的低信噪比语音端点检测 被引量:8
6
作者 柏顺 颜夕宏 +2 位作者 张生平 陈建飞 张胜 《南京师大学报(自然科学版)》 CAS CSCD 北大核心 2021年第2期117-120,共4页
低信噪比环境下语音信号的端点检测在语音识别与通信等领域具有重要意义,目前低信噪比环境下的端点检测还存在效率低、识别率不高等问题.本文在分析梅尔频率倒谱系数(MFCC)和短时能量在端点检测中应用的基础上,提出将MFCC前三维度分量相... 低信噪比环境下语音信号的端点检测在语音识别与通信等领域具有重要意义,目前低信噪比环境下的端点检测还存在效率低、识别率不高等问题.本文在分析梅尔频率倒谱系数(MFCC)和短时能量在端点检测中应用的基础上,提出将MFCC前三维度分量相加(MFCCa),再与短时能量相除(梅尔能量比)作为语音特征参数的语音端点检测测度,最后利用模糊C均值聚类算法自适应确定双门限阈值进行端点检测.选取TIMIT语音库中的50条语音信号进行实验,结果表明:在信噪比为5 dB、0 dB、-5 dB的噪声环境下,与能零比、谱熵等算法相比,本算法端点识别准确率均有所提高,其中在-5 dB信噪比环境下提升了约30%. 展开更多
关键词 语音端点检测 梅尔频率谱系 短时能量 模糊C均值聚类 低信噪比
下载PDF
基于短时能量和梅尔频率倒谱系数的球磨机工况识别 被引量:2
7
作者 田原 刘琼 《烧结球团》 北大核心 2020年第3期39-43,共5页
针对球磨机在粉磨作业过程中,交替出现的空磨、正常磨和饱磨3种工作状态,而球磨机磨音信号特征复杂,单一特征提取方法不能较好地识别球磨机工作状况的这一问题,提出了1种将时域的短时能量与频域的梅尔频率倒谱系数相组合作为新的磨音信... 针对球磨机在粉磨作业过程中,交替出现的空磨、正常磨和饱磨3种工作状态,而球磨机磨音信号特征复杂,单一特征提取方法不能较好地识别球磨机工作状况的这一问题,提出了1种将时域的短时能量与频域的梅尔频率倒谱系数相组合作为新的磨音信号的特征提取方法。首先,通过分析在不同工作状况下球磨机磨音信号在时频域中表现的特性,提出通过扩展特征参数来改善反映信号特征,并设计相应的时频域组合来提取特征;最后将该方法运用到分类识别隐马尔可夫模型中,并建立球磨机工况识别系统。实验表明,采用该组合的特征提取方法的识别率相对于单个的时域短时能量和频域梅尔频率倒谱系数要高,可以有效地提升球磨机工况系统的识别性能。 展开更多
关键词 球磨机磨音 特征提取 短时能量 梅尔频率谱系 隐马尔可夫模型
下载PDF
基于GFCC和能量算子倒谱的语种识别 被引量:3
8
作者 刘晶 邵玉斌 +1 位作者 龙华 李一民 《云南大学学报(自然科学版)》 CAS CSCD 北大核心 2022年第2期254-261,共8页
为了提高低信噪比下语种识别的准确率,引入一种新的特征提取融合方法.在前端加入有声段检测,并基于人耳听觉感知模型提取伽玛通频率倒谱系数(Gammatone Frequency Cepstrum Coefficient,GFCC)特征,通过主成分分析对特征进行压缩、降噪,... 为了提高低信噪比下语种识别的准确率,引入一种新的特征提取融合方法.在前端加入有声段检测,并基于人耳听觉感知模型提取伽玛通频率倒谱系数(Gammatone Frequency Cepstrum Coefficient,GFCC)特征,通过主成分分析对特征进行压缩、降噪,融合每个有声段的Teager能量算子倒谱参数,通过高斯混合通用背景模型进行语种识别验证.实验结果表明,在信噪比为-5~0 dB时,相对于基于对数梅尔尺度滤波器组能量特征方法,融合特征集方法对5种语言的识别率,分别提升了23.7%~34.0%,其他信噪比等级下识别率也有明显的提升. 展开更多
关键词 语种识别 伽玛通频率谱系 有声无声段检测 teager能量算子谱参 主成分分析
下载PDF
小波包变换与Teager能量算子结合的说话人识别 被引量:2
9
作者 祝鹏 王成儒 《计算机工程与应用》 CSCD 2013年第9期187-189,共3页
在说话人识别系统中,语音特征参数的提取是影响系统性能的关键因素之一。在研究了MFCC参数的基础上,结合MFCC参数在信号的低频部分具有高频率分辨率以及小波包变换可以对信号的高频部分进行分解以提高高频部分的频率分辨率的优点,将二... 在说话人识别系统中,语音特征参数的提取是影响系统性能的关键因素之一。在研究了MFCC参数的基础上,结合MFCC参数在信号的低频部分具有高频率分辨率以及小波包变换可以对信号的高频部分进行分解以提高高频部分的频率分辨率的优点,将二者结合,将Teager能量算子引入到信号高频部分的能量参数求解,构造了一种新的混合特征参数,采用支持向量机实现说话人的分类识别。实验结果表明,该特征参数有效提高了说话人辨识系统的识别率。 展开更多
关键词 说话人识别 梅尔频率谱系 小波包变换 teager能量算子
下载PDF
一种用于助听器场景分类的对数能量特征
10
作者 韩晓丽 崔杰 肖灵 《太赫兹科学与电子信息学报》 2013年第3期451-456,共6页
为降低助听器场景分类算法中特征提取的复杂度,提高识别准确率,给出了一种改进的对数能量特征参数。以基于最小距离聚类的场景分类方法为例,验证了特征参数的有效性。在其他条件相同时,比较了使用改进的对数能量、普通倒谱系数(CCs)和... 为降低助听器场景分类算法中特征提取的复杂度,提高识别准确率,给出了一种改进的对数能量特征参数。以基于最小距离聚类的场景分类方法为例,验证了特征参数的有效性。在其他条件相同时,比较了使用改进的对数能量、普通倒谱系数(CCs)和梅尔频率倒谱系数(MFCCs)为特征参数时的分类结果。实验结果表明,相对于其他2组特征参数,使用改进的对数能量时,分类结果在总体命中率以及均方误差意义上效果更优。另外,改进后的对数能量,相对于MFCCs,计算量更小。 展开更多
关键词 助听器 场景分类 能量 梅尔频率谱系
下载PDF
MFCC和短时TEO能量的混合参数应用于说话人识别 被引量:5
11
作者 王茂蓉 周萍 景新幸 《微电子学与计算机》 CSCD 北大核心 2016年第1期144-148,共5页
特征参数的提取在说话人识别中起至关重要的作用,影响到整个系统的识别率.采用表征说话人语音特性的Mel倒谱系数和体现语音信号时域特征的短时TEO能量的混合特征参数应用到说话人识别系统中,目的是通过增加表征说话人语音特征参数的维数... 特征参数的提取在说话人识别中起至关重要的作用,影响到整个系统的识别率.采用表征说话人语音特性的Mel倒谱系数和体现语音信号时域特征的短时TEO能量的混合特征参数应用到说话人识别系统中,目的是通过增加表征说话人语音特征参数的维数,来改善系统性能,与传统提取方法相比,该方法弥补了特征参数有效维数的不足,最后建立GMM-UBM分类器模型,对语音信号识别.实验证明,该混合特征参数与MFCC,以及MFCC与其一阶差分的组合特征参数相比,在没有增加运算复杂度的同时提高了系统的识别率. 展开更多
关键词 说话人识别 MEL频率谱系 teager能量算子 混合特征参 GMM-UBM
下载PDF
基于MFCC和短时能量混合的异常声音识别算法 被引量:29
12
作者 吕霄云 王宏霞 《计算机应用》 CSCD 北大核心 2010年第3期796-798,共3页
针对现行异常声音识别算法复杂度高和特征识别率低的问题,将梅尔频率倒谱系数(MFCC)与短时能量混合特征应用到异常声音识别系统中。该混合特征使得高斯混合模型(GMM)分类器可获得比使用MFCC特征及其差分MFCC更好的分类性能。给出了系统... 针对现行异常声音识别算法复杂度高和特征识别率低的问题,将梅尔频率倒谱系数(MFCC)与短时能量混合特征应用到异常声音识别系统中。该混合特征使得高斯混合模型(GMM)分类器可获得比使用MFCC特征及其差分MFCC更好的分类性能。给出了系统实现的具体步骤,并通过仿真实验证明了该算法的有效性,分类器的平均识别率可达到90%以上,并且计算复杂度小。 展开更多
关键词 异常声音识别 梅尔谱系 短时能量 高斯混合模型
下载PDF
基于改进GFCC特征参数的广播音频语种识别 被引量:1
13
作者 邵玉斌 陈亮 +1 位作者 龙华 杜庆治 《吉林大学学报(理学版)》 CAS 北大核心 2022年第2期417-424,共8页
针对广播音频语种识别中与语种识别无关的特征对识别结果产生影响的问题,提出一种基于伽马频率倒谱系数的改进特征参数的语种识别方法.通过提取每帧信号的能量谱包络,去除部分与说话人相关的特征,采用Gammatone滤波器组滤波,经离散余弦... 针对广播音频语种识别中与语种识别无关的特征对识别结果产生影响的问题,提出一种基于伽马频率倒谱系数的改进特征参数的语种识别方法.通过提取每帧信号的能量谱包络,去除部分与说话人相关的特征,采用Gammatone滤波器组滤波,经离散余弦变换后再进行倒谱提升,得到改进的伽马频率倒谱系数特征参数.将广播音频信号提取特征参数输入隐Markov模型中进行训练测试,得到的语种识别结果表明,该方法有效提升了广播音频语种识别的准确率,优于目前使用的伽马频率倒谱系数特征及其衍生方法. 展开更多
关键词 广播音频语种识别 能量谱包络 谱提升 改进伽马频率谱系
下载PDF
基于能量检测的复杂环境下的鸟鸣识别 被引量:6
14
作者 张小霞 李应 《计算机应用》 CSCD 北大核心 2013年第10期2945-2949,共5页
针对实际环境噪声使得鸟鸣识别准确率受到影响的问题,提出一种基于能量检测的抗噪鸟鸣识别方法。首先,对包含有噪声的鸟鸣信号用能量检测方法检测并筛选出有用鸟鸣信号;其次,根据梅尔尺度的分布,对有用鸟鸣信号提取小波包分解子带倒谱系... 针对实际环境噪声使得鸟鸣识别准确率受到影响的问题,提出一种基于能量检测的抗噪鸟鸣识别方法。首先,对包含有噪声的鸟鸣信号用能量检测方法检测并筛选出有用鸟鸣信号;其次,根据梅尔尺度的分布,对有用鸟鸣信号提取小波包分解子带倒谱系数(WPSCC)特征;最后,用支持向量机(SVM)分类器分别对提取的小波包分解子带倒谱系数(WPSCC)和梅尔频率倒谱系数(MFCC)特征进行建模分类识别。同时还对比了在添加不同信噪比的噪声下15类鸟鸣在能量检测前后的识别性能差异。实验结果表明,提取的WPSCC特征具有较好的抗噪功能,且经过能量检测后的识别性能更佳,更适用于复杂环境下的鸟鸣识别。 展开更多
关键词 能量检测 小波包分解子带谱系 梅尔频率谱系 支持向量机 鸟鸣识别
下载PDF
噪声环境下基于能量检测的生态声音识别 被引量:5
15
作者 王浩安 李应 《计算机工程》 CAS CSCD 2013年第2期168-171,共4页
无效声音段的存在导致噪声环境下声音识别方法的识别率迅速降低。为此,提出一种基于能量检测的抗噪声音识别方法。用能量检测方法检测背景噪声环境下的有用声音信号,对检测到的信号提取Mel频率倒谱系数特征,使用支持向量机对提取的特征... 无效声音段的存在导致噪声环境下声音识别方法的识别率迅速降低。为此,提出一种基于能量检测的抗噪声音识别方法。用能量检测方法检测背景噪声环境下的有用声音信号,对检测到的信号提取Mel频率倒谱系数特征,使用支持向量机对提取的特征向量训练分类模型,对含有噪声的生态环境声音进行识别。实验结果表明,该方法具有较好的抗噪能力,其在信噪比40 dB以下的识别率比添加能量检测前提高约25%。 展开更多
关键词 生态环境声音 能量检测 支持向量机 MEL频率谱系 虚警概率
下载PDF
基于Gammatone滤波器和子带能量规整的语音特征提取 被引量:2
16
作者 龙乐凯 周萍 杨海燕 《测控技术》 CSCD 2017年第5期21-24,28,共5页
为了改善传统语音特征参数在复杂环境下识别性能不足的问题,提出了一种基于Gammatone滤波器和子带能量规整的语音特征提取方法。该方法以能量规整倒谱系数(PNCC)特征算法为基础,在前端引入平滑幅度包络和归一化Gammatone滤波器组,并通... 为了改善传统语音特征参数在复杂环境下识别性能不足的问题,提出了一种基于Gammatone滤波器和子带能量规整的语音特征提取方法。该方法以能量规整倒谱系数(PNCC)特征算法为基础,在前端引入平滑幅度包络和归一化Gammatone滤波器组,并通过子带能量规整方法抑制真实环境的背景噪声,最后在后端进行特征弯折和信道补偿处理加以改进。实验采用高斯混合通用背景分类器模型(GMM-UBM)将该算法和其他特征参数进行对比。结果表明,在多种噪声环境中相比其他特征参数,本文方法表现出良好的抗噪能力,即使在低信噪比下仍有较好的识别效果。 展开更多
关键词 特征提取 Gammatone滤波器 子带能量规整 能量规整谱系 信道补偿
下载PDF
车辆发动机异响信号的故障特征参数提取方法 被引量:7
17
作者 王昱翔 殷希梅 +1 位作者 陈凯 胡子阳 《兵器装备工程学报》 CAS 北大核心 2020年第2期44-48,共5页
选取某型运输车发动机正常运转与缺缸运转状态下音频信号作为样本,对原始信号进行预加重、分帧、加窗的预处理;在时域范围内获取分析帧信号的短时能量特征;在频域范围内计算离散功率谱,将其通过梅尔滤波器组,经离散余弦变换得到梅尔频... 选取某型运输车发动机正常运转与缺缸运转状态下音频信号作为样本,对原始信号进行预加重、分帧、加窗的预处理;在时域范围内获取分析帧信号的短时能量特征;在频域范围内计算离散功率谱,将其通过梅尔滤波器组,经离散余弦变换得到梅尔频率倒谱系数。研究结果表明,此方法得到的时、频域特征参数均能反映发动机的运转状态信息,可以有效区分是否缺缸运转,适合作为车辆发动机故障诊断与预测的特征向量,为下一步混合特征提取以及多故障识别打下基础,具有实际应用价值。 展开更多
关键词 故障诊断 特征参 短时能量 梅尔频率谱系
下载PDF
基于改进MFCC与短时能量特征的异常音频检测方法 被引量:4
18
作者 潘泽波 《电子世界》 2020年第23期139-141,145,共4页
在现实声场景中存在着大量的有用信息,当场景中出现了异常音频时(如哭声、玻璃碎裂、物体摔裂、爆炸、车辆急促鸣笛等),意味着这个场景中存在着一定的危险性,可通过对场景中异常声音的关键特征进行识别检索来达到对危险声环境检测的效... 在现实声场景中存在着大量的有用信息,当场景中出现了异常音频时(如哭声、玻璃碎裂、物体摔裂、爆炸、车辆急促鸣笛等),意味着这个场景中存在着一定的危险性,可通过对场景中异常声音的关键特征进行识别检索来达到对危险声环境检测的效果。国内外研究者针对检测声音事件时效率较低、稳定性较差等问题,不对异常声音进行分类建模,而仅结合特征参数特点分类爆炸声、尖叫声、哭笑声等异常情况,通常选用的参数有短时能量、过零率、梅尔倒谱系数(Mel-Frequency Cepstrum,MFCC)等。为了探寻更适合异常音频检测的参数,本文提出了一种基于改进梅尔频率倒谱系数MFCC(Mel-scale Frequency Cepstral Coefficients,MFCC)与短时能量特征的异常音频检测方法。 展开更多
关键词 短时能量 音频检测 梅尔谱系 MFCC 过零率 梅尔频率谱系 环境检测 异常声音
下载PDF
语音驱动唇形自动合成算法 被引量:6
19
作者 林鑫 陈桦 +1 位作者 王开志 王继成 《计算机工程》 CAS CSCD 北大核心 2007年第17期237-238,269,共3页
定义了10种基本的嘴形。以Mel频率倒谱系数(MFCC)作为语音特征,通过SVM分类器进行元音a,i,u的识别,根据其对应量化后的语音能量,映射到嘴形序列,进行中值滤波和排除"奇异点"。该算法在基于语音驱动人脸动画系统中的应用取得... 定义了10种基本的嘴形。以Mel频率倒谱系数(MFCC)作为语音特征,通过SVM分类器进行元音a,i,u的识别,根据其对应量化后的语音能量,映射到嘴形序列,进行中值滤波和排除"奇异点"。该算法在基于语音驱动人脸动画系统中的应用取得了良好的效果。 展开更多
关键词 语音 嘴形 MEL频率谱系 能量
下载PDF
腭裂语音高鼻音等级自动识别算法研究 被引量:4
20
作者 何凌 袁亚南 +4 位作者 尹恒 张桠童 张劲 刘奇 李杨 《四川大学学报(工程科学版)》 EI CAS CSCD 北大核心 2014年第2期127-132,共6页
为了对腭裂语音的高鼻音进行等级区分,提出基于声学特征参数分析的腭裂语音高鼻音等级自动识别算法,提取基于香农能量和Mel倒谱系数(Mel frequency cepstrum coefficient,MFCC)的S-MFCC作为声学特征参数,结合高斯混合模型(Gaussian mixt... 为了对腭裂语音的高鼻音进行等级区分,提出基于声学特征参数分析的腭裂语音高鼻音等级自动识别算法,提取基于香农能量和Mel倒谱系数(Mel frequency cepstrum coefficient,MFCC)的S-MFCC作为声学特征参数,结合高斯混合模型(Gaussian mixture model,GMM)分类器实现对腭裂语音4类高鼻音等级(正常、轻度、中度和重度)的自动识别。实验结果表明,提出的自动识别算法取得了较高的高鼻音类别正确识别率,对4类高鼻音的平均识别率达到79%以上,其中,提出的S-MFCC参数取得了85%的平均正确识别率,优于传统的香农能量算法、MFCC算法,具有较高的临床应用价值。 展开更多
关键词 腭裂语音 高鼻音 香农能量 MEL谱系 高斯混合模型识别器
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部